一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

jf_23871869 ? 來源:劉力 ? 作者:劉力 ? 2025-04-03 18:07 ? 次閱讀

作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力

一,什么是PaddleOCR工具庫?

PaddleOCR 旨在打造一套豐富、領(lǐng)先、且實(shí)用的 OCR 工具庫,助力開發(fā)者訓(xùn)練出更好的模型,并應(yīng)用落地。在GitHub上與其它OCR開源庫相比,PaddleOCR在近五年發(fā)展時(shí)間內(nèi),擁有最多的星標(biāo)(46k)、最快的星標(biāo)增速、最多的貢獻(xiàn)者(234)和最活躍的社區(qū)支持!

wKgZPGfuXPOAN_UvAAIEoqE99fE421.png

PaddleOCR支持多種 OCR 相關(guān)前沿算法,在此基礎(chǔ)上打造產(chǎn)業(yè)級(jí)特色模型系列:PP-OCR、PP-Structure和PP-ChatOCR,打通了模型訓(xùn)練、壓縮、部署全流程。

Github Repo: https://github.com/PaddlePaddle/PaddleOCR

二,什么是PP-OCRv4模型?

PP-OCRv4是PaddleOCR工具庫的PP-OCR系列模型中,當(dāng)前性能最優(yōu)的一個(gè)。它在前代模型(PP-OCRv3)的基礎(chǔ)上,針對檢測模型和識(shí)別模型進(jìn)行了數(shù)據(jù)、網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練策略等多個(gè)模塊的優(yōu)化,在多個(gè)應(yīng)用場景中,精度均有大幅提升:

中文場景,相對于PP-OCRv3中文模型提升超4%;

英文數(shù)字場景,相比于PP-OCRv3英文模型提升6%;

多語言場景(支持韓語、日語、德語、法語等80種語言),平均準(zhǔn)確率提升超8%。

PP-OCRv4是一個(gè)兩階段的OCR系統(tǒng),包含檢測模型、方向分類模型和識(shí)別模型。在檢測和識(shí)別之間添加方向分類模型,將不同角度的文本檢測框修正為水平檢測框,方便識(shí)別模型完成行文本識(shí)別。

wKgZO2fuXPuARKoMAAR-I7xxQis911.png

為了適應(yīng)服務(wù)器和邊緣端不同場景的部署需求,PP-OCRv4提供兩種推理模型權(quán)重版本:

邊緣端:中英文超輕量PP-OCRv4模型(16.1M) = 檢測模型(4.7M) + 識(shí)別模型(10.0M) + 方向分類模型(1.4M)。Hmean:62.24%;ACC:70.1%。

服務(wù)器端:中英文高精度PP-OCRv4 server模型(199.4M) = 檢測模型(110M) + 識(shí)別模型(88M) + 方向分類模型(1.4M)。Hmean:82.69%;ACC:84.04%。

PP-OCRv4模型鏈接:

https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/ppocr/blog/PP-OCRv4_introduction.md

PP-OCRv4模型的卓越性能使其在多個(gè)領(lǐng)域具有廣泛的應(yīng)用前景,如文檔掃描、文字提取、智能表單填寫、物流信息追蹤、文檔自動(dòng)化處理、智能服務(wù)窗口、文獻(xiàn)資料整理等等。本文將介紹使用OpenVINO?工具套件在英特爾? CPU、獨(dú)立顯卡、集成顯卡和NPU上優(yōu)化并部署飛槳PP-OCRv4模型。

三,OpenVINO?工具套件簡介

OpenVINO?工具套件是一個(gè)用于優(yōu)化和部署人工智能AI)模型,提升AI推理性能的開源工具集合,不僅支持以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心組件的預(yù)測式AI模型(Predictive AI),還支持以Transformer為核心組件的生成式AI模型(Generative AI)。OpenVINO?工具套件支持直接讀取并優(yōu)化PaddlePaddle訓(xùn)練好的模型(*.pdmodel),提升其在英特爾? CPU、獨(dú)立顯卡、集成顯卡、NPU等硬件上的AI推理計(jì)算性能。

wKgZPGfuXQWAVYwWAAUadbqoIwM145.pngwKgZPGfuXceAGXB-AAPwbrDdSKA605.png

四,搭建開發(fā)環(huán)境

您可以選擇無需搭建開發(fā)環(huán)境,直接在飛槳AIStudio星河社區(qū)上體驗(yàn)范例:

https://aistudio.baidu.com/projectdetail/8770259

或者,在本地搭建開發(fā)環(huán)境,在算力魔方?上運(yùn)行。

首先,請克隆PP-OCRv4_OpenVINO到本地:

git clone git clone https://github.com/openvino-book/PP-OCRv4_OpenVINO.git

cd PP-OCRv4_OpenVINO

接著,安裝依賴項(xiàng):

pip install -r requirements.txt

最后,請從

https://paddlepaddle.github.io/PaddleOCR/latest/model/index.html

下載中英文超輕量 PP-OCRv4 模型,包括檢測模型、方向分類器和識(shí)別模型到PP-OCRv4_OpenVINO文件夾,并解壓。

wKgZPGfuXYeAcIE1AAI995XPlok133.png

下載命令:

# 下載并解壓PP-OCRv4的檢測模型

wget https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_infer.tar && tar -xvf ch_PP-OCRv4_det_infer.tar

# 下載并解壓PP-OCRv4的方向分類器

wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar && tar -xvf ch_ppocr_mobile_v2.0_cls_infer.tar

# 下載并解壓PP-OCRv4的識(shí)別模型

wget https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_infer.tar && tar -xvf ch_PP-OCRv4_rec_infer.tar

下載并解壓完畢后,開發(fā)環(huán)境搭建完成!

五,編寫PP-OCRv4推理程序

PP-OCRv4_OpenVINO項(xiàng)目已將推理程序編寫完成,各文件功能如下:

執(zhí)行演示程序main.py,并指定模型路徑和推理硬件設(shè)備:

python main.py --image_dir images/general_ocr_006.png

--det_model_dir ch_PP-OCRv4_det_infer/inference.pdmodel

--det_model_device CPU

--rec_model_dir ch_PP-OCRv4_rec_infer/inference.pdmodel

--rec_model_device CPU

--cls_model_dir ch_ppocr_mobile_v2.0_cls_infer/inference.pdmodel

--cls_model_device CPU

--use_angle_cls True

運(yùn)行結(jié)果,如下圖所示:

wKgZPGfuXduAFgE2AAazGIKn5sk016.png

六,總結(jié)

使用OpenVINO?可以直接讀入PP-OCRv4模型(無需轉(zhuǎn)換),并能方便快捷的將PP-OCRv4模型部署在含有英特爾? CPU、獨(dú)立顯卡、集成顯卡或NPU等硬件的算力魔方?上。

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內(nèi)容請關(guān)注“算力魔方?”!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3464

    瀏覽量

    49819
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    112

    瀏覽量

    380
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    PP-OCRv3優(yōu)化策略詳細(xì)解讀

    PP-OCR是PaddleOCR團(tuán)隊(duì)自研的超輕量OCR系統(tǒng),面向OCR產(chǎn)業(yè)應(yīng)用,權(quán)衡精度與速度。近期,PaddleOCR團(tuán)隊(duì)針對PP-OCRv2的檢測模塊和識(shí)別模塊,進(jìn)行共計(jì)9個(gè)方面的升級(jí),打造出一款全新的、效果更優(yōu)的超輕量OCR系統(tǒng):
    的頭像 發(fā)表于 05-12 09:21 ?3913次閱讀

    基于C#和OpenVINO?在英特爾獨(dú)立顯卡上部署PP-TinyPose模型

    OpenVINO,將 PP-TinyPose 模型部署在英特爾獨(dú)立顯卡上。 1.1 PP-TinyPose
    的頭像 發(fā)表于 11-18 18:27 ?2858次閱讀

    百度PP-YOLOE ONNX 在LabVIEW中的部署推理(含源碼)

    PP-YOLOE是百度基于其之前的PP-YOLOv2所改進(jìn)的卓越的單階段Anchor-free模型,超越了多種流行的YOLO模型。如何使用python進(jìn)行該
    的頭像 發(fā)表于 05-26 14:01 ?1430次閱讀
    百度<b class='flag-5'>飛</b><b class='flag-5'>槳</b><b class='flag-5'>PP</b>-YOLOE ONNX 在LabVIEW中的<b class='flag-5'>部署</b>推理(含源碼)

    使用OpenVINO C# API輕松部署PP-OCRv4模型

    ? 作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 《超4萬6千星的開源OCR黑馬登場,PaddleOCR憑什么脫穎而出?》 收到了讀者熱烈反響,很多讀者提出:如何在C#中部署
    的頭像 發(fā)表于 02-12 10:42 ?1164次閱讀
    使用<b class='flag-5'>OpenVINO</b> C# API輕松<b class='flag-5'>部署</b><b class='flag-5'>飛</b><b class='flag-5'>槳</b><b class='flag-5'>PP-OCRv4</b><b class='flag-5'>模型</b>

    如何在C#中部署PP-OCRv4模型

    《超4萬6千星的開源OCR黑馬登場,PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響c,很多讀者提出:如何在C#中部署PP-OCRv4
    的頭像 發(fā)表于 02-17 10:58 ?1477次閱讀
    如何在C#中<b class='flag-5'>部署</b><b class='flag-5'>飛</b><b class='flag-5'>槳</b><b class='flag-5'>PP-OCRv4</b><b class='flag-5'>模型</b>

    運(yùn)行時(shí)OpenVINO?找不到模型優(yōu)化器,為什么?

    在運(yùn)行時(shí)OpenVINO?找不到模型優(yōu)化器,運(yùn)行模型下載程序命令收到錯(cuò)誤消息: omz_downloader:找不到命令
    發(fā)表于 03-05 08:16

    使用OpenVINO? 部署PaddleSeg模型庫中的DeepLabV3+模型

    ? ? ? 01 概述 ? ? 本文是OpenVINO 工具套件與百度PaddlePaddle模型轉(zhuǎn)換/部署系列的第二部。這篇文章專注于
    的頭像 發(fā)表于 11-22 14:58 ?1w次閱讀
    使用<b class='flag-5'>OpenVINO</b>? <b class='flag-5'>部署</b>PaddleSeg<b class='flag-5'>模型</b>庫中的DeepLabV3+<b class='flag-5'>模型</b>

    基于OpenVINO? 的版 PGNet 實(shí)現(xiàn)案例

    OpenVINO 工具套件2022.1版于2022年3月22日正式發(fā)布,根據(jù)官宣OpenVINO 迎來迄今為止最重大更新,2022.1新特性搶先看!,OpenVINO 2022.1將是迄今為止最大變化的版本,并可以直接支持讀取
    發(fā)表于 08-04 16:25 ?1005次閱讀

    基于NVIDIAGPU定制優(yōu)化的NGC容器

    基于 NVIDIA GPU 定制優(yōu)化的 NGC 容器,包含了最新的 NVIDIA 工具包和優(yōu)化后的
    的頭像 發(fā)表于 08-25 10:49 ?1051次閱讀

    NVIDIA 與團(tuán)隊(duì)合作開發(fā)基于 ResNet50 的模型示例

    為了讓開發(fā)者可以快速復(fù)現(xiàn)頂尖的精度和超高的性能,NVIDIA 與團(tuán)隊(duì)合作開發(fā)了基于 ResNet50 的模型示例,并將持續(xù)開發(fā)更多的
    的頭像 發(fā)表于 10-18 10:03 ?1461次閱讀

    在C++中使用OpenVINO工具包部署YOLOv5模型

    下載并轉(zhuǎn)換YOLOv5預(yù)訓(xùn)練模型的詳細(xì)步驟,請參考:《基于OpenVINO?2022.2和蝰蛇峽谷優(yōu)化部署YOLOv5
    的頭像 發(fā)表于 02-15 16:53 ?6778次閱讀

    基于OpenVINO?工具包部署PP-Human的全流程

    PP-Human是目標(biāo)檢測套件PaddleDetection中開源的實(shí)時(shí)行人分析工具,提供了五大異常行為識(shí)別和四大產(chǎn)業(yè)級(jí)功能:人體屬性分析、人流計(jì)數(shù)、跨鏡ReID
    的頭像 發(fā)表于 02-23 18:03 ?1025次閱讀

    【報(bào)名有獎(jiǎng)】Imagination+百度模型部署實(shí)戰(zhàn) Workshop 邀您參加

    舉辦線上Workshop,現(xiàn)已開放注冊報(bào)名。在此次的Workshop中,您將學(xué)習(xí)“端到端在Imagination硬件上部署模型的工作流程”,來自百度
    的頭像 發(fā)表于 09-28 10:20 ?718次閱讀
    【報(bào)名有獎(jiǎng)】Imagination+百度<b class='flag-5'>飛</b><b class='flag-5'>槳</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>實(shí)戰(zhàn) Workshop 邀您參加

    使用OpenVINO優(yōu)化部署訓(xùn)練好的YOLOv7模型

    在《英特爾銳炫 顯卡+ oneAPI 和 OpenVINO 實(shí)現(xiàn)英特爾 視頻 AI 計(jì)算盒訓(xùn)推一體-上篇》一文中,我們詳細(xì)介紹基于英特爾 獨(dú)立顯卡搭建 YOLOv7 模型的訓(xùn)練環(huán)境,完成了 YOLOv7
    的頭像 發(fā)表于 08-25 11:08 ?1825次閱讀
    使用<b class='flag-5'>OpenVINO</b><b class='flag-5'>優(yōu)化</b><b class='flag-5'>并</b><b class='flag-5'>部署</b>訓(xùn)練好的YOLOv7<b class='flag-5'>模型</b>

    基于OpenVINO C# API部署RT-DETR模型

    在 C# 環(huán)境下使用該模型應(yīng)用到工業(yè)檢測中,因此在本文中,我們將向大家展示使用 OpenVINO Csharp API 部署 RT-DETR 模型,
    的頭像 發(fā)表于 11-10 16:59 ?1012次閱讀
    基于<b class='flag-5'>OpenVINO</b> C# API<b class='flag-5'>部署</b>RT-DETR<b class='flag-5'>模型</b>