一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

低門檻AI部署工具FastDeploy開源!

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 作者:新機(jī)器視覺 ? 2022-11-08 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能產(chǎn)業(yè)應(yīng)用發(fā)展的越來越快,開發(fā)者需要面對(duì)的適配部署工作也越來越復(fù)雜。層出不窮的算法模型、各種架構(gòu)的AI硬件、不同場(chǎng)景的部署需求(服務(wù)器、服務(wù)化、嵌入式、移動(dòng)端等)、不同操作系統(tǒng)和開發(fā)語言,為AI開發(fā)者項(xiàng)目落地帶來不小的挑戰(zhàn)。edc63234-5f1e-11ed-8abf-dac502259ad0.png

為了解決AI部署落地難題,我們發(fā)起了FastDeploy項(xiàng)目。FastDeploy針對(duì)產(chǎn)業(yè)落地場(chǎng)景中的重要AI模型,將模型API標(biāo)準(zhǔn)化,提供下載即可運(yùn)行的Demo示例。相比傳統(tǒng)推理引擎,做到端到端的推理性能優(yōu)化。FastDeploy還支持在線(服務(wù)化部署)和離線部署形態(tài),滿足不同開發(fā)者的部署需求。

經(jīng)過為期一年的高密度打磨,F(xiàn)astDeploy目前具備三類特色能力:

全場(chǎng)景:支持GPU、CPU、Jetson、ARM CPU、瑞芯微NPU、晶晨NPU、恩智浦NPU等多類硬件,支持本地部署、服務(wù)化部署、Web端部署、移動(dòng)端部署等,支持CV、NLP、Speech三大領(lǐng)域,支持圖像分類、圖像分割、語義分割、物體檢測(cè)、字符識(shí)別(OCR)、人臉檢測(cè)識(shí)別、人像扣圖、姿態(tài)估計(jì)、文本分類、信息抽取、行人跟蹤、語音合成等16大主流算法場(chǎng)景。

易用靈活:三行代碼完成AI模型的部署,一行API完成模型替換,無縫切換至其他模型部署,提供了150+熱門AI模型的部署Demo。

極致高效:相比傳統(tǒng)深度學(xué)習(xí)推理引擎只關(guān)注模型的推理時(shí)間,F(xiàn)astDeploy則關(guān)注模型任務(wù)的端到端部署性能。通過高性能前后處理、整合高性能推理引擎、一鍵自動(dòng)壓縮等技術(shù),實(shí)現(xiàn)了AI模型推理部署的極致性能優(yōu)化。

項(xiàng)目傳送門:

https://github.com/PaddlePaddle/FastDeploy

以下將對(duì)該3大特性做進(jìn)一步技術(shù)解讀,全文大約2100字,預(yù)計(jì)閱讀時(shí)長3分鐘。

1

3大特性篇

2

3步部署實(shí)戰(zhàn)篇,搶先看

CPU/GPU部署實(shí)戰(zhàn)

Jetson部署實(shí)戰(zhàn)

RK3588部署實(shí)戰(zhàn)(RV1126、晶晨A311D等NPU類似)

1

3大特性解讀

全場(chǎng)景:一套代碼云邊端多平臺(tái)多硬件一網(wǎng)打盡,覆蓋CV、NLP、Speech

支持PaddleInference、TensorRT、OpenVINO、ONNXRuntime、PaddleLite、RKNN等后端,覆蓋常見的NVIDIAGPU、x86CPU、Jetson Nano、Jetson TX2、ARMCPU(移動(dòng)端、ARM開發(fā)板)、Jetson Xavier、瑞芯微NPU(RK3588、RK3568、RV1126、RV1109、RK1808)、晶晨NPU(A311D、S905D)等云邊端場(chǎng)景的多類幾十款A(yù)I硬件部署。同時(shí)支持服務(wù)化部署、離線CPU/GPU部署、端側(cè)和移動(dòng)端部署方式。針對(duì)不同硬件,統(tǒng)一API保證一套代碼在數(shù)據(jù)中心、邊緣部署和端側(cè)部署無縫切換。edd89dc0-5f1e-11ed-8abf-dac502259ad0.jpgFastDeploy支持CV、NLP、Speech三大AI領(lǐng)域,覆蓋16大類算法(圖像分類、圖像分割、語義分割、物體檢測(cè)、字符識(shí)別(OCR) 、人臉檢測(cè)、人臉關(guān)鍵點(diǎn)檢測(cè)、人臉識(shí)別、人像扣圖、視頻扣圖、姿態(tài)估計(jì)、文本分類 信息抽取 文圖生成、行人跟蹤、語音合成)。支持飛槳PaddleClas、PaddleDetection、PaddleSeg、PaddleOCR、PaddleNLP、PaddleSpeech 6大熱門AI套件的主流模型,同時(shí)也支持生態(tài)(如PyTorch、ONNX等)熱門模型的部署。ede4faa2-5f1e-11ed-8abf-dac502259ad0.gif ?

易用靈活,三行代碼完成模型部署,一行命令快速體驗(yàn)150+熱門模型部署

FastDeploy三行代碼可完成AI模型在不同硬件上的部署,極大降低了AI模型部署難度和工作量。一行命令切換TensorRT、OpenVINO、Paddle Inference、Paddle Lite、ONNX Runtime、RKNN等不同推理后端和對(duì)應(yīng)硬件。低門檻的推理引擎后端集成方案,平均一周時(shí)間即可完成任意硬件推理引擎的接入使用,解耦前后端架構(gòu)設(shè)計(jì),簡單編譯測(cè)試即可體驗(yàn)FastDeploy支持的AI模型。開發(fā)者可以根據(jù)模型API實(shí)現(xiàn)相應(yīng)模型部署,也可以選擇git clone一鍵獲取150+熱門AI模型的部署示例Demo,快速體驗(yàn)不同模型的推理部署。

			# PP-YOLOE的部署 import fastdeploy as fd import cv2 model = fd.vision.detection.PPYOLOE("model.pdmodel", "model.pdiparams", "infer_cfg.yml") im = cv2.imread("test.jpg") result = model.predict(im) # YOLOv7的部署 import fastdeploy as fd import cv2 model = fd.vision.detection.YOLOv7("model.onnx") im = cv2.imread("test.jpg") result = model.predict(im)

FastDeploy部署不同模型


			# PP-YOLOE的部署 import fastdeploy as fd import cv2 option = fd.RuntimeOption() option.use_cpu() option.use_openvino_backend() # 一行命令切換使用 OpenVINO部署 model = fd.vision.detection.PPYOLOE("model.pdmodel", "model.pdiparams", "infer_cfg.yml", runtime_option=option) im = cv2.imread("test.jpg") result = model.predict(im)FastDeploy切換后端和硬件
						

極致高效:一鍵壓縮提速,預(yù)處理加速,端到端性能優(yōu)化,提升AI算法產(chǎn)業(yè)落地

FastDeploy在吸收TensorRT、OpenVINO、Paddle Inference、Paddle Lite、ONNX Runtime、RKNN等高性能推理優(yōu)勢(shì)的同時(shí),通過端到端的推理優(yōu)化解決了傳統(tǒng)推理引擎僅關(guān)心模型推理速度的問題,提升整體推理速度和性能。集成自動(dòng)壓縮工具,在參數(shù)量大大減小的同時(shí)(精度幾乎無損),推理速度大幅提升。使用CUDA加速優(yōu)化預(yù)處理和后處理模塊,將YOLO系列的模型推理加速整體從41ms優(yōu)化到25ms。端到端的優(yōu)化策略,徹底解決AI部署落地中的性能難題。更多性能優(yōu)化,歡迎關(guān)注GitHub了解詳情。https://github.com/PaddlePaddle/FastDeployee0f9bea-5f1e-11ed-8abf-dac502259ad0.png

2

3步部署實(shí)戰(zhàn)篇,搶先看

1

CPU/GPU部署實(shí)戰(zhàn)(以YOLOv7為例)

安裝FastDeploy部署包,下載部署示例(可選,也可以三行API實(shí)現(xiàn)部署代碼)


			pip install fastdeploy-gpu-python -f https://www.paddlepaddle.org.cn/whl/fastdeploy.html git clone https://github.com/PaddlePaddle/FastDeploy.git cd examples/vision/detection/yolov7/python/
						

準(zhǔn)備模型文件和測(cè)試圖片


			wget https://bj.bcebos.com/paddlehub/fastdeploy/yolov7.onnx wget https://gitee.com/paddlepaddle/PaddleDetection/raw/release/2.4/demo/000000014439.jpg
						

CPU/GPU推理模型


			# CPU推理 python infer.py --model yolov7.onnx --image 000000014439.jpg --device cpu # GPU推理 python infer.py --model yolov7.onnx --image 000000014439.jpg --device gpu # GPU上使用TensorRT推理 python infer.py --model yolov7.onnx --image 000000014439.jpg --device gpu --use_trt True

推理結(jié)果示例:

ee3d56b6-5f1e-11ed-8abf-dac502259ad0.png

2

Jetson部署實(shí)戰(zhàn)(以YOLOv7為例)

安裝FastDeploy部署包,配置環(huán)境變量


			git clone https://github.com/PaddlePaddle/FastDeploy cd FastDeploy mkdir build && cd build cmake .. -DBUILD_ON_JETSON=ON -DENABLE_VISION=ON -DCMAKE_INSTALL_PREFIX=${PWD}/install make -j8 make install cd FastDeploy/build/install source fastdeploy_init.sh
						

準(zhǔn)備模型文件和測(cè)試圖片


			wget https://bj.bcebos.com/paddlehub/fastdeploy/yolov7.onnx wget https://gitee.com/paddlepaddle/PaddleDetection/raw/release/2.4/demo/000000014439.jpg
						

編譯推理模型


			cd examples/vision/detection/yolov7/cpp cmake .. -DFASTDEPLOY_INSTALL_DIR=${FASTDEPOLY_DIR} mkdir build && cd build make -j # 使用TensorRT推理(當(dāng)模型不支持TensorRT時(shí)會(huì)自動(dòng)轉(zhuǎn)成使用CPU推理) ./infer_demo yolov7s.onnx 000000014439.jpg 27s.onnx 000000014439.jpg 2

推理結(jié)果示例:

ee534ce6-5f1e-11ed-8abf-dac502259ad0.png

3

RK3588部署實(shí)戰(zhàn)以輕量化檢測(cè)網(wǎng)絡(luò)PicoDet為例)

安裝FastDeploy部署包,下載部署示例(可選,也可以三行API實(shí)現(xiàn)部署代碼)


			# 參考編譯文檔,完成FastDeploy編譯安裝 # 參考文檔鏈接:https://github.com/PaddlePaddle/FastDeploy/blob/develop/docs/cn/build_and_install/rknpu2.md # 下載部署示例代碼 git clone https://github.com/PaddlePaddle/FastDeploy.git cd examples/vision/detection/paddledetection/rknpu2/python
						

準(zhǔn)備模型文件和測(cè)試圖片


			wget https://bj.bcebos.com/fastdeploy/models/rknn2/picodet_s_416_coco_npu.zip unzip -qo picodet_s_416_coco_npu.zip ## 下載Paddle靜態(tài)圖模型并解壓 wget https://bj.bcebos.com/fastdeploy/models/rknn2/picodet_s_416_coco_npu.zip unzip -qo picodet_s_416_coco_npu.zip # 靜態(tài)圖轉(zhuǎn)ONNX模型,注意,這里的save_file請(qǐng)和壓縮包名對(duì)齊 paddle2onnx --model_dir picodet_s_416_coco_npu --model_filename model.pdmodel --params_filename model.pdiparams --save_file picodet_s_416_coco_npu/picodet_s_416_coco_npu.onnx --enable_dev_version True python -m paddle2onnx.optimize --input_model picodet_s_416_coco_npu/picodet_s_416_coco_npu.onnx --output_model picodet_s_416_coco_npu/picodet_s_416_coco_npu.onnx --input_shape_dict "{'image':[1,3,416,416]}" # ONNX模型轉(zhuǎn)RKNN模型 # 轉(zhuǎn)換模型,模型將生成在picodet_s_320_coco_lcnet_non_postprocess目錄下 python tools/rknpu2/export.py --config_path tools/rknpu2/config/RK3588/picodet_s_416_coco_npu.yaml # 下載圖片 wget https://gitee.com/paddlepaddle/PaddleDetection/raw/release/2.4/demo/000000014439.jpg
						

推理模型


		python3 infer.py --model_file ./picodet _3588/picodet_3588.rknn --config_file ./picodet_3588/deploy.yaml --image images/000000014439.jpg
		審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280000
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249562
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122798

原文標(biāo)題:模型部署不再難!低門檻AI部署工具FastDeploy開源!

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    STM32F769是否可以部署邊緣AI?

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    RAKsmart服務(wù)器如何賦能AI開發(fā)與部署

    AI開發(fā)與部署的復(fù)雜性不僅體現(xiàn)在算法設(shè)計(jì)層面,更依賴于底層基礎(chǔ)設(shè)施的支撐能力。RAKsmart服務(wù)器憑借其高性能硬件架構(gòu)、靈活的資源調(diào)度能力以及面向AI場(chǎng)景的深度優(yōu)化,正在成為企業(yè)突破算力瓶頸、加速
    的頭像 發(fā)表于 04-30 09:22 ?272次閱讀

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場(chǎng)景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    集成于同一硬件平臺(tái)。內(nèi)置RISC-V AI核,接入ONNXRuntime加速框架,可快速部署Transformer、CNN等主流算法,實(shí)現(xiàn)視覺跟蹤、語音交互與自主決策的一體化應(yīng)用。 門檻
    發(fā)表于 04-25 17:59

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南------Docker Desktop環(huán)境操作
    發(fā)表于 04-16 18:30

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    基石。 Neuron Studio打造全流程一站式開發(fā)體驗(yàn),為AI應(yīng)用開發(fā)按下加速鍵 AI 應(yīng)用的開發(fā)瓶頸,從來都不是“點(diǎn)的問題”,而是“鏈的問題”:開發(fā)工具碎片化,調(diào)優(yōu)過程靠手動(dòng),單模型分析效率
    發(fā)表于 04-13 19:52

    開源AI MPU

    ? (2) CORE-V(OpenHW Group) ? ? 特點(diǎn) ?:開源RISC-V處理器家族,支持AI加速擴(kuò)展(如DSP/向量指令)。 ? 代表IP ?:CV32E40P(支持自定義AI協(xié)處理器)。 ? 適用場(chǎng)景 ?:
    的頭像 發(fā)表于 04-02 17:44 ?1645次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)庫

    繼續(xù)學(xué)習(xí)迪哥的AI Agent入門引導(dǎo)書籍。 LLM在落地應(yīng)用中面臨著專業(yè)領(lǐng)域表現(xiàn)不足、知識(shí)更新困難、容易產(chǎn)生\"幻覺\"等問題,這些挑戰(zhàn)嚴(yán)重制約了AI技術(shù)在各行業(yè)的深入
    發(fā)表于 03-07 19:49

    如何部署OpenVINO?工具套件應(yīng)用程序?

    編寫代碼并測(cè)試 OpenVINO? 工具套件應(yīng)用程序后,必須將應(yīng)用程序安裝或部署到生產(chǎn)環(huán)境中的目標(biāo)設(shè)備。 OpenVINO?部署管理器指南包含有關(guān)如何輕松使用部署管理器將應(yīng)用程序打包并
    發(fā)表于 03-06 08:23

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    合。未來,F(xiàn)PGA將更多地集成到系統(tǒng)級(jí)芯片(SoC)中,形成更高效的計(jì)算平臺(tái)。? 開發(fā)工具門檻降低:隨著高級(jí)綜合工具(HLS)和AI框架(如NVIDIA Modulus)的發(fā)展,F(xiàn)P
    發(fā)表于 03-03 11:21

    C#集成OpenVINO?:簡化AI模型部署

    什么是OpenVINO 工具套件? OpenVINO 工具套件是一個(gè)用于優(yōu)化和部署人工智能(AI)模型,提升AI推理性能的
    的頭像 發(fā)表于 02-17 10:03 ?1994次閱讀
    C#集成OpenVINO?:簡化<b class='flag-5'>AI</b>模型<b class='flag-5'>部署</b>

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    方法的優(yōu)缺點(diǎn)與操作要點(diǎn)。 01-使用Ollama工具部署-便捷但有短板 Ollama 是一個(gè)開源的大模型服務(wù)工具,可以支持最新的deepseek模型,以及Llama 3,Phi 3,M
    發(fā)表于 02-14 17:42

    云端AI開發(fā)者工具怎么用

    云端AI開發(fā)者工具通常包括代碼編輯器、模型訓(xùn)練平臺(tái)、自動(dòng)化測(cè)試工具、代碼管理工具等。這些工具不僅降低了A
    的頭像 發(fā)表于 12-05 13:31 ?563次閱讀

    如何在STM32f4系列開發(fā)板上部署STM32Cube.AI,

    已下載STM32Cube.AI擴(kuò)展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經(jīng)過開發(fā)板處理器進(jìn)行AI模型處理識(shí)別過后,告訴我識(shí)別結(jié)果,顯示在TFL
    發(fā)表于 11-18 09:39

    Arm推出GitHub平臺(tái)AI工具,簡化開發(fā)者AI應(yīng)用開發(fā)部署流程

    專為 GitHub Copilot 設(shè)計(jì)的 Arm 擴(kuò)展程序,可加速從云到邊緣側(cè)基于 Arm 平臺(tái)的開發(fā)。 Arm 原生運(yùn)行器為部署云原生、Windows on Arm 以及云到邊緣側(cè)的 AI
    的頭像 發(fā)表于 10-31 18:51 ?3330次閱讀