一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

干貨 | 機器學(xué)習(xí)加持,基于FPGA的高性能視覺應(yīng)用方案設(shè)計

5CTi_cirmall ? 來源:YXQ ? 2019-07-16 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著攝像頭和其他設(shè)備產(chǎn)生的數(shù)據(jù)在快速增長,促使人們運用機器學(xué)習(xí)從汽車、安防和其他應(yīng)用產(chǎn)生的影像中提取更多有用的信息。專用器件有望在嵌入式視覺應(yīng)用中實現(xiàn)高性能機器學(xué)習(xí) (ML) 推理。但是此類器件大都處于早期開發(fā)階段,因為設(shè)計人員正在努力尋找最有效的算法,甚至人工智能 (AI) 研究人員也在迅速推演新方法。

目前,開發(fā)人員一般使用針對 ML 的可用 FPGA 平臺來構(gòu)建嵌入式視覺系統(tǒng),以期滿足更高的性能要求。與此同時,他們可以保持所需的靈活性,以跟上機器學(xué)習(xí)發(fā)展的步伐。

本文將介紹 ML 處理的要求,以及為何 FPGA 能解決許多性能問題。然后,將介紹一個合適的基于 FPGA 的 ML 平臺及其使用方法。

機器學(xué)習(xí)算法和推理引擎

在 ML 算法中,卷積神經(jīng)網(wǎng)絡(luò) (CNN) 已成為圖像分類的首選解決方案。其圖像識別的準確率非常高,因而得以廣泛應(yīng)用于多種應(yīng)用,跨越不同的平臺,例如智能手機、安防系統(tǒng)和汽車駕駛員輔助系統(tǒng)。作為一種深度神經(jīng)網(wǎng)絡(luò) (DNN),CNN 使用的神經(jīng)網(wǎng)絡(luò)架構(gòu)由專用層構(gòu)成。在對標注圖像進行訓(xùn)練期間,它會從圖像中提取特征,并使用這些特征給圖像分類(參見“利用現(xiàn)成的軟硬件啟動機器學(xué)習(xí)”)。

CNN 開發(fā)人員通常在高性能系統(tǒng)或云平臺上進行訓(xùn)練,使用圖形處理單元 (GPU) 加速在標注圖像數(shù)據(jù)集(通常數(shù)以百萬計)上訓(xùn)練模型所需的巨量矩陣計算。訓(xùn)練完成之后,訓(xùn)練好的模型用在推理應(yīng)用中,對視頻流中的新圖像或幀進行分類。推理部署完成后,訓(xùn)練好的模型仍然需要執(zhí)行同樣的矩陣計算,但由于輸入量要少很多,開發(fā)人員可以將 CNN 用于在通用硬件上運行的普通機器學(xué)習(xí)應(yīng)用(參見“利用 Raspberry Pi 構(gòu)建機器學(xué)習(xí)應(yīng)用”)。

然而,對于許多應(yīng)用而言,通用平臺缺乏在 CNN 推理中同時實現(xiàn)高準確率和高性能所需的性能。優(yōu)化技術(shù)和替代 CNN 架構(gòu)(如 MobileNet 或 SqueezeNet)有助于降低平臺要求,但通常會犧牲準確率并增加推理延時,而這可能與應(yīng)用要求相沖突。

與此同時,快速發(fā)展的算法使得機器學(xué)習(xí) IC 的設(shè)計工作變得復(fù)雜,因為需要機器學(xué)習(xí) IC 既要足夠?qū)iT化以加速推理,又要足夠通用化以支持新算法。FPGA 多年來一直扮演著這一特定角色,提供加速關(guān)鍵算法所需的性能和靈活性,解決了通用處理器性能不足或沒有專用器件可用的問題。

FPGA 作為機器學(xué)習(xí)平臺

對于機器學(xué)習(xí)而言,GPU 仍然是標桿——這是早期的 FPGA 根本無法企及的。最近出現(xiàn)的一些器件,如 Intel Arria 10 GX FPGA 和 Lattice Semiconductor ECP5 FPGA,大大縮小了先進 FPGA 和 GPU 之間的差距。對于某些使用緊湊的整數(shù)數(shù)據(jù)類型的 DNN 架構(gòu)來說,此類 FPGA 的性能/功耗比甚至高于主流 GPU。

高級 FPGA 組合了嵌入式存儲器和數(shù)字信號處理 (DSP) 資源,對于一般矩陣乘法 (GEMM) 運算能夠?qū)崿F(xiàn)很高的性能。其嵌入式存儲器靠近計算引擎,從而緩解了 CPU 存儲器瓶頸,而這種瓶頸通常會限制通用處理器上機器學(xué)習(xí)算法的性能。反之,相比于典型 DSP 器件(圖 1),F(xiàn)PGA 上的嵌入式 DSP 計算引擎提供了更多的并行乘法器資源。FPGA 廠商在交付專門用于機器學(xué)習(xí)的 FPGA 開發(fā)平臺時充分利用了這些特性。

例如,Intel 最近推出的支持 FPGA 的 OPENVINO? 擴展了該平臺將推理模型部署到不同類型設(shè)備(包括 GPU、CPU 和 FPGA)的能力。在該平臺上,開發(fā)人員可使用 Intel 的深度學(xué)習(xí)推理引擎工作流程,其中整合了 Intel 深度學(xué)習(xí)部署工具包和在 Intel OPENVINO 工具包中提供的 Intel 計算機視覺軟件開發(fā)套件 (SDK)。開發(fā)人員使用 SDK 的應(yīng)用編程接口 (API) 構(gòu)建模型,并且可利用 Intel 的運行模型優(yōu)化器針對不同硬件平臺進行優(yōu)化。

深度學(xué)習(xí)部署工具包旨在與 Intel DK-DEV-10AX115S-A Arria 10 GX FPGA 開發(fā)套件配合使用,讓開發(fā)人員能從領(lǐng)先的 ML 框架(包括 Caffe 和 TensorFlow)導(dǎo)入訓(xùn)練好的模型(圖 2)。在諸如 Arria 10 GX FPGA 開發(fā)套件之類目標平臺或使用 Arria 10 GX FPGA 器件的定制設(shè)計上,工具包中的模型優(yōu)化器和推理引擎分別處理模型轉(zhuǎn)換和部署。

為了遷移預(yù)訓(xùn)練模型,開發(fā)人員使用基于 Python 的模型優(yōu)化器生成了一個中間表示 (IR),該表示包含在一個提供網(wǎng)絡(luò)拓撲的 xml 文件和一個以二進制值提供模型參數(shù)的 bin 文件中。除了生成 IR 之外,模型優(yōu)化器還會執(zhí)行一項關(guān)鍵功能——移除模型中用于訓(xùn)練但對推理毫無作用的層。此外,該工具會在可能的情況下將每個提供獨立數(shù)學(xué)運算的層合并到一個組合層中。

通過這種網(wǎng)絡(luò)修剪和合并,模型變得更緊湊,進而加快推理時間并減少對目標平臺的存儲器需求。

Intel 推理引擎是一個 C++ 庫,其中包含一組 C++ 類。這些類對于受支持的目標硬件平臺來說是通用的,因此可以在各個平臺上實現(xiàn)推理。對于推理應(yīng)用而言,開發(fā)人員使用像 CNNNetReader 這樣的類來讀取 xml 文件 (ReadNetwork) 中包含的 CNN 拓撲以及 bin 文件 (ReadWeights) 中包含的模型參數(shù)。模型加載完成后,調(diào)用類方法 Infer() 執(zhí)行阻塞推理,同時調(diào)用類方法 StartAsync() 執(zhí)行異步推理,當推理完成時使用等待或完成例程處理結(jié)果。

Intel 在 OPENVINO 環(huán)境提供的多個示例應(yīng)用程序中演示了完整的工作流程和詳細的推理引擎 API 調(diào)用。例如,安全屏障攝像機示例應(yīng)用程序展示了使用推理模型流水線,以首先確定車輛邊界框(圖 3)。流水線中的下一個模型檢查了邊界框中的內(nèi)容,識別車輛類別、顏色和車牌位置等車輛屬性。

流水線中的最后一個模型使用這些車輛屬性從車牌中提取字符。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22050

    瀏覽量

    618540
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134627

原文標題:機器學(xué)習(xí)加持,基于FPGA的高性能視覺應(yīng)用方案設(shè)計

文章出處:【微信號:cirmall,微信公眾號:電路設(shè)計技能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    FPGA機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?395次閱讀

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會:ROS2機器視覺與地圖構(gòu)建技術(shù) 通過對本書第7章(ROS2視覺應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學(xué)習(xí),我對機器
    發(fā)表于 05-03 19:41

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    工業(yè)相機與采集卡配套方案:構(gòu)建高性能機器視覺系統(tǒng)的核心要素

    機器視覺技術(shù)作為人工智能和智能制造的關(guān)鍵組成部分,正日益廣泛地應(yīng)用于工業(yè)自動化、質(zhì)量檢測、機器人引導(dǎo)等領(lǐng)域。而一套高性能機器
    的頭像 發(fā)表于 03-31 15:53 ?337次閱讀
    工業(yè)相機與采集卡配套<b class='flag-5'>方案</b>:構(gòu)建<b class='flag-5'>高性能</b><b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)的核心要素

    德晟達高性能服務(wù)器助力工業(yè)機器視覺落地

    處理以及多模態(tài)數(shù)據(jù)融合。在此背景下,服務(wù)器集群作為核心算力基礎(chǔ)設(shè)施,其高性能計算、低延遲推理及高可靠性特性,已成為支撐工業(yè)機器視覺系統(tǒng)規(guī)?;渴鸬年P(guān)鍵技術(shù)底座。
    的頭像 發(fā)表于 03-11 17:22 ?696次閱讀

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    和并行計算能力,將AI模型(如CNN、LSTM、Transformer等)部署到FPGA上,實現(xiàn)高效的數(shù)據(jù)預(yù)處理、實時推理和后處理。? 定制化解決方案:根據(jù)具體應(yīng)用場景(如自動駕駛、機器視覺
    發(fā)表于 03-03 11:21

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    隨著HarmonyOS NEXT的正式推出,鴻蒙原生應(yīng)用開發(fā)熱度高漲,數(shù)量激增。但在三方應(yīng)用鴻蒙化進程中,性能問題頻出。為此,HarmonyOS NEXT推出了一整套原生頁面高性能解決方案,包括
    發(fā)表于 01-02 18:00

    低電壓冗余電源方案設(shè)計

    低電壓冗余電源方案設(shè)計
    發(fā)表于 12-16 14:47 ?1次下載

    適用于機器視覺應(yīng)用的智能機器視覺控制平臺

    看51camera的合作伙伴Neousys宸曜科技的Nuvis系列工控機。Nuvis系列機器視覺控制平臺是適用于現(xiàn)如今機器視覺市場的高整合機器
    的頭像 發(fā)表于 11-23 01:08 ?552次閱讀
    適用于<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>應(yīng)用的智能<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>控制平臺

    FCB-EW9500H高清攝像機:為工業(yè)機器人打造的高性能視覺解決方案

    在智能制造和工業(yè)4.0的快速發(fā)展背景下,高清視覺技術(shù)已成為工業(yè)機器人不可或缺的重要組成部分。索尼推出的FCB-EW9500H高清攝像機,憑借其卓越的性能和專為工業(yè)機器人設(shè)計的功能,為工
    的頭像 發(fā)表于 11-19 14:19 ?568次閱讀

    安森美機器視覺系統(tǒng)解決方案

    ,它還用于驗證數(shù)據(jù)矩陣碼、檢查食品包裝和讀取條形碼。機器視覺系統(tǒng)方案指南將全面介紹機器視覺系統(tǒng)方案
    的頭像 發(fā)表于 11-14 09:53 ?734次閱讀
    安森美<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)解決<b class='flag-5'>方案</b>

    AI干貨補給站 | 深度學(xué)習(xí)機器視覺的融合探索

    在智能制造的浪潮中,阿丘科技作為業(yè)界領(lǐng)先的工業(yè)AI視覺平臺及解決方案提供商,始終致力于推動AI+機器視覺技術(shù)的革新與應(yīng)用。為此,我們特別開設(shè)了「AI
    的頭像 發(fā)表于 10-29 08:04 ?578次閱讀
    AI<b class='flag-5'>干貨</b>補給站 | 深度<b class='flag-5'>學(xué)習(xí)</b>與<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>的融合探索

    全新升級,洛微發(fā)布高性能3D工業(yè)相機,為機器視覺注入新動能

    10月14日,VisionChina2024(深圳)于深圳國際會展中心盛大開幕,作為機器視覺與自動化領(lǐng)域的盛會,VisionChina匯聚了眾多行業(yè)頂尖的視覺技術(shù)與應(yīng)用成果。杭州洛微科技有限公司
    的頭像 發(fā)表于 10-14 16:29 ?50次閱讀
    全新升級,洛微發(fā)布<b class='flag-5'>高性能</b>3D工業(yè)相機,為<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>注入新動能

    微視傳感高性能3D視覺產(chǎn)品亮相2024上海機器視覺

    近日,2024上海機器視覺展在上海新國際博覽中心隆重舉行,微視傳感攜最新的高性能3D視覺產(chǎn)品亮相E2館2121展位,得到廣泛關(guān)注,這次展會不僅是微視傳感展示創(chuàng)新技術(shù)的舞臺,更是與行業(yè)同
    的頭像 發(fā)表于 08-06 15:15 ?974次閱讀
    微視傳感<b class='flag-5'>高性能</b>3D<b class='flag-5'>視覺</b>產(chǎn)品亮相2024上海<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>展

    高性能圖像傳感器加速機器視覺應(yīng)用落地

    根據(jù) Expert Market Research 的報告,2023 年全球機器視覺市場規(guī)模達到了約 108.8 億美元。預(yù)計 2024 年至 2032 年期間,該市場將以 7.90% 的復(fù)合
    發(fā)表于 07-24 11:13 ?1167次閱讀
    以<b class='flag-5'>高性能</b>圖像傳感器加速<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>應(yīng)用落地