一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

mW范圍內(nèi)的機(jī)器視覺使物聯(lián)網(wǎng)端點(diǎn)推理變得切實(shí)可行

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Semir Haddad ? 2022-10-14 14:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器視覺已經(jīng)在世界上迅速找到了自己的位置。從樹上看到和采摘橙子。注視檢測(cè)針對(duì)危險(xiǎn)不明的駕駛員。在工廠車間移動(dòng)的工業(yè)機(jī)器人依靠它進(jìn)行安全障礙物檢測(cè)。

物聯(lián)網(wǎng)端點(diǎn)位于嵌入式視覺的前沿。而且,與其他前沿領(lǐng)域一樣,也存在挑戰(zhàn),其中最重要的是電源效率。是否可以在不超出節(jié)點(diǎn)功率容量的情況下在極端邊緣進(jìn)行推理?

這個(gè)問題值得考慮。這是因?yàn)樵谶吘夁M(jìn)行推理可以避免不加選擇地將數(shù)據(jù)(其中只有一些是可操作的)傳輸?shù)皆七M(jìn)行分析。這降低了存儲(chǔ)成本。此外,訪問云會(huì)損害延遲并抑制實(shí)時(shí)功能。傳輸數(shù)據(jù)是易受攻擊的數(shù)據(jù),因此端點(diǎn)處理更可取。這對(duì)于降低支付給網(wǎng)絡(luò)運(yùn)營(yíng)商的成本也是有利的。

一種全新的 SoC 架構(gòu)方法

然而,對(duì)于所有這些好處,一個(gè)主要的絆腳石仍然存在。使用傳統(tǒng)微控制器的器件的功耗限制阻礙了極端邊緣的神經(jīng)網(wǎng)絡(luò)推理。

傳統(tǒng)的微控制器(MCU)性能無法達(dá)到周期密集型操作。方法喚醒解決方案可能依賴于機(jī)器視覺進(jìn)行對(duì)象分類,而機(jī)器視覺又需要卷積神經(jīng)網(wǎng)絡(luò) (CNN) 執(zhí)行矩陣乘法運(yùn)算,從而轉(zhuǎn)換為數(shù)百萬乘法累加 (MAC) 計(jì)算(圖 1)。

poYBAGNJCSiAWO9SAAEWRe_sYzI951.png

圖 1.到目前為止,微控制器無法承受大容量乘法累加(MAC)的效率問題一直是絆腳石。

MCU存在各種各樣的神經(jīng)網(wǎng)絡(luò)。但是,這些未能作為生產(chǎn)就緒的解決方案流行起來,因?yàn)樗璧男阅軣o法超越電源障礙。

克服功耗-性能難題是為什么對(duì)處理器角色和 SoC 架構(gòu)采用全新方法的解決方案是有意義的。采用這種新方法需要了解物聯(lián)網(wǎng)端點(diǎn)有三個(gè)工作負(fù)載需要處理才能成功推理。一個(gè)是程序性的,一個(gè)是用于數(shù)字信號(hào)處理的,一個(gè)是執(zhí)行大量的MAC操作。滿足每個(gè)工作負(fù)載獨(dú)特需求的一種方法是在 SoC 中將用于信號(hào)處理和機(jī)器學(xué)習(xí)的雙 MAC 16 位 DSP 和用于程序負(fù)載的 Arm Cortex-M CPU 組合在一起。

這種混合多核架構(gòu)充分利用了 DSP 雙存儲(chǔ)體、零環(huán)路開銷和復(fù)雜地址生成。有了它,可以處理工作負(fù)載的任意組合:例如,網(wǎng)絡(luò)堆棧,RTOS,數(shù)字濾波器,時(shí)頻轉(zhuǎn)換,RNN,CNN以及傳統(tǒng)的類似人工智能的搜索,決策樹和線性回歸。圖 2 顯示了當(dāng) DSP 架構(gòu)優(yōu)勢(shì)發(fā)揮作用時(shí),神經(jīng)網(wǎng)絡(luò)計(jì)算性能如何提高 2 倍甚至 3 倍。

pYYBAGNJCTCAUDVLAAERzsxYMvs002.png

圖 2.矩陣乘法 (NxN) 基準(zhǔn)測(cè)試。

僅靠架構(gòu)更改是不夠的

無論是對(duì)于嵌入式視覺系統(tǒng)還是依賴于顯著提高神經(jīng)網(wǎng)絡(luò)效率的任何其他系統(tǒng),實(shí)施混合多核架構(gòu)都很重要。但是,當(dāng)目標(biāo)是將功耗降至mW范圍時(shí),必須做更多的工作。認(rèn)識(shí)到這一需求,埃塔計(jì)算獲得了專利的連續(xù)電壓和頻率調(diào)節(jié)(CVFS)。

CVFS 克服了動(dòng)態(tài)電壓頻率縮放或 DVFS 遇到的問題。DVFS確實(shí)利用了降低功率的選項(xiàng),即降低電壓。缺點(diǎn)是,當(dāng)執(zhí)行此選項(xiàng)時(shí),最大頻率會(huì)降低。這個(gè)問題將DVFS的有效性固定在一個(gè)狹窄的范圍內(nèi)——一個(gè)由嚴(yán)格限制數(shù)量的預(yù)定義離散電壓電平定義,并束縛在幾百mV的電壓范圍內(nèi)。

相比之下,為了在最有效的電壓下實(shí)現(xiàn)一致的 SoC 操作,CVFS 使用自定時(shí)邏輯。通過自定時(shí)邏輯,每個(gè)器件都可以在連續(xù)的范圍內(nèi)自動(dòng)調(diào)整電壓和頻率。CVFS比DVFS更有效,也比亞閾值設(shè)計(jì)更容易實(shí)施,CVFS在另一個(gè)重要方面也與這些不同。這個(gè)關(guān)鍵的區(qū)別在于,上面提到的混合多核架構(gòu)使CVFS已經(jīng)做的好處成倍增加。

生產(chǎn)級(jí)極致邊緣

極端邊緣的端點(diǎn)(例如用于人員檢測(cè)的端點(diǎn))具有特定需求。雖然已發(fā)布的神經(jīng)網(wǎng)絡(luò)可供任何人用于這些物聯(lián)網(wǎng)端點(diǎn),但它們并未針對(duì)這些需求進(jìn)行優(yōu)先級(jí)排序。使用領(lǐng)先的設(shè)計(jì)技術(shù)優(yōu)化這些網(wǎng)絡(luò)可以解決這個(gè)問題。

除了使用先進(jìn)的設(shè)計(jì)方法外,我們?cè)贓ta計(jì)算中采用的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法還集中在我們的生產(chǎn)級(jí)神經(jīng)傳感器處理器ECM3532上(圖3)。它融合了混合多核架構(gòu)和 CVFS 技術(shù)的所有優(yōu)勢(shì)。

pYYBAGNJCTqAXtnMAAJ3fsSdaPk243.png

圖 3.Eta Compute ECM3532 神經(jīng)傳感器處理器采用混合多核架構(gòu),其中 Arm Cortex-M3 處理器、恩智浦 CoolFlux DSP、512KB 閃存、352KB SRAM 和支持外設(shè)集成在 SoC 中,可實(shí)現(xiàn)在 mW 范圍內(nèi)的極端邊緣進(jìn)行推理。

獲得的知識(shí)

圖4所示的測(cè)試結(jié)果表明,為了將深度學(xué)習(xí)引入嵌入式視覺系統(tǒng),電力成本不必上升到不可接受的水平。雖然沒有一根魔杖可以滿足耗電的神經(jīng)網(wǎng)絡(luò)的需求,但將MCU能效和DSP優(yōu)勢(shì)與網(wǎng)絡(luò)優(yōu)化相結(jié)合的方法可以幫助應(yīng)用程序避免僅依靠云計(jì)算而導(dǎo)致的安全性,延遲和低效率問題。

poYBAGNJCQaAfc1DAABgSkhPLA0472.png

圖 4.在對(duì)人員檢測(cè)模型的測(cè)試中,包括攝像頭在內(nèi)的平均系統(tǒng)功率達(dá)到5.6mW。對(duì)于此測(cè)試,速率為每秒 1.3 次推理,但進(jìn)一步優(yōu)化應(yīng)將平均系統(tǒng)功耗降低到 4mW,同時(shí)將速率提高到每秒 2 次推理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    17985

    瀏覽量

    367320
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2931

    文章

    46264

    瀏覽量

    392909
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    163

    文章

    4598

    瀏覽量

    122948
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    聯(lián)網(wǎng)技術(shù)促進(jìn)能量收集創(chuàng)新應(yīng)用落地

    能量收集并不是一個(gè)時(shí)興的名詞,但是聯(lián)網(wǎng)技術(shù)的進(jìn)步以及諸如Silicon Labs的聯(lián)網(wǎng)產(chǎn)品以及開發(fā)套件,使能量收集技術(shù)的應(yīng)用也
    的頭像 發(fā)表于 07-09 15:07 ?140次閱讀
    <b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>技術(shù)促進(jìn)能量收集創(chuàng)新應(yīng)用落地

    Aux-Think打破視覺語言導(dǎo)航任務(wù)的常規(guī)推理范式

    視覺語言導(dǎo)航(VLN)任務(wù)的核心挑戰(zhàn),是讓機(jī)器人在復(fù)雜環(huán)境中聽懂指令、看懂世界,并果斷行動(dòng)。我們系統(tǒng)性地引入推理任務(wù),探索其在導(dǎo)航策略學(xué)習(xí)中的作用,并首次揭示了VLN中的“推理崩塌”現(xiàn)
    的頭像 發(fā)表于 07-08 10:00 ?133次閱讀
    Aux-Think打破<b class='flag-5'>視覺</b>語言導(dǎo)航任務(wù)的常規(guī)<b class='flag-5'>推理</b>范式

    聯(lián)網(wǎng)藍(lán)牙模塊有哪些優(yōu)勢(shì)?

    的續(xù)航時(shí)間。這對(duì)于需要長(zhǎng)時(shí)間運(yùn)行的聯(lián)網(wǎng)設(shè)備來說,是非常重要的一個(gè)優(yōu)勢(shì)。傳輸距離遠(yuǎn):相較于其他無線通信技術(shù),藍(lán)牙模塊的傳輸距離較遠(yuǎn),可以在100米以內(nèi)的范圍內(nèi)實(shí)現(xiàn)穩(wěn)定的通信。這使得其在
    發(fā)表于 06-28 21:49

    聯(lián)網(wǎng)的應(yīng)用范圍有哪些?

    的應(yīng)用范圍極其廣泛,眾多行業(yè)都在積極引入這項(xiàng)技術(shù),以提升效率、創(chuàng)新業(yè)務(wù)模式。 物流行業(yè):在倉儲(chǔ)環(huán)節(jié),借助聯(lián)網(wǎng)技術(shù),可實(shí)現(xiàn)對(duì)貨物的實(shí)時(shí)監(jiān)測(cè),了解貨物的位置、狀態(tài)等信息,優(yōu)化倉儲(chǔ)空間布局。運(yùn)輸過程中,通過
    發(fā)表于 06-16 16:01

    村田NPO電容在哪些頻率范圍內(nèi)具有較好的性能?

    ,以及其在高頻電路中的應(yīng)用優(yōu)勢(shì)。 村田NPO電容的基本特性 村田NPO電容是一種具有溫度補(bǔ)償特性的單片陶瓷電容器,其填充介質(zhì)由銣、釤和一些其他稀有氧化組成。這種電容器在-55℃到125℃的溫度范圍內(nèi),容量變化為0±30ppm/℃,電容量隨頻率的變
    的頭像 發(fā)表于 03-17 14:50 ?521次閱讀

    蜂窩聯(lián)網(wǎng)怎么選

    的數(shù)據(jù)傳輸速率。有了蜂窩聯(lián)網(wǎng)技術(shù),您就不必在功耗和數(shù)據(jù)傳輸速率之間做出妥協(xié),而是可以兩全其美。 終身成本:雖然某些 LPWAN 技術(shù)的前期成本可能看起來很吸引人,但評(píng)估整個(gè)生命周期的成本(部署
    發(fā)表于 03-17 11:46

    為什么選擇蜂窩聯(lián)網(wǎng)

    、Wi-SUN 或其他 LPWAN 相比,蜂窩聯(lián)網(wǎng)(包括 NB-IoT 和 LTE-M)更適合您的聯(lián)網(wǎng)項(xiàng)目,以下是其中一些關(guān)鍵原因。 許可與非許可頻段: 蜂窩
    發(fā)表于 03-17 11:42

    宇樹科技在聯(lián)網(wǎng)方面

    的發(fā)展,對(duì)傳感器的需求不斷增加且要求越來越高,宇樹科技通過與傳感器公司的合作,不斷優(yōu)化和拓展傳感器技術(shù)在其機(jī)器人產(chǎn)品中的應(yīng)用,使機(jī)器人能夠更好地適應(yīng)各種
    發(fā)表于 02-04 06:48

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    將自然語言理解與運(yùn)動(dòng)規(guī)劃融為一體。這種端到端的方法使機(jī)器人能夠直接從人類指令生成動(dòng)作序列,大幅簡(jiǎn)化了控制流程。該項(xiàng)目的工作流程包含設(shè)計(jì)并封裝一個(gè)人機(jī)器人函數(shù)庫、編寫清晰地描述提示詞、在仿真環(huán)境中執(zhí)行
    發(fā)表于 12-24 15:03

    ad7124上電開啟診斷結(jié)果,顯示LDO不在范圍內(nèi),是哪里出錯(cuò)了?

    上電開啟診斷結(jié)果,并輸出--串口打印顯示 0x80------模擬LDO不在范圍內(nèi) 萬用表實(shí)際測(cè)量有1.89V,是在范圍內(nèi)的; 請(qǐng)問這種情況是芯片壞了?應(yīng)該不是芯片壞了吧。數(shù)據(jù)能輸出
    發(fā)表于 12-19 08:58

    ADS1230怎么處理才能使信號(hào)在芯片量程范圍內(nèi)?

    要用10-15V電壓給重量傳感器,那需要怎么處理才能使信號(hào)在芯片量程范圍內(nèi),加運(yùn)放?且是負(fù)反饋?求高手指教,不勝感激
    發(fā)表于 12-19 07:01

    ADS131A02 0-50的溫度范圍內(nèi),ADC輸出漂移0.1%是怎么回事?

    請(qǐng)問ADS131A02在使用中,增益設(shè)置默認(rèn),當(dāng)ADC輸入3V時(shí),在0℃-50℃范圍內(nèi),MCU讀取到ADS131輸出漂移3mV左右;當(dāng)輸入是0.3V時(shí),漂移量則為0.3mV,請(qǐng)問這個(gè)現(xiàn)象的如何解釋?符合規(guī)格書要求嗎?
    發(fā)表于 11-22 08:15

    中國(guó)蜂窩聯(lián)網(wǎng)連接數(shù)領(lǐng)跑全球

    隨著4G的普及和5G商用化進(jìn)程的加速,與聯(lián)網(wǎng)相結(jié)合的蜂窩聯(lián)網(wǎng)產(chǎn)品逐漸增多,并在全球范圍內(nèi)展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力。
    的頭像 發(fā)表于 11-01 15:32 ?1261次閱讀
    中國(guó)蜂窩<b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>連接數(shù)領(lǐng)跑全球

    全天候全覆蓋的衛(wèi)星通訊方案如何在聯(lián)網(wǎng)系統(tǒng)中應(yīng)用

    、高山等。這使得聯(lián)網(wǎng)系統(tǒng)能夠?qū)崿F(xiàn)全球范圍內(nèi)的設(shè)備連接和數(shù)據(jù)傳輸,無論設(shè)備位于何處都能保持在線。 無縫連接:在多顆衛(wèi)星組成的星座系統(tǒng)下,可以實(shí)現(xiàn)全球范圍內(nèi)的無縫連接。這種連接不受地理位
    的頭像 發(fā)表于 09-30 15:29 ?1651次閱讀
    全天候全覆蓋的衛(wèi)星通訊方案如何在<b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>系統(tǒng)中應(yīng)用

    PCM1794A的INL性能大概在多少lsb范圍內(nèi)?

    請(qǐng)教下PCM1794A的INL性能大概在多少lsb范圍內(nèi)
    發(fā)表于 09-30 06:34