一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用一顆簡單的MCU,讓深度學(xué)習在網(wǎng)絡(luò)邊緣上跑起來

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-10-30 05:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

就在幾年前,人們普遍認為,機器學(xué)習(ML)甚至深度學(xué)習(DL)只能通過由網(wǎng)關(guān)、邊緣服務(wù)器或數(shù)據(jù)中心執(zhí)行的邊緣訓(xùn)練和推理,在高端硬件上完成。這種想法在當時不無道理,因為在云端和邊緣之間分配計算資源的趨勢尚處于早期發(fā)展階段。但如今,得益于業(yè)界和學(xué)術(shù)界的艱苦研發(fā)和不懈努力,情況已然發(fā)生了翻天覆地的變化。

處理器不必提供每秒數(shù)萬億次操作(TOPS),也能執(zhí)行機器學(xué)習(ML)。越來越多的用例證明,只要使用最新的微控制器(部分帶有嵌入式 ML 加速器),就能在邊緣設(shè)備上開展機器學(xué)習。

只需極低的成本和極低的功耗,這些設(shè)備就能出色地完成 ML,僅在絕對必要時才連接到云。簡而言之,內(nèi)置 ML 加速器的微控制器代表著物聯(lián)網(wǎng)發(fā)展的下一階段:在生產(chǎn)數(shù)據(jù)的源頭,例如麥克風、攝像頭和監(jiān)控其他環(huán)境條件的傳感器中引入智能計算,并使物聯(lián)網(wǎng)應(yīng)用受益。

邊緣有多深?

目前普遍認為邊緣是物聯(lián)網(wǎng)網(wǎng)絡(luò)的最遠點,但通常指先進的網(wǎng)關(guān)或邊緣服務(wù)器。不過,這并不是邊緣的盡頭。真正的盡頭是鄰近用戶的傳感器。所以,合乎邏輯的做法是將盡可能多的分析能力安排在鄰近用戶的位置,而這也正是微處理器所擅長的。

不同寬度乘數(shù)下的多個 MobileNet V1 模型。圖中可見,寬度乘數(shù)對參數(shù)的數(shù)量、計算結(jié)果和精度都有顯著影響。但是,如果只是將寬度乘數(shù)從 1.0 改為 0.75,TOP-1 精度并無太大變化,參數(shù)的數(shù)量和算力需求卻明顯不同。

可以說,單板計算機也能用于邊緣處理,因為它們具有出色的性能,其集群可媲美一臺小型超級計算機。但問題是尺寸依然過大,而且對于大規(guī)模應(yīng)用所需的成百上千次部署而言,成本過于高昂。它們還需要連接外部直流電源,在某些情況下可能超出可用范圍;相比之下,MCU 的功耗只有幾毫瓦,并且可以使用紐扣電池或一些太陽能電池來供電。

毫無意外,用于在邊緣執(zhí)行 ML 的微控制器成為了十分熱門的研發(fā)領(lǐng)域。甚至還有專有名稱——TinyML。TinyML 的目標就是允許在資源受限的小型低功耗設(shè)備(尤其是微控制器),而不是在更大的平臺或云端上執(zhí)行模型推理,甚至最終能實現(xiàn)模型訓(xùn)練。這就需要縮小神經(jīng)網(wǎng)絡(luò)模型的尺寸,以容納這些設(shè)備中相對較少的算力、存儲空間和帶寬資源,同時不會嚴重降低功能性和精度。

這些方案對資源進行了優(yōu)化,使設(shè)備可以采集充足的傳感器數(shù)據(jù)并發(fā)揮恰當作用,同時微調(diào)精度并降低資源要求。因此,雖然數(shù)據(jù)可能仍被發(fā)送到云端(或者可能是先發(fā)送到邊緣網(wǎng)關(guān),然后再發(fā)送到云端),但數(shù)量少得多,因為相當大一部分的分析已經(jīng)完成。

現(xiàn)實中,一個十分常見的 TinyML 用例就是基于攝像頭的對象檢測系統(tǒng),盡管能夠捕獲高分辨率圖像,但由于存儲空間有限,只能降低圖像分辨率??墒?,如果攝像頭內(nèi)置了數(shù)據(jù)分析功能,則只會捕獲所需的對象而非整個場景,而且因為相關(guān)的圖像區(qū)域更小,能保留高分辨率圖像。這種功能通常只見于更大型、性能更強大的設(shè)備,但是 TinyML 技術(shù)使得微控制器也能實現(xiàn)。

小巧卻不簡單!

盡管 TinyML 還只是相對較新的一種范式,但已經(jīng)表現(xiàn)出了不容小覷的推理能力(即便使用的是相對溫和的微控制器)和訓(xùn)練(在性能更強大的微控制器上)成效,且精度損耗控制在最低限度。最近的示例包括:語音和面部識別、語音命令和自然語言處理,甚至同時運行多個復(fù)雜的視覺算法

實際說來,這意味著一臺裝載 500MHz Arm Cortex-M7 內(nèi)核的微控制器,花費不超過 2 美元,內(nèi)存容量從 28 Kb 到 128 KB 不等,卻能提供強大的性能,使傳感器實現(xiàn)真正智能。例如,恩智浦的 i.MX RT 跨界 MCU 就使用運行 TensorFlow Lite 運行時引擎的小型 ML 模型實現(xiàn)了此種性能。以基本對象識別為例,通常在 200ms 內(nèi)即可完成,而且精度接近 95%。

即使在這個價格和性能水平上,這些微處理器配備了多個安全功能(包括 AES-128),并支持多個外部存儲器類型、以太網(wǎng)、USB 和 SPI,同時還包含或支持多種類型的傳感器以及藍牙、Wi-Fi、SPDIF 和 I2C 音頻接口。價格稍高一些的設(shè)備則是通常搭載 1GHz Arm Cortex-M7、400MHz Cortex-M4、2 Mbytes RAM 和圖形加速。采用 3.3 VDC 電源供電時,功耗一般遠低于單板計算機。

TOPS 有意義嗎?

會使用單一指標來評判性能的不僅是消費者;設(shè)計者和市場營銷部門也一直如此,因為作為一項主要規(guī)格,它可以輕松地區(qū)分設(shè)備。一個經(jīng)典示例就是 CPU,多年來人們一直通過時鐘速率來評判性能;幸運的是,現(xiàn)在的設(shè)計者和消費者已不再如此。只用一個指標評定 CPU 性能就像是按照發(fā)動機的峰值轉(zhuǎn)速來評估汽車性能。盡管峰值轉(zhuǎn)速有一定參考意義,但幾乎無法體現(xiàn)發(fā)動機的強勁或汽車的駕駛性能,這些特性取決于許多其他因素。

遺憾的是,同樣的尷尬也發(fā)生在以每秒數(shù)十億次或上萬億次操作來界定的神經(jīng)網(wǎng)絡(luò)加速器(包括高性能 MPU 或微控制器中的加速器),原因一樣,簡單的數(shù)字好記。在實踐中,單獨的 GOPS 和 TOPS 只是相對無意義的指標,代表的是實驗室而非實際操作環(huán)境中的一次測量結(jié)果(毫無疑問是最好的結(jié)果)。例如,TOPS 沒有考慮內(nèi)存帶寬的限制、所需要的 CPU 開支、預(yù)處理和后處理以及其他因素。如果將所有這些和其他因素都一并考慮在內(nèi),例如在實際操作中應(yīng)用于特定電路板時,系統(tǒng)級別的性能或許只能達到數(shù)據(jù)表上 TOPS 值的 50%或 60%。

所有這些數(shù)字都是硬件中的計算單元乘以對應(yīng)的時鐘速率所得到的數(shù)值,而不是需要運行時數(shù)據(jù)已經(jīng)就緒的頻率。如果數(shù)據(jù)一直即時可用,也不存在功耗問題和內(nèi)存限制,并且算法能無縫映射到硬件,則這種統(tǒng)計方式更有參考價值。然而,現(xiàn)實中并沒有這樣理想的環(huán)境。

當應(yīng)用于微控制器中的 ML 加速器時,該指標更沒有價值。這些小型設(shè)備的 GOPS 值通常在 1-3 之間,但仍然能夠提供許多 ML 應(yīng)用中所需要的推理功能。這些設(shè)備也依賴專為低功耗 ML 應(yīng)用而設(shè)計的 Arm Cortex 處理器。除了支持整數(shù)和浮點運算以及微控制器中的許多其他功能之外,TOPS 或其他任何單一指標明顯無法充分定義性能,無論是單獨使用還是在系統(tǒng)中都是如此。

邊緣計算的未來

隨著物聯(lián)網(wǎng)領(lǐng)域進一步發(fā)展,在邊緣執(zhí)行盡可能多的處理,逐漸出現(xiàn)一種需求,即在直接位于或附著于傳感器上的微控制器上執(zhí)行推理。也就是說,微處理器中應(yīng)用處理器和神經(jīng)網(wǎng)絡(luò)加速器的發(fā)展速度十分迅猛,更完善的解決方案也層出不窮??傮w趨勢是將更多以人工智能為中心的功能(例如神經(jīng)網(wǎng)絡(luò)處理)與應(yīng)用處理器一起整合到微處理器中,同時避免功耗或尺寸顯著增加。

如今,可以先在功能更強大的 CPU 或 GPU 上訓(xùn)練模型,然后在使用推理引擎(例如 TensorFlow Lite)的微控制器上實施,從而減小尺寸以滿足微控制器的資源要求。可輕松擴展,以適應(yīng)更高的 ML 要求。相信不久之后,推理和訓(xùn)練就能在這些設(shè)備上同時執(zhí)行,讓微控制器的競爭力直追更大、更昂貴的計算解決方案。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    17981

    瀏覽量

    366776
  • 深度學(xué)習
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122793
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    LED 燈壞一顆全滅?這招故障 “無感自愈”,90% 工程師都在抄!

    想象下:戶外路燈突然熄滅段、汽車尾燈某燈珠罷工、商場LED屏出現(xiàn)暗區(qū)……這些場景的背后,往往是單個LED燈珠的開路故障。LED燈珠串聯(lián)時最怕“一顆崩,全串黑!”熱震、靜電、雷擊隨
    的頭像 發(fā)表于 06-03 09:41 ?280次閱讀
    LED 燈壞<b class='flag-5'>一顆</b>全滅?這招<b class='flag-5'>讓</b>故障 “無感自愈”,90% 工程師都在抄!

    智能車淺談——手把手跑起來(電磁篇)

    前言電磁尋跡小車之前智能車系列已經(jīng)做了個比較詳細的解析,但是美中不足是知識點被拆的太零散,可能對于新手來說不太友好,所以借著有空就再寫點能讓車跑起來的方案。當然,也就僅僅限于可以跑起來
    的頭像 發(fā)表于 05-22 19:32 ?2145次閱讀
    智能車淺談——手把手<b class='flag-5'>讓</b>車<b class='flag-5'>跑起來</b>(電磁篇)

    stm32cubeide生成的lwip網(wǎng)絡(luò)通訊任務(wù)跑起來都很正常,為什么旦加獨立看門狗之后就會卡死呢?

    stm32cubeide生成的lwip網(wǎng)絡(luò)通訊任務(wù)跑起來都很正常,為什么旦加獨立看門狗之后就會卡死?
    發(fā)表于 03-10 07:29

    愛立信如何網(wǎng)絡(luò)運維更簡單

    在愛立信“可編程網(wǎng)絡(luò)”這創(chuàng)新概念里,差異化連接、AI賦能和意圖驅(qū)動、網(wǎng)絡(luò)能力開放作為三大基石,各司其職,網(wǎng)絡(luò)更智能、更靈活、更開放。本期
    的頭像 發(fā)表于 03-03 09:27 ?9817次閱讀

    BP神經(jīng)網(wǎng)絡(luò)深度學(xué)習的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)深度學(xué)習之間存在著密切的關(guān)系,以下是對它們之間關(guān)系的介紹: 、BP神經(jīng)網(wǎng)絡(luò)的基本概念 BP神經(jīng)
    的頭像 發(fā)表于 02-12 15:15 ?855次閱讀

    ADI 的 MAX78002 MCU 開發(fā)邊緣人工智能應(yīng)用

    應(yīng)用能夠在物聯(lián)網(wǎng)設(shè)備運行,而這些設(shè)備通常會受到內(nèi)存、帶寬和功耗的限制。 [Analog Devices, Inc.] 的款微控制器 (MCU) 集成了低功耗卷積神經(jīng)網(wǎng)絡(luò) (CNN)
    的頭像 發(fā)表于 01-26 21:20 ?573次閱讀
    <b class='flag-5'>用</b> ADI 的 MAX78002 <b class='flag-5'>MCU</b> 開發(fā)<b class='flag-5'>邊緣</b>人工智能應(yīng)用

    深度學(xué)習入門:簡單神經(jīng)網(wǎng)絡(luò)的構(gòu)建與實現(xiàn)

    深度學(xué)習中,神經(jīng)網(wǎng)絡(luò)是核心模型。今天我們 Python 和 NumPy 構(gòu)建簡單的神經(jīng)
    的頭像 發(fā)表于 01-23 13:52 ?528次閱讀

    一顆TXB0104可以進行串口電壓轉(zhuǎn)換嗎?

    TXB0104現(xiàn)在有兩對串口 TXD,RXD共4路信號,他們是1.8伏的,需要轉(zhuǎn)成3.3伏的,問一顆TXB0104可以嗎?
    發(fā)表于 01-21 09:01

    邊緣設(shè)備設(shè)計和部署深度神經(jīng)網(wǎng)絡(luò)的實用框架

    ???? 機器學(xué)習深度學(xué)習應(yīng)用程序正越來越多地從云端轉(zhuǎn)移到靠近數(shù)據(jù)源頭的嵌入式設(shè)備。隨著邊緣計算市場的快速擴張,多種因素正在推動邊緣人工智
    的頭像 發(fā)表于 12-20 11:28 ?885次閱讀

    一顆5G的204B接口DA芯片,DA芯片的輸入時鐘大小和輸入數(shù)據(jù)的速率是怎么樣的關(guān)系?

    假設(shè)我一顆5G的204B接口DA芯片,DA芯片的輸入時鐘大小和輸入數(shù)據(jù)的速率是怎么樣的關(guān)系
    發(fā)表于 12-18 07:43

    1X Technologies明示:機器人跑起來

    近日,OpenAI投資的機器人公司1X Technologies(簡稱1X)透露了其機器人研發(fā)的下步計劃。11月23日,1X的AI副總裁Eric Jang在社交媒體發(fā)帖求推薦跑步機,并特別注明
    的頭像 發(fā)表于 11-25 14:40 ?953次閱讀

    一顆射頻開關(guān)的獨白

    轉(zhuǎn)載自——鐘林談芯 一顆射頻開關(guān)成就卓勝微,便催生出一百個卓勝微夢。時代需要榜樣,追夢人在路上。 卓勝微靠著一顆射頻開關(guān)起死回生,靠著一顆射頻開關(guān)成功上市。射頻開關(guān)已經(jīng)不只是代表射頻前端芯片,代表
    的頭像 發(fā)表于 11-14 16:22 ?610次閱讀
    <b class='flag-5'>一顆</b>射頻開關(guān)的獨白

    TAS5711,一顆作2.0輸出,一顆作PBTL輸出,共用個I2S_DATA時發(fā)現(xiàn)失真增大,為什么?

    你們晚上好,請指導(dǎo)解決個問題: 問題描述: 兩TAS5711,一顆設(shè)置為2.0輸出:16W*2CH,一顆設(shè)置為PBTL輸出:36W*1CH,共用
    發(fā)表于 10-25 15:59

    使用 ADI 的 MAX78002 MCU 開發(fā)邊緣 AI 應(yīng)用

    的物聯(lián)網(wǎng)設(shè)備運行。 Analog Devices, Inc. 的微控制器單元 (MCU) 可以通過集成的低功耗卷積神經(jīng)網(wǎng)絡(luò) (CNN) 加速器來解決邊緣處理限制,以處理電池供電設(shè)備
    的頭像 發(fā)表于 10-17 11:39 ?2087次閱讀
    使用 ADI 的 MAX78002 <b class='flag-5'>MCU</b> 開發(fā)<b class='flag-5'>邊緣</b> AI 應(yīng)用

    OPA197如果使用多階,一顆跟隨器提供基準電壓是否可行?

    目前使用該芯片做濾波器性能,每階使用一顆作為跟隨,一顆來做濾波器。 Q1、如果使用多階,一顆跟隨器提供基準電壓是否可行,自測過,覺得不
    發(fā)表于 08-16 15:08