一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Lattice sensAI再獲重大更新

電子工程師 ? 來(lái)源:FPGA設(shè)計(jì)論壇 ? 作者:FPGA設(shè)計(jì)論壇 ? 2020-11-11 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從家庭控制中智能門(mén)鈴和安全攝像頭的存在檢測(cè),到零售應(yīng)用中用于庫(kù)存的對(duì)象計(jì)數(shù),再到工業(yè)應(yīng)用中物體和存在檢測(cè),越來(lái)越多的網(wǎng)絡(luò)邊緣應(yīng)用正在不斷推動(dòng)新型AI解決方案面市。根據(jù)IHS Markit(現(xiàn)Omida)的預(yù)測(cè),2018-2025年物聯(lián)網(wǎng)設(shè)備數(shù)量將達(dá)到400億,截至2022年,所有企業(yè)產(chǎn)生的數(shù)據(jù)中近50%會(huì)在傳統(tǒng)數(shù)據(jù)中心或云端以外的地方進(jìn)行處理。

但與此同時(shí),市場(chǎng)一方面要求設(shè)計(jì)人員開(kāi)發(fā)出性能比以往更高的解決方案;另一方面,延遲、帶寬、隱私、功耗和成本問(wèn)題又限制了他們依賴云的計(jì)算資源來(lái)執(zhí)行分析。如何解決系統(tǒng)對(duì)于日益嚴(yán)格的功耗(毫瓦級(jí))和小尺寸(5mm2到100mm2)要求?如何能夠快速獲得相應(yīng)的硬件和軟件工具、參考設(shè)計(jì)、演示示例和設(shè)計(jì)服務(wù)?萊迪思公司為此做出了有益的嘗試。

圖1 sensAI架構(gòu)框圖

Lattice sensAI再獲重大更新

作為萊迪思推出的業(yè)界第一款用于網(wǎng)絡(luò)邊緣設(shè)備端AI處理的完整解決方案集合,sensAITM提供了供開(kāi)發(fā)人員評(píng)估、開(kāi)發(fā)和部署基于FPGA機(jī)器學(xué)習(xí)/人工智能解決方案所需的全部資源,包括模塊化硬件平臺(tái)、演示示例、參考設(shè)計(jì)、神經(jīng)網(wǎng)絡(luò)IP核、軟件開(kāi)發(fā)工具和定制化設(shè)計(jì)服務(wù)。

2019年上半年,sensAI通過(guò)更新迎來(lái)10倍性能提升,這是由多個(gè)優(yōu)化促成的,包括通過(guò)更新CNN IP和神經(jīng)網(wǎng)絡(luò)編譯器、新增8位激活量化、智能層合并以及雙DSP引擎等特性。而最令人感到興奮的是它新增并優(yōu)化了用于快速實(shí)現(xiàn)網(wǎng)絡(luò)邊緣常見(jiàn)AI應(yīng)用的參考設(shè)計(jì),為關(guān)鍵詞檢測(cè)、人臉識(shí)別、人員偵測(cè)、人員計(jì)數(shù)等賦予了更強(qiáng)大的特性。

圖2 在訓(xùn)練過(guò)程中支持8位量化可在神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過(guò)程中實(shí)現(xiàn)更高的精度

為了演示關(guān)鍵詞檢測(cè)系統(tǒng)的功能,工程師使用了搭載iCE40 UltraPlus FPGA的HiMax HM01B0 UPduino shield開(kāi)發(fā)板。該開(kāi)發(fā)板有兩個(gè)直連到FPGA的I2S麥克風(fēng)、用于FPGA設(shè)計(jì)的外部閃存、權(quán)重激活存儲(chǔ)器、以及LED指示燈用以指示是否檢測(cè)到關(guān)鍵詞。用戶可以直接對(duì)麥克風(fēng)說(shuō)話,一旦檢測(cè)到關(guān)鍵詞,LED就會(huì)亮起。

圖3 關(guān)鍵詞檢測(cè)演示系統(tǒng)

圖4左側(cè)是針對(duì)低功耗運(yùn)行進(jìn)行優(yōu)化、采用CMOS圖像傳感器的人員偵測(cè)演示,通過(guò)VGG8網(wǎng)絡(luò)提供64 x 64 x 3的分辨率,該系統(tǒng)以每秒5幀的速率運(yùn)行,使用iCE40 UltraPlus FPGA功耗僅為7mW;右側(cè)是性能經(jīng)優(yōu)化的人員計(jì)數(shù)應(yīng)用演示,同樣也使用CMOS圖像傳感器,通過(guò)VGG8網(wǎng)絡(luò)提供128 x 128 x 3的分辨率。該演示以每秒30幀的速率運(yùn)行,使用ECP5-85K FPGA功耗為850mW。

圖4 這些參考設(shè)計(jì)展示了sensAI提供的功耗與性能可選方案

Lattice人員識(shí)別參考設(shè)計(jì)方案也應(yīng)用于售賣(mài)機(jī)上檢測(cè)人員的出現(xiàn),喚醒售賣(mài)機(jī)的內(nèi)核。通過(guò)減少非人員靠近造成的誤觸發(fā),或人員路過(guò)造成的誤觸發(fā),達(dá)到減小功耗的目的。

2020年5月,sensAI又成功升級(jí)至3.0版本。

在此前支持ECP5/ECP5-5G和iCE40 UltraPlus 模塊化硬件平臺(tái)的基礎(chǔ)上,新推出的sensAI 3.0版本支持CrossLink-NX系列FPGA,運(yùn)行sensAI軟件的CrossLink-NX FPGA比之前版本降低了一半的功耗,同時(shí)實(shí)現(xiàn)性能翻倍,從而為監(jiān)控/安防、機(jī)器人、汽車和計(jì)算領(lǐng)域的智能視覺(jué)應(yīng)用帶來(lái)功耗和性能上的再次突破。同時(shí),它還擁有定制化卷積神經(jīng)網(wǎng)絡(luò)CNN IP并新增支持MobileNet v2、SSD和ResNet模型,這些靈活的加速器IP可簡(jiǎn)化常見(jiàn)CNN網(wǎng)絡(luò)的實(shí)現(xiàn),經(jīng)優(yōu)化后可更加充分利用FPGA的并行處理能力,開(kāi)發(fā)人員可輕松編譯經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型并將其下載到CrossLink-NX FPGA中。

CrossLink-NX FPGA采用28nm FD-SOI工藝制造,與同類FPGA競(jìng)品相比,功耗可降低75%。在CrossLink-NX FPGA上運(yùn)行解決方案時(shí),sensAI可提供多達(dá)2.5Mb的分布式內(nèi)存、RAM塊以及額外的DSP資源,MIPI I/O提供瞬時(shí)啟動(dòng)的性能可在不到3ms的時(shí)間內(nèi)完成自我配置,而整個(gè)器件的配置也只需8ms。在基于CrossLink-NX的對(duì)象計(jì)數(shù)演示中,——基于VGG的對(duì)象計(jì)數(shù)演示擁有10幀/秒的性能,功耗僅為200mW。

圖6sensAI支持多種AI算法模型

當(dāng)AI遇見(jiàn)超低功耗FPGA

擁有5K LUT的iCE40 UltraPlus FPGA可實(shí)現(xiàn)網(wǎng)絡(luò)邊緣實(shí)時(shí)在線的智能應(yīng)用所需的神經(jīng)網(wǎng)絡(luò)模式匹配。其擁有5280個(gè)4輸入LUT、自定義I/O、多達(dá)80Kb和1Mb的嵌入式存儲(chǔ)器,睡眠電流低至75uA,工作電流僅為1-10mA,功耗低至1mW,硬件平臺(tái)尺寸小至5.5mm2。為了滿足各類應(yīng)用的需求,還采用了包括從專為電子消費(fèi)品和IoT設(shè)備優(yōu)化的超小尺寸2.15 mm x 2.50 mm x 0.45 mm WLCSP封裝,到低成本應(yīng)用的0.5mm間距7x7mm QFN封裝在內(nèi)的多種封裝選項(xiàng)。

功耗優(yōu)化遙遙領(lǐng)先的原因,得益于其采用的分布式異構(gòu)處理(Distributed Heterogenous Processing,DHP)架構(gòu)。由于不使用云端執(zhí)行算法,而是使用內(nèi)置的數(shù)字信號(hào)處理器(DSP)執(zhí)行重復(fù)的數(shù)字處理任務(wù),因此大幅減少了功耗極大的應(yīng)用處理器(AP)的計(jì)算負(fù)載,從而實(shí)現(xiàn)更長(zhǎng)時(shí)間的睡眠模式以延長(zhǎng)電池使用時(shí)間。另一方面,內(nèi)置的神經(jīng)網(wǎng)絡(luò)軟IP和編譯器實(shí)現(xiàn)了靈活的機(jī)器學(xué)習(xí)/人工智能應(yīng)用,消除了云端智能應(yīng)用帶來(lái)的延遲,降低了整個(gè)系統(tǒng)解決方案的成本。

圖7 iCE40 UltraPlus采用的分布式異構(gòu)處理(DHP)架構(gòu)

圖8和圖9描述了不同F(xiàn)PGA之間存在的資源差異如何影響到人臉檢測(cè)和人員檢測(cè)應(yīng)用的性能和功耗。圖8左側(cè)的32x32輸入示例中,橙色部分代表卷積層上運(yùn)行的周期。在四個(gè)示例中,UltraPlus的乘法器數(shù)量最少,其他三片ECP5 FPGA的乘法器數(shù)量依次遞增。隨著乘法器數(shù)量的增加,卷積層所需的周期數(shù)減少;右側(cè)的90x90輸入示例中,在每個(gè)柱形圖的底部有大面積的藍(lán)色區(qū)域。這是由于設(shè)計(jì)更為復(fù)雜,需要占用外部DRAM,性能就有所折中。

圖8 在UltraPlus和ECP5 FPGA上實(shí)現(xiàn)入門(mén)級(jí)和提高級(jí)人臉檢測(cè)時(shí)的性能、功耗和占用面積

人員偵測(cè)應(yīng)用的情況類似,兩組分別采用了64x64輸入和128x128輸入的情況。同樣,較多的乘法器會(huì)減少卷積層的負(fù)擔(dān),而依賴DRAM則會(huì)影響性能。

圖9 在UltraPlus和ECP5 FPGA上實(shí)現(xiàn)簡(jiǎn)單和復(fù)雜人員檢測(cè)時(shí)的性能、功耗和占用面積

其實(shí),設(shè)計(jì)AI模型的最常見(jiàn)做法就是使用處理器,可能是GPU或者DSP,也有可能是微控制器MCU)。不過(guò),低端MCU可能連簡(jiǎn)單的AI模型也無(wú)法處理,高性能處理器又可能會(huì)違反設(shè)備的功耗和成本要求,但這正是低功耗FPGA發(fā)揮作用的地方。與增強(qiáng)處理器來(lái)處理算法的方式不同,萊迪思iCE40 UltraPlus FPGA可以作為MCU的協(xié)處理器,處理MCU無(wú)法解決的復(fù)雜任務(wù)之余,將功耗保持在要求范圍內(nèi)。

另一種思路是將低功耗FPGA作為單獨(dú)運(yùn)行的、完整的AI引擎,此時(shí)FPGA中的DSP就起到了關(guān)鍵作用。即便網(wǎng)絡(luò)邊緣設(shè)備沒(méi)有其他的計(jì)算資源,也可以在不超出功耗、成本或電路板尺寸預(yù)算的情況下添加AI功能,更何況它們還擁有支持快速演進(jìn)算法所需的靈活性和可擴(kuò)展性。

無(wú)論采取哪種方法,都意味著設(shè)計(jì)人員可以采用萊迪思sensAI以及一片低功耗的iCE40 UltraPlus FPGA對(duì)傳感器數(shù)據(jù)進(jìn)行預(yù)處理,從而最大程度地降低了向SoC或云端傳輸數(shù)據(jù)進(jìn)行分析的成本。例如,如果是用在智能門(mén)鈴上,sensAI會(huì)初步讀取來(lái)自圖像傳感器的數(shù)據(jù)。如果判斷為不是人,比如說(shuō)是一只貓,那么系統(tǒng)就不會(huì)喚醒SoC或連接到云端作進(jìn)一步處理。因此,這種方法可以最大程度降低數(shù)據(jù)傳輸成本和功耗。如果預(yù)處理系統(tǒng)判斷門(mén)口的對(duì)象是人,則喚醒SoC作進(jìn)一步處理。這能極大減少系統(tǒng)需要處理的數(shù)據(jù)量,同時(shí)降低功耗要求,這對(duì)于實(shí)時(shí)在線的網(wǎng)絡(luò)邊緣應(yīng)用來(lái)說(shuō)至關(guān)重要。

圖10 基于iCE40 UltraPlus FPGA的sensAI會(huì)預(yù)處理傳感器數(shù)據(jù)以判斷該數(shù)據(jù)是否需要發(fā)送到SoC作進(jìn)一步處理

結(jié)語(yǔ):

萊迪思的FPGA具有獨(dú)特的優(yōu)勢(shì),可以滿足網(wǎng)絡(luò)邊緣設(shè)備快速變化的市場(chǎng)需求。設(shè)計(jì)人員可以在不依賴云端的情況下,快速為網(wǎng)絡(luò)邊緣設(shè)備提供更多計(jì)算資源的其中一個(gè)方法是使用FPGA中本身的并行處理能力來(lái)加速神經(jīng)網(wǎng)絡(luò)性能。此外,通過(guò)使用針對(duì)低功耗運(yùn)行而優(yōu)化的低密度、小尺寸封裝FPGA,設(shè)計(jì)人員可以滿足新的消費(fèi)和工業(yè)應(yīng)用對(duì)功耗和尺寸的嚴(yán)格限制。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22018

    瀏覽量

    616999
  • 探測(cè)系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    60

    瀏覽量

    11502
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8499

    瀏覽量

    134394

原文標(biāo)題:當(dāng)AI遇到FPGA,低功耗智能探測(cè)系統(tǒng)不再是難題

文章出處:【微信號(hào):gh_9d70b445f494,微信公眾號(hào):FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    羅徹斯特電子與Lattice合作,擴(kuò)展對(duì)FPGA產(chǎn)品的支持

    確保對(duì)長(zhǎng)生命周期應(yīng)用的持續(xù)供貨支持 羅徹斯特電子與Lattice達(dá)成合作,向全球客戶供應(yīng)精選的Lattice現(xiàn)場(chǎng)可編程門(mén)陣列產(chǎn)品(FPGA)。 Lattice作為全球領(lǐng)先的可編程邏輯解決方案供應(yīng)商
    的頭像 發(fā)表于 06-10 09:29 ?353次閱讀

    DevEco重大更新快來(lái)體驗(yàn)吧

    HarmonyOS首個(gè)api17 release已經(jīng)正式發(fā)布了。這次的更新DevEco增加了很多重大特性,系統(tǒng)能力也有所增強(qiáng)。DevEco現(xiàn)在支持創(chuàng)建api17的應(yīng)用了,模擬器也首次支持闊折疊手機(jī)
    發(fā)表于 05-17 20:59

    微軟Copilot迎來(lái)重大更新

    “在微軟成立50周年之際,微軟AI首席執(zhí)行官穆斯塔法·蘇萊曼發(fā)布了Copilot的重大更新,這標(biāo)志著人工智能助手進(jìn)入了一個(gè)全新的時(shí)代。穆斯塔法在活動(dòng)中表示:“Copilot不僅僅是一個(gè)AI,它是屬于
    的頭像 發(fā)表于 04-09 16:40 ?357次閱讀

    LibreELEC 12.0.2 為樹(shù)莓派用戶帶來(lái)重大變化!

    LibreELEC12.0.2,一個(gè)開(kāi)源媒體中心,現(xiàn)集成Kodi21.2,從ARM升級(jí)到AArch64,并為RaspberryPi4/5帶來(lái)這些重大更新。在其上一個(gè)12.0.1版本發(fā)布五個(gè)月
    的頭像 發(fā)表于 03-25 09:20 ?420次閱讀
    LibreELEC 12.0.2 為樹(shù)莓派用戶帶來(lái)<b class='flag-5'>重大</b>變化!

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術(shù)的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎(chǔ)模型 (WFM) 的重大更新,該模型引入了開(kāi)放式、可完全定制的物理 AI 開(kāi)發(fā)
    的頭像 發(fā)表于 03-20 19:01 ?845次閱讀

    騰訊AI助手“騰訊元寶”重大更新:支持深度思考功能

    近日,騰訊AI助手“騰訊元寶”再次迎來(lái)了重大更新,為用戶帶來(lái)了更加智能、高效的使用體驗(yàn)。此次更新中,騰訊元寶新增了深度思考功能,這一功能由混元+DeepSeek兩大模型共同支持,用戶只需下載并打開(kāi)
    的頭像 發(fā)表于 02-18 09:21 ?1120次閱讀

    OpenAI更新macOS ChatGPT應(yīng)用,推出“代理”功能實(shí)現(xiàn)無(wú)縫集成

    OpenAI近日宣布,針對(duì)macOS平臺(tái)的ChatGPT應(yīng)用程序迎來(lái)重大更新,此次更新引入了與多種筆記和編碼應(yīng)用程序的無(wú)縫集成功能,極大地提升了用戶體驗(yàn)和工作效率。 此次更新的核心亮點(diǎn)
    的頭像 發(fā)表于 01-02 10:49 ?653次閱讀

    輕舟智航中高階智駕解決方案再獲項(xiàng)目定點(diǎn)

    近日,輕舟智航宣布其基于地平線征程6M打造的中高階智駕解決方案「輕舟乘風(fēng)」正式獲得頭部新勢(shì)力車企量產(chǎn)項(xiàng)目定點(diǎn)。目前,輕舟智航基于征程5的智駕方案已取得規(guī)?;慨a(chǎn)。此次基于征程6M再獲車企量產(chǎn)定點(diǎn),意味著輕舟智航已基于地平線征程平臺(tái)建立面向中高階智駕量產(chǎn)的可靠實(shí)力。
    的頭像 發(fā)表于 12-26 15:26 ?648次閱讀

    ADS6245EVM和Lattice ECP2/M接口演示用戶指南

    電子發(fā)燒友網(wǎng)站提供《ADS6245EVM和Lattice ECP2/M接口演示用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 12-19 14:53 ?0次下載
    ADS6245EVM和<b class='flag-5'>Lattice</b> ECP2/M接口演示用戶指南

    Android 16發(fā)布計(jì)劃曝光,谷歌將同步更新AOSP與Pixel設(shè)備

    。這一消息不僅揭示了谷歌在安卓系統(tǒng)更新策略上的重大調(diào)整,也預(yù)示著安卓用戶將迎來(lái)更為及時(shí)和高效的系統(tǒng)更新體驗(yàn)。
    的頭像 發(fā)表于 11-06 17:05 ?1767次閱讀

    PerfXCloud 重大更新 端側(cè)多模態(tài)模型 MiniCPM-Llama3-V 2.5 閃亮上架

    近日,PerfXCloud完成重大更新,上架了面壁小鋼炮 MiniCPM 系列的端側(cè)多模態(tài)模型 MiniCPM-Llama3-V 2.5,現(xiàn)已對(duì)平臺(tái)用戶免費(fèi)開(kāi)放體驗(yàn)!
    的頭像 發(fā)表于 08-27 18:20 ?778次閱讀
    PerfXCloud <b class='flag-5'>重大</b><b class='flag-5'>更新</b>  端側(cè)多模態(tài)模型 MiniCPM-Llama3-V 2.5 閃亮上架

    Lattice MachXO3 Family默認(rèn)IO上下拉配置

    您好,請(qǐng)問(wèn)下Lattice MachXO3 Family 芯片如何配置unused pin的IO狀態(tài)? 1:通過(guò)《MachXO3 Family Data Sheet》查閱到 During
    發(fā)表于 08-23 12:57

    微軟推出Windows 11重大更新:強(qiáng)化Bug修復(fù),全面升級(jí)功能體驗(yàn)

    近期,微軟向Windows 11的多個(gè)Release預(yù)覽版用戶推送了一系列重要更新,涵蓋Build 26100.1586(針對(duì)24H2版本)、22631.4108(面向23H2版本)以及22621.4108(針對(duì)22H2版本),此次更新聚焦于解決已知漏洞、強(qiáng)化系統(tǒng)穩(wěn)定性,
    的頭像 發(fā)表于 08-20 15:58 ?1471次閱讀

    微軟推出Windows 11的重大更新KB5040529

    微軟今日針對(duì)Windows Insider項(xiàng)目中的Release Preview頻道成員,隆重推出了Windows 11的重大更新——KB5040529,此次更新將系統(tǒng)版本號(hào)躍升至Build 26100.1297,為用戶解鎖了一
    的頭像 發(fā)表于 07-26 14:46 ?1996次閱讀

    理想汽車推出其年度重大軟件更新OTA 6.0版本

    7月15日,理想汽車隆重推出了其年度重大軟件更新——OTA 6.0版本,專為理想MEGA與理想L系列車型量身打造,此次升級(jí)囊括了59項(xiàng)功能創(chuàng)新與52項(xiàng)用戶體驗(yàn)優(yōu)化,標(biāo)志著理想汽車在智能駕駛、智能座艙體驗(yàn)及智能電動(dòng)技術(shù)上的全面飛躍。
    的頭像 發(fā)表于 07-15 15:20 ?1269次閱讀