一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向AI時(shí)代的高性能需求

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-04-09 17:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能 (AI) 不斷對(duì)我們的日常生活產(chǎn)生越來越大的影響,其推理任務(wù)也逐漸從云端遷移到邊緣側(cè)和端側(cè)。邊緣側(cè)推理為板載設(shè)備引入智能化能力,使數(shù)據(jù)能夠在本地進(jìn)行處理,并實(shí)時(shí)做出決策,同時(shí)提高了數(shù)據(jù)隱私性和安全性。

Arm Ethos NPU

Arm 多年來不斷開發(fā)邊緣 AI 加速器,以滿足邊緣側(cè)和端側(cè)不斷增長(zhǎng)的推理工作負(fù)載需求。此前兩款成功的 NPU 產(chǎn)品 —— Arm Ethos-U55 和 Ethos-U65,為邊緣側(cè)和端側(cè) AI 應(yīng)用帶來了高性能、高能效的解決方案。

Ethos-U55 通常部署在基于 Cortex-M 的異構(gòu)系統(tǒng)中。而 Ethos-U65 則將 Ethos-U 系列的適用性擴(kuò)展到基于 Cortex-A 的系統(tǒng)中,并為設(shè)備上的機(jī)器學(xué)習(xí) (ML) 能力帶來了兩倍的性能提升。這兩款產(chǎn)品均提供統(tǒng)一的工具鏈,可簡(jiǎn)化開發(fā)并支持常見的 ML 神經(jīng)網(wǎng)絡(luò)運(yùn)算,包括卷積神經(jīng)網(wǎng)絡(luò) (CNN) 和循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN)。

Transformer 架構(gòu)的影響

于 2017 年問世的 Transformer 架構(gòu)徹底改變了生成式 AI,并成為許多新型神經(jīng)網(wǎng)絡(luò)的首選架構(gòu)?;?Transformer 架構(gòu)的模型可利用注意力機(jī)制處理序列數(shù)據(jù),并在機(jī)器翻譯、自然語言理解、語音識(shí)別、分割和圖像字幕生成等多項(xiàng) AI 任務(wù)中實(shí)現(xiàn)優(yōu)異的效果。

這些模型可被調(diào)整和壓縮,在不過多影響準(zhǔn)確度的情況下,能高效運(yùn)行于邊緣設(shè)備上,并在許多邊緣側(cè)和端側(cè)用例中發(fā)揮領(lǐng)先的優(yōu)勢(shì)。

全新 Ethos-U85 NPU

依托 Ethos-U 系列 NPU 過往的成功經(jīng)驗(yàn),Arm 推出了全新產(chǎn)品 —— Ethos-U85。該處理器秉承此前 Ethos-U NPU 一貫的高性能、高能效設(shè)計(jì)理念,并可同時(shí)為邊緣側(cè)和端側(cè)設(shè)備上采用 Transformer 架構(gòu)的現(xiàn)有和未來的工作負(fù)載提供支持。

Ethos-U85 是 Arm Ethos-U 產(chǎn)品線中的第三代 NPU,也是迄今為止性能和能效最強(qiáng)的 Ethos NPU。與上一代產(chǎn)品相比,該 NPU 的性能提升了四倍,能效提高了 20%,并且可在主流網(wǎng)絡(luò)上實(shí)現(xiàn)高達(dá) 85% 的利用率。全新 Ethos-U85 可滿足諸如工廠自動(dòng)化和商用或智能家居攝像頭等物聯(lián)網(wǎng)應(yīng)用不斷攀升的性能需求。此外,其專為搭配基于 Cortex-M 或 Cortex-A的系統(tǒng)一同運(yùn)行而設(shè)計(jì),并容忍高 DRAM 延遲。

Ethos-U85 的主要特性包括:

單周期支持從 128 到 2048 個(gè) MAC 單元的配置 —— 在 1GHz 時(shí),算力可支持從 256 GOPS 到 4 TOPS。

支持 int8 權(quán)重和 int8 或 int16 激活。

支持 Transformer 架構(gòu)網(wǎng)絡(luò),以及 CNN 和 RNN。

硬件原生支持 2/4 稀疏性,使吞吐量翻倍。

內(nèi)部 SRAM 為 29 至 267 KB,多達(dá)六個(gè) 128 位 AXI5 接口。

支持權(quán)重壓縮,采用標(biāo)準(zhǔn)和快速權(quán)重編碼器。

支持?jǐn)U展壓縮。

除了 Ethos-U55 和 Ethos-U65 目前支持的算子,通過支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等運(yùn)算,Ethos-U85 涵蓋了對(duì) Transformer 模型和 DeeplabV3 語義分割網(wǎng)絡(luò)的原生硬件支持。

Ethos-U85 也支持元素級(jí)算子鏈化。通過鏈化將元素級(jí)運(yùn)算與先前的運(yùn)算相結(jié)合,使 SRAM 不必先寫入再讀取中間張量。由此可憑借 NPU 和內(nèi)存之間數(shù)據(jù)傳輸量的減少,提高 NPU 的效率。相比于 Ethos-U65,鏈化是 Ethos-U85 在效率提升上的新功能之一,其余還包括快速的權(quán)重編碼器、優(yōu)化的 MAC 陣列能效,以及提升的元素效率。

76e89a6c-f64e-11ee-a297-92fbcf53809c.png

圖:Ethos-U85 系統(tǒng)配置

Ethos-U85 可用于與 Ethos-U55 和 Ethos-U65 相同的系統(tǒng)配置流程,并且我們支持從基于 Cortex-A 的系統(tǒng)直接驅(qū)動(dòng) Ethos-U85 的功能。

Ethos-U85 支持與上一代 Ethos-U 系列產(chǎn)品相同的軟件工具鏈, 即使用 TFLmicro 運(yùn)行時(shí)。此外,在這個(gè)基礎(chǔ)上,Ethos-U85 同時(shí)還能為更廣泛采用 Transformer 架構(gòu)的用例提供支持,這對(duì)于已經(jīng)投入在基于 Cortex-A/Cortex-M 與 Ethos-U55/Ethos-U65 的系統(tǒng)廠商來說,將能擴(kuò)大其過往的投資價(jià)值。未來,我們預(yù)計(jì)將支持面向邊緣設(shè)備的 PyTorch 運(yùn)行時(shí) ExecuTorch。

Ethos-U85 支持的算子將在 NPU 上進(jìn)行加速,對(duì)于特殊算子不支持的情況,其中部分算子將調(diào)用 CMSIS-NN 庫實(shí)現(xiàn)在 Cortex-M系統(tǒng)上進(jìn)行加速。例如,在 tinyLlama 的用例中,該模型算子可完全映射到 Ethos-U85,沒有算子回退到 CPU。

Ethos-U85 擔(dān)任了 Arm 全新物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái) Corstone-320 的核心角色,該參考設(shè)計(jì)平臺(tái)加快了各類 AIoT 解決方案中高性能 SoC 的開發(fā)和部署。

釋放邊緣 AI 的無限潛力

Ethos-U85 將提供在邊緣側(cè)和端側(cè)設(shè)備上執(zhí)行領(lǐng)先 AI 功能所需的算力。隨著 AI 時(shí)代的不斷發(fā)展,我們的合作伙伴將獲得基于 Arm Ethos-U 的可靠、高效兼具高性能的解決方案。我們預(yù)計(jì)在新興的邊緣 AI 用例、智能家居、零售或工業(yè)場(chǎng)景中看到 Ethos-U85 被廣泛部署,這些用例和場(chǎng)景需要更高的計(jì)算性能,并支持新型的 AI 框架。

Arm 引以為傲的是,我們不斷通過前沿的軟硬件解決方案,為合作伙伴與生態(tài)系統(tǒng)提供強(qiáng)而有力的支持。全新 Ethos-U85 的推出將釋放邊緣側(cè)和端側(cè) AI 推理用例的無限潛能,從而改變世界。Arm 正在引領(lǐng)邊緣 AI 的創(chuàng)新提升至全新水平,并持續(xù)夯實(shí) Arm 成為未來邊緣 AI 的基石。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • sram
    +關(guān)注

    關(guān)注

    6

    文章

    786

    瀏覽量

    115983
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2931

    文章

    46251

    瀏覽量

    392742
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249628
  • Cortex-M
    +關(guān)注

    關(guān)注

    2

    文章

    231

    瀏覽量

    30391
  • AI加速器
    +關(guān)注

    關(guān)注

    1

    文章

    70

    瀏覽量

    9097

原文標(biāo)題:Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向 AI 時(shí)代的高性能需求

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    香橙派發(fā)布RISC-V高性能智能網(wǎng)關(guān)解決方案OrangePi R2S,賦能智能家居和工業(yè)互聯(lián)網(wǎng)

    OrangePiR2S,該板基于開芯微KyX18核RISC-VAI處理器,在算力、能效和接口配置等方面均達(dá)到業(yè)界領(lǐng)先水平,旨在滿足聯(lián)網(wǎng)應(yīng)用的高性能需求。面對(duì)AIoT
    的頭像 發(fā)表于 06-06 17:29 ?563次閱讀
    香橙派發(fā)布RISC-V<b class='flag-5'>高性能</b>智能網(wǎng)關(guān)解決方案OrangePi R2S,賦能智能家居和工業(yè)互<b class='flag-5'>聯(lián)網(wǎng)</b>

    聯(lián)網(wǎng)工程師為什么要學(xué)Linux?

    聯(lián)網(wǎng)工程師需要掌握Linux的主要原因可以從技術(shù)生態(tài)、開發(fā)需求、行業(yè)應(yīng)用及就業(yè)競(jìng)爭(zhēng)力四個(gè)角度來分析: 一、技術(shù)生態(tài)與行業(yè)適配性 1)嵌入式開發(fā)的主流平臺(tái)
    發(fā)表于 05-26 10:32

    Synaptics發(fā)布高性能AI MCU,推動(dòng)邊緣計(jì)算新突破

    新突思科技發(fā)布SR系列高性能自適應(yīng)微控制器(MCU),基于Astra?原生AI平臺(tái),專為邊緣AI情境感知設(shè)計(jì)。該系列支持三種功耗模式(性能、超低功耗、持續(xù)運(yùn)行),搭載
    的頭像 發(fā)表于 04-23 10:00 ?541次閱讀
    Synaptics發(fā)布<b class='flag-5'>高性能</b><b class='flag-5'>AI</b> MCU,推動(dòng)邊緣計(jì)算新突破

    ESP32-C3FH4:高性能聯(lián)網(wǎng)芯片的卓越之選,智能門鎖安防等應(yīng)用

    防護(hù),滿足聯(lián)網(wǎng)設(shè)備安全需求 低功耗設(shè)計(jì):多種省電模式延長(zhǎng)電池設(shè)備使用壽命 ESP32-C3FH4以其出色的性能參數(shù)和廣泛的應(yīng)用適應(yīng)性,
    發(fā)表于 04-03 11:41

    Nordic nRF54 系列芯片:開啟 AI聯(lián)網(wǎng)時(shí)代?

    ,在保證性能的同時(shí)實(shí)現(xiàn)了成本的有效控制。? Nordic nRF54 系列芯片憑借其在 AI 機(jī)器學(xué)習(xí)和聯(lián)網(wǎng)領(lǐng)域的卓越表現(xiàn),正引領(lǐng)著行業(yè)的發(fā)展潮流。無論是追求
    發(fā)表于 04-01 00:18

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    選擇無擁塞路徑,提高數(shù)據(jù)傳輸效率。 多租戶性能隔離:確保不同用戶任務(wù)之間帶寬分配合理。 飛速(FS)800G光模塊在AI數(shù)據(jù)中心中的作用 為滿足AI和大規(guī)模數(shù)據(jù)中心的帶寬
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開發(fā)者和企業(yè)用戶對(duì)高性能、低功耗和靈活擴(kuò)展的需求。 [](
    發(fā)表于 03-19 17:54

    MediaTek發(fā)布全新高性能邊緣AI聯(lián)網(wǎng)芯片

    在國際嵌入式展(EMBEDDED WORLD)上, MediaTek 發(fā)布高性能邊緣 AI 聯(lián)網(wǎng)芯片 Genio 720 和 Genio 520。作為 Genio 智能
    的頭像 發(fā)表于 03-12 16:21 ?526次閱讀

    Arm 推出 Armv9 邊緣 AI 計(jì)算平臺(tái),以超高能效與先進(jìn) AI 能力賦能聯(lián)網(wǎng)革新

    架構(gòu)的超高能效 CPU——Arm Cortex-A320 以及對(duì) Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣AI 計(jì)算平臺(tái),可支持運(yùn)行超
    的頭像 發(fā)表于 03-06 11:43 ?1332次閱讀
    <b class='flag-5'>Arm</b> 推出 Armv9 邊緣 <b class='flag-5'>AI</b> 計(jì)算平臺(tái),以超高能效與先進(jìn) <b class='flag-5'>AI</b> 能力賦能<b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b>革新

    Arm推出全球首個(gè)Armv9邊緣AI計(jì)算平臺(tái)

    全球首個(gè) Armv9 邊緣 AI 計(jì)算平臺(tái)以 Cortex-A320 CPU 和 Ethos-U85 NPU 為核心,專為聯(lián)網(wǎng)應(yīng)用優(yōu)化,支持運(yùn)行超 10 億參數(shù)的端側(cè)
    的頭像 發(fā)表于 02-27 17:08 ?889次閱讀

    如何在Arm Ethos-U85上使用ExecuTorch

    在快速發(fā)展的機(jī)器學(xué)習(xí)領(lǐng)域,PyTorch 憑借其靈活性和全面的生態(tài)系統(tǒng),已成為模型開發(fā)的熱門框架。Arm 與 Meta 合作在 ExecuTorch 中引入了對(duì) Arm 平臺(tái)的支持,進(jìn)一步簡(jiǎn)化了模型算法開發(fā)過程,實(shí)現(xiàn)無縫在邊緣側(cè)設(shè)備上部署 PyTorch 模型。
    的頭像 發(fā)表于 02-14 14:23 ?645次閱讀
    如何在<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>上使用ExecuTorch

    基于Arm Ethos-U85 NPU部署小語言模型

    隨著人工智能 (AI) 的演進(jìn),人們對(duì)使用小語言模型 (SLM) 在嵌入式設(shè)備上執(zhí)行 AI 工作負(fù)載的興趣愈發(fā)高漲。
    的頭像 發(fā)表于 01-20 09:53 ?555次閱讀

    國產(chǎn)固態(tài)繼電器如何滿足聯(lián)網(wǎng)應(yīng)用的需求

    聯(lián)網(wǎng)(IoT)的快速發(fā)展徹底改變了從智能家居到工業(yè)自動(dòng)化等各個(gè)行業(yè)。由于聯(lián)網(wǎng)系統(tǒng)需要高效、可靠且緊湊的組件來處理眾多傳感器、執(zhí)行器和通信設(shè)備,國產(chǎn)固態(tài)繼電器(SSR)已成為
    的頭像 發(fā)表于 01-03 15:57 ?700次閱讀

    高通推出面向AI時(shí)代的全新工業(yè)聯(lián)網(wǎng)產(chǎn)品組合

    AI解決方案,從而在AI時(shí)代占據(jù)領(lǐng)先地位。作為解決工業(yè)需求的關(guān)鍵舉措,全新工規(guī)級(jí)處理器產(chǎn)品組合高通IQ系列面向最具挑戰(zhàn)性的安全級(jí)工作環(huán)境而設(shè)
    的頭像 發(fā)表于 11-08 10:22 ?689次閱讀

    ARM開發(fā)板在聯(lián)網(wǎng)中的應(yīng)用

    于需要長(zhǎng)時(shí)間運(yùn)行且能源有限的聯(lián)網(wǎng)設(shè)備來說至關(guān)重要。低功耗意味著更長(zhǎng)的電池壽命和更低的運(yùn)營(yíng)成本。 2. 高性能 ARM處理器提供了高性能的處
    的頭像 發(fā)表于 11-05 11:38 ?1168次閱讀