一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在Arm Ethos-U85上使用ExecuTorch

Arm社區(qū) ? 來(lái)源:Arm社區(qū) ? 2025-02-14 14:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 工程部應(yīng)用機(jī)器學(xué)習(xí)總監(jiān) Robert Elliott、Arm 工程部首席工程師 Fredrik Knutsson、Arm 物聯(lián)網(wǎng)事業(yè)部技術(shù)管理總監(jiān) Mark Quartermain

在快速發(fā)展的機(jī)器學(xué)習(xí)領(lǐng)域,PyTorch 憑借其靈活性和全面的生態(tài)系統(tǒng),已成為模型開(kāi)發(fā)的熱門(mén)框架。Arm 與 Meta 合作在 ExecuTorch 中引入了對(duì) Arm 平臺(tái)的支持,進(jìn)一步簡(jiǎn)化了模型算法開(kāi)發(fā)過(guò)程,實(shí)現(xiàn)無(wú)縫在邊緣側(cè)設(shè)備上部署 PyTorch 模型。

ExecuTorch 對(duì) Ethos-U85 的支持

高性能的 Arm Ethos-U85 NPU 可滿足在邊緣側(cè)日益增長(zhǎng)的運(yùn)行先進(jìn)人工智能 (AI) 推理工作負(fù)載的需求,包括諸如大語(yǔ)言模型等基于 Transformer 的網(wǎng)絡(luò)。Arm 針對(duì) Ethos-U 提供參考設(shè)計(jì),如 Arm Corstone-320 物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái),以加速和簡(jiǎn)化芯片開(kāi)發(fā)周期。參考設(shè)計(jì)平臺(tái)中包含固定虛擬平臺(tái) (FVP) 等許多項(xiàng)目,F(xiàn)VP 可仿真整個(gè)系統(tǒng),為 Ethos-U85 平臺(tái)上進(jìn)行前沿的嵌入式軟件開(kāi)發(fā)和神經(jīng)網(wǎng)絡(luò)部署提供支持。

Arm 通過(guò)在 Ethos-U85 上支持 ExecuTorch 測(cè)試版,為開(kāi)發(fā)者構(gòu)建物聯(lián)網(wǎng)邊緣側(cè)應(yīng)用提供了更多支持。開(kāi)發(fā)者可以借助 ExecuTorch,高效地部署原生開(kāi)發(fā)的 PyTorch 模型,基于 Arm 平臺(tái)構(gòu)建出智能且響應(yīng)迅速的物聯(lián)網(wǎng)解決方案。

隨著該軟件包的推出,想要?jiǎng)?chuàng)建邊緣側(cè) AI 應(yīng)用的開(kāi)發(fā)者能夠在平臺(tái)上市前數(shù)月就開(kāi)始模型和應(yīng)用的軟件開(kāi)發(fā)工作。

在 Ethos-U85 上開(kāi)始使用 ExecuTorch

ExecuTorch GitHub 公共代碼倉(cāng)庫(kù)中提供了完整的開(kāi)發(fā)環(huán)境。其中包含一個(gè)集成且經(jīng)過(guò)測(cè)試的開(kāi)發(fā)流程和所有必要組件。

三個(gè)簡(jiǎn)單的步驟如下所示:

設(shè)置 ExecuTorch

https://pytorch.org/executorch/main/getting-started-setup.html

設(shè)置 Arm Build 環(huán)境

https://pytorch.org/executorch/main/executorch-arm-delegate-tutorial.html

在 arm_executor_runner 上編譯并運(yùn)行模型

https://pytorch.org/executorch/main/executorch-arm-delegate-tutorial.html#delegated-quantized-workflow

之后就可以在此流程的基礎(chǔ)上編譯和運(yùn)行模型,從 Ethos-U85 驅(qū)動(dòng)程序采集周期數(shù)信息等運(yùn)行時(shí)行為。

為了讓最終用戶更輕松地完成此過(guò)程,Arm 還向 ExecuTorch 代碼倉(cāng)庫(kù)貢獻(xiàn)了腳本:

設(shè)置 ExecuTorch

setup.sh:下載必要的軟件

https://github.com/pytorch/executorch/blob/main/examples/arm/setup.sh

run.sh:在 Corstone-320 FVP 上編譯并運(yùn)行模型

https://github.com/pytorch/executorch/blob/main/examples/arm/run.sh

要構(gòu)建其他模型,可使用提前編譯器腳本 aot_arm_compiler.py,它能將 PyTorch 項(xiàng)目代碼 (nn.module) 轉(zhuǎn)換為 ExecuTorch 項(xiàng)目代碼(.pte flatbuffer 文件)。

腳本鏈接:

https://github.com/pytorch/executorch/blob/main/examples/arm/aot_arm_compiler.py

要編寫(xiě)使用 ExecuTorch 的自定義應(yīng)用,可以按照示例 executor_runner 應(yīng)用中的應(yīng)用流程進(jìn)行操作。

示例 executor_runner 應(yīng)用鏈接:

https://github.com/pytorch/executorch/tree/main/examples/arm/executor_runner

隨著陸續(xù)支持更多算子,我們將能夠支持更多的 PyTorch 模型。后續(xù)添加的更多功能,將通過(guò) pytorch.org 上的 Ethos-U 教程材料進(jìn)行演示。

Ethos-U 教程:

https://pytorch.org/executorch/main/index.html

部署流程的詳細(xì)工作原理

利用 ExecuTorch 的可擴(kuò)展性和 Arm 的張量算子集架構(gòu) (TOSA) 的特性,Arm 在 ExecuTorch 中實(shí)現(xiàn)了 Ethos-U 支持。Ethos-U 編譯器 Vela 已通過(guò) TOSA 前端得到增強(qiáng),可以為 Ethos-U 系列中的所有產(chǎn)品編譯模型。

為了將這些組件整合為一個(gè)連貫的工作流程,需要遵循以下步驟:

將 PyTorch 模型轉(zhuǎn)換為可部署的 ExecuTorch 程序(AOT 流程)

將 ExecuTorch 程序編譯為可執(zhí)行文件,以便部署在 Corstone-320 上(運(yùn)行時(shí)流程)

ExecuTorch 的 AOT 流程

此過(guò)程首先使用 PyTorch 的dynamo export 功能,將 PyTorch 模型轉(zhuǎn)換為量化的 TOSA 表示。然后,就能利用 Vela 編譯 TOSA 前端生成一組 Ethos-U 機(jī)器指令(稱(chēng)為命令流)。接著,命令流被捆綁到 Executorch 程序中,由 flatbuffer 文件 (.pte) 表示。該文件中包含了 ExecuTorch 運(yùn)行時(shí)使用 Ethos-U 硬件執(zhí)行推理所需的所有內(nèi)容。

c5bf9cb4-ea89-11ef-9310-92fbcf53809c.jpg

ExecuTorch 運(yùn)行時(shí)流程

ExecuTorch 運(yùn)行時(shí)以 C/C++ 編寫(xiě),可支持多種后端。Arm 對(duì) ExecuTorch 運(yùn)行時(shí)進(jìn)行了擴(kuò)展,以包含對(duì) Ethos-U 設(shè)備驅(qū)動(dòng)程序的支持。按照此流程操作,將生成一個(gè)獨(dú)立的經(jīng)過(guò)編譯的可執(zhí)行文件。在 Corstone-320 FVP 上部署可執(zhí)行文件非常簡(jiǎn)單,只需要在調(diào)用 FVP 時(shí)使用適當(dāng)?shù)臉?biāo)志即可。

c5d19e00-ea89-11ef-9310-92fbcf53809c.jpg

Ethos-U85 和 Corstone-320

Ethos-U 系列 NPU 為邊緣側(cè) AI 提供高性能、高能效的解決方案。Ethos-U55(同樣受 ExecuTorch 支持)廣泛應(yīng)用于眾多 Arm Cortex-M 異構(gòu)系統(tǒng),而 Ethos-U65 則將 Ethos-U 系列的適用性擴(kuò)展到基于 Cortex-A 的系統(tǒng),并提升了性能。

Ethos-U85 進(jìn)一步擴(kuò)展了 Ethos-U 產(chǎn)品線,支持當(dāng)前以及未來(lái)更多使用 Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu)的邊緣側(cè)工作負(fù)載。與前代產(chǎn)品相比,Ethos-U85 的性能提升了四倍,能效提高了 20%,在主流神經(jīng)網(wǎng)絡(luò)上的利用率高達(dá) 85%。

Ethos-U85 的顯著特性包括:

配置范圍從 128 到 2048 MAC/周期,在 1GHz 下可提供高達(dá) 4 TOP/s 的性能。

兼容基于 Cortex-A 和 Cortex-M 的系統(tǒng)。

通過(guò)支持 TOSA,對(duì)主要的神經(jīng)網(wǎng)絡(luò)提供原生支持。

可對(duì)主要的神經(jīng)網(wǎng)絡(luò)進(jìn)行全面硬件加速。

完整列表請(qǐng)參閱 Ethos-U85 技術(shù)概述

https://developer.arm.com/documentation/102684/0000

未來(lái)規(guī)劃

Arm 會(huì)陸續(xù)增加新的算子支持,擴(kuò)展 ExecuTorch 核心 ATen 算子的覆蓋范圍,并支持更多模型在 Ethos-U 上運(yùn)行。Arm 將持續(xù)專(zhuān)注于提高性能,以確保模型在 Ethos-U 上高效運(yùn)行。

ExecuTorch 委托框架支持將 Ethos-U 不支持的算子回調(diào)到 CPU 上運(yùn)行,使用參考內(nèi)核執(zhí)行。Arm 致力于使用 CMSIS-NN 在 Cortex-M CPU 上實(shí)現(xiàn)卓越性能,為回調(diào)算子提供更好的支持,并確保在沒(méi)有 Ethos-U 功能的設(shè)備上也能實(shí)現(xiàn)良好性能。

上述的軟件包和 Corstone-320 FVP 是 Arm 在簡(jiǎn)化應(yīng)用開(kāi)發(fā)道路上邁出的又一步,歡迎各位開(kāi)發(fā)者繼續(xù)探索代碼和構(gòu)建過(guò)程,并向 Arm 提供反饋意見(jiàn)。同時(shí),Arm 也致力于支持更多特性和模型,并盡可能充分發(fā)揮硬件性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9349

    瀏覽量

    377303
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279349
  • 開(kāi)發(fā)環(huán)境

    關(guān)注

    1

    文章

    242

    瀏覽量

    17121
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134564

原文標(biāo)題:三步輕松上手!在 Arm Ethos-U85 上使用 ExecuTorch

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    何在STM32實(shí)現(xiàn)USB主機(jī)讀寫(xiě)U盤(pán)文件

    在項(xiàng)目應(yīng)用中,經(jīng)常會(huì)有對(duì)外交換數(shù)據(jù)的需求。USB接口讀寫(xiě)U盤(pán)無(wú)疑是一種頗為方便的選擇。在這一篇中,我們就來(lái)討論如何在STM32實(shí)現(xiàn)USB主機(jī)讀寫(xiě)U盤(pán)文件的方法。
    的頭像 發(fā)表于 12-13 17:20 ?1.6w次閱讀
    如<b class='flag-5'>何在</b>STM32<b class='flag-5'>上</b>實(shí)現(xiàn)USB主機(jī)讀寫(xiě)<b class='flag-5'>U</b>盤(pán)文件

    Arm推動(dòng)生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    等領(lǐng)先企業(yè)均已推出搭載 Ethos-U 的量產(chǎn)芯片。最近,Arm發(fā)布Arm Ethos-U85 AI加速器,這款加速器在性能、算力、應(yīng)用場(chǎng)景方面進(jìn)一步拓展,著
    的頭像 發(fā)表于 04-16 09:10 ?5298次閱讀
    <b class='flag-5'>Arm</b>推動(dòng)生成式AI落地邊緣!全新<b class='flag-5'>Ethos-U85</b> AI加速器支持Transformer 架構(gòu),性能提升四倍

    介紹一種Arm ML嵌入式評(píng)估套件

    是一個(gè)開(kāi)源 Python 工具,可將 TFLite NN 模型編譯為可在包含 Arm Ethos-U NPU 的嵌入式系統(tǒng)運(yùn)行的優(yōu)化版本。您可以通過(guò)運(yùn)行 $pip install
    發(fā)表于 08-12 15:35

    Arm Ethos-U NPU應(yīng)用程序開(kāi)發(fā)概述

    到嵌入式系統(tǒng)中,并使用兩個(gè)Arm連接到嵌入式或外部存儲(chǔ)器AMBA 5 AXI接口,M0和M1。 ?為了優(yōu)化Ethos-U NPU的性能,AXI接口M0應(yīng)連接到高速、低延遲存儲(chǔ)器,如SRAM。內(nèi)存用于
    發(fā)表于 08-02 06:37

    Arm Ethos-U NPU處理器入門(mén)指南

    感謝您使用Arm Ethos-U NPU處理器系列。為您提供最好的使用Arm Ethos-U NPU開(kāi)發(fā)機(jī)器學(xué)習(xí)(ML)應(yīng)用程序的經(jīng)驗(yàn)設(shè)計(jì)我們的工具,使軟件工程變得簡(jiǎn)單高效。此外,
    發(fā)表于 08-08 06:17

    ARM正式發(fā)布了針對(duì)物聯(lián)網(wǎng)設(shè)備的AI芯片設(shè)計(jì)——Cortex-M55

    此外ARM還發(fā)布了一款神經(jīng)處理單元Ethos-U55,Ethos-U55 NPU旨在加快機(jī)器學(xué)習(xí),而U55的設(shè)計(jì)將更加精簡(jiǎn),且只能與較新的Cortex-M處理器(如M55、M33、M7
    的頭像 發(fā)表于 02-13 07:35 ?3502次閱讀

    Arm推出新一代Ethos-U AI加速器及全新物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái)

    Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡(jiǎn)稱(chēng)“Arm”)今日宣布推出 Arm Ethos-U85 神經(jīng)網(wǎng)絡(luò)處理器 (NPU),是
    的頭像 發(fā)表于 04-09 17:02 ?1235次閱讀
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos-U</b> AI加速器及全新物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái)

    Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向AI時(shí)代的高性能需求

    隨著人工智能 (AI) 不斷對(duì)我們的日常生活產(chǎn)生越來(lái)越大的影響,其推理任務(wù)也逐漸從云端遷移到邊緣側(cè)和端側(cè)。
    的頭像 發(fā)表于 04-09 17:04 ?1762次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>:滿足物聯(lián)網(wǎng)面向AI時(shí)代的高性能需求

    Arm發(fā)布第三代NPU,適用于工業(yè)自動(dòng)化等場(chǎng)景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神經(jīng)網(wǎng)絡(luò)以達(dá) 85% 的利用率。其設(shè)計(jì)適配基于 Arm Cortex-M / A 處理器內(nèi)核的系統(tǒng),對(duì)內(nèi)存延遲有較強(qiáng)適應(yīng)性。
    的頭像 發(fā)表于 04-12 16:13 ?1271次閱讀

    Arm推第三代邊緣AI加速器:Arm Ethos-U85

    除了Ethos-U85之外,Arm還推出了全新的物聯(lián)網(wǎng)參考設(shè)計(jì)平臺(tái)Corstone-320。該平臺(tái)將Arm最高性能的Cortex-M85 CPU、Mali-C55圖像信號(hào)處理器和
    發(fā)表于 04-16 11:09 ?987次閱讀
    <b class='flag-5'>Arm</b>推第三代邊緣AI加速器:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國(guó)產(chǎn)CPU市場(chǎng)

    Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?1165次閱讀

    何在DRA821U使用Linux實(shí)現(xiàn)快速引導(dǎo)

    電子發(fā)燒友網(wǎng)站提供《如何在DRA821U使用Linux實(shí)現(xiàn)快速引導(dǎo).pdf》資料免費(fèi)下載
    發(fā)表于 09-03 10:11 ?0次下載
    如<b class='flag-5'>何在</b>DRA821<b class='flag-5'>U</b><b class='flag-5'>上</b>使用Linux實(shí)現(xiàn)快速引導(dǎo)

    ArmExecuTorch合作加速端側(cè)生成式AI實(shí)現(xiàn)

    Arm 正在與 Meta 公司的 PyTorch 團(tuán)隊(duì)攜手合作,共同推進(jìn)新的 ExecuTorch 測(cè)試版 (Beta) 上線,旨在為全球數(shù)十億邊緣側(cè)設(shè)備和數(shù)百萬(wàn)開(kāi)發(fā)者提供人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 功能,進(jìn)而確保 AI 真正的潛力能被最廣泛的設(shè)備和開(kāi)發(fā)者所
    的頭像 發(fā)表于 11-15 11:30 ?790次閱讀

    基于Arm Ethos-U85 NPU部署小語(yǔ)言模型

    隨著人工智能 (AI) 的演進(jìn),人們對(duì)使用小語(yǔ)言模型 (SLM) 在嵌入式設(shè)備執(zhí)行 AI 工作負(fù)載的興趣愈發(fā)高漲。
    的頭像 發(fā)表于 01-20 09:53 ?523次閱讀

    Arm推出全球首個(gè)Armv9邊緣AI計(jì)算平臺(tái)

    全球首個(gè) Armv9 邊緣 AI 計(jì)算平臺(tái)以 Cortex-A320 CPU 和 Ethos-U85 NPU 為核心,專(zhuān)為物聯(lián)網(wǎng)應(yīng)用優(yōu)化,支持運(yùn)行超 10 億參數(shù)的端側(cè) AI 模型,已獲得包括亞馬遜云科技 (AWS)、西門(mén)子和瑞薩電子等在內(nèi)的多家行業(yè)領(lǐng)先企業(yè)的支持。
    的頭像 發(fā)表于 02-27 17:08 ?883次閱讀