一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)嵌入式神經(jīng)網(wǎng)絡(luò)的現(xiàn)實(shí)

石飛鵬 ? 來源:CZM陳先生123 ? 作者:CZM陳先生123 ? 2022-07-15 16:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關(guān)于將人工智能用于越來越智能的車輛的文章已經(jīng)很多。但是,您如何將在服務(wù)器場上開發(fā)的神經(jīng)網(wǎng)絡(luò) (NN) 壓縮到量產(chǎn)汽車中資源受限的嵌入式硬件中呢?本文探討了我們應(yīng)該如何授權(quán)汽車生產(chǎn) AI 研發(fā)工程師在將 NN 從原型到生產(chǎn)的整個過程中改進(jìn) NN,而不是像今天過早地將 NN 移交給嵌入式軟件團(tuán)隊的過程。

“如果我們要充分利用嵌入式硬件資源,我們需要讓生產(chǎn) AI 團(tuán)隊在軟件移植過程中利用他們對 NN 的知識”(來源:Marton Feher,SVP 硬件工程,AImotive)

嵌入式人工智能:嵌入式軟件——但不是我們所知道的

對于任何注定要在批量生產(chǎn)中部署的嵌入式軟件,一旦完成并驗(yàn)證了其核心功能的實(shí)現(xiàn),就會在代碼中投入大量精力。這個優(yōu)化階段是關(guān)于最小化所需的內(nèi)存、CPU 和其他資源,以便盡可能多地保留軟件功能,同時將執(zhí)行它所需的資源減少到絕對最低限度。

這種從基于實(shí)驗(yàn)室的算法創(chuàng)建嵌入式軟件的過程使生產(chǎn)工程師能夠?qū)④浖δ艹杀竟こ袒癁榭闪慨a(chǎn)的形式,與用于開發(fā)它的海量計算數(shù)據(jù)中心相比,所需的芯片和硬件更便宜、功能更差。但是,它通常需要從一開始就凍結(jié)功能,只進(jìn)行代碼修改以改進(jìn)算法本身的執(zhí)行方式。對于大多數(shù)軟件來說,這很好:確實(shí),它可以使用嚴(yán)格的驗(yàn)證方法來確保嵌入過程保留所需的所有功能。

然而,當(dāng)嵌入基于 NN 的 AI 算法時,這可能是一個主要問題。為什么?因?yàn)閺囊婚_始就凍結(jié)功能,您正在刪除可以優(yōu)化執(zhí)行的主要方法之一。

問題是什么?

有兩種根本不同的方法可以解決將復(fù)雜的 NN 從實(shí)驗(yàn)室中不受約束、資源豐富的 NN 訓(xùn)練環(huán)境移植到受嚴(yán)格約束的嵌入式硬件平臺的任務(wù):

優(yōu)化執(zhí)行NN的代碼

優(yōu)化神經(jīng)網(wǎng)絡(luò)本身

當(dāng)嵌入式軟件工程師發(fā)現(xiàn)性能問題,例如內(nèi)存帶寬瓶頸或底層嵌入式硬件平臺利用率低下時,傳統(tǒng)的嵌入式軟件技術(shù)會鼓勵您深入挖掘底層代碼并找出問題所在。

這反映在當(dāng)今可用于嵌入式MCUDSP的許多先進(jìn)而復(fù)雜的工具中。它們使您能夠了解軟件中正在發(fā)生的事情的最低水平,并識別和改進(jìn)軟件本身的執(zhí)行——希望不會改變其功能。

對于神經(jīng)網(wǎng)絡(luò)來說,優(yōu)化與傳統(tǒng)的嵌入式軟件完全不同——至少如果你想用可用的硬件資源實(shí)現(xiàn)盡可能最佳的結(jié)果。對于神經(jīng)網(wǎng)絡(luò),通過改變拓?fù)渖窠?jīng)網(wǎng)絡(luò)本身(神經(jīng)網(wǎng)絡(luò)的各個層如何連接,以及每個層做什么)和使用更新的約束和輸入重新訓(xùn)練來實(shí)現(xiàn)改進(jìn)。這是因?yàn)楣δ懿皇怯缮窠?jīng)網(wǎng)絡(luò)“軟件”定義的,而是在訓(xùn)練期間應(yīng)用的目標(biāo)和約束,以創(chuàng)建定義神經(jīng)網(wǎng)絡(luò)最終行為的權(quán)重。

因此,在執(zhí)行神經(jīng)網(wǎng)絡(luò)的嵌入過程時,需要凍結(jié)神經(jīng)網(wǎng)絡(luò)的目標(biāo)性能,而不是如何實(shí)現(xiàn)它。如果您從嵌入過程開始就約束神經(jīng)網(wǎng)絡(luò)拓?fù)?,那么您就是在刪除生產(chǎn)工程師需要的提高性能的工具。

這意味著您需要新的不同工具來完成將NNs從實(shí)驗(yàn)室移植到嵌入式平臺的任務(wù)。低級軟件工程師無法完成這項(xiàng)工作——你需要人工智能工程師根據(jù)工具提供的性能信息來調(diào)整神經(jīng)網(wǎng)絡(luò)及其訓(xùn)練。這是新的:當(dāng)研發(fā)工程師將經(jīng)過培訓(xùn)的神經(jīng)網(wǎng)絡(luò)交給生產(chǎn)工程師時,他們再也不能說“工作完成了”!

不同的方法

通過采用將 AI 研發(fā)工程師置于嵌入式軟件移植任務(wù)中心的開發(fā)工作流程,任何芯片都可以實(shí)現(xiàn)卓越的結(jié)果。使用以層為中心的分析,輔以從編譯改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò) (CNN) 到查看目標(biāo)神經(jīng)處理器單元 (NPU) 的準(zhǔn)確性能結(jié)果的幾分鐘內(nèi)快速周轉(zhuǎn),開發(fā)人員可以使用相同的底層硬件實(shí)現(xiàn) 100% 或更多的增益. 這是因?yàn)樾薷?CNN 本身,而不是只修改用于執(zhí)行相同 CNN 的代碼,為 AI 工程師提供了更大的靈活性來識別和實(shí)施性能改進(jìn)。

在開發(fā)我們的 aiWare NPU 時,AImotive 使用了我們自己的 AI 工程師將移植過程移植到具有廣泛 NPU 功能的多個不同芯片的經(jīng)驗(yàn)。我們希望找到更好的方法來幫助我們自己的 AI 工程師完成這項(xiàng)任務(wù),因此在開發(fā)我們對 aiWare NPU 本身和支持它的 aiWare Studio 工具的要求時,我們確定了我們在過去的:

高度確定性的 NPU 架構(gòu),使時序非常可預(yù)測

準(zhǔn)確的基于層(不是基于時序或低級代碼)的性能估計,以便任何 AI 研發(fā)工程師都可以看到更改其訓(xùn)練標(biāo)準(zhǔn)(例如添加或更改使用的場景,或修改目標(biāo) KPI)的影響; / 或 NN 拓?fù)淇焖?/p>

準(zhǔn)確的離線性能估計,以便在第一個硬件可用之前執(zhí)行所有 NN 優(yōu)化(因?yàn)榈谝粋€原型總是稀缺的?。?/p>

點(diǎn)擊查看完整大小的圖片

poYBAGG3EIKAVGprABB3v6LafIM851.png


圖 1:aiWare Studio 使用戶能夠優(yōu)化他們的 NN,而不是用于執(zhí)行它們的代碼。這為 AI 設(shè)計人員提供了更大的靈活性,可以更快地實(shí)現(xiàn)出色的結(jié)果。(來源:AImotive)

結(jié)果是一組工具使 AI 研發(fā)工程師能夠在實(shí)驗(yàn)室環(huán)境中對目標(biāo)硬件進(jìn)行幾乎所有優(yōu)化,并在最終目標(biāo)硬件的 5% 范圍內(nèi)展示性能——這一切都在任何人看到硬件之前完成。

最終檢查

當(dāng)然,在芯片和硬件原型可用時測量最終硬件至關(guān)重要。這種開發(fā)環(huán)境中實(shí)時硬件分析功能的可用性使工程師能夠訪問由此類工具支持的 NPU 內(nèi)的一系列深度嵌入式硬件寄存器和計數(shù)器。雖然芯片開銷很小(因?yàn)樵S多 NPU 主要由內(nèi)存而非邏輯控制),但這些功能可以在執(zhí)行期間實(shí)現(xiàn)前所未有的、非侵入式的實(shí)時性能測量。然后可以將其用于直接與離線性能估計器結(jié)果進(jìn)行比較,以確認(rèn)準(zhǔn)確性。

點(diǎn)擊查看完整大小的圖片

poYBAGG3EIWAUiOjABWWAeWEhuU271.png


圖 2:使用嵌入式寄存器和計數(shù)器,aiWare Studio 可以準(zhǔn)確測量最終芯片性能,與離線估計結(jié)果相比,通常在 1%-5% 以內(nèi)。(來源:AImotive 和 Nextchip Co. Ltd)

結(jié)論

這種新方法為汽車行業(yè)提供了一種新的、更好的方式來開發(fā)、優(yōu)化和在生產(chǎn)車輛中部署人工智能。使用協(xié)同 NPU 硬件和工具,人工智能工程師可以為汽車應(yīng)用設(shè)計、實(shí)施和優(yōu)化更好的 CNN。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5152

    文章

    19675

    瀏覽量

    317662
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103654
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280046
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    ETAS全新的嵌入式AI解決方案

    “將訓(xùn)練后的AI神經(jīng)網(wǎng)絡(luò)模型,自動化生成安全且高效的C代碼,用于嵌入式系統(tǒng)” ,近日ETAS攜全新的智能化工具Embedded AI Coder亮相2025上海國際車展。
    的頭像 發(fā)表于 05-07 11:43 ?687次閱讀
    ETAS全新的<b class='flag-5'>嵌入式</b>AI解決方案

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的比較

    BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)在多個方面存在顯著差異,以下是對兩者的比較: 一、結(jié)構(gòu)特點(diǎn) BP神經(jīng)網(wǎng)絡(luò) : BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 02-12 15:53 ?673次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)分析

    BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)作為一種常用的機(jī)器學(xué)習(xí)模型,具有顯著的優(yōu)點(diǎn),同時也存在一些不容忽視的缺點(diǎn)。以下是對BP神經(jīng)網(wǎng)絡(luò)優(yōu)缺點(diǎn)的分析: 優(yōu)點(diǎn)
    的頭像 發(fā)表于 02-12 15:36 ?926次閱讀

    什么是BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法

    BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法(Backpropagation Algorithm)是一種用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的有效方法。以下是關(guān)于BP神經(jīng)網(wǎng)絡(luò)的反向傳播算法的介紹: 一、基本概念 反向傳播算法是BP
    的頭像 發(fā)表于 02-12 15:18 ?775次閱讀

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)之間存在著密切的關(guān)系,以下是對它們之間關(guān)系的介紹: 一、BP神經(jīng)網(wǎng)絡(luò)的基本概念 BP神經(jīng)網(wǎng)絡(luò),即反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural N
    的頭像 發(fā)表于 02-12 15:15 ?863次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識和多種算法。在本文中,我們會介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工神經(jīng)網(wǎng)絡(luò) ? 人工神經(jīng)網(wǎng)絡(luò)模型之所
    的頭像 發(fā)表于 01-09 10:24 ?1209次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的比較

    在深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)模型被廣泛應(yīng)用于各種任務(wù),如圖像識別、自然語言處理和游戲智能等。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)是兩種常見的模型。 1. 結(jié)構(gòu)差異 1.1 傳統(tǒng)神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-15 14:53 ?1878次閱讀

    RNN模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)領(lǐng)域中的一種強(qiáng)大工具,它們能夠模擬人腦處理信息的方式。隨著技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的類型也在不斷增加,其中循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(如前饋
    的頭像 發(fā)表于 11-15 09:42 ?1133次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與工作機(jī)制

    LSTM(Long Short-Term Memory,長短期記憶)神經(jīng)網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),設(shè)計用于解決長期依賴問題,特別是在處理時間序列數(shù)據(jù)時表現(xiàn)出色。以下是LSTM神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-13 10:05 ?1632次閱讀

    Moku人工神經(jīng)網(wǎng)絡(luò)101

    Moku3.3版更新在Moku:Pro平臺新增了全新的儀器功能【神經(jīng)網(wǎng)絡(luò)】,使用戶能夠在Moku設(shè)備上部署實(shí)時機(jī)器學(xué)習(xí)算法,進(jìn)行快速、靈活的信號分析、去噪、傳感器調(diào)節(jié)校準(zhǔn)、閉環(huán)反饋等應(yīng)用。如果您
    的頭像 發(fā)表于 11-01 08:06 ?667次閱讀
    Moku人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>101

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計,通過輕量級的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)車牌識別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計提高了識別的實(shí)時性和準(zhǔn)確性
    發(fā)表于 10-10 16:40

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)算法開發(fā)環(huán)境搭建

    download_model.sh 腳本,該腳本 將下載一個可用的 YOLOv5 ONNX 模型,并存放在當(dāng)前 model 目錄下,參考命令如下: 安裝COCO數(shù)據(jù)集,在深度神經(jīng)網(wǎng)絡(luò)算法中,模型的訓(xùn)練離不開大量的數(shù)據(jù)集,數(shù)據(jù)集用于神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。
    發(fā)表于 10-10 09:28

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】開箱報告

    /Linux Buildroot是一個輕量級的、針對嵌入式Linux系統(tǒng)的交叉編譯工具鏈和根文件系統(tǒng)生成器。 較比Unbuntu系統(tǒng)、Debian系統(tǒng)來說開發(fā)起來較為麻煩。Builroot系統(tǒng)缺少很多
    發(fā)表于 10-10 09:22

    matlab 神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析

    matlab神經(jīng)網(wǎng)絡(luò) 數(shù)學(xué)建模數(shù)值分析 精通的可以討論下
    發(fā)表于 09-18 15:14

    嵌入式linux開發(fā)的基本步驟有哪些?

    嵌入式Linux開發(fā)是一個復(fù)雜的過程,涉及到硬件選擇、操作系統(tǒng)移植、驅(qū)動開發(fā)、應(yīng)用程序開發(fā)等多個方面。以下是嵌入式Linux
    的頭像 發(fā)表于 09-02 09:11 ?1255次閱讀