一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

靈活應(yīng)變的計(jì)算平臺滿足嵌入式AI的要求

4dD0_chinacmos ? 來源:未知 ? 作者:工程師曾玲 ? 2018-10-02 09:45 ? 次閱讀

人工智能新興應(yīng)用通過帶可配置加速的片上系統(tǒng)器件來滿足日益嚴(yán)格的性能和效率需求

隨著智能安全、機(jī)器人無人駕駛汽車等應(yīng)用越來越依靠嵌入式人工智能技術(shù)來提高性能,交付全新的用戶體驗(yàn),傳統(tǒng)計(jì)算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實(shí)際要求。推斷引擎必須滿足嚴(yán)格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進(jìn)行調(diào)整優(yōu)化。我們需要靈活應(yīng)變的計(jì)算平臺來滿足運(yùn)行一流卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的嵌入式 AI 的要求。

放眼未來,適應(yīng)于更多前沿神經(jīng)網(wǎng)絡(luò)的靈活性是我們的主要關(guān)注點(diǎn)。今天廣受歡迎的 CNN 正加速被新型的先進(jìn)架構(gòu)所取代。然而,傳統(tǒng)的 SoC 設(shè)計(jì)要使用當(dāng)前的神經(jīng)網(wǎng)絡(luò)架構(gòu)知識,從開發(fā)開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經(jīng)網(wǎng)絡(luò)可能會讓傳統(tǒng) SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預(yù)見的未來不斷提升的需求,就必須采用更加靈活的自適應(yīng)計(jì)算平臺。我們可利用用戶可配置的多核片上系統(tǒng) (MPSoC) 器件,整合主應(yīng)用處理器和可擴(kuò)展的可編程邏輯結(jié)構(gòu),包含可配置的存儲器架構(gòu)和滿足可變精度推斷所需的信號處理技術(shù),從而滿足上述要求。

推斷精度

在傳統(tǒng)的 SoC 中,決定性能的特性如存儲器架構(gòu)和計(jì)算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優(yōu)化至晶體管層面,這就能根據(jù)需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計(jì)算。

能自由優(yōu)化推斷精度,根據(jù)平方律提供剛好滿足需求的計(jì)算效率,也就是說單位的運(yùn)算用 1 位核心執(zhí)行,相對于用 8 位核心完成相同計(jì)算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經(jīng)網(wǎng)絡(luò)的每層做出不同優(yōu)化,從而以最大的效率提供所需的性能。

存儲器架構(gòu)

除了通過改變推斷精度來提高計(jì)算效率之外,配置可編程片上存儲器的帶寬和結(jié)構(gòu)能進(jìn)一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運(yùn)行相同推斷引擎的傳統(tǒng)計(jì)算平臺而言,片上存儲器可能達(dá)到 4 倍多,存儲器—接口帶寬可能達(dá)到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優(yōu)化芯片資源的利用率。此外,典型的子系統(tǒng)只有有限的片上集成高速緩存,必須與片外存儲設(shè)備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數(shù)存儲器交換都在片上進(jìn)行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯片面積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機(jī)、機(jī)器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結(jié)構(gòu)上實(shí)現(xiàn)的推斷引擎可能僅占用傳統(tǒng) SoC 八分之一的芯片面積,這就能讓開發(fā)人員在更小的器件中構(gòu)建功能更強(qiáng)大的引擎。

此外,MPSoC 器件系列為設(shè)計(jì)人員提供了實(shí)現(xiàn)推斷引擎的豐富選擇,能支持最節(jié)能、成本效率最高、面積占用最小的方案,從而滿足系統(tǒng)性能要求。一些通過汽車應(yīng)用認(rèn)證的部件具備硬件功能安全特性,達(dá)到業(yè)界標(biāo)準(zhǔn)的 ISO 26262 ASIL-C 安全規(guī)范,這對自動駕駛應(yīng)用而言至關(guān)重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統(tǒng)以及可擴(kuò)展的可編程邏輯結(jié)構(gòu),這就能在單個芯片上整合控制處理、機(jī)器學(xué)習(xí)算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實(shí)現(xiàn),功耗低至 2 瓦,這對移動機(jī)器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統(tǒng)計(jì)算平臺即便現(xiàn)在也無法用這么低的功耗運(yùn)行實(shí)時 CNN 應(yīng)用,未來也不太可能在更嚴(yán)格的功耗限制條件下滿足更快響應(yīng)和更復(fù)雜功能的日益嚴(yán)格的要求。基于可編程 MPSoC 的平臺能夠提供更高的計(jì)算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發(fā)人員不能在自己的項(xiàng)目中輕松地實(shí)現(xiàn)這些優(yōu)勢,那么這種可配置型多平行計(jì)算架構(gòu)的優(yōu)勢就僅限于學(xué)術(shù)領(lǐng)域。成功需要適當(dāng)?shù)墓ぞ邅韼椭_發(fā)人員優(yōu)化目標(biāo)推斷引擎的實(shí)現(xiàn)。為了滿足有關(guān)需求,賽靈思不斷擴(kuò)展開發(fā)工具生態(tài)系統(tǒng)和機(jī)器學(xué)習(xí)軟件堆棧,并與專業(yè)合作伙伴合作,一起簡化和加速計(jì)算機(jī)視覺和視頻監(jiān)控等應(yīng)用的實(shí)現(xiàn)。

面向未來的靈活性

利用 SoC 的可配置性為手頭應(yīng)用創(chuàng)建最佳平臺,也使得 AI 開發(fā)人員能夠靈活地跟上神經(jīng)網(wǎng)絡(luò)架構(gòu)快速發(fā)展演進(jìn)的要求。業(yè)界可能遷移到新型神經(jīng)網(wǎng)絡(luò)的可能性,對于平臺開發(fā)人員來說是一個巨大的風(fēng)險(xiǎn)。可重配置的 MPSoC 通過重配置并用當(dāng)前最先進(jìn)的策略來構(gòu)建最高效的處理引擎,能夠讓開發(fā)人員靈活地響應(yīng)神經(jīng)網(wǎng)絡(luò)架構(gòu)方式的變化。

AI 越來越多地嵌入到各種設(shè)備中,包括工業(yè)控制、醫(yī)療設(shè)備、安全系統(tǒng)、機(jī)器人和自動駕駛汽車等。利用可編程邏輯結(jié)構(gòu)的 MPSoC 器件的靈活應(yīng)變加速技術(shù),是提供保持競爭力所需的快速響應(yīng)和高級功能的關(guān)鍵。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7615

    瀏覽量

    165989
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4305

    瀏覽量

    221150
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48477

    瀏覽量

    245170

原文標(biāo)題:【展會】2018CIMF第三屆生物識別、攝像頭展震撼來襲(11月15—17日)

文章出處:【微信號:chinacmos,微信公眾號:攝像頭觀察】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Xilinx隆重發(fā)布Vitis統(tǒng)一軟件平臺,賦予軟件開發(fā)者靈活應(yīng)變的硬件

    Vitis將賦予軟件開發(fā)者靈活應(yīng)變的硬件,同時將提高硬件設(shè)計(jì)者的工作效率。
    發(fā)表于 10-09 16:22 ?1215次閱讀

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動化提供強(qiáng)大支持。這款全新的計(jì)算
    發(fā)表于 03-19 17:54

    為什么需要嵌入式AI?

    為什么需要嵌入式AI?嵌入式AI還有瓶頸半導(dǎo)體廠商的新商機(jī)
    發(fā)表于 01-22 06:14

    如何滿足嵌入式系統(tǒng)的靈活需求?

    嵌入式程序開發(fā)基本概念如何滿足嵌入式系統(tǒng)的靈活需求開發(fā)高效程序的技巧是什么
    發(fā)表于 04-28 06:07

    工業(yè)嵌入式計(jì)算平臺開發(fā)招聘

    西電移動計(jì)算與通信團(tuán)隊(duì)招聘:嵌入式軟件開發(fā)(專職或兼職)研究方向:工業(yè)嵌入式計(jì)算平臺開發(fā)。需求人數(shù):1人
    發(fā)表于 10-12 09:32

    嵌入式AI平臺有哪些?

    11.2.2 修剪神經(jīng)網(wǎng)絡(luò) 21.2.3 嵌入式終端優(yōu)化 21.3 GPU 21.4 ARM 31.5 FPGA結(jié)構(gòu)的并行計(jì)算 41.5.1 介紹 41.5.2 流水線計(jì)算 41.5.3 分布
    發(fā)表于 10-27 06:45

    嵌入式Linux的靈活

    嵌入式Linux的靈活性,為嵌入式計(jì)算而設(shè)計(jì)的高效、節(jié)能的處理器的可用性,以及新處理器的低成本,使許多工業(yè)公司在嵌入式處理器的基礎(chǔ)上開發(fā)新的
    發(fā)表于 11-04 08:51

    汽車嵌入式計(jì)算平臺的設(shè)計(jì)

    對汽車嵌入式計(jì)算平臺的硬件和軟件進(jìn)行了分析
    發(fā)表于 07-02 15:04 ?22次下載

    Xilinx推出革命性的新型靈活應(yīng)變計(jì)算產(chǎn)品

    Acceleration Platform,靈活應(yīng)變計(jì)算加速平臺)。ACAP 是一個高度集成的多核異構(gòu)計(jì)算平臺,能根據(jù)各種應(yīng)用與工作負(fù)載的需求從硬件層對其進(jìn)行
    發(fā)表于 03-20 03:42 ?1140次閱讀

    靈活應(yīng)變計(jì)算平臺才能滿足運(yùn)行卷積神經(jīng)網(wǎng)絡(luò)的嵌入式 AI要求

    在傳統(tǒng)的 SoC 中,決定性能的特性如存儲器架構(gòu)和計(jì)算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。
    的頭像 發(fā)表于 07-26 16:42 ?1459次閱讀

    Xilinx Versal? Premium專為靈活應(yīng)變的云提供商而設(shè)計(jì)

    。Versal Premium 系列具備高度集成且功耗優(yōu)化的網(wǎng)絡(luò)硬核,是業(yè)界帶寬最高、計(jì)算密度最高的自適應(yīng)平臺。Versal Premium 專為在散熱條件和空間受限的環(huán)境下運(yùn)行最高帶寬網(wǎng)絡(luò),以及那些需要可擴(kuò)展、靈活應(yīng)變應(yīng)用加速
    的頭像 發(fā)表于 03-12 15:00 ?2436次閱讀

    Versal Premium ACAP:在靈活應(yīng)變平臺上突破性集成功耗優(yōu)化的網(wǎng)絡(luò)IP

    電子發(fā)燒友網(wǎng)站提供《Versal Premium ACAP:在靈活應(yīng)變平臺上突破性集成功耗優(yōu)化的網(wǎng)絡(luò)IP.pdf》資料免費(fèi)下載
    發(fā)表于 09-15 10:48 ?0次下載
    Versal Premium ACAP:在<b class='flag-5'>靈活應(yīng)變</b>的<b class='flag-5'>平臺</b>上突破性集成功耗優(yōu)化的網(wǎng)絡(luò)IP

    高端嵌入式實(shí)驗(yàn)平臺

    一、整體概述 該嵌入式平臺具有前沿性、專業(yè)性、高集成度、功能豐富等特點(diǎn),平臺涵蓋嵌入式計(jì)算機(jī)技術(shù)、嵌入式硬件接口、
    的頭像 發(fā)表于 01-29 09:55 ?733次閱讀
    高端<b class='flag-5'>嵌入式</b>實(shí)驗(yàn)<b class='flag-5'>平臺</b>

    AMD日前推出Ryzen(銳龍)嵌入式8000系列處理器

    AMD 日前推出 Ryzen(銳龍)嵌入式 8000 系列處理器,這是首款將基于 AMD XDNA 架構(gòu)的 NPU 與傳統(tǒng) CPU 和 GPU 元件相結(jié)合的 AMD 嵌入式器件,面向工業(yè)人工智能( AI )應(yīng)用對工作負(fù)載多功能性
    的頭像 發(fā)表于 04-18 10:36 ?1260次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算嵌入式開發(fā)

    ——近期在嵌入式世界2025上新發(fā)布,為 AI 計(jì)算、嵌入式系統(tǒng)及工自動化提供強(qiáng)大支持。這款全新的計(jì)算
    的頭像 發(fā)表于 03-19 17:53 ?332次閱讀
    Banana Pi 發(fā)布 BPI-<b class='flag-5'>AI</b>2N &amp; BPI-<b class='flag-5'>AI</b>2N Carrier,助力 <b class='flag-5'>AI</b> <b class='flag-5'>計(jì)算</b>與<b class='flag-5'>嵌入式</b>開發(fā)