一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

邊緣AI推理應(yīng)用設(shè)計(jì)的發(fā)展

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Geoff Tate ? 2022-07-10 10:03 ? 次閱讀

在過去的三四年里,人工智能推理市場發(fā)生了巨大變化。以前,甚至不存在邊緣人工智能,大多數(shù)推理能力都發(fā)生在數(shù)據(jù)中心、超級(jí)計(jì)算機(jī)或政府應(yīng)用程序中,這些應(yīng)用程序通常也是大型計(jì)算項(xiàng)目。在所有這些情況下,性能都是至關(guān)重要的,并且始終是重中之重??爝M(jìn)到今天,邊緣人工智能市場與此截然不同,尤其是當(dāng)它進(jìn)入更多商業(yè)應(yīng)用時(shí)。對(duì)于這些用例,主要關(guān)注點(diǎn)更多的是低成本、功耗和小尺寸;而更少關(guān)于原始性能。

通過硬件-軟件協(xié)同設(shè)計(jì)平衡更好的性能

在查看推理芯片時(shí),很明顯一種芯片與另一種不同。設(shè)計(jì)師總是在他們的設(shè)計(jì)中做出選擇,而好的選擇會(huì)考慮他們的最終應(yīng)用以及他們?cè)谶@些應(yīng)用中的限制。例如,當(dāng) Flex Logix 設(shè)計(jì)其第一個(gè)推理芯片時(shí),它最初的大小是現(xiàn)在的 4 倍。我們很快意識(shí)到,芯片需要更小才能在成本更低、功耗更低、外形尺寸更小的邊緣 AI 市場中占據(jù)一席之地。

有趣的是,大多數(shù)人最初認(rèn)為大多數(shù)推理總是在數(shù)據(jù)中心完成。這種觀點(diǎn)最終發(fā)生了變化,因?yàn)樾袠I(yè)意識(shí)到它有太多的數(shù)據(jù)需要移動(dòng),因此,這些數(shù)據(jù)開始向邊緣移動(dòng)。隨著 5G 開始出現(xiàn),更清楚的是,不可能始終將原始數(shù)據(jù)發(fā)送到云端進(jìn)行處理。顯然,邊緣必須有一定的智能才能解決 99.9% 的場景,而數(shù)據(jù)中心實(shí)際上只需要用于極端情況。一個(gè)完美的例子是安全攝像頭。邊緣 AI 需要能夠確定是否發(fā)生了任何可疑活動(dòng)以及周圍是否有人。然后,如果發(fā)現(xiàn)任何有趣的東西,這些部分可以發(fā)送到數(shù)據(jù)中心進(jìn)行進(jìn)一步處理。然而,發(fā)送到數(shù)據(jù)中心的數(shù)據(jù)實(shí)際上只是整體推理的一小部分。邊緣推理 AI 通常意味著要滿足很多約束,有時(shí)如果你想運(yùn)行非常大的復(fù)雜模型,你實(shí)際上只需要在很小一部分?jǐn)?shù)據(jù)上運(yùn)行這些模型。

早期邊緣 AI 推理設(shè)計(jì)的另一個(gè)誤解是,一刀切的方法就足夠了。這也被證明是錯(cuò)誤的,因?yàn)槌霈F(xiàn)了展示其優(yōu)勢(shì)和力量的專用芯片。關(guān)鍵是圍繞算法構(gòu)建芯片,因?yàn)槿绻娴哪茉谒惴ㄉ夏ゾ?,你可以獲得更好的性能。正確的平衡實(shí)際上是像專用硬件一樣獲得最有效的計(jì)算,但在編譯時(shí)具有可編程性。

可編程性是關(guān)鍵

該行業(yè)確實(shí)處于人工智能發(fā)展的風(fēng)口浪尖。在接下來的幾十年里,我們將在這個(gè)領(lǐng)域看到的創(chuàng)新將是驚人的。就像任何長壽的市場一樣,您可以期待變化。這就是為什么不為某些客戶模型設(shè)計(jì)超級(jí)專業(yè)的芯片變得至關(guān)重要的原因。如果我們今天這樣做,那么當(dāng)芯片在兩年后到達(dá)客戶手中時(shí),模型可能會(huì)發(fā)生重大變化——客戶的要求也會(huì)發(fā)生變化。這就是我們不斷聽到有關(guān)公司最終獲得他們的人工智能推理芯片的故事的主要原因——然后發(fā)現(xiàn)它們的表現(xiàn)并沒有像他們需要的那樣。如果將可編程性內(nèi)置到芯片架構(gòu)中,則可以輕松解決該問題。

如今,在任何邊緣 AI 處理器中,AI 的靈活性和可編程性都至關(guān)重要??蛻舻乃惴〞?huì)定期發(fā)生變化,系統(tǒng)設(shè)計(jì)也會(huì)發(fā)生變化。隨著 Edge AI 功能在主流中的推廣,越來越清楚的是,芯片設(shè)計(jì)人員需要能夠適應(yīng)和改變客戶模型,而不是根據(jù)他們“認(rèn)為”的模型來選擇它。我們一次又一次地看到這一點(diǎn),這就是編譯器如此重要的原因。編譯器中有很多對(duì)最終用戶隱藏的技術(shù),這些技術(shù)是圍繞分配資源以確保一切都以最少的功率高效完成的。

另一個(gè)被密切關(guān)注的關(guān)鍵特性是吞吐量。現(xiàn)在正在構(gòu)建好的推理芯片,以便它們可以非常快速地通過它們移動(dòng)數(shù)據(jù),這意味著它們必須非??焖俚靥幚磉@些數(shù)據(jù),并且非??焖俚貙⑵湟迫牒鸵瞥鰞?nèi)存。通常,芯片供應(yīng)商會(huì)拋出各種各樣的性能數(shù)據(jù),例如 TOPS 或 ResNet-50,但研究這些數(shù)據(jù)的系統(tǒng)/芯片設(shè)計(jì)人員很快就會(huì)意識(shí)到這些數(shù)據(jù)通常毫無意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過程以及 PVT(過程/電壓/溫度)條件提供多少吞吐量。這是衡量其性能表現(xiàn)的第一個(gè)衡量標(biāo)準(zhǔn),但令人驚訝的是,很少有供應(yīng)商提供它。

邊緣人工智能向前發(fā)展

今天的許多客戶都渴望吞吐量,并正在尋找能夠以與他們現(xiàn)在使用的相同功率/價(jià)格為他們提供更高吞吐量和更大圖像尺寸的解決方案。當(dāng)他們得到它時(shí),他們的解決方案將比競爭解決方案更準(zhǔn)確和可靠,然后他們的市場采用和擴(kuò)展將加速。因此,盡管今天的應(yīng)用程序有數(shù)千或數(shù)萬個(gè)單位,但我們預(yù)計(jì)隨著推理的可用性,這種情況會(huì)迅速增長,從而提供越來越多的吞吐量/美元和吞吐量/瓦特。

邊緣人工智能市場正在迅速增長,芯片供應(yīng)商也在這個(gè)市場上爭奪一席之地。事實(shí)上,到 2020 年代中期,人工智能銷售額迅速增長至數(shù)百億美元,其中大部分增長來自邊緣人工智能推理。沒有人可以預(yù)測(cè)未來的模型,這就是為什么在設(shè)計(jì)時(shí)考慮到靈活性和可編程性更為重要

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19740

    瀏覽量

    232844
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    51927

    瀏覽量

    433653
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274186
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI推理的存儲(chǔ),看好SRAM?

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)近幾年,生成式AI引領(lǐng)行業(yè)變革,AI訓(xùn)練率先崛起,帶動(dòng)高帶寬內(nèi)存HBM一飛沖天。但我們知道AI推理的廣泛應(yīng)用才能推動(dòng)A
    的頭像 發(fā)表于 03-03 08:51 ?1393次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的存儲(chǔ),看好SRAM?

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    華為AI WAN在智算邊緣推理網(wǎng)絡(luò)中的關(guān)鍵優(yōu)勢(shì)

    WAN:智算邊緣推理網(wǎng)絡(luò)架構(gòu)、實(shí)踐及產(chǎn)業(yè)進(jìn)展”的演講,詳細(xì)闡述了AI WAN在智算邊緣推理網(wǎng)絡(luò)中的關(guān)鍵優(yōu)勢(shì)及其對(duì)產(chǎn)業(yè)
    的頭像 發(fā)表于 04-09 09:53 ?262次閱讀

    2025邊緣AI預(yù)測(cè):昇騰310B邊緣將占工業(yè)推理市場35%的三大動(dòng)因

    據(jù)工信部《2025 智能算力發(fā)展白皮書》預(yù)測(cè),到 2025 年我國邊緣 AI 推理芯片市場規(guī)模將突破 580 億元,其中工業(yè)場景占比達(dá) 42%。在這場變革中,昇騰 310B
    的頭像 發(fā)表于 03-24 14:09 ?513次閱讀
    2025<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>預(yù)測(cè):昇騰310B<b class='flag-5'>邊緣</b>將占工業(yè)<b class='flag-5'>推理</b>市場35%的三大動(dòng)因

    AI變革正在推動(dòng)終端側(cè)推理創(chuàng)新

    尖端AI推理模型DeepSeek R1一經(jīng)問世,便在整個(gè)科技行業(yè)引起波瀾。因其性能能夠媲美甚至超越先進(jìn)的同類模型,顛覆了關(guān)于AI發(fā)展的傳統(tǒng)認(rèn)知。
    的頭像 發(fā)表于 02-20 10:54 ?383次閱讀

    當(dāng)我問DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    資源浪費(fèi)。例如,在深度學(xué)習(xí)模型推理階段,F(xiàn)PGA可以針對(duì)特定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行硬件加速,提高推理速度。 3.支持邊緣計(jì)算與實(shí)時(shí)應(yīng)用 ? 邊緣計(jì)算:隨著物聯(lián)網(wǎng)的
    發(fā)表于 02-19 13:55

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    。這一變革不僅帶來了技術(shù)架構(gòu)的革新,更為產(chǎn)業(yè)發(fā)展開辟了新的增長空間。 傳統(tǒng)邊緣網(wǎng)關(guān)受限于計(jì)算能力和算法支持,往往只能完成數(shù)據(jù)采集和簡單處理,大量原始數(shù)據(jù)需要回傳云端處理,導(dǎo)致響應(yīng)延遲和帶寬壓力。AI技術(shù)
    發(fā)表于 02-15 11:41

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?523次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    生成式AI推理技術(shù)、市場與未來

    (reasoning)能力,這一轉(zhuǎn)變將極大推動(dòng)上層應(yīng)用的發(fā)展。 紅杉資本近期指出,在可預(yù)見的未來,邏輯推理推理時(shí)計(jì)算將是一個(gè)重要主題,并開啟生成式AI的下一階段。新一輪競賽已然開始。
    的頭像 發(fā)表于 01-20 11:16 ?685次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術(shù)、市場與未來

    新品| LLM630 Compute Kit,AI 大語言模型推理開發(fā)平臺(tái)

    LLM630LLM推理,視覺識(shí)別,可開發(fā),靈活擴(kuò)展···LLM630ComputeKit是一款AI大語言模型推理開發(fā)平臺(tái),專為邊緣計(jì)算和智能交互應(yīng)用而設(shè)計(jì)。該套件的主板搭載愛芯AX63
    的頭像 發(fā)表于 01-17 18:48 ?500次閱讀
    新品| LLM630 Compute Kit,<b class='flag-5'>AI</b> 大語言模型<b class='flag-5'>推理</b>開發(fā)平臺(tái)

    Imagination 引領(lǐng)邊緣計(jì)算和AI創(chuàng)新,擁抱AI未來發(fā)展

    6月25日,2024“N+”AI互動(dòng)創(chuàng)新論壇在南京舉辦,Imagination中國資深副總裁張曉波受邀出席。在主題演講中,張曉波表示,Imagination作為圖形、計(jì)算和邊緣人工智能領(lǐng)域的領(lǐng)導(dǎo)者
    的頭像 發(fā)表于 06-28 08:28 ?740次閱讀
    Imagination 引領(lǐng)<b class='flag-5'>邊緣</b>計(jì)算和<b class='flag-5'>AI</b>創(chuàng)新,擁抱<b class='flag-5'>AI</b>未來<b class='flag-5'>發(fā)展</b>

    MediaTek與NVIDIA TAO加速物聯(lián)網(wǎng)邊緣AI應(yīng)用發(fā)展

    在即將到來的COMPUTEX 2024科技盛會(huì)上,全球知名的芯片制造商MediaTek宣布了一項(xiàng)重要合作——將NVIDIA的TAO(TensorRT Accelerated Optimizer)與其NeuroPilot SDK(軟件開發(fā)工具包)集成,共同推動(dòng)邊緣AI
    的頭像 發(fā)表于 06-12 14:49 ?628次閱讀

    如何基于OrangePi?AIpro開發(fā)AI推理應(yīng)

    。通過昇騰CANN軟件棧的AI編程接口,可滿足大多數(shù)AI算法原型驗(yàn)證、推理應(yīng)用開發(fā)的需求。AscendCL(AscendComputingLanguage,昇騰計(jì)算
    的頭像 發(fā)表于 06-04 14:23 ?773次閱讀
    如何基于OrangePi?AIpro開發(fā)<b class='flag-5'>AI</b><b class='flag-5'>推理應(yīng)</b>用

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計(jì)算盒子詳解

    近年來,隨著人工智能和邊緣計(jì)算的發(fā)展,一種名為AI邊緣盒子的新型設(shè)備正逐漸引起廣泛關(guān)注。作為一種集成了邊緣計(jì)算和
    的頭像 發(fā)表于 05-29 14:24 ?1349次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計(jì)算盒子詳解

    邊緣側(cè)AI芯片提供商超星未來完成數(shù)億元 Pre-B輪融資

    AI產(chǎn)業(yè)生態(tài)中,計(jì)算芯片被視為行業(yè)的“賣水人”。依據(jù)云端/邊緣端、訓(xùn)練/推理兩大分類標(biāo)準(zhǔn),AI芯片可劃分為四個(gè)類別,其中邊緣側(cè)
    的頭像 發(fā)表于 05-09 09:38 ?720次閱讀