一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

邊緣AI處理器拼的只是算力和功耗嗎

lPCU_elecfans ? 來源:電子發(fā)燒友網 ? 作者: 周凱揚 ? 2021-11-02 11:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/周凱揚)AI應用如同燃起的野火一般,從消費級的手機端,出現(xiàn)在了工業(yè)級的超級游輪和航空級的空間站上。然而在邊緣端,這些應用遇上了傳統(tǒng)應用也掙扎了數(shù)年的需求:更高的性能、更大的容量和更低的功耗。

更糟糕的是,機器學習模型正在以指數(shù)級的速度增長,每3到5個月就會翻一番。要想應用這些模型的話,傳統(tǒng)的計算芯片已經難以利用有限的內存資源和功率提供高性能,連數(shù)據(jù)中心都在AI工作負載上感到吃力了,更不用說在邊緣側運行的大型模型。為此,邊緣AI處理器成了不少芯片大廠和初創(chuàng)企業(yè)的發(fā)力方向。然而在處理器的選取上,并不是僅僅看算力、功耗和成本而已。

邊緣AI處理器的選擇

首先,AI芯片公司不僅要有硬件開發(fā)實力,也要具備強大的AI軟件棧和工具。比如英特爾英偉達之類的廠商,其CPUGPU設計早已為TensorFlow、Caffe或Pytorch等框架提供了支持,但初創(chuàng)企業(yè)自研架構的AI處理器往往需要打造自己的編譯器來支持這些框架。

其次,是處理器支持的神經網絡精度。多數(shù)邊緣AI處理器精度并不高,這是因為將神經網絡轉換為低精度簡化了硬件設計,同時也極大地降低了功耗。要想保持高精度的話,往往需要重新訓練神經網絡。

Nvidia - Jetson Xavier NX

英偉達于2019年公布了一款名為“Jetson Xavier NX”的AI處理器,專門用于邊緣系統(tǒng)和嵌入式應用。Jetson Xavier NX只有70mm x 45mm的大小,卻可以在15W的功耗下提供21 TOPS(INT8)的AI算力。

Jetson Xavier NX集成了6核CPU、384核GPU、48個Tensor核心、2個NVDLA深度學習加速器和7路VLIW視覺處理器加速器。其中CPU選用了英偉達Carmel Arm核心,GPU則是基于Volta架構。該處理器還配備了8GB 128位的LDDR4x內存,可提供59.7GB/s的帶寬性能。

英偉達已經為用戶提供了開發(fā)者套件,可以創(chuàng)建高性能的AI應用,并快速部署深度神經網絡模型和常見的機器學習框架,比如Tensorflow和Pytorch等,除此之外也可以用到cuDNN、TensorRT和DeepStream等一系列軟件庫和加速工具。

Jetson Xavier NX最大的優(yōu)勢在于其Jetson產品線全部基于同一軟件棧,所以可以直接套用更強大的Jetson AGX Xavier上的AI應用,只不過算力要稍低一截而已。憑借其21TOPS的AI算力,加上加速器提供的視頻處理器性能,可以毫無壓力地完成人體識別、自研語言處理、姿勢檢測和注視檢測等AI應用,適用于自動光學檢測和智能攝像頭等一系列邊緣IoT設備。

Hailo - Hailo-8

Hailo是一家來自于以色列的AI芯片公司,不少核心開發(fā)成員來自于以色列國防科技部門,主要負責為邊緣設備開發(fā)高性能的AI處理器。早在2019年,Hailo就公布了其自研的邊緣AI處理器Hailo-8,其算力可達26TOPS(INT8),但該處理器的典型功耗僅有2.5W。在完成了多輪融資后,Hailo也在今年開始了Hailo-8的量產。

55d3c90a-3b84-11ec-82a9-dac502259ad0.png

Hailo-8與Jetson產品的對比 / Hailo

與傳統(tǒng)的CPU、GPU、DSP或硬件加速器的架構不同,Hailo在這款處理器上運用了自研的結構定義數(shù)據(jù)流架構。在ResNet-50的神經網絡測試中,Hailo-8取得了1330FPS@3.2W的成績。Hailo還在官網曬出出了Hailo-8與英偉達Jetson Nano與Xavier NX在ResNet和SSD_MobileNet等模型下的預期表現(xiàn)對比,我們從上圖可以看出,Hailo-8在性能上優(yōu)勢明顯,能耗比更是讓英偉達的兩款Jetson處理器望塵莫及。

Hailo還準備好了開源的Model Zoo,其中囊括了物體識別、分類、人臉檢測識別等60多種計算機視覺任務的深度學習模型。開發(fā)者利用這些預訓練的Tensorflow和ONNX模型,只需用上自己的數(shù)據(jù)重新訓練,即可在Hailo設備上迅速創(chuàng)建好原型。

Mythic - M1076

美國德州的初創(chuàng)公司Mythic推出了利用存內計算技術的M1076模擬矩陣處理器(AMP)。單個M1076芯片的面積只有360mm2,卻可以在3W至4W的功耗下提供35 TOPS的算力,與常見的SoC或GPU方案相比,功耗低了10倍以上。

但這并不是M1076的最大特色,與傳統(tǒng)數(shù)字計算方式不同,Mythic在M1076上運用了模擬計算。模擬計算雖然理論上要要與數(shù)字計算,但長久以來收到尺寸的限制,在速度與擴展性上一直提不上去。然而Mythic通過將模擬運算與嵌入式閃存結合,選擇了存內計算的方式。

M1076同時支持INT4、INT8和INT16三種數(shù)據(jù)類型,非常適合作為TinyML的開發(fā)平臺。Mythic也為客戶提供了物體識別/分類、圖像分割和姿勢評估等模型,可用于AR/VR中的智能健身和游戲等應用。

小結

云計算在邊緣端的弱勢使得邊緣AI處理器有了崛起的機會,在工業(yè)4.0、自動化系統(tǒng)和智能IoT的潮流下,邊緣AI還需要繼續(xù)開拓應用場景,而不僅僅是用于機器視覺任務。邊緣AI處理器廠商也必須繼續(xù)提供更多的模型,幫助開發(fā)者加速邊緣AI應用的落地。

聲明:本文由電子發(fā)燒友原創(chuàng),轉載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱huangjingjing@elecfans.com。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19893

    瀏覽量

    235174
  • 芯片
    +關注

    關注

    460

    文章

    52505

    瀏覽量

    440800
  • AI
    AI
    +關注

    關注

    88

    文章

    35136

    瀏覽量

    279762
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134601

原文標題:邊緣AI處理器拼的不僅是算力和功耗

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    揭秘瑞芯微協(xié)處理器,RK3576/RK3588強大搭檔

    瑞芯微協(xié)處理器-Gongga1(簡稱“貢嘎”),是瑞芯微針對旗艦芯片平臺RK3576/RK3588等SoC平臺配套的
    的頭像 發(fā)表于 07-17 10:00 ?47次閱讀
    揭秘瑞芯微<b class='flag-5'>算</b><b class='flag-5'>力</b>協(xié)<b class='flag-5'>處理器</b>,RK3576/RK3588強大<b class='flag-5'>算</b><b class='flag-5'>力</b>搭檔

    騰視科技TS-SG-SM7系列AI模組:32TOPS引擎,開啟邊緣智能新紀元

    從城市管理到工業(yè)生產,從物流運輸?shù)较M終端,TS-SG-SM7系列AI模組以 “超強、超低功耗
    的頭像 發(fā)表于 07-07 16:44 ?700次閱讀
    騰視科技TS-SG-SM7系列<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組:32TOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>引擎,開啟<b class='flag-5'>邊緣</b>智能新紀元

    騰視科技TS-NV-P100系列AI邊緣盒子綜合算高達157TOPS:重新定義AI邊緣,賦能千行百業(yè)智能化升級

    從技術架構到場景落地,騰視科技TS-NV-P100系列AI邊緣盒子以 "前置、智能下沉"
    的頭像 發(fā)表于 07-02 10:24 ?720次閱讀
    騰視科技TS-NV-P100系列<b class='flag-5'>AI</b><b class='flag-5'>邊緣</b><b class='flag-5'>算</b><b class='flag-5'>力</b>盒子綜合算<b class='flag-5'>力</b>高達157TOPS:重新定義<b class='flag-5'>AI</b><b class='flag-5'>邊緣</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,賦能千行百業(yè)智能化升級

    騰視科技TS-NV-P100系列AI邊緣盒子綜合算高達157TOPS:重新定義AI邊緣,賦能千行百業(yè)智能化升級

    從技術架構到場景落地,騰視科技TS-NV-P100系列AI邊緣盒子以 "前置、智能下沉"
    的頭像 發(fā)表于 07-02 10:16 ?241次閱讀

    性能飛躍 慧視8核+32T平臺讓目標檢測幀率提升20倍

    RK3588和大卡開發(fā)而成的一款低功耗AI處理
    的頭像 發(fā)表于 06-10 17:55 ?317次閱讀
    性能飛躍 慧視8核+32T<b class='flag-5'>算</b><b class='flag-5'>力</b>平臺讓目標檢測幀率提升20倍

    6TOPSNPU加持!RK3588如何重塑8K顯示的邊緣計算新邊界

    與復雜運算。明遠智睿推出的RK3588芯片,以6TOPS的NPU為核心,為這一難題提供了突破性的解決方案。 從硬件架構來看,RK3588的NPU采用了先進的神經網絡處理器設計,支持多種主流深度學習
    發(fā)表于 04-18 15:32

    157 TOPS !AIO-OrinNX 主板助力邊緣 AI 應用

    Firefly最新推出NVIDlAJetsonOrin主板,搭載JetsonOrin系列核心模組,最高可達157TOPS,支持大模型私有化部署,為邊緣AI應用的開發(fā)與部署提供強勁的
    的頭像 發(fā)表于 04-02 16:33 ?1310次閱讀
    157 TOPS <b class='flag-5'>算</b><b class='flag-5'>力</b>!AIO-OrinNX 主板助力<b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 應用

    DeepSeek推動AI需求:800G光模塊的關鍵作用

    隨著人工智能技術的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務對的需求持續(xù)攀升,直接推動了服務
    發(fā)表于 03-25 12:00

    端側 AI 音頻處理器:集成音頻處理AI 計算能力的創(chuàng)新芯片

    電子發(fā)燒友網綜合報道:端側 AI 音頻處理器是專為智能物聯(lián)網(AIoT)端側設備設計,集成了人工智能(AI)加速的系統(tǒng)級音頻處理器。這類
    的頭像 發(fā)表于 02-16 00:13 ?2209次閱讀

    進迭時空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

    一、總體概述K1 系列是基于 RISC - V 開源指令集打造的 AI CPU,致力于構建更通用、高能效的 AI 處理器平臺,推動全球開源、開放的 AI
    發(fā)表于 01-06 17:37

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網向專業(yè)的提供商租用所需的計算資源,以滿足其AI應用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2405次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者能更好理解芯片。 全書共11章,
    發(fā)表于 10-15 22:08

    超緊湊模塊提供高達 39 TOPS AI

    的 XDNA? NPU 和強大的 Radeon RDNA 3? 圖形處理器,可為AI推理提供高達39 TOPS的驚人。 ? ?? 這使得全新conga-TCR8 Type 6模塊在
    發(fā)表于 09-25 13:46 ?1549次閱讀
     超緊湊模塊提供高達 39 TOPS <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>

    米爾STM32MP2核心板首發(fā)新品上市!高性能+多接口+邊緣

    的工業(yè)4.0應用賦能。 機器視覺 先進的邊緣AI STM32MP25內置高達1.35 TOPS的NPU邊緣
    發(fā)表于 09-20 18:24

    基于全志V853處理器的智能輔助駕駛算法介紹

    全志V853處理器,是專為智慧視覺領域設計的AI處理器,配備了高效的NPU和豐富的外設接口,能夠提供穩(wěn)定的
    的頭像 發(fā)表于 09-14 09:23 ?1809次閱讀
    基于全志V853<b class='flag-5'>處理器</b>的智能輔助駕駛算法介紹