一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepX的AI加速器能夠脫穎而出嗎?

Astroys ? 來源:Astroys ? 2023-06-08 16:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在評(píng)估AI硬件時(shí),規(guī)格競(jìng)賽(能效、性能和對(duì)各種算法的支持)絕對(duì)是重要的。

但是,當(dāng)系統(tǒng)公司把在GPU上開發(fā)的AI模型移植到其他類型的硬件時(shí)發(fā)生的精度損失怎么處理呢?這就是DeepX的特色。

上周,AI芯片初創(chuàng)公司DeepX的創(chuàng)始人Lokwon Kim,在加州Santa Clara的展會(huì)上推出了一系列AI加速器。Kim聲稱,這些芯片將實(shí)現(xiàn)“無處不在的AI,人人可用的AI?!?

Kim選擇了嵌入式視覺峰會(huì)作為他的首次公開亮相。需明確的是,DeepX是一個(gè)剛加入這個(gè)擁擠賽道的初創(chuàng)公司。然而,DeepX在韓國(guó)卻有著深厚的根基。通過向韓國(guó)政府積極地營(yíng)銷,Kim已經(jīng)把DeepX在AI領(lǐng)域的研發(fā)變成了一個(gè)國(guó)家項(xiàng)目。

DeepX從政府那里籌集了4000萬美元,還在韓國(guó)的風(fēng)投圈中籌集了2000萬美元。根據(jù)Kim的說法,今年晚些時(shí)候?qū)⒂?jì)劃進(jìn)行B輪融資。

DeepX正在推出一系列用于邊緣設(shè)備嵌入式視覺產(chǎn)品的AI加速器。它還開發(fā)了包括編譯器和運(yùn)行時(shí)在內(nèi)的軟件開發(fā)套件DXNN。DeepX認(rèn)為DXNN是其皇冠上的明珠。

據(jù)報(bào)道,DXNN可以簡(jiǎn)化深度學(xué)習(xí)模型部署到DeepX的AI SoC的過程。其編譯器提供了高性能量化、模型優(yōu)化和NPU推理編譯的工具。其運(yùn)行時(shí)包括NPU設(shè)備驅(qū)動(dòng)程序、帶有API的運(yùn)行時(shí)和NPU固件。

最重要的是,該公司聲稱,DXNN支持“以浮點(diǎn)格式訓(xùn)練的DNN模型的自動(dòng)量化”。

DeepX并沒有憑空創(chuàng)造出其AI硬件架構(gòu)。Kim說,自2016年創(chuàng)立公司以來,“我們實(shí)際上已經(jīng)與數(shù)百家全球公司坐下來進(jìn)行了面談?!?

Kim觀察到,“可擴(kuò)展性、AI精度以及功率/性能效率”是邊緣AI系統(tǒng)開發(fā)者一直在苦苦掙扎的三個(gè)領(lǐng)域。DeepX的目標(biāo)是在其AI加速器上實(shí)現(xiàn)GPU級(jí)的AI精度,同時(shí)提供高吞吐量和低功耗。

DeepX的源起

在DeepX之前,Kim是Apple的AP的首席設(shè)計(jì)師,參與開發(fā)了A10、A11 Bionic和A12 Bionic。

Kim創(chuàng)辦DeepX的靈感來源于他2010年在IBM的T.J. Watson研究中心做訪問學(xué)者的經(jīng)歷。他當(dāng)時(shí)的工作是開發(fā)深度學(xué)習(xí)MPU,這是DARPA指派給IBM的一個(gè)項(xiàng)目。

當(dāng)時(shí)Kim是UCLA的博士生,自那以后,他一直沉迷于在MPU上運(yùn)行DNN的想法。

即使在加入Apple后,Kim也一直堅(jiān)持著自己的AI創(chuàng)業(yè)夢(mèng)想?!拔覍?shí)際上已經(jīng)把我的想法帶給了Apple的高層管理人員?!彼麄兙芙^了,于是Kim結(jié)束了在Apple的工作,并返回韓國(guó)。

Kim表示,他非常敬仰張忠謀。半導(dǎo)體行業(yè)對(duì)張忠謀的貢獻(xiàn)有很大的感激之情。張忠謀離開美國(guó),在臺(tái)灣創(chuàng)辦了TSMC。這個(gè)起初并不被看好的企業(yè)最終成為了全球最大的代工巨頭。

Kim說,TSMC對(duì)臺(tái)灣的重要性(無論是經(jīng)濟(jì)上還是政治上)已不言而喻。通過利用AI的力量,Kim希望在他的祖國(guó)取得類似的重要地位。

這是一個(gè)大膽的說法。但是Kim的想法反映了這個(gè)時(shí)代。無論是好是壞,地緣政治已經(jīng)成為先進(jìn)半導(dǎo)體發(fā)展的內(nèi)在因素。

戰(zhàn)略

DeepX設(shè)計(jì)了同屬一系列的四款A(yù)I加速器,所有的焦點(diǎn)都集中在視覺應(yīng)用上。其策略是為多個(gè)邊緣視覺AI領(lǐng)域提供可擴(kuò)展的解決方案。

DX-L1,適用于IP攝像頭、車內(nèi)監(jiān)控、機(jī)器人攝像頭和無人機(jī)等攝像頭應(yīng)用。

DX-L1包含四核RISC-V、ISP、MIPI和視頻編碼器,提供12 eTOPS的AI性能。Kim指的eTOPS是“相當(dāng)于GPU的TOPS的性能度量標(biāo)準(zhǔn)”。

DX-L2支持3-4個(gè)攝像頭的邊緣AI視覺系統(tǒng),提供38 eTOPS。

DX-M1,配備了雙核ARM核和ISP,支持10個(gè)攝像頭,提供200 eTOPS。

DX-H1,提供1600 eTOPS,將以PCIe卡的形式生產(chǎn),可以部署在能夠執(zhí)行大規(guī)模AI操作的邊緣服務(wù)器中。通過支持10,000個(gè)攝像頭,DX-H1可以服務(wù)于安裝了大量監(jiān)控?cái)z像頭的工廠。H1具有與M1類似的雙核ARM核和ISP模塊。

所有四種芯片都由三星代工,其中L1和L2采用28nm制程。M1是14nm,H1則使用5nm工藝。價(jià)格范圍從10美元(L1)、20美元(L2)到50美元(M1)和1500美元(H1)不等。

準(zhǔn)確性

除了提供低功耗和性能效率外,DeepX還將資源集中在量化工作上,以保證GPU級(jí)的準(zhǔn)確性。

基于自身經(jīng)驗(yàn),DeepX專注于解決準(zhǔn)確性降低的問題上。Kim指出,將原本在浮點(diǎn)格式GPU上訓(xùn)練的AI模型移植到其它硬件上,都會(huì)導(dǎo)致準(zhǔn)確性降低。

因此,DeepX的團(tuán)隊(duì)尋找了每個(gè)數(shù)據(jù)路徑中準(zhǔn)確性降低的點(diǎn)。結(jié)果就是DeepX在其SDK,即DXNN中稱之為“世界頂級(jí)的量化器”。

396034be-05d8-11ee-962d-dac502259ad0.jpg

市場(chǎng)細(xì)分

過去幾年中,許多AI硬件創(chuàng)業(yè)公司被汽車行業(yè)所誘惑,夢(mèng)想著他們的AI芯片將成為下一代車輛平臺(tái)的計(jì)算機(jī)大腦。

相反,Kim得出的結(jié)論是,對(duì)于一家初創(chuàng)公司來說,向車廠銷售AI芯片是一個(gè)糟糕的選擇。因?yàn)槠囆酒枰?jīng)過漫長(zhǎng)的驗(yàn)證時(shí)間,ASIL B和C等認(rèn)證作業(yè)增加了很多困難。即使解決了這些障礙,芯片銷量也微乎其微。

相反,Kim的策略是與車廠合作,為DeepX MPU授權(quán)IP,包括軟件。Kim解釋說,DeepX一直被OEM忽視,現(xiàn)在卻開始收到OEM要求評(píng)估DeepX芯片的請(qǐng)求。

這可能意味著兩件事。

首先,許多歐洲車廠向Kim暗示,他們對(duì)下一代車輛平臺(tái)仍未做出決定。

其次,一些領(lǐng)先的車廠已經(jīng)投入資源使用Nvidia的GPU開發(fā)自己的AI模型。但現(xiàn)在,當(dāng)他們將模型移植到其他硬件上時(shí),準(zhǔn)確性降低問題正在出現(xiàn)。這迫使他們重新尋找另一種AI硬件解決方案。

Kim表示,DeepX只會(huì)為車廠提供IP授權(quán)。對(duì)于其他應(yīng)用領(lǐng)域,其業(yè)務(wù)模式則是直接銷售芯片。

Kim表示,DeepX的AI芯片的最佳應(yīng)用場(chǎng)景是機(jī)器人,無論是配送機(jī)器人還是在工廠內(nèi)作業(yè)的機(jī)器人。

Nvidia顯然已經(jīng)通過GPU贏得了AI市場(chǎng)。然而,AI競(jìng)賽的下一章或許在于如何將在GPU上訓(xùn)練的AI模型有效地移植到非GPU硬件上。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    827

    瀏覽量

    39093
  • SoC設(shè)計(jì)
    +關(guān)注

    關(guān)注

    1

    文章

    151

    瀏覽量

    19163
  • MPU
    MPU
    +關(guān)注

    關(guān)注

    0

    文章

    415

    瀏覽量

    49892
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    327

    瀏覽量

    19718
  • ai硬件
    +關(guān)注

    關(guān)注

    0

    文章

    23

    瀏覽量

    2510

原文標(biāo)題:DeepX的AI加速器能夠脫穎而出嗎?

文章出處:【微信號(hào):Astroys,微信公眾號(hào):Astroys】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場(chǎng)在高真空環(huán)境中對(duì)帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術(shù)現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?413次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    邊緣AI運(yùn)算革新 DeepX DX-M1 AI加速卡結(jié)合Rockchip RK3588多路物體檢測(cè)解決方案

    度等性能表現(xiàn)。 通過結(jié)合 Orange Pi 5 Plus(Rockchip RK3588) 與 DeepX AI 加速卡,這套解決方案以極高性價(jià)比為基礎(chǔ),能夠為工業(yè)電腦提供即插即用的
    的頭像 發(fā)表于 05-06 14:15 ?582次閱讀
    邊緣<b class='flag-5'>AI</b>運(yùn)算革新 <b class='flag-5'>DeepX</b> DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡結(jié)合Rockchip RK3588多路物體檢測(cè)解決方案

    3大優(yōu)勢(shì),讓鋰電池外殼氣密性檢測(cè)儀脫穎而出

    應(yīng)運(yùn)而生,憑借三大顯著優(yōu)勢(shì),在眾多同類產(chǎn)品中脫穎而出。優(yōu)勢(shì)一:高精度檢測(cè)技術(shù)。鋰電池外殼氣密性檢測(cè)儀采用先進(jìn)的傳感技術(shù)和算法,能夠實(shí)現(xiàn)對(duì)鋰電池外殼微小泄漏的精準(zhǔn)識(shí)別
    的頭像 發(fā)表于 04-18 13:42 ?230次閱讀
    3大優(yōu)勢(shì),讓鋰電池外殼氣密性檢測(cè)儀<b class='flag-5'>脫穎而出</b>

    嵌入式AI加速器DRP-AI 詳細(xì)介紹

    的嵌入式設(shè)備。此外,人工智能正在不斷發(fā)展,新的算法不時(shí)被開發(fā)出來。 在人工智能快速發(fā)展的過程中,瑞薩開發(fā)了人工智能加速器(DRP-AI)和軟件(DRP-AI翻譯),既提供高性能又提供
    的頭像 發(fā)表于 03-15 16:13 ?997次閱讀
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 詳細(xì)介紹

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型進(jìn)行了深度優(yōu)化。 這一優(yōu)化舉措使得AI開發(fā)者能夠以更低的成本和更高的效率實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化。英特爾Gaudi 2D AI加速器通過其卓越的計(jì)算能力和高度優(yōu)化的軟件棧,
    的頭像 發(fā)表于 02-10 11:10 ?617次閱讀

    DeepSeek發(fā)布Janus Pro模型,英特爾Gaudi 2D AI加速器優(yōu)化支持

    Gaudi 2D AI加速器現(xiàn)已針對(duì)該模型進(jìn)行了全面優(yōu)化。這一優(yōu)化舉措使得AI開發(fā)者能夠更輕松地實(shí)現(xiàn)復(fù)雜任務(wù)的部署與優(yōu)化,從而有效滿足行業(yè)應(yīng)用對(duì)于推理算力的迫切需求。 英特爾Gaudi
    的頭像 發(fā)表于 02-08 14:35 ?614次閱讀

    消息稱AMD Instinct MI400 AI加速器將配備8個(gè)計(jì)算芯片

    近日,據(jù)外媒 videocardz 報(bào)道,參考 AMD 最新推出的 AMD - GFX 補(bǔ)丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器設(shè)計(jì)將有重大變革,其將配備 8
    的頭像 發(fā)表于 02-05 15:07 ?942次閱讀

    蘋果加入U(xiǎn)ALink聯(lián)盟,共推AI加速器新標(biāo)準(zhǔn)

    蘋果公司已正式成為Ultra Accelerator Link(UALink)聯(lián)盟的一員,并獲得了該聯(lián)盟董事會(huì)席位。UALink聯(lián)盟由超過65家成員組成,專注于開發(fā)下一代人工智能加速器架構(gòu),旨在推動(dòng)AI技術(shù)的快速發(fā)展。
    的頭像 發(fā)表于 01-22 18:18 ?755次閱讀

    英偉達(dá)AI加速器新藍(lán)圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

    加速器設(shè)計(jì)的愿景。 英偉達(dá)認(rèn)為未來整個(gè) AI 加速器復(fù)合體將位于大面積先進(jìn)封裝基板之上,采用垂直供電,集成硅光子 I/O 器件,GPU 采用多模塊設(shè)計(jì),3D 垂直堆疊 DRAM 內(nèi)存,并在模塊內(nèi)直接整合
    的頭像 發(fā)表于 12-13 11:37 ?689次閱讀
    英偉達(dá)<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍(lán)圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    IBM將在云平臺(tái)部署AMD加速器

    IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺(tái)上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI模型方面的性能和能效,進(jìn)一步推動(dòng)AI技術(shù)的創(chuàng)新與應(yīng)用。
    的頭像 發(fā)表于 11-19 16:24 ?594次閱讀

    IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器

    合作服務(wù)預(yù)計(jì)將于2025年上半年正式推出。AMD Instinct MI300X加速器作為AMD在高性能計(jì)算領(lǐng)域的旗艦產(chǎn)品,將為IBM云上的AI應(yīng)用提供強(qiáng)大的計(jì)算支持。通過此次合作,企業(yè)客戶將能夠
    的頭像 發(fā)表于 11-19 11:03 ?839次閱讀

    SiFive發(fā)布MX系列高性能AI加速器IP

    AI技術(shù)日新月異的今天,RISC-V IP設(shè)計(jì)領(lǐng)域的領(lǐng)軍企業(yè)SiFive再次引領(lǐng)行業(yè)潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這一創(chuàng)新產(chǎn)品專為
    的頭像 發(fā)表于 09-24 14:46 ?812次閱讀

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級(jí)<b class='flag-5'>AI</b>系統(tǒng)高級(jí)<b class='flag-5'>AI</b>中更快的嵌入處理

    NAS設(shè)備鐵威馬F4-424是如何從市場(chǎng)中脫穎而出

    簡(jiǎn)便又性能卓越的家用NAS,成為了眾多家庭面臨的難題。今天,我們將聚焦于鐵威馬F4-424這款NAS設(shè)備,探討它是如何憑借其出色的性能與易用性,在家用NAS市場(chǎng)中脫穎而出,成為家庭用戶的理想之選。
    的頭像 發(fā)表于 07-18 17:28 ?1104次閱讀