一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

特斯拉的下一代AI芯片:存算一體

佐思汽車研究 ? 來源:佐思汽車研究 ? 2023-03-09 09:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT的火爆預(yù)示了自動駕駛的方向:大模型(至少超過100億個參數(shù))和高算力(至少1000TOPS@FP16)。ChatGPT完美展示了大模型的優(yōu)勢,也讓英偉達欣喜若狂,英偉達、AMD英特爾是最大受益者(英偉達最頂級的DGX-H100中的CPU是英特爾的W3495X,國內(nèi)售價高達每片8萬人民幣),還有幾乎壟斷高端服務(wù)器市場的中國臺灣企業(yè)廣達和英業(yè)達,科技巨頭每年需要花費數(shù)百億乃至上千億美元購買新的服務(wù)器來處理越來越大的AI模型,并且會持續(xù)數(shù)十年。

高算力讓存儲墻愈加明顯,存儲系統(tǒng)的成本也持續(xù)攀升,AI芯片價格越來越高,未來10萬美元甚至百萬美元級AI芯片也極有可能。要完美解決存儲墻問題是不可能的,折中的辦法是存算一體。這雖然無法解決芯片成本趨高的問題,但是可以解決1000TOPS算力的問題。

根據(jù)存儲與計算的距離遠近,將廣義存算一體的技術(shù)方案分為三大類,分別是近存計算 (Processing Near Memory,PNM)、存內(nèi)處理(Processingln Memory,PIM) 和存內(nèi)計算(Computing in Memory, CIM)。其中,存內(nèi)計算即狹義的存算一體。

存內(nèi)計算面臨的最大挑戰(zhàn)是內(nèi)存和高性能計算都是高度集中的行業(yè),巨頭們出于利潤的考量,不會允許革命性的存內(nèi)計算顛覆其所屬的壟斷行業(yè)。內(nèi)存行業(yè),美光、三星和SK Hynix在高性能存儲領(lǐng)域市占率達100%。高性能計算領(lǐng)域,英特爾、AMD和英偉達的市場占有率也接近100%。臺積電和三星聯(lián)合壟斷了高性能芯片代工領(lǐng)域。7納米以下晶圓廠產(chǎn)能是最具話語權(quán)的武器,沒有這個,高性能計算便是空中樓閣。

PNM已經(jīng)非常常見,即HBM與CPU一體,所有高性能計算芯片都是如此,采用HBM堆疊,2.5D封裝,硅中介層(Interposer)內(nèi)聯(lián)在基板上。也可以反推,沒有采用HBM就不是高性能計算芯片。特斯拉二代FSD已經(jīng)用上了GDDR6,下一代基本可以肯定是HBM3了。

d7ecdc00-be15-11ed-bfe3-dac502259ad0.png

PIM則是再下一階段熱點

圖片來源:Planet

d81b9c0c-be15-11ed-bfe3-dac502259ad0.png

PIM已經(jīng)有商業(yè)化的實例,最早的實例是Xilinx的Alveo U280

圖片來源:Planet

d836f1c8-be15-11ed-bfe3-dac502259ad0.png

PIM可以大幅度降低存取功耗

圖片來源:Planet

d855242c-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

AMD收購Xilinx,其中最看中的就是PIM堆疊技術(shù),AMD后來將其用在InstinctMI100/MI250/MI150/MI210系列GPU上,這也是美國商務(wù)部禁止向中國出售的芯片。MI100的性能能夠超越英偉達的上一代旗艦A100,功耗較A100降低約25%,價格也低于A100約30%。MI250與英偉達新旗艦H100持平,在FP32和FP64上,MI250更強;在FP16上,H100遠超MI250。

PIM的主角還是三星,配角是AMD,三星Aquabolt-XLHBM2-PIM是目前唯一PIM內(nèi)存。

Aquabolt-XL HBM2-PIM架構(gòu)

d86e5050-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

PIM非常簡單,就是用硅通孔(Through Silicon Via, TSV)技術(shù)將計算單元塞進內(nèi)存上下BANK之間。TSV技術(shù)人類2010年就掌握了,只不過迄今還不算特別成熟,價格還是有點高。

d888ef46-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

計算單元很簡單,一個FP16矩陣乘法,一個FP16矩陣加法。輸入命令解碼和行列地址即可。

PIM運作模式

d8b32180-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

PIM的軟件棧

d8cb9292-be15-11ed-bfe3-dac502259ad0.png

圖片來源:三星

在2023CES消費電子展上,AMD推出了MI300,PIM似乎升級到了HBM3。

d8e0dc1a-be15-11ed-bfe3-dac502259ad0.png

圖片來源:AMD

國人一心打破美國的科技壟斷,由于缺乏先進2.5D和3D封裝產(chǎn)能和技術(shù),中國企業(yè)對PNM和PIM完全不感興趣,聚焦的是真正的存算一體,即存內(nèi)計算。

其本質(zhì)是利用不同存儲介質(zhì)的物理特性,對存儲電路進行重新設(shè)計使其同時具備計算和存儲能力,直接消除“存〞“算〞界限,使計算能效達到數(shù)量級提升的目標。在存儲原位上實現(xiàn)計算,是真正的存算一體。存算一體理論上完美,但目前離實用至少還有10年距離。

存內(nèi)計算主要包含數(shù)字和模擬兩種實現(xiàn)方式,二者適用于不同應(yīng)用場景。模擬存內(nèi)計算能效高,但誤差較大,適用于低精度、低功耗計算場景,如端側(cè)可穿戴設(shè)備等。模擬存內(nèi)計算還涉及復(fù)雜的模數(shù)轉(zhuǎn)換器ADC)、數(shù)模轉(zhuǎn)換器DAC)、跨阻放大器(TIA) 等模塊。ADC和DAC領(lǐng)域需要幾十年經(jīng)驗長期摸索,全球精通ADC和DAC的僅有ADI、德州儀器NXP三家,其中ADI最強,正是牽涉大量模擬部分,存內(nèi)計算無法使用EDA工具,導(dǎo)致芯片開發(fā)成本高、周期長、規(guī)模小、算力低。

一直以來,主流的存內(nèi)計算大多采用模擬計算實現(xiàn),近兩年數(shù)字存內(nèi)計算的研究熱度也有所提升。模擬存內(nèi)計算主要基于物理定律(歐姆定律和基爾霍夫定律),在存算陣列上實現(xiàn)乘加運算。數(shù)字存內(nèi)計算通過在存儲陣列內(nèi)部加入邏輯計算電路,如與門和加法器等,使數(shù)字存內(nèi)計算陣列具備存儲及計算能力。數(shù)字存內(nèi)計算精度高,但是其存儲單元只能存儲單比特數(shù)據(jù),而目前主流人工智能訓(xùn)練是32或64比特數(shù)據(jù),這嚴重限制了其應(yīng)用范圍,并且數(shù)字存內(nèi)計算需增加加法樹邏輯電路,很大程度上限制了面積及能效優(yōu)勢。也就是目前存內(nèi)計算在高算力領(lǐng)域沒有容身之地的原因。

存內(nèi)計算最重要的部分就是存儲器件本身,算法之類的軟件部分幾乎可以忽略。目前存儲器主要有易失性存儲器和非易失存儲器件。易失性存儲器在設(shè)備掉電之后數(shù)據(jù)丟失,如SRAM等。非易失性存儲器在設(shè)備掉電后數(shù)據(jù)可保持不變,如NOR Flash、可變電阻隨機存儲器 (Resistive Random Access Memory, RRAM或ReRAM)、磁性隨機存儲器(Magnetoresistive Random Access Memory, MRAM)、相變存儲器 (Phase ChangeMemory, PCM)等。中國企業(yè)或機構(gòu)主要研究的是鐵電晶體管FeFET。傳統(tǒng)的SRAM、DRAM、NAND被三星、美光和SK Hynix壟斷,因此基于傳統(tǒng)存儲的存內(nèi)計算無論如何都無法對抗這三大巨頭,大部分機構(gòu)或企業(yè)都選擇另辟蹊徑。

幾種新興存儲器的技術(shù)對比

d909b07c-be15-11ed-bfe3-dac502259ad0.jpg

需要指出,目前存儲器制造也需要EUV***了,而EUV***被ASML壟斷,又聽命于美國政府。通常認為,DRAM的天花板是10nm。其原因是在傳統(tǒng)1T1C架構(gòu)下,單位元件面積不斷減小,如何保證電容能夠存儲足夠的電荷、防止相鄰存儲單元之間的耦合,是DRAM推進到10nm以下的無解難題,而EUV是用來做7nm以下的,DRAM目前主流是14納米。14納米理論上完全可以用DUV來完成,不需要EUV。

但實際情況并非如此,三星電子的1Znm節(jié)點DRAM量產(chǎn)結(jié)果表明,相比于DUV浸沒式光學(xué)***,EUV***極大簡化了制造流程,不僅可以大幅度提高光刻分辨率和DRAM性能,而且可以減少所使用的掩模數(shù)量,從而減少流程步驟的數(shù)量,減少缺陷、提高存儲密度,并大幅降低DRAM生產(chǎn)成本,縮短生產(chǎn)周期。也就是說,即使EUV掩模費用(達數(shù)百萬美元)遠高于DUV掩模費用,使用EUV***量產(chǎn)DRAM也具有更高的性價比。三星電子和SK海力士公司將EUV***引入1Znm節(jié)點DRAM的量產(chǎn)進展順利,并一路高歌到第五代1β節(jié)點,令DRAM三巨頭中最為保守的美光公司很無奈。美光一度宣稱自己用DUV也做到了11納米,然而進入2023年后的DDR5時代,韓國雙雄再一次依靠EUV***碾壓了美光。美光在DDR5方面嚴重落后韓國雙雄。

全球智能汽車領(lǐng)域,特斯拉是第一個用上GDDR6的企業(yè),特斯拉也很可能第一個用上HBM2或HBM3,當然代價是芯片成本超過1000美元以上,不過以特斯拉的溢價能力,消費者愿意為高價買單。要想超越特斯拉,不如一步到位,直接上HBM3。當然了,對中國企業(yè)來說最困難的不是技術(shù),而是供應(yīng)鏈,晶圓級2.5D封裝HBM的產(chǎn)能95%都在臺積電手中,5%在三星手中。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7648

    瀏覽量

    167307
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4531

    瀏覽量

    87419
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35892

原文標題:特斯拉的下一代AI芯片:存算一體

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    緩解高性能一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計

    在高性能計算與AI芯片領(lǐng)域,基于SRAM的一體(Processing-In-Memory, PIM)架構(gòu)因兼具計算密度、能效和精度優(yōu)勢成
    的頭像 發(fā)表于 07-11 15:11 ?110次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>IR-drop問題的軟硬件協(xié)同設(shè)計

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這背景下,
    的頭像 發(fā)表于 05-06 17:01 ?448次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側(cè) <b class='flag-5'>AI</b> 新征程

    PIMCHIP S300 全球首款28nm節(jié)點實現(xiàn)存一體產(chǎn)品化AI芯片

    PIMCHIP-S300 芯片是蘋芯科技基于一體技術(shù)打造的多模態(tài)智慧感知決策 AI 芯片。其
    的頭像 發(fā)表于 03-28 17:06 ?1062次閱讀
    PIMCHIP S300 全球首款28nm節(jié)點實現(xiàn)存<b class='flag-5'>算</b><b class='flag-5'>一體</b>產(chǎn)品化<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>

    澎峰科技DeepSeek智一體機助力中小企業(yè)AI轉(zhuǎn)型

    澎峰科技推出的智先鋒 Deep Fusion DF系列大模型一體機是專為中小企業(yè)、事業(yè)單位以及對數(shù)據(jù)安全有極高要求的部門(財務(wù)、人力、研發(fā)、銷售等)設(shè)計的高性能大模型 AI 一體化解
    的頭像 發(fā)表于 02-28 11:07 ?775次閱讀
    澎峰科技DeepSeek智<b class='flag-5'>算</b><b class='flag-5'>一體</b>機助力中小企業(yè)<b class='flag-5'>AI</b>轉(zhuǎn)型

    濟南市中區(qū)一體化智中心上線DeepSeek

    濟南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)一體化智中心(國家大學(xué)科技園節(jié)點)昇騰力部署D
    的頭像 發(fā)表于 02-19 10:38 ?700次閱讀

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術(shù)的迅猛發(fā)展成為人工智能領(lǐng)域的核心驅(qū)動力,其對硬件力和存儲效率的極致需求,促使一體技術(shù)在全球范圍內(nèi)迎來前所未有的關(guān)注與突破。隨著模型參數(shù)規(guī)模的持續(xù)膨脹和應(yīng)用場
    的頭像 發(fā)表于 01-23 11:24 ?1060次閱讀

    直播預(yù)約 |開源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計算

    鷺島論壇開源芯片系列講座第24期「SRAM一體:賦能高能效RISC-V計算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目SRAM
    的頭像 發(fā)表于 11-16 01:10 ?700次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    、人工智能(AI)等技術(shù)的發(fā)展,數(shù)據(jù)量的分布性、實時性需求增加,邊緣計算也逐漸從概念走向落地。本文將介紹一體化與邊緣計算的核心思想及其發(fā)展趨勢,探討兩者在智能
    的頭像 發(fā)表于 11-12 01:05 ?811次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計算:重新定義智能計算的未來

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?857次閱讀

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款
    發(fā)表于 09-26 13:51 ?663次閱讀
    科技新突破:首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>成功問世

    后摩智能首款一體智駕芯片獲評突出創(chuàng)新產(chǎn)品獎

    近日,2024年6月29日,由深圳市汽車電子行業(yè)協(xié)會主辦的「第十三屆國際汽車電子產(chǎn)業(yè)峰會暨2023年度汽車電子科學(xué)技術(shù)獎頒獎典禮」在深圳寶安隆重舉行。后摩智能首款一體智駕芯片——后
    的頭像 發(fā)表于 09-24 16:51 ?890次閱讀

    蘋芯科技引領(lǐng)存一體技術(shù)革新 PIMCHIP系列芯片重塑AI計算新格局

    智能芯片國產(chǎn)化再傳利好,8月8日,國際領(lǐng)先的一體芯片開拓者——蘋芯科技在北京召開 “
    發(fā)表于 08-08 17:21 ?399次閱讀
    蘋芯科技引領(lǐng)存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑<b class='flag-5'>AI</b>計算新格局

    IaaS+on+DPU(IoD)+下一代高性能力底座技術(shù)白皮書

    大規(guī)模生產(chǎn)環(huán)境落地應(yīng)用的條件。某種程度上,IoD 技術(shù)已成為下一代高性能力底座的核心技術(shù)與最佳實踐。 白皮書下載:*附件:IaaS+on+DPU(IoD)+下一代高性能力底座+技
    發(fā)表于 07-24 15:32

    一體AI芯片企業(yè)后摩智能完成數(shù)億元戰(zhàn)略融資

    近日,國內(nèi)領(lǐng)先的一體AI 芯片創(chuàng)新企業(yè)后摩智能完成數(shù)億元人民幣的戰(zhàn)略融資,由中國移動旗下北京中移數(shù)字新經(jīng)濟產(chǎn)業(yè)基金、上海中移數(shù)字轉(zhuǎn)型產(chǎn)業(yè)
    的頭像 發(fā)表于 07-15 15:32 ?807次閱讀