一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新一代GPU之王B200面世,帶動產(chǎn)業(yè)鏈狂歡!

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2024-03-19 23:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)作為AI時代不容置疑的無冕之王,英偉達每年舉辦的GTC大會不僅是針對英偉達軟硬件生態(tài)開發(fā)者的一場盛會,也是英偉達展示肌肉的舞臺。在近日舉辦的GTC大會上,英偉達CEO黃仁勛在發(fā)布新品的同時,也宣告了一個新的計算時代的到來。

黃仁勛表示,我們需要更大的模型,然后用更多的多模數(shù)據(jù)去訓(xùn)練它,而不再局限于互聯(lián)網(wǎng)上的文本數(shù)據(jù),還有圖片、圖表。正如我們通過電視來獲取支持知識一樣,這些大模型也將快速接入視頻數(shù)據(jù),比如最近爆火的Sora等。

192GB HBM3e內(nèi)存,Blackwell架構(gòu)的前鋒

為了應(yīng)對更大的模型,自然也就需要更大的GPU,這才有了英偉達此次發(fā)布的Blackwell GPU平臺。Blackwell架構(gòu)以數(shù)學(xué)家David Harold Blackwell命名,作為兩年前發(fā)布的Hopper架構(gòu)繼任者,Blackwell可以說實現(xiàn)了設(shè)計到性能上的全方位升級,而首個享受這些升級的,就是B200 GPU。

全新的B200 GPU基于臺積電4NP工藝,采用了兩個GPU die集成在同一芯片上的設(shè)計,并配備了192GGB的HBM3e超大內(nèi)存。也正因如此,B200單芯片的晶體管數(shù)量達到了驚人的2080億個,TDP也高達1000W。但這樣瘋狂的堆料帶來的自然是性能的翻倍提升,在FP8精度的訓(xùn)練性能上,B200 GPU的算力是上一代的2.5倍。

wKgaomX5twWARXkfAAmVJFg1468232.png?
兩代GPU架構(gòu)支持精度 / 英偉達


有趣的一點在于,在英偉達第二代Transformer引擎的支持下,此次B200加入了對FP4精度的支持,從而支持到規(guī)模更大,性能要求更高的模型。在FP4精度下的推理性能,B200的算力更是達到了上一代的5倍。如果以1750億參數(shù)的GPT-3大模型作為實例進行測試的話,B200 GPU的總體性能是H100的7倍,訓(xùn)練速度則是H100的4倍。

為了更好地提升B200的擴展性,英偉達基于最新的第五代NVLink技術(shù),開發(fā)了一塊全新的NVLink Switch芯片,雙向帶寬高達1800GB/s,是上一代的兩倍。與此同時,NVLink支持的最大擴展規(guī)模也得到了提升,如今最多支持576塊B200 GPU互聯(lián)互通。

wKgaomX5tyOAX88kABIoDTWVbVY026.png?
GB200超級芯片 / 英偉達


除了新架構(gòu)的GPU外,英偉達基于NVLink C2C互聯(lián)技術(shù),也為超級芯片GH200打造了下一代繼任者GB200。GB200超級芯片由一個Grace CPU與兩塊B200 GPU組成,并以超低功耗卻能實現(xiàn)900GB/s超大帶寬的互聯(lián)。不過此次英偉達并沒有對CPU的架構(gòu)進行升級,仍然采用的是72核Arm Neoverse N2的設(shè)計,所以此次GH200的主要性能提升還是在GPU上,英偉達GB200在LLM推理性能上有了30倍的提升,但能效比也提升了25倍。

wKgZomX5t0OAZKvkACBFL86q3WQ679.png?
GB200 NVL72與GB200配置與性能 / 英偉達


針對萬億參數(shù)級別的超級大模型,英偉達基于GB200和NVLink技術(shù)推出了集成36/72個GPU的GB200 NVL36/72方案。基于GB200 NVL72打造的MGX系統(tǒng)更是可以實現(xiàn)30TB的統(tǒng)一內(nèi)存,130TB/s的總帶寬,甚至是單機柜exaFLOP級(FP4精度)的AI算力。英偉達表示,即便面對1.8萬億參數(shù)的GPT-MoE-1.8T超大模型,也可以實現(xiàn)比同數(shù)量H100 GPU高出4倍的訓(xùn)練性能,以及實時的AI推理。

B200發(fā)布后,哪些產(chǎn)業(yè)同步受益

過去英偉達先進AI GPU的熱度,已經(jīng)帶動了一批上下游產(chǎn)業(yè)的發(fā)展,而隨著B200的發(fā)布,相關(guān)市場或再度迎來一輪爆發(fā)。從制造上游來看,無疑晶圓代工廠受益最大,無論是提供邏輯代工、先進封裝方案的臺積電,還是為新GPU提供大容量HBM內(nèi)存的三大存儲廠商(SK海力士、三星和美光)。

四年之前,英偉達在GA100采取了將芯片分成兩半,通過高速互聯(lián)技術(shù)來完成通信的設(shè)計,然而這一大膽的設(shè)計卻很少被人注意。而如今在CUDA、GPU團隊,以及臺積電的先進邏輯與封裝工藝下,B200終于采用了Chiplet的設(shè)計,將兩個GPU die集成在單個封裝內(nèi),并做到了逼近臺積電4NP工藝節(jié)點的極限die面積,以及高達10TB/s的C2C互聯(lián)速度。

再考慮到未來即將出貨的H200和B100 GPU,這一系列芯片將進一步推動臺積電4nm工藝走向滿載的產(chǎn)能利用率,而這還是在過去只被視為淡季的Q1。更不用說這一系列芯片帶來的CoWoS產(chǎn)能壓力,據(jù)報道,臺積電已經(jīng)計劃投資160億美元在臺灣建設(shè)6座新的CoWoS封裝設(shè)施,甚至有爆料稱臺積電開始考慮出海擴張CoWoS封裝產(chǎn)能,第一站很可能會在日本,足以看出GPU的訂單數(shù)量之夸張。

這也進一步推動了存儲廠商在HBM上的營收占比,三大參與廠商在HBM產(chǎn)能供應(yīng)上的競爭已經(jīng)進入了白熱化階段。本次GTC線下活動中,SK海力士、三星和美光均展示了自己的HBM3e解決方案。據(jù)TrendForce預(yù)估,2024年全年HBM產(chǎn)能將同比提升260%,于整個DRAM行業(yè)產(chǎn)值占比從去年的8.4%擴大至20.1%。不過,對于存儲廠商而言,今年的訂單基本已經(jīng)排滿了,依照英偉達和AMD的發(fā)布計劃來看,即便在瘋狂擴產(chǎn)下,2025年的產(chǎn)能恐怕也抵不住即將瘋狂襲來的訂單。

另一個即將從數(shù)據(jù)中心進一步攫取更多市場機會的產(chǎn)業(yè)為液冷,而且服務(wù)器廠商們早已準備好了對應(yīng)的解決方案。目前隨著服務(wù)器AI算力的不斷增強,液冷解決方案的普及率在整個服務(wù)器市場依然算不上高,甚至不到5%。

B200、GB200以及GB200 NVL72盡管一再強調(diào)提高了能效比,但對于單個系統(tǒng)的散熱要求依然提高了。畢竟單個GB200 NVL72機柜的計算單元規(guī)模就比過去的DGX系統(tǒng)高出不少,液冷是英偉達目前給出的唯一設(shè)計,畢竟單個GB200超級芯片的最高TDP可達2700W。

為此服務(wù)器OEM幾乎同時宣布了對應(yīng)的液冷服務(wù)器配置方案,比如戴爾推出了首個采用液冷配置的PowerEdge XE9680服務(wù)器,Supermicro也發(fā)布了液冷ORV3 MGX系統(tǒng)。鴻海集團也發(fā)布了針對GB200 NVL72的先進液冷解決方案,具備高達1300kW的強大散熱能力。

最后自然就是服務(wù)器上的高速通信了,與B200同步公布的還有Quantum-X800 InfiniBand和Spectrum?-X800 Ethernet這兩大高速網(wǎng)絡(luò)解決方案。在與英偉達LinkX線纜和光模塊的組合下,可以做到最高2公里內(nèi)的800GB/s網(wǎng)絡(luò)傳輸速度。盡管這是英偉達收購Mellanox后發(fā)布的專用方案,但無疑加快了800G網(wǎng)絡(luò)普及的進程。

計算光刻,反哺芯片制造

去年,英偉達推出了cuLitho這一軟件庫,借助GPU的強大算力有望將光罩的開發(fā)速度提升40倍。在今天的GTC大會上,英偉達也宣布和臺積電、新思達成合作,正式將其計算光刻技術(shù)投入生態(tài)當中去,并充分利用英偉達此次發(fā)布的Blackwell GPU。

計算光刻主要用于芯片的開發(fā)和制造環(huán)節(jié),通過建立大量的數(shù)學(xué)和物理模型來幫助客戶設(shè)計光罩。相比傳統(tǒng)基于CPU的計算光刻技術(shù),基于GPU加速和生成式AI算法的計算光刻技術(shù)要高效得多,英偉達聲稱集成了350個H100的系統(tǒng)就可以替代掉一個由40000個CPU組成的計算光刻系統(tǒng),加速生產(chǎn)時間的同時,降低了成本、部署空間和功耗。

寫在最后

盡管每次在英偉達展示其新品后,這些產(chǎn)品都會成為其他AI硬件公司拿來作為各種性能對比的參考,比如這次Groq就在GTC會后很快正面回應(yīng)了英偉達,并發(fā)布了“Groq仍然更快”的聲明。然而,明眼人都能看出來,在當今的市場環(huán)境下,英偉達在AI行業(yè)的地位依舊不可撼動。

其中不僅有架構(gòu)創(chuàng)新、CUDA的功勞,也少不了英偉達在半導(dǎo)體上下游多年來的經(jīng)營。臺積電優(yōu)先給英偉達CoWoS封裝產(chǎn)能,AI服務(wù)器廠商們在發(fā)布會后一呼百應(yīng),都佐證了英偉達已經(jīng)為這個新計算時代打造好了一條完整且已經(jīng)得到證實的AI生態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4949

    瀏覽量

    131282
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93830
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2025電機產(chǎn)業(yè)鏈交流會圓滿收官,技術(shù)分享與供需對接雙驅(qū)動

    2025年3月27日,由Big-Bit商務(wù)網(wǎng)主辦,《半導(dǎo)體器件應(yīng)用》雜志承辦的2025中國電機智造與創(chuàng)新應(yīng)用暨電機產(chǎn)業(yè)鏈交流會(春季)于深圳登喜路國際大酒店圓滿落下帷幕。 本屆電機產(chǎn)業(yè)鏈交流會以
    的頭像 發(fā)表于 07-18 14:49 ?182次閱讀
    2025電機<b class='flag-5'>產(chǎn)業(yè)鏈</b>交流會圓滿收官,技術(shù)分享與供需對接雙驅(qū)動

    新一代高效電機技術(shù)—PCB電機

    純分享帖,點擊下方附件免費獲取完整資料~~~ *附件:新一代高效電機技術(shù)—PCB電機.pdf 內(nèi)容有幫助可以關(guān)注、點贊、評論支持下,謝謝! 【免責聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第
    發(fā)表于 07-17 14:35

    華正新材AI產(chǎn)業(yè)鏈技術(shù)論壇精彩回顧

    為追蹤行業(yè)發(fā)展趨勢,促進產(chǎn)業(yè)鏈技術(shù)創(chuàng)新,近日,由華正新材主辦的“AI背景下從芯片到設(shè)備、PCB/CCL與原物料的產(chǎn)業(yè)鏈技術(shù)全景解析”主題論壇在杭州青山湖成功舉辦。本次論壇聚焦AI算力爆發(fā)時代下“材料
    的頭像 發(fā)表于 06-25 16:15 ?393次閱讀

    2025年4月工業(yè)機器人相關(guān)產(chǎn)業(yè)鏈新品發(fā)布情況

    隨著今年第季度過去,大部分機器人產(chǎn)業(yè)鏈企業(yè)對2025年的應(yīng)用形勢有了初步判斷,在4月份,不少機器人產(chǎn)業(yè)鏈企業(yè)開始發(fā)力,接連推出重磅新品。
    的頭像 發(fā)表于 05-13 14:00 ?562次閱讀
    2025年4月工業(yè)機器人相關(guān)<b class='flag-5'>產(chǎn)業(yè)鏈</b>新品發(fā)布情況

    聞泰科技深耕氮化鎵推動產(chǎn)業(yè)升級

    隨著人工智能、數(shù)據(jù)中心、汽車電子等應(yīng)用領(lǐng)域的快速發(fā)展,第三半導(dǎo)體——氮化鎵(GaN)正迎來前所未有的發(fā)展機遇。聞泰科技已布局GaN領(lǐng)域多年,憑借卓越的創(chuàng)新能力不斷推動產(chǎn)業(yè)鏈發(fā)展,創(chuàng)造新的價值增量。
    的頭像 發(fā)表于 02-10 17:15 ?719次閱讀
    聞泰科技深耕氮化鎵推<b class='flag-5'>動產(chǎn)業(yè)</b>升級

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛關(guān)注。 Vitality GPU
    的頭像 發(fā)表于 12-24 10:55 ?934次閱讀

    福田汽車助力景德鎮(zhèn)汽車產(chǎn)業(yè)鏈協(xié)同發(fā)展

    近日,景德鎮(zhèn)市2024年裝備制造產(chǎn)業(yè)鏈-汽車子產(chǎn)業(yè)鏈供需對接會在福田汽車景德鎮(zhèn)工廠舉辦。
    的頭像 發(fā)表于 12-13 10:04 ?572次閱讀

    華為汽車產(chǎn)業(yè)鏈的技術(shù)解析與未來展望

    編者語: 「智駕最前沿」微信公眾號后臺回復(fù): C-0613 ,獲取本文參考報告:《華為汽車產(chǎn)業(yè)鏈深度:競爭優(yōu)勢、產(chǎn)業(yè)機遇、產(chǎn)業(yè)鏈及相關(guān)企業(yè)深度梳理》pdf下載方式。 在全球汽車行業(yè)加速邁向智能化
    的頭像 發(fā)表于 12-05 12:28 ?1861次閱讀
    華為汽車<b class='flag-5'>產(chǎn)業(yè)鏈</b>的技術(shù)解析與未來展望

    58大新質(zhì)生產(chǎn)力產(chǎn)業(yè)鏈圖譜

    大躍升 的先進生產(chǎn)力。 58大新質(zhì)生產(chǎn)力產(chǎn)業(yè)鏈圖譜 01 元宇宙產(chǎn)業(yè)圖譜 02 算力產(chǎn)業(yè)圖譜 03 數(shù)商產(chǎn)業(yè)圖譜 04 人形機器人產(chǎn)業(yè)圖譜
    的頭像 發(fā)表于 11-09 10:16 ?980次閱讀
    58大新質(zhì)生產(chǎn)力<b class='flag-5'>產(chǎn)業(yè)鏈</b>圖譜

    英偉達將重新命名其Blackwell Ultra產(chǎn)品線為B300系列

    據(jù)TrendForce的最新報道,英偉達計劃對其Blackwell Ultra產(chǎn)品線進行更名,以B300系列來標識這性能提升的新系列,旨在與即將面世B100和
    的頭像 發(fā)表于 11-01 14:54 ?1048次閱讀

    頭部電池企業(yè)擴產(chǎn)熱,鎖單鋰鹽帶動產(chǎn)業(yè)鏈高景氣

    自三季度以來,電池行業(yè)迎來了顯著的復(fù)蘇跡象,以寧德時代和億緯鋰能為代表的領(lǐng)軍企業(yè)重啟并加速了投資與擴產(chǎn)活動,且這些項目多以10GWh及以上的大規(guī)模為主。這系列動作不僅限于產(chǎn)能擴張,還帶動了整個鋰電產(chǎn)業(yè)鏈上下游的活躍度提升,包括
    的頭像 發(fā)表于 10-28 13:46 ?608次閱讀

    碳化硅產(chǎn)業(yè)鏈成本大幅下降,市場迎來新變革

    近期市場消息指出,中國新能源汽車和光伏市場的快速發(fā)展,推動了碳化硅(SiC)產(chǎn)業(yè)鏈在技術(shù)迭代和產(chǎn)能擴充上的加速。這趨勢導(dǎo)致SiC產(chǎn)業(yè)鏈中的多個環(huán)節(jié)成本顯著下降,特別是SiC襯底、外延以及SiC模塊的價格降幅明顯。
    的頭像 發(fā)表于 10-22 11:48 ?1223次閱讀

    NVIDIA DGX B200首次面向零售市場:配備8塊B200 GPU

    10月13日最新消息,NVIDIA的DGX B200 AI服務(wù)器近期已在Broadberry上架,標價515,410美元(相當于約364.2萬元人民幣)。   自發(fā)布以來,Blackwell架構(gòu)就備受業(yè)界矚目,NVIDIA首席執(zhí)行官黃仁勛對其贊譽有加,微軟、Meta等科技巨頭也迅速跟進采用。
    的頭像 發(fā)表于 10-14 14:34 ?1995次閱讀

    英偉達或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現(xiàn)行H100/H200
    的頭像 發(fā)表于 08-08 17:19 ?1026次閱讀

    3萬-4萬美元/顆,英偉達最新AI芯片曝設(shè)計缺陷、延遲出貨

    Q1。 隨后,SemiAnalysis在最新研報中剖析了英偉達Blackwell B200芯片的技術(shù)挑戰(zhàn),主要在合封方面。顆Blackwell B200芯片包含了2個Blackwell GP
    的頭像 發(fā)表于 08-06 00:19 ?4663次閱讀