據(jù)TrendForce援引的消息,英偉達正計劃對其即將發(fā)布的Blackwell B300 GPU(針對人工智能AI和高性能計算HPC應(yīng)用)采用創(chuàng)新的插槽設(shè)計。這一決策的背后,是對AI GPU在高強度運算下故障率、主板替換成本以及散熱難題的深入考量。
英偉達與其他AI GPU設(shè)計者正考慮在下一代產(chǎn)品中引入插槽設(shè)計,以替代當前GPU直接焊接到主板上的做法。然而,值得注意的是,插槽式設(shè)計往往伴隨著更高的功耗和散熱挑戰(zhàn),因為最強大的GPU通常采用BGA封裝技術(shù)。
供應(yīng)鏈方面,里昂證券分析師Chen Shuowen透露,英偉達可能從其GB200 Ultra系列開始引入GPU插槽設(shè)計。Chen提到了英偉達一個包含CPU主板的4路GPU設(shè)計方案,盡管與DGX服務(wù)器的8路GPU主板和2路CPU主板設(shè)計相比,這似乎并不尋常。
英偉達的數(shù)據(jù)中心產(chǎn)品線以其GPU(如A100、H100、B100/B200)和Grace CPU + GPU平臺(如GH100、GB200)命名。目前,GB200平臺的CPU和GPU均使用BGA封裝,但B200 Ultra的更新版本是否會有所改變,尤其是下半年可能出現(xiàn)的GB200 Ultra升級,目前尚不確定。
盡管插槽設(shè)計為維修和升級提供了便利,但在服務(wù)器環(huán)境中,它們相比BGA封裝或SXM/OAM模塊,占用的空間更大,功耗和散熱限制也更多。雖然模塊可修復,但拆卸過程復雜,且可能因主板設(shè)計而異。相比之下,插槽更為便捷。
此外,附加卡和SXM/OAM模塊的制造難度高、成本昂貴,且大多數(shù)英偉達SXM模塊由富士康生產(chǎn)。從板卡或模塊轉(zhuǎn)向插槽可以降低成本,但可能會犧牲部分性能。
英偉達已推出B200 GPU(功率超過1000W),用于GB200板卡(如Bianca,配備Grace CPU和Blackwell GPU;以及Ariel,配備Ariel CPU和一個Blackwell GPU),均采用BGA封裝。此外,英偉達還推出了支持8個B200(1000W)和B100(700W)SXM模塊的Umbriel GPU板,以及Miranda和Oberon GB200等平臺。
盡管英偉達已推出基于Hopper架構(gòu)的H100甚至H200附加卡,通過降低性能以適應(yīng)傳統(tǒng)服務(wù)器的功耗和散熱限制,但英偉達尚未宣布任何基于Blackwell GPU的附加卡。
最新爆料顯示,英偉達正在準備代號為B200A的產(chǎn)品,該產(chǎn)品基于單片B102處理器,采用臺積電CoWoS-S封裝技術(shù)連接四個HBM3E內(nèi)存堆棧,與雙芯片B100/B200設(shè)計形成鮮明對比。
-
gpu
+關(guān)注
關(guān)注
28文章
4937瀏覽量
131172 -
AI
+關(guān)注
關(guān)注
88文章
35041瀏覽量
279072 -
英偉達
+關(guān)注
關(guān)注
22文章
3944瀏覽量
93596
發(fā)布評論請先 登錄
英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
新思科技攜手英偉達加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率
英偉達Blackwell芯片機架出現(xiàn)故障 訂單下滑
英偉達AI服務(wù)器供應(yīng)鏈遇挑戰(zhàn):GB300/B300 DrMOS過熱問題
英偉達將重新命名其Blackwell Ultra產(chǎn)品線為B300系列
英偉達Blackwell GPU未來一年訂單爆滿
英偉達或明年將革新AI GPU設(shè)計,采用插槽設(shè)計
英偉達AI服務(wù)器將革新采用插槽式設(shè)計
英偉達Blackwell GPU量產(chǎn)加速,Q4營收沖刺百億美元大關(guān)
英偉達Blackwell可支持10萬億參數(shù)模型AI訓練,實時大語言模型推理

評論