2022年3月,NVIDIA發(fā)布了首款數(shù)據(jù)中心CPU Grace、新一代高性能計(jì)算GPU Hopper,同時(shí)利用它們打造了兩顆“超級芯片”(Super Chip),一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一,看起來都極為酷炫。
現(xiàn)在,足足14個(gè)月過去了,NVIDIA終于宣布,GH200 Grace Hopper超級芯片已經(jīng)全面投產(chǎn),將為復(fù)雜AI、HPC工作負(fù)載提供澎湃的動(dòng)力。
再加上Grace CPU、Hopper GPU、Ada Lovelace GPU、BlueField DPU等全套系統(tǒng)方案,NVIDIA現(xiàn)在已經(jīng)有400多種配置,可滿足市場對生成式AI的激增需求。
歐洲和美國的超大規(guī)模云服務(wù)商、超算中心,將會成為接入GH200系統(tǒng)的首批客戶。
同時(shí),黃仁勛還公布了Grace Hopper的更多細(xì)節(jié),尤其是它的CPU、GPU之間使用NVLink-C2C互連技術(shù),總帶寬高達(dá)900GB/s,相比傳統(tǒng)的PCIe 5.0通道超出足足7倍,能夠滿足要求最苛刻的生成式AI和HPC應(yīng)用,功耗也降低了超過80%。
Grace Hopper是一塊CPU+GPU合體的超級芯片,CPU是NVIDIA自研的72核處理器,Neoverse V2內(nèi)核,擁有480GB LPDDR5內(nèi)存,512GB/s帶寬。
GPU部分是H100,F(xiàn)P64性能34TFLOPS,但更強(qiáng)的是INT8性能,AI運(yùn)算能力達(dá)到了3958TFLOPS,帶96GB HBM3內(nèi)存。
同時(shí),NVIDIA發(fā)布了針對AI推出的大內(nèi)存DGX GH200超算系統(tǒng),配備了256個(gè)Grace Hopper芯片,總計(jì)1.8萬CPU核心,144TB內(nèi)存,相比之前漲了500倍。
AI運(yùn)算對內(nèi)存容量的要求更高,所以DGX GH200通過最新的NVLink、NVLink Switch等技術(shù)連接了256塊Grace Hooper超級芯片,實(shí)現(xiàn)了極為夸張的性能及內(nèi)存。
GH200總計(jì)有256塊Grace Hooper芯片,因此總計(jì)18432個(gè)CPU核心,144TB HBM3內(nèi)存,AI性能達(dá)到了1 exaFLOPS,也就是100億億次。
這是什么概念?當(dāng)前最強(qiáng)的TOP500超算也就是百億億次性能,只不過這個(gè)性能是HPC計(jì)算的,NVIDIA的是百億億次AI性能。
為了讓256個(gè)超級芯片互聯(lián),GH200還使用了256塊單口400Gb/s InfiniBand互聯(lián)芯片,256個(gè)雙口200Gb/s InfiniBand芯片,還有96組L1 NVLink、36組L2 NVLink開關(guān)等等,設(shè)計(jì)非常復(fù)雜。
NVIDIA表示,谷歌、Meta及微軟是首批獲得DGX H200系統(tǒng)的公司,后續(xù)他們還會開放給更多客戶,運(yùn)行客戶定制。
不過DGX H200還不是最強(qiáng)的,NVIDIA今年晚些時(shí)候會推出名為NVIDIA Helios的AI超算系統(tǒng),由4組GH200組成,總計(jì)1024個(gè)Grace Hooper超級芯片,576TB HBM內(nèi)存。
黃仁勛還向傳統(tǒng)的CPU服務(wù)器集群發(fā)起“挑戰(zhàn)”,認(rèn)為在人工智能和加速計(jì)算這一未來方向上,GPU服務(wù)器有著更為強(qiáng)大的優(yōu)勢。
根據(jù)黃仁勛在演講上展示的范例,訓(xùn)練一個(gè)LLM大語言模型,將需要960個(gè)CPU組成的服務(wù)器集群,這將耗費(fèi)大約1000萬美元(約合人民幣7070萬元),并消耗11千兆瓦時(shí)的電力。
相比之下,同樣以1000萬美元的成本去組建GPU服務(wù)器集群,將以僅3.2千兆瓦時(shí)的電力消耗,訓(xùn)練44個(gè)LLM大模型。
如果同樣消耗11千兆瓦時(shí)的電量,那么GPU服務(wù)器集群能夠?qū)崿F(xiàn)150倍的加速,訓(xùn)練150個(gè)LLM大模型,且占地面積更小。
而當(dāng)用戶僅僅想訓(xùn)練一個(gè)LLM大模型時(shí),則只需要一個(gè)40萬美元左右,消耗0.13千兆瓦時(shí)電力的GPU服務(wù)器即可。
換言之,相比CPU服務(wù)器,GPU服務(wù)器能夠以4%的成本和1.2%的電力消耗來訓(xùn)練一個(gè)LLM,這將帶來巨大的成本節(jié)省。
審核編輯 :李倩
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5282瀏覽量
106053 -
gpu
+關(guān)注
關(guān)注
28文章
4925瀏覽量
130915 -
超級芯片
+關(guān)注
關(guān)注
0文章
38瀏覽量
9065
原文標(biāo)題:領(lǐng)先幾光年!NVIDIA CPU+GPU超級芯片終于量產(chǎn)
文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理
借助NVIDIA技術(shù)加速半導(dǎo)體芯片制造
MediaTek與NVIDIA攜手設(shè)計(jì)GB10 Grace Blackwell超級芯片
MediaTek與NVIDIA攜手打造超級芯片
MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級芯片
聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個(gè)人AI超級計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級芯片
《CST Studio Suite 2024 GPU加速計(jì)算指南》
NVIDIA Colossus超級計(jì)算機(jī)集群突破10萬顆Hopper GPU
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計(jì)算機(jī)

AMD與NVIDIA GPU優(yōu)缺點(diǎn)
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽
名單公布!【書籍評測活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
NVIDIA GB200超級芯片引領(lǐng)液冷散熱新紀(jì)元
NVIDIA GB200 CPU+GPU超級芯片功耗達(dá)2700W
超級猛獸 GPU ?NVIDIA GeForce RTX 5090 基本頻率接近 2.9 GHz

評論