2023年的AWS re:Invent大會上,AWS和NVIDIA宣布AWS將成為第一個提供NVIDIA GH200 Grace Hopper超級芯片的云服務(wù)提供商。這一超級芯片通過NVIDIA DGX Cloud與NVIDIA NVLink技術(shù)相連,將在Amazon Elastic Compute Cloud(Amazon EC2)上運行,為云計算帶來了一場技術(shù)革命。
一)大殺器NVIDIA GH200 NVL32
NVIDIA GH200 NVL32 是針對 NVIDIA GH200 Grace Hopper 超級芯片的機架級參考設(shè)計,通過 NVLink 連接,面向超大規(guī)模數(shù)據(jù)中心。支持 16 個與 NVIDIA MGX 機箱設(shè)計兼容的雙 NVIDIA Grace Hopper 服務(wù)器節(jié)點,并且可以采用液體冷卻,以最大限度地提高計算密度和效率。
NVIDIA GH200 NVL32 的主要特點如下:
●擁有 32 個 GPU NVLink 域,每個 GPU NVLink 域包含一個 GH200 Grace Hopper 超級芯片,可以訪問網(wǎng)絡(luò)中任何其他 Grace Hopper 超級芯片的內(nèi)存,從而提供 19.5 TB 的 NVLink 可尋址內(nèi)存。這意味著它可以突破單個系統(tǒng)的內(nèi)存限制,實現(xiàn)更大的并行性和可擴展性。
●使用 9 個 NVLink 交換機,每個交換機包含一個第三代 NVSwitch 芯片,將 32 個 GH200 GPU 連接在一起,形成一個完全連接的胖樹網(wǎng)絡(luò)。這意味著它可以實現(xiàn)高速的通信和低延遲的同步,提高人工智能的性能和效率。
●由 NVIDIA HPC SDK 以及全套 CUDA、NVIDIA CUDA-X 和 NVIDIA Magnum IO 庫支持,可加速超過 3,000個 GPU 應(yīng)用程序。這意味著它可以提供豐富的軟件生態(tài)系統(tǒng),讓開發(fā)者和研究者可以輕松地開發(fā)和部署人工智能應(yīng)用程序。
二)NVIDIAGH200 NVL32的應(yīng)用場景
NVIDIA GH200 NVL32 非常適合以下幾種人工智能應(yīng)用場景:
1)AI推理和訓(xùn)練:生成式人工智能模型可以根據(jù)給定的文本或上下文生成自然語言,廣泛應(yīng)用于聊天機器人、文本摘要、文本生成、機器翻譯等領(lǐng)域,為用戶提供智能的交互和服務(wù)。法學(xué)碩士需要大規(guī)模、多 GPU 訓(xùn)練,參數(shù)數(shù)量非常龐大,例如 GPT-3 有 1750 億個參數(shù),GPT-4 有 1.5 萬億個參數(shù)。NVIDIA GH200 NVL32 專為推理和訓(xùn)練下一代法學(xué)碩士而構(gòu)建。該系統(tǒng)利用 32 個 NVLink 連接的 GH200 Grace Hopper 超級芯片突破了內(nèi)存、通信和計算瓶頸,訓(xùn)練萬億參數(shù)模型的速度比 NVIDIA HGX H100 快 1.7 倍 以上。在 GPT-530B 推理模型上,NVIDIA GH200 NVL32 系統(tǒng)的性能比四個 H100 NVL8 系統(tǒng)高出 2 倍。
2)推薦系統(tǒng):人工智能模型可以根據(jù)用戶的偏好和行為,向用戶推薦最相關(guān)和最感興趣的內(nèi)容或產(chǎn)品。它們廣泛用于電子商務(wù)和零售、媒體和社交媒體、數(shù)字廣告等領(lǐng)域,以實現(xiàn)內(nèi)容個性化。
這推動了收入和商業(yè)價值。推薦器使用代表用戶、產(chǎn)品、類別和上下文的嵌入,大小可達數(shù)十 TB。高度準確的推薦器將提供更具吸引力的用戶體驗,但也需要更大的嵌入和更精確的推薦器。嵌入對于人工智能模型具有獨特的特征,需要大量內(nèi)存、高帶寬和閃電般快速的網(wǎng)絡(luò)。NVIDIA GH200 NVL32 可提供 7 倍 的快速訪問內(nèi)存,并且與基于 x86 的傳統(tǒng)設(shè)計中與 GPU 的 PCIe Gen5 連接相比,可提供 7 倍 的帶寬。與采用 x86 的 H100 相比,它可以實現(xiàn) 7 倍 詳細的嵌入。NVIDIA GH200 NVL32 還可以為具有大量嵌入表的模型提供高達 7.9 倍 的訓(xùn)練性能。
3)圖神經(jīng)網(wǎng)絡(luò):圖神經(jīng)網(wǎng)絡(luò)是一種人工智能模型,可以將深度學(xué)習(xí)的預(yù)測能力應(yīng)用于豐富的數(shù)據(jù)結(jié)構(gòu),這些數(shù)據(jù)結(jié)構(gòu)將對象及其關(guān)系描述為圖中由線連接的點。科學(xué)和工業(yè)的許多分支已經(jīng)將有價值的數(shù)據(jù)存儲在圖數(shù)據(jù)庫中。深度學(xué)習(xí)用于訓(xùn)練預(yù)測模型,從圖表中挖掘新的見解。
總結(jié):
Amazon和NVIDIA推動NVIDIA DGX Cloud即將在AWS上推出,將成為首家在DGX云中提供NVIDIA GH200 NVL32,并將其作為EC2實例的云服務(wù)提供商。NVIDIA GH200 NVL32解決方案包含32個GPU NVLink域和19.5 TB的大容量統(tǒng)一內(nèi)存。在GPT-3的訓(xùn)練和LLM推理方面明顯優(yōu)于先前的模型。NVIDIA GH200 NVL32的CPU-GPU內(nèi)存互連速度非???,提高了應(yīng)用程序的內(nèi)存可用性。該技術(shù)是超大規(guī)模數(shù)據(jù)中心可擴展設(shè)計的一部分,由NVIDIA軟件和庫提供支持,可加速數(shù)千個GPU應(yīng)用程序。NVIDIA GH200 NVL32特別適用于LLM訓(xùn)練和推理、推薦系統(tǒng)、GNN等任務(wù),為人工智能和計算應(yīng)用程序帶來顯著的性能改進。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106421 -
GPT
+關(guān)注
關(guān)注
0文章
368瀏覽量
16096 -
超級芯片
+關(guān)注
關(guān)注
0文章
38瀏覽量
9093 -
AWS
+關(guān)注
關(guān)注
0文章
437瀏覽量
25285 -
GPU芯片
+關(guān)注
關(guān)注
1文章
305瀏覽量
6205
原文標題:NVIDIA GH200 NVL32在AWS里落地
文章出處:【微信號:QCDZSJ,微信公眾號:汽車電子設(shè)計】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
極海半導(dǎo)體榮獲2025年度創(chuàng)新車規(guī)級芯片提供商
NVIDIA技術(shù)賦能歐洲最快超級計算機JUPITER
NVIDIA Grace CPU C1獲得廣泛支持
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

RAKsmart公司介紹:全球領(lǐng)先的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施與云服務(wù)提供商
MediaTek與NVIDIA攜手設(shè)計GB10 Grace Blackwell超級芯片
MediaTek與NVIDIA攜手打造超級芯片
MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級芯片
NVIDIA推出個人AI超級計算機Project DIGITS
聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個人AI超級計算機設(shè)計NVIDIA GB10超級芯片
NVIDIA Colossus超級計算機集群突破10萬顆Hopper GPU
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機

評論