在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強大功能為超級計算機提供強大助力。
美國洛斯阿拉莫斯國家實驗室 (LANL) 正在與 NVIDIA 進行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應(yīng)用的性能提高 30 倍。
LANL 研究人員預(yù)計,使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。
面向 DPU 的開放式 API
這些努力還將有助于進一步定義 OpenSNAPI,任何人都可通過該應(yīng)用接口來控制 DPU。這是統(tǒng)計計算框架( Unified Communication Framework) 的一個項目,Unified Communication Framework 是一個旨在實現(xiàn) HPC 應(yīng)用異構(gòu)計算的聯(lián)盟,成員包括 Arm、IBM、NVIDIA、美國國家實驗室和美國的一些大學(xué)。
LANL 已經(jīng)感受到網(wǎng)絡(luò)計算的強大功能,這要歸功于其創(chuàng)建的 DPU 賦能的存儲系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達同類存儲系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?br />
德克薩斯州打造出云原生超級計算平臺
德克薩斯高級計算中心 (TACC) 近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計算的開發(fā)平臺。
TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。
MPI 獲得加速
在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個 HPC 熱門編程模型的運行速度提高 26%。
他們通過卸載消息傳遞接口 (MPI) 的關(guān)鍵部分,加速了 P3DFFT,這是一個用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。
俄亥俄州立大學(xué)計算機科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團隊推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載?!?br />
HPC 中心和云中的 DPU
對于運行藥物研發(fā)或飛機設(shè)計等 HPC 仿真應(yīng)用的超級計算機而言,高達兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個 HPC 中心的代碼請求。
Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。
他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計算,而 InfiniBand 已經(jīng)在為它提供支持?!?br />
達勒姆開發(fā)負載均衡
歐洲的多個研究團隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負載。
例如,英格蘭北部的達勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個節(jié)點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現(xiàn) MPI 作業(yè)的負載均衡。該項目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。
劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用
劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU。
倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。
Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機 CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時,慕尼黑工業(yè)大學(xué)計算機體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項目的一部分。
在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實驗室合作,利用 BlueField-2 DPU 加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達 20%,且不會損失模擬的準(zhǔn)確性。
NVIDIA BlueField DPU極大推動了全球超級計算中心的發(fā)展,我們看到了加速計算未來的無限可能。
不斷擴展的網(wǎng)絡(luò)
本月早些時候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。
NEC 將使用 H100 的為筑波大學(xué)計算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計算機。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。
與此同時,Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。
他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載?!?/p>
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106423 -
DPU
+關(guān)注
關(guān)注
0文章
393瀏覽量
24938
發(fā)布評論請先 登錄
NVIDIA DOCA 3.0版本的亮點解析

NVIDIA攜手微軟加速代理式AI發(fā)展
第三屆NVIDIA DPU黑客松開啟報名
NVIDIA使用加速計算與AI推動精準(zhǔn)醫(yī)學(xué)發(fā)展
利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來

在NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優(yōu)勢

《CST Studio Suite 2024 GPU加速計算指南》
NVIDIA加速全球大多數(shù)超級計算機推動科技進步

NVIDIA加速計算如何推動醫(yī)療健康
從特斯拉看智能駕駛未來發(fā)展

NVIDIA在加速計算和生成式AI領(lǐng)域的創(chuàng)新
NVIDIA 加速人形機器人發(fā)展

評論