在最新發(fā)布的全球最強(qiáng)超級計算機(jī)排名 Top500 的榜單中,InfiniBand 網(wǎng)絡(luò)再次以絕對的數(shù)量和性能優(yōu)勢蟬聯(lián)超級計算機(jī)互連設(shè)備數(shù)量榜首,比上次排行榜的數(shù)量又有了大幅度的增長??v觀這次的榜單,可以歸納出以下三個趨勢:
基于 InfiniBand 網(wǎng)絡(luò)的超級計算機(jī)以 197 臺的數(shù)量大幅領(lǐng)先于其它網(wǎng)絡(luò)技術(shù)。特別在 Top100 的系統(tǒng)中,基于 InfiniBand 網(wǎng)絡(luò)的超級計算機(jī)更是遙遙領(lǐng)先,InfiniBand 網(wǎng)絡(luò)已經(jīng)成為了追求性能的超級計算機(jī)的標(biāo)配。
NVIDIA 網(wǎng)絡(luò)產(chǎn)品成為 Top500 系統(tǒng)中的主流互連設(shè)備,其中超過三分之二的超級計算機(jī)在使用 NVIDIA 網(wǎng)絡(luò)互連,NVIDIA 網(wǎng)絡(luò)的性能和技術(shù)領(lǐng)先性已經(jīng)得到了廣泛認(rèn)可。
還值得一提的是,InfiniBand 網(wǎng)絡(luò)不僅在傳統(tǒng)的 HPC 業(yè)務(wù),在企業(yè)級數(shù)據(jù)中心和公有云上也已被廣泛使用。目前性能第一的企業(yè)級超級計算機(jī) NVIDIA Selene 和微軟公司的 Azure 公有云都在利用 InfiniBand 網(wǎng)絡(luò)來發(fā)揮其超高的業(yè)務(wù)性能。
網(wǎng)絡(luò)計算技術(shù)成就性能優(yōu)勢
為什么 InfiniBand 網(wǎng)絡(luò)在 Top500 中受到了如此的重視?
其性能優(yōu)勢起到了決定性的作用。
InfiniBand 網(wǎng)絡(luò)率先實現(xiàn)了通信和計算在網(wǎng)絡(luò)中的融合,是業(yè)界第一款會計算的網(wǎng)絡(luò),其先進(jìn)的網(wǎng)絡(luò)計算技術(shù),不僅大幅提升了計算性能,還通過計算的手段解決了困擾通信領(lǐng)域數(shù)十年的問題,如 Reduce 、Allreduce 、Barrier 等通信操作帶來的網(wǎng)絡(luò)擁塞問題。
這些操作會在網(wǎng)絡(luò)中產(chǎn)生瞬間的網(wǎng)絡(luò)流量突發(fā),對于無損網(wǎng)絡(luò)來說,會通過擁塞控制技術(shù)來強(qiáng)迫網(wǎng)絡(luò)降速以緩解擁塞問題;對于有損網(wǎng)絡(luò)來說,就會造成網(wǎng)絡(luò)中的大量丟包,從而導(dǎo)致網(wǎng)絡(luò)重傳數(shù)據(jù),這兩種情形都會造成業(yè)務(wù)的性能下降。
由于這些通信操作是很多業(yè)務(wù)中頻繁使用的通信方式,在過去幾十年的時間里,眾多的科研人員都在致力于優(yōu)化擁塞控制的算法和優(yōu)化通信法則來解決這個問題,但是一直沒能有突破性的進(jìn)展。
InfiniBand 網(wǎng)絡(luò)的 SHARP 網(wǎng)絡(luò)計算技術(shù)(In-Network Computing)的出現(xiàn),為業(yè)界提供了新的思路,利用計算的手段從根本上可以解決這些通信模型造成的擁塞問題,讓您的網(wǎng)絡(luò)不必再降速或者丟包,在全線速的狀態(tài)下完成數(shù)據(jù)的傳輸。
這項技術(shù)已經(jīng)被廣泛用到 Top500 的眾多的機(jī)器當(dāng)中。
性能隔離技術(shù)解決企業(yè)級數(shù)據(jù)中心
和云市場難題
為什么 InfiniBand 網(wǎng)絡(luò)進(jìn)入了企業(yè)級數(shù)據(jù)中心和云的市場?
InfiniBand 網(wǎng)絡(luò)帶來的性能隔離技術(shù)為其叩開了這些市場的大門。
對于業(yè)務(wù)來進(jìn)行性能隔離也是困擾網(wǎng)絡(luò)界和計算界很久的問題,現(xiàn)在我們已經(jīng)實現(xiàn)了租戶之間的安全隔離,租戶業(yè)務(wù)和業(yè)務(wù)之間的隔離,但是當(dāng)很多的租戶在同時運行多個應(yīng)用的時候,卻無法實現(xiàn)應(yīng)用之間的性能隔離。
即使我們通過一些先進(jìn)的 QoS 技術(shù)來將計算資源和通信資源隔離開來,但卻無法實現(xiàn)業(yè)務(wù)運行在 Bare Metal 系統(tǒng)上的性能。
InfiniBand 網(wǎng)絡(luò)極先進(jìn)的性能隔離技術(shù),除了實現(xiàn)業(yè)務(wù)的隔離之外,更是保障了業(yè)務(wù)在云上多租戶、多任務(wù)的狀態(tài)下,實現(xiàn)和在 Bare Metal 環(huán)境下一樣的性能。
這項技術(shù)已經(jīng)在微軟的 Azure 公有云上開始向用戶提供服務(wù)。
在當(dāng)前的算力成為服務(wù),數(shù)據(jù)中心成為計算單元的新型計算平臺下,網(wǎng)絡(luò)成為決定算力性能的關(guān)鍵因素。
單機(jī)的性能已無法滿足算力的需求,數(shù)據(jù)中心的性能以及多數(shù)據(jù)中心的綜合性能才是算力保障的基礎(chǔ)。
作為連接數(shù)據(jù)中心內(nèi)的計算單元、存儲單元以及各個數(shù)據(jù)中心之間的網(wǎng)絡(luò),成為算力保障的核心。
InfiniBand 網(wǎng)絡(luò)憑借其極致的性能,不斷創(chuàng)新的技術(shù)架構(gòu),在更低功耗、更少硬件設(shè)備的前提下幫助用戶實現(xiàn)了業(yè)務(wù)性能的最大化,其進(jìn)入越來越多的使用場景自是大勢所趨。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5193瀏覽量
105479 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5072瀏覽量
73070 -
計算技術(shù)
+關(guān)注
關(guān)注
0文章
28瀏覽量
7984
發(fā)布評論請先 登錄
深度解析如何利用時延解決方案最大化相控陣性能

5G網(wǎng)絡(luò)中,信令測試儀如何幫助提升用戶體驗?
英偉達(dá)GTC25亮點:NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型
EE-19:最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導(dǎo)內(nèi)存效率

EE-365:在ADSP-CM40x混合信號控制處理器上實現(xiàn)ADC采樣速率最大化

光伏發(fā)電如何實現(xiàn)能效最大化
運營商如何實現(xiàn)差異化連接
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機(jī)


擴(kuò)展塢使用技巧:如何最大化你的筆記本電腦接口能力
液冷充電槍線最大化提高充電效率
Elektrobit EB zoneo平臺助力提升車輛網(wǎng)絡(luò)性能

MES系統(tǒng)幫助【線束工廠】實現(xiàn)精益生產(chǎn)和效率最大化

使用OpenUSD和NVIDIA Omniverse開發(fā)虛擬工廠解決方案

評論