在最新發(fā)布的全球最強超級計算機排名 Top500 的榜單中,InfiniBand 網(wǎng)絡(luò)再次以絕對的數(shù)量和性能優(yōu)勢蟬聯(lián)超級計算機互連設(shè)備數(shù)量榜首,比上次排行榜的數(shù)量又有了大幅度的增長。縱觀這次的榜單,可以歸納出以下三個趨勢。
基于 InfiniBand 網(wǎng)絡(luò)的超級計算機以 197 臺的數(shù)量大幅領(lǐng)先于其它網(wǎng)絡(luò)技術(shù)。特別在 Top100 的系統(tǒng)中,基于 InfiniBand 網(wǎng)絡(luò)的超級計算機更是遙遙領(lǐng)先,InfiniBand 網(wǎng)絡(luò)已經(jīng)成為了追求性能的超級計算機的標(biāo)配。
NVIDIA 網(wǎng)絡(luò)產(chǎn)品成為 Top500 系統(tǒng)中的主流互連設(shè)備,其中超過三分之二的超級計算機在使用 NVIDIA 網(wǎng)絡(luò)互連,NVIDIA 網(wǎng)絡(luò)的性能和技術(shù)領(lǐng)先性已經(jīng)得到了廣泛認(rèn)可。
還值得一提的是,InfiniBand 網(wǎng)絡(luò)不僅在傳統(tǒng)的 HPC 業(yè)務(wù),在企業(yè)級數(shù)據(jù)中心和公有云上也已被廣泛使用。目前性能第一的企業(yè)級超級計算機 NVIDIA Selene 和微軟公司的 Azure 公有云都在利用 InfiniBand 網(wǎng)絡(luò)來發(fā)揮其超高的業(yè)務(wù)性能。
網(wǎng)絡(luò)計算技術(shù)成就性能優(yōu)勢
為什么 InfiniBand 網(wǎng)絡(luò)在 Top500 中受到了如此的重視?
其性能優(yōu)勢起到了決定性的作用。
InfiniBand 網(wǎng)絡(luò)率先實現(xiàn)了通信和計算在網(wǎng)絡(luò)中的融合,是業(yè)界第一款會計算的網(wǎng)絡(luò),其先進的網(wǎng)絡(luò)計算技術(shù),不僅大幅提升了計算性能,還通過計算的手段解決了困擾通信領(lǐng)域數(shù)十年的問題,如 Reduce 、Allreduce 、Barrier 等通信操作帶來的網(wǎng)絡(luò)擁塞問題。
這些操作會在網(wǎng)絡(luò)中產(chǎn)生瞬間的網(wǎng)絡(luò)流量突發(fā),對于無損網(wǎng)絡(luò)來說,會通過擁塞控制技術(shù)來強迫網(wǎng)絡(luò)降速以緩解擁塞問題;對于有損網(wǎng)絡(luò)來說,就會造成網(wǎng)絡(luò)中的大量丟包,從而導(dǎo)致網(wǎng)絡(luò)重傳數(shù)據(jù),這兩種情形都會造成業(yè)務(wù)的性能下降。
由于這些通信操作是很多業(yè)務(wù)中頻繁使用的通信方式,在過去幾十年的時間里,眾多的科研人員都在致力于優(yōu)化擁塞控制的算法和優(yōu)化通信法則來解決這個問題,但是一直沒能有突破性的進展。
InfiniBand 網(wǎng)絡(luò)的 SHARP 網(wǎng)絡(luò)計算技術(shù)(In-Network Computing)的出現(xiàn),為業(yè)界提供了新的思路,利用計算的手段從根本上可以解決這些通信模型造成的擁塞問題,讓您的網(wǎng)絡(luò)不必再降速或者丟包,在全線速的狀態(tài)下完成數(shù)據(jù)的傳輸。
這項技術(shù)已經(jīng)被廣泛用到 Top500 的眾多的機器當(dāng)中。
性能隔離技術(shù)解決企業(yè)級數(shù)據(jù)中心
和云市場難題
為什么 InfiniBand 網(wǎng)絡(luò)進入了企業(yè)級數(shù)據(jù)中心和云的市場?
InfiniBand 網(wǎng)絡(luò)帶來的性能隔離技術(shù)為其叩開了這些市場的大門。
對于業(yè)務(wù)來進行性能隔離也是困擾網(wǎng)絡(luò)界和計算界很久的問題,現(xiàn)在我們已經(jīng)實現(xiàn)了租戶之間的安全隔離,租戶業(yè)務(wù)和業(yè)務(wù)之間的隔離,但是當(dāng)很多的租戶在同時運行多個應(yīng)用的時候,卻無法實現(xiàn)應(yīng)用之間的性能隔離。
即使我們通過一些先進的 QoS 技術(shù)來將計算資源和通信資源隔離開來,但卻無法實現(xiàn)業(yè)務(wù)運行在 Bare Metal 系統(tǒng)上的性能。
InfiniBand 網(wǎng)絡(luò)極先進的性能隔離技術(shù),除了實現(xiàn)業(yè)務(wù)的隔離之外,更是保障了業(yè)務(wù)在云上多租戶、多任務(wù)的狀態(tài)下,實現(xiàn)和在 Bare Metal 環(huán)境下一樣的性能。
這項技術(shù)已經(jīng)在微軟的 Azure 公有云上開始向用戶提供服務(wù)。
在當(dāng)前的算力成為服務(wù),數(shù)據(jù)中心成為計算單元的新型計算平臺下,網(wǎng)絡(luò)成為決定算力性能的關(guān)鍵因素。
單機的性能已無法滿足算力的需求,數(shù)據(jù)中心的性能以及多數(shù)據(jù)中心的綜合性能才是算力保障的基礎(chǔ)。
作為連接數(shù)據(jù)中心內(nèi)的計算單元、存儲單元以及各個數(shù)據(jù)中心之間的網(wǎng)絡(luò),成為算力保障的核心。
InfiniBand 網(wǎng)絡(luò)憑借其極致的性能,不斷創(chuàng)新的技術(shù)架構(gòu),在更低功耗、更少硬件設(shè)備的前提下幫助用戶實現(xiàn)了業(yè)務(wù)性能的最大化,其進入越來越多的使用場景自是大勢所趨。
原文標(biāo)題:算力時代,網(wǎng)絡(luò)決定性能
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106469 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5232瀏覽量
73541 -
InfiniBand
+關(guān)注
關(guān)注
1文章
31瀏覽量
9403 -
公有云
+關(guān)注
關(guān)注
1文章
104瀏覽量
17687
原文標(biāo)題:算力時代,網(wǎng)絡(luò)決定性能
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案
數(shù)據(jù)中心和通信網(wǎng)絡(luò)有什么區(qū)別

小型數(shù)據(jù)中心晶振選型關(guān)鍵參數(shù)全解
華為面向亞太地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡(luò)方案
華為榮獲數(shù)據(jù)中心自智網(wǎng)絡(luò)基礎(chǔ)能力解決方案檢測證書
27MHz HCSL 差分晶體振蕩器在數(shù)據(jù)中心網(wǎng)絡(luò)存儲系統(tǒng)中的應(yīng)用方案
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)
華為全新升級星河AI數(shù)據(jù)中心網(wǎng)絡(luò)
優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
亞馬遜云科技發(fā)布全新數(shù)據(jù)中心組件
NIDA發(fā)布《智算數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)技術(shù)要求》
Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片

評論