最近又讀了阿里巴巴的技術(shù)委員會的新書《彈性計算》,從序上看的確很新,2020年7月。在疫情這個年代,短時間內(nèi)出版再次證明了中國人民的偉大。關(guān)于書中的內(nèi)容,不想再多說。俺幾個小時讀下來,挑了幾個錯別字,以后找各位大佬領(lǐng)賞了。
其中印象深刻的是,為什么有神龍裸金屬服務(wù)器,對RDMA的支持是一個關(guān)鍵的場景。在云計算中引入RDMA,目的也很明確-HPC。HPC是老黃的老巢,也是老黃現(xiàn)在整合網(wǎng)絡(luò),計算和存儲的試驗田。有了Mellanox,ARM加持,老黃提出了自己的口號:
CPU,做業(yè)務(wù)的編排,框架
GPU,做計算
DPU,數(shù)據(jù)的搬運(yùn)和服務(wù)
不得不講,老黃的市場部很強(qiáng)大,DPU就這樣橫空出世了。對比我司萬能的P2P[1]的功能,我們就是簡單說P2P,不知道的人以為我們就是個金融片子,悲催的我司沒趕上匹凸匹的好時光。人家老黃不對稱的P2P實現(xiàn)就有一個響亮的名字,GPUDirect。同樣,老黃的Tensor Core也有一個土鱉的名字,DSP。
這里就來談?wù)勥@個RDMA,RDMA的優(yōu)勢和劣勢都很清楚。在過去的10幾年中,mellanox作為另類的以色列公司持續(xù)投入了很多年。(大部分以色列公司的套路是第一代產(chǎn)品創(chuàng)新,賣公司。公司賣不掉,第二代產(chǎn)品就SoSo了,如果有第三代產(chǎn)品,可以真接pass了)。
在Flash剛剛進(jìn)入數(shù)據(jù)中心的時候,大家都在考慮DAS到SANder問題,什么樣的網(wǎng)絡(luò)最合適。
其中試過PCIE 外接,AMD的HT,等等。就像一位做HPC出身的朋友講的一樣:“沒幾年就會冒出了一堆硬件公司,然后大家就上一把,然后大部分公司都死掉了”
因此,可以看到IB versb在2010年成為主流,在HPC中目前已經(jīng)已有疲態(tài)了,正是把這個HPC的專用技術(shù)用到hyperscale數(shù)據(jù)中心的好時機(jī)。
第一個規(guī)模使用IB而成功的案例是Oracle 的Exadata[1]
之后就是大量的SDS存儲的公司起來了。Flash+RDMA是大家的標(biāo)配。直到Microsoft在數(shù)據(jù)中心中規(guī)模部署。其實之前的RoCE本質(zhì)上還是一個channel的協(xié)議,和之前的FCOE類似,只是在RoCEv2的時候,因為Microsoft的加持,從真正成就了Mellanox,同時把原來最擅長存儲的Iwarp打進(jìn)了小眾市場,但是目前IBM和Netapp依然在堅守。
原來一個Intel的網(wǎng)卡大佬就很不服氣,“我們做網(wǎng)卡快20年了,Mellanox的ethernet 網(wǎng)卡到現(xiàn)在都有很多功能不支持,但是他們咋就成了先進(jìn)技術(shù)了,成了Smartnic呢?”。這樣的話,當(dāng)年EMC也說過Fusion-io這樣的startup。
不管結(jié)果如何,Microsoft和Mellanox在Data Center Network的深度合作,讓Mellanox在25G成功上位。取代了Intel和Broadcom在高端網(wǎng)卡的江湖地位。
當(dāng)年在見識了Annapuna的EBS性能之后,我在加入新公司時就對大佬說要做RDMA,要做RoCEv2。但是大佬就是大佬,他們認(rèn)為lossless的網(wǎng)絡(luò)一直就是一個傳說。而且,那個時候AI正在風(fēng)口上??傊?,這個事情也讓我看清了一個事實,就是Hyperscale用RDMA,只會有兩種配置:Mellanox的RDMA,以及他們自己的RDMA。
這個微軟是最先這么考慮的,他們就是認(rèn)為RDMA只有兩種。微軟內(nèi)部實現(xiàn)的RDMA的細(xì)節(jié)很少有透露,知道的大佬歡迎分享。
但是另一個大佬的AWS的RDMA就有很多細(xì)節(jié)。拿另一個常常教育我的大佬的話:“ 他們想做什么都在EFA的驅(qū)動里寫著!??!“。在火焰圖流行的這個時代,靜態(tài)分析的確有點反人類。
比較好的是,作為HPC RDMA權(quán)威的熊貓教授率先被AWS的EFA招安,他們在SC19以及今年發(fā)表很多關(guān)于EFA的詳細(xì)信息[2]。當(dāng)然還有Annapurna CTO Nafea 同學(xué)的軟文[3]
熊貓教授的一個學(xué)生做了Azure和AWS的RDMA性能的分析,因為過于敏感,自己關(guān)心的人可以去了解。但是以后估計每家大廠炫耀的資本里面會很快有一個:“我的RDMA是自研的,是XXXCloud特色的RDMA!”
--”老黃你怎么辦呢?“
”DPU,DPU+GPU,DPU+GPU+CPU。。。。。。?!?/p>
--”Chiplets 要不要考慮一下?“
責(zé)任編輯:haq
-
cpu
+關(guān)注
關(guān)注
68文章
11077瀏覽量
217023 -
云計算
+關(guān)注
關(guān)注
39文章
7976瀏覽量
140022 -
DPU
+關(guān)注
關(guān)注
0文章
393瀏覽量
24926
發(fā)布評論請先 登錄
HPC云計算的技術(shù)架構(gòu)
遙遙領(lǐng)先的華為云 Flexus 云服務(wù)器 X 它來了~~~~

評論