一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)中心超融合以太網(wǎng)技術(shù)解析

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-09-11 14:55 ? 次閱讀

AI集群訓練過程中,參數(shù)通過高速互聯(lián)網(wǎng)絡在不同的服務器間進行同步交互,這些通信流量具有共同的特征:流量成周期性、流數(shù)量少、流量長連接、并行任務間有強實時同步性要求,通信效率取決于最慢的節(jié)點,并且AI集群訓練場景下,傳輸?shù)臄?shù)據(jù)量較大。上述的流量特征導致網(wǎng)絡較易出現(xiàn)負載分擔不均、整網(wǎng)吞吐下降的問題,從而影響AI集群訓練的性能。

當前網(wǎng)絡均衡的主流技術(shù)有三種,逐流(Flow-based)ECMP均衡、基于子流flowlet均衡和逐包(Packet-based)ECMP均衡。逐流ECMP均衡,是當前最為常用的負載均衡算法,基于流量的五元組進行HASH負載均衡,在流鏈接數(shù)量較多的場景下適用,它優(yōu)勢在于無亂序,劣勢在于流數(shù)量較少時,例如AI訓練場景下,存在HASH沖突問題,網(wǎng)絡均衡效果不佳?;谧恿鱢lowlet均衡技術(shù),它依賴于子流之間時間間隔GAP值的正確配置來實現(xiàn)均衡,但由于網(wǎng)路中全局路徑級時延信息不可知,因此GAP值無法準確配置。同時,該技術(shù)存在接收端側(cè)亂序的問題。逐包(Packet-based)ECMP均衡,理論上均衡度最好,但實際在接收端側(cè)存在大量亂序問題,現(xiàn)實中幾乎無使用案例。

現(xiàn)有創(chuàng)新的網(wǎng)絡均衡技術(shù)NSLB是面向AI訓練場景量身打造的,根據(jù)該場景下的流量特征,將搜集到的整網(wǎng)信息作為創(chuàng)新算路算法的輸入,從而得到最優(yōu)的流量轉(zhuǎn)發(fā)路徑,實現(xiàn)AI訓練場景下整網(wǎng)流量100%的均衡度和AI訓練性能的提升。

利用12臺GPU服務器(每臺服務器包含1塊型號為Tesla v100S PCIe 32GB的GPU卡),4臺華為交換機組成2級CLOS網(wǎng)絡(其中2臺交換機作為接入層交換機,每臺下掛6臺服務器,使用100GE單端口接入,2臺交換機作為匯聚交換機,每臺與接入層交換機之間使用6個100GE端口互聯(lián))的AI訓練集群,運行開源Tensorflow深度學習平臺上的VGG16深度學習網(wǎng)絡模型。以下為采用NSLB技術(shù)運行單計算任務和多計算任務時,AI訓練性能的提升結(jié)果。

22147cfa-4ebe-11ee-a25d-92fbcf53809c.png

Ring算法場景,運行單個計算任務下,使用NSLB技術(shù)對比典型ECMP負載分擔技術(shù),AI訓練集性能最高提升113.41%。

2234cadc-4ebe-11ee-a25d-92fbcf53809c.png

Ring算法場景,運行兩個計算任務下,使用NSLB技術(shù)對比典型ECMP負載分擔技術(shù),AI訓練集性能最高提升57.29%。

高性能計算、AI模型訓練等應用場景,以及數(shù)據(jù)中心網(wǎng)絡/云網(wǎng)絡在架構(gòu)上的發(fā)展(資源池化),均要求網(wǎng)絡傳輸排隊時延和吞吐上的進一步性能提升。例如,為了保證性能損失在5%以內(nèi),數(shù)據(jù)庫集群系統(tǒng)要求至少40Gbps的吞吐和3us的網(wǎng)絡RTT。為了達到極低時延的傳輸,應當盡力降低網(wǎng)絡設備上的排隊時延,同時維持接近瓶頸鏈路滿吞吐。

隨著業(yè)務發(fā)放速度的不斷加快,以及引入了VM、容器等虛擬化技術(shù),網(wǎng)絡流量的不確定性增加。而當前運維手段有限,仍然依靠傳統(tǒng)網(wǎng)管和命令行方式進行查看、監(jiān)控,分鐘級的網(wǎng)絡監(jiān)控已經(jīng)無法滿足業(yè)務秒級體驗保障的要求,往往被動感知故障。故障發(fā)生后,定位仍主要依賴專家經(jīng)驗,利用多種輔助工具,逐段定界、逐流分析、抓包定位,效率十分低下。

為了解決上述故障收斂慢的問題,提出了一種基于網(wǎng)絡設備數(shù)據(jù)面的鏈路故障快速自愈技術(shù),稱為DPFF(Data Plane Fast Failover)。該技術(shù)基于轉(zhuǎn)發(fā)芯片的硬件可編程能力構(gòu)建。DPFF從傳統(tǒng)的基于控制面軟件協(xié)議的收斂方式演進到基于數(shù)據(jù)面硬件極速感知故障和快速換路的收斂方式,并且基于數(shù)據(jù)面硬件實現(xiàn)遠程通告和快速換路,可達到亞毫秒級(<1ms)的收斂速度,將對業(yè)務性能的影響降至最低。該技術(shù)為高性能數(shù)據(jù)庫、存儲以及超算等關鍵應用提供了極致的高可靠性保證和穩(wěn)定性體驗。

實驗室采用4臺華為交換機組成2級CLOS網(wǎng)絡(其中2臺交換機作為接入層交換機,每臺下掛>2臺服務器,2臺交換機作為匯聚交換機),利用vdbench 測試套件,客戶端服務器與存儲陣列建立兩個連接,每連接8個qp,并發(fā)訪問8個SSD磁盤。通過拔光纖模擬鏈路故障。256KB message size,16 threads,write IO , 觀察鏈路故障發(fā)送后的IOPS指標。

2277367e-4ebe-11ee-a25d-92fbcf53809c.png

測試結(jié)論:DPFF方案下鏈路故障對IOPS性能幾乎沒有影響,而OSPF協(xié)議收斂方案下IOPS出現(xiàn)多秒跌零情況。

利用Benchmarksql測試套件進行在線事務處理模型的測試,又稱TPC-C測試。統(tǒng)計每百毫秒周期內(nèi)完成的在線事務的數(shù)量,通過查看該數(shù)量值的變化測試收斂性能對業(yè)務性能的影響。模擬鏈路故障,重復測試4次, 觀察在線交易事務受影響情況。

2292d88e-4ebe-11ee-a25d-92fbcf53809c.png

測試結(jié)論:DPFF收斂方案比傳統(tǒng)的OSPF收斂方案在鏈路故障下,每100ms周期內(nèi)完成交易事務數(shù)量下降減少60%~80%。

計算集群網(wǎng)絡傳統(tǒng)采用CLOS架構(gòu),以業(yè)界常見的64口盒式交換機為例,3級CLOS架構(gòu),最大可支持6.5萬服務器接口,不滿足10E級計算集群規(guī)模訴求。如果增加網(wǎng)絡層數(shù)則會帶來網(wǎng)絡跳數(shù)增加,通信時延不滿足業(yè)務需求。

業(yè)界針對該問題開展了多樣的架構(gòu)研究和新拓撲的設計。直連拓撲在超大規(guī)模組網(wǎng)場景下,因為網(wǎng)絡直徑短,具備低成本、端到端通信跳數(shù)少的特點。以64口盒式交換機構(gòu)建10萬個節(jié)點超大規(guī)模集群為例,傳統(tǒng)的CLOS架構(gòu)需要部署4層組網(wǎng),端到端通信最大需要跨7跳交換機。使用無阻塞直連拓撲組網(wǎng),端到端交換機轉(zhuǎn)發(fā)跳數(shù)最少只3跳,交換機臺數(shù)(整體投資)下降40%。

22c4abfc-4ebe-11ee-a25d-92fbcf53809c.png

采用12臺GPU服務器,每臺服務器2塊GPU卡,型號Tesla v100s;2塊CX6-Dx網(wǎng)卡,網(wǎng)卡是100G單端口接入。OSU MPI Benchmark測試AllReduce集合通信操作,DF相對FT組網(wǎng),任務完成時間最高提升39.47%,總體提升21.63%。

22f267fe-4ebe-11ee-a25d-92fbcf53809c.png

OSU MPI Benchmark測試Alltoall集合通信操作, DF相對FT組網(wǎng),任務完成時間最高提升56.53%,總體提升49.71%。

2313d056-4ebe-11ee-a25d-92fbcf53809c.png

隨著高性能網(wǎng)絡的全以太化發(fā)展,超融合以太網(wǎng)絡同時承載計算、存儲、管理和虛擬化等多種業(yè)務流量。為了追求更極致的性能,不同業(yè)務流量之間,極易出現(xiàn)互相干擾現(xiàn)象,競爭網(wǎng)絡側(cè)有限的端口轉(zhuǎn)發(fā)資源。

為了解決這個難題,提出超融合智能無損網(wǎng)絡方案,將業(yè)務級SLA智能保障技術(shù)引入到交換機中,用iLoss-less智能無損算法代替專家經(jīng)驗,對網(wǎng)絡流量的變化進行基于隊列級捕獲和預測,實現(xiàn)細粒度動態(tài)差異化優(yōu)化。結(jié)合不同業(yè)務的流量變化情況以及業(yè)務特征,實現(xiàn)不同業(yè)務流量差異化動態(tài)優(yōu)化保障。

23355000-4ebe-11ee-a25d-92fbcf53809c.png

2363a590-4ebe-11ee-a25d-92fbcf53809c.png

根據(jù)實驗室測試,采用3臺華為交換機組成2級Spine-Leaf組網(wǎng),每臺接入層交換機下掛16臺100GE服務器,Spine與每個Leaf之間采用4個400G互聯(lián)(1:1收斂)。在計算和存儲benchmark流量混跑的測試環(huán)境下,智能無損算法相比于傳統(tǒng)算法配置,在保持存儲持平前提下,能夠有效降低計算任務的總體完成時間,在測試場景中實現(xiàn)最高20%以上的計算時延降低。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 負載
    +關注

    關注

    2

    文章

    600

    瀏覽量

    34944
  • 服務器
    +關注

    關注

    12

    文章

    9603

    瀏覽量

    87019
  • 數(shù)據(jù)中心

    關注

    16

    文章

    5072

    瀏覽量

    73070
  • AI
    AI
    +關注

    關注

    87

    文章

    33628

    瀏覽量

    274342
  • 均衡技術(shù)

    關注

    0

    文章

    12

    瀏覽量

    6709

原文標題:數(shù)據(jù)中心超融合以太技術(shù)(2023)

文章出處:【微信號:架構(gòu)師技術(shù)聯(lián)盟,微信公眾號:架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    以太網(wǎng)交換機將在數(shù)據(jù)中心領域加速增長

    近幾年,隨著(移動)互聯(lián)網(wǎng)、云計算和大數(shù)據(jù)產(chǎn)業(yè)的加速發(fā)展,進一步推動了數(shù)據(jù)中心的建設步伐。據(jù)Dell‘Oro集團最新調(diào)查報告顯示,2019年,數(shù)據(jù)中心以太網(wǎng)交換機市場預計將
    發(fā)表于 08-05 07:47 ?771次閱讀

    以太網(wǎng)技術(shù)基本原理

    Xeros公司開發(fā)的一種基帶局域網(wǎng)技術(shù),使用同軸電纜作為網(wǎng)絡媒體,采用載波多路訪問和碰撞檢測(CSMA/CD)機制,數(shù)據(jù)傳輸速率達到10Mbps。雖然以太網(wǎng)是由Xeros公司早在70年代最先研制成功,但是如今
    發(fā)表于 12-03 19:07

    探討工業(yè)以太網(wǎng)技術(shù)(一)

    所謂工業(yè)以太網(wǎng)就是在以太網(wǎng)技術(shù)和TCP/IP技術(shù)的基礎上開發(fā)出來的一種現(xiàn)場總線。作為現(xiàn)場總線的工業(yè)以太網(wǎng)與一般的商用以太網(wǎng)有很大不同。 必須
    發(fā)表于 12-15 14:28

    探討工業(yè)以太網(wǎng)技術(shù)~(二)

    所謂工業(yè)以太網(wǎng)就是在以太網(wǎng)技術(shù)和TCP/IP技術(shù)的基礎上開發(fā)出來的一種現(xiàn)場總線。作為現(xiàn)場總線的工業(yè)以太網(wǎng)與一般的商用以太網(wǎng)有很大不同。 必須
    發(fā)表于 12-15 14:29

    網(wǎng)絡發(fā)展怎么改變企業(yè)數(shù)據(jù)中心的面貌的

    云和網(wǎng)絡規(guī)模提供商已經(jīng)實施了軟件定義存儲、融合架構(gòu)和融合架構(gòu)。以太網(wǎng)存儲結(jié)構(gòu)(ESF)技術(shù)已經(jīng)成為數(shù)據(jù)
    發(fā)表于 08-16 15:08

    以太網(wǎng)技術(shù)基本原理

    以太網(wǎng)技術(shù)基本原理 通常我們所說的以太網(wǎng)主要是指以下三種不同的局域網(wǎng)技術(shù):  
    發(fā)表于 07-24 08:10 ?5586次閱讀
    <b class='flag-5'>以太網(wǎng)技術(shù)</b>基本原理

    更好的以太網(wǎng)打造更現(xiàn)代的數(shù)據(jù)中心

    以太網(wǎng)正在隨著數(shù)據(jù)中心不斷發(fā)展,有時這意味著增量改進,而不是巨大的飛躍。在數(shù)據(jù)中心網(wǎng)絡基礎設施的變革中,值得注意的是,傳統(tǒng)網(wǎng)絡技術(shù)需要應付瞬息萬變的世界,而解決方案并不總是更多的帶寬和
    發(fā)表于 01-22 14:43 ?812次閱讀

    融合數(shù)據(jù)中心網(wǎng)絡簡介

    現(xiàn)如今,數(shù)據(jù)中心正成為算力中心,為千行百業(yè)提供數(shù)字化底座,并基于海量數(shù)據(jù)挖掘其中的商業(yè)價值。同時,在數(shù)據(jù)中心云化升級、全閃存化等變革之下,全以太
    的頭像 發(fā)表于 10-19 15:17 ?2881次閱讀
    <b class='flag-5'>超</b><b class='flag-5'>融合數(shù)據(jù)中心</b>網(wǎng)絡簡介

    轉(zhuǎn)載|數(shù)據(jù)中心網(wǎng)絡持續(xù)進階,融合以太技術(shù)正當其時

    隨著數(shù)字經(jīng)濟進入“算力時代”,在算力蓬勃發(fā)展的同時,打造一張與時俱進的高水平數(shù)據(jù)中心網(wǎng)絡顯得尤為重要。近日,華為聯(lián)合中國信息通信研究院共同發(fā)布的數(shù)據(jù)中心融合
    的頭像 發(fā)表于 12-16 19:15 ?963次閱讀

    融合數(shù)據(jù)中心網(wǎng)絡架構(gòu)的典型特征與價值

    結(jié)合業(yè)界在融合數(shù)據(jù)中心網(wǎng)絡技術(shù)中的實踐與探索,對融合數(shù)據(jù)中心網(wǎng)絡架構(gòu)的未來發(fā)展進行了展望。數(shù)據(jù)中心
    的頭像 發(fā)表于 12-19 10:53 ?2049次閱讀

    企業(yè)數(shù)據(jù)中心融合的現(xiàn)實

    電子發(fā)燒友網(wǎng)站提供《企業(yè)數(shù)據(jù)中心融合的現(xiàn)實.pdf》資料免費下載
    發(fā)表于 08-28 09:34 ?0次下載
    企業(yè)<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>超</b><b class='flag-5'>融合</b>的現(xiàn)實

    HPC和數(shù)據(jù)中心融合網(wǎng)絡面臨的技術(shù)挑戰(zhàn)

    隨著大型DC采用具有更高帶寬需求的高性能加速器,數(shù)據(jù)中心網(wǎng)絡通過支持遠程直接內(nèi)存訪問(RDMA)、RDMA融合以太網(wǎng)(RDMA over converged Ethernet,RoCE)、互聯(lián)網(wǎng)廣域RDMA協(xié)議(iWarp)等新
    發(fā)表于 09-15 09:56 ?1121次閱讀
    HPC和<b class='flag-5'>數(shù)據(jù)中心</b><b class='flag-5'>融合</b>網(wǎng)絡面臨的<b class='flag-5'>技術(shù)</b>挑戰(zhàn)

    單對以太網(wǎng)技術(shù)的介紹 單對以太網(wǎng)技術(shù)的優(yōu)勢 單對以太網(wǎng)技術(shù)的應用

    單對以太網(wǎng)技術(shù)的介紹 單對以太網(wǎng)技術(shù)的優(yōu)勢 單對以太網(wǎng)技術(shù)的應用? 以太網(wǎng)技術(shù)是一種局域網(wǎng)傳輸協(xié)議,通常用于連接局域網(wǎng)內(nèi)的多臺計算機和網(wǎng)絡設備。它是最常用的局域
    的頭像 發(fā)表于 11-28 15:45 ?985次閱讀

    祝賀!《融合以太網(wǎng)絡總體技術(shù)要求》行業(yè)標準立項成功

    數(shù)據(jù)中心存在通用計算、存儲、算和AI智算多種業(yè)務場景,傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡使用不同的網(wǎng)絡技術(shù)承載不同業(yè)務,如存儲使用FC網(wǎng)絡,算使用IB網(wǎng)絡
    的頭像 發(fā)表于 11-28 19:05 ?706次閱讀

    數(shù)據(jù)中心市場的關鍵以太網(wǎng)解決方案

    了解數(shù)據(jù)中心市場動態(tài)的關鍵在于以太網(wǎng)解決方案。Synopsys負責產(chǎn)品管理和高性能計算IP的副總裁Michael Posner說:“以太網(wǎng)數(shù)據(jù)中心中根深蒂固……雖然它并不廣為人知,但
    發(fā)表于 03-12 09:53 ?612次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>市場的關鍵<b class='flag-5'>以太網(wǎng)</b>解決方案