一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在ZTR無配置大規(guī)模中實現(xiàn)的縮放零接觸RoCE技術

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Zero Touch RoCE ( ZTR )使數(shù)據(jù)中心能夠無縫部署 聚合以太網上的 RDMA ( RoCE ) ,而無需任何特殊交換機配置。直到最近, ZTR 還僅適用于中小型數(shù)據(jù)中心。同時,大規(guī)模部署傳統(tǒng)上依賴于顯式擁塞通知( ECN )來啟用 RoCE 網絡傳輸,這需要交換機配置。

新的 NVIDIA 擁塞控制算法往返時間擁塞控制( RTTCC ) – 允許 ZTR 在不影響性能的情況下擴展到數(shù)千臺服務器。通過使用 ZTR 和 RTTCC ,數(shù)據(jù)中心運營商可以在無需任何交換機配置的情況下,享受部署和操作的便利性,以及大規(guī)模遠程直接內存訪問( RDMA )的卓越性能。

這篇文章描述了以前在大規(guī)模和小型 RoCE 部署中推薦的 RoCE 擁塞控制。然后介紹了一種新的擁塞控制算法,該算法允許 ZTR 的無配置大規(guī)模實現(xiàn),其性能類似于支持 ECN 的 RoCE 。

具有數(shù)據(jù)中心量化擁塞通知的 RoCE 部署

在典型的基于 TCP 的環(huán)境中,分布式內存請求需要許多步驟和 CPU 周期,這會對應用程序性能產生負面影響。 RDMA 消除了服務器之間內存數(shù)據(jù)傳輸?shù)乃?CPU 參與,大大加快了對存儲數(shù)據(jù)的訪問和應用程序性能。

RoCE 在以太網環(huán)境中提供 RDMA ,這是數(shù)據(jù)中心的主要網絡結構。以太網需要高級擁塞控制機制來支持 RDMA 網絡傳輸。數(shù)據(jù)中心量化擁塞通知( DCQCN )是一種擁塞控制算法,能夠響應擁塞通知并動態(tài)調整流量傳輸速率。

DCQCN 的實現(xiàn)需要啟用顯式擁塞通知( ECN ),這需要配置網絡交換機。 ECN 將交換機配置為設置擁塞經歷( CE )位,以指示即將發(fā)生的擁塞。

具有無功擁塞控制的零接觸 RoCE

NVIDIA 開發(fā)的 ZTR 技術允許 RoCE 部署,無需配置交換機基礎設施。 ZTR 根據(jù) InfiniBand Trade Association ( IBTA ) RDMA 標準構建,完全符合 RoCE specifications ,支持 RoCE 的無縫部署。 ZTR 還擁有與傳統(tǒng)交換機啟用的 RoCE 相當?shù)男阅埽⑶颐黠@優(yōu)于傳統(tǒng)的基于 TCP 的內存訪問。此外,通過 ZTR , RoCE 網絡傳輸服務在普通 TCP / IP 環(huán)境中與非 RoCE 通信并行運行。

正如 NVIDIA 零接觸 RoCE 技術為 Microsoft Azure Stack HCI 實現(xiàn)了云經濟 文章中所指出的,微軟已經為其 Azure Stack HCI 平臺驗證了 ZTR ,該平臺通??蓴U展到幾十個節(jié)點。在這樣的環(huán)境中, ZTR 依賴于隱式丟包通知,這對于小規(guī)模部署來說已經足夠了。通過添加新的基于往返計時器( RTT )的擁塞控制算法, ZTR 變得更加健壯和可擴展,而無需依賴丟包來通知服務器網絡擁塞。

引入往返時間擁塞控制

新的 NVIDIA 擁塞控制算法 RTTCC 主動監(jiān)控網絡 RTT ,以便在丟棄數(shù)據(jù)包之前主動檢測并適應擁塞的發(fā)生。 RTTCC 使用基于硬件的反饋環(huán)路實現(xiàn)動態(tài)擁塞控制,與基于軟件的擁塞控制算法相比,該反饋環(huán)路提供了顯著優(yōu)越的性能。 RTTCC 還支持更快的傳輸速率,可以在更大范圍內部署 ZTR 。帶有 RTTCC 的 ZTR 現(xiàn)在作為測試版功能提供, GA 計劃在 2022 年下半年推出。

ZTR-RTTCC 的工作原理

ZTR-RTTCC 通過基于硬件 RTT 的擁塞控制算法擴展了 RoCE 網絡中的 DCQCN 。

圖 1 服務器之間的往返計時

定時數(shù)據(jù)包(上圖中的綠色網絡數(shù)據(jù)包)定期從啟動器發(fā)送到目標。立即返回定時數(shù)據(jù)包,從而能夠測量往返延遲。 RTTCC 測量數(shù)據(jù)包發(fā)送和啟動器接收數(shù)據(jù)包之間的時間間隔。差異(接收時間–發(fā)送時間)衡量往返延遲,這表明路徑擁塞。未壓縮流繼續(xù)傳輸數(shù)據(jù)包,以最佳利用可用網絡路徑帶寬。延遲增加的流意味著路徑擁塞, RTTCC 會對流量進行節(jié)流,以避免緩沖區(qū)溢出和數(shù)據(jù)包丟失。

隨著擁塞的減少或增加,網絡流量可以實時地向上或向下調整。主動監(jiān)控和應對擁塞的能力對于使 ZTR 能夠主動管理擁塞至關重要。這種主動速率控制還可以減少數(shù)據(jù)包的重新傳輸,提高 RoCE 性能。使用 ZTR-RTTCC ,數(shù)據(jù)中心節(jié)點不會等待數(shù)據(jù)包丟失的通知;相反,它們主動識別擁塞 prior to 數(shù)據(jù)包丟失并作出相應反應,通知啟動器調整傳輸速率。

如前所述, ZTR 的一個關鍵優(yōu)勢是能夠提供 RoCE 功能,同時在普通 TCP / IP 流量中與非 RoCE 通信同時運行。 ZTR 提供 RoCE 網絡功能的無縫部署。通過添加 RTTCC 主動監(jiān)控擁塞, ZTR 提供數(shù)據(jù)中心范圍內的操作,無需交換機配置。請繼續(xù)閱讀,看看它的性能如何。

具有 RTTCC 性能的 ZTR

如圖 2 所示,當通過網絡結構配置 ECN 和 PFC 時,帶有 RTTCC 的 ZTR 提供了與 RoCE 相當?shù)膽贸绦蛐阅?。這些測試是在最壞的多對一( in-cast )情況下進行的,以模擬擁擠條件下的吞吐量。

結果表明,具有 RTTCC 的 ZTR 不僅可以擴展到數(shù)千個節(jié)點,而且其性能與目前可用的最快 RoCE 解決方案相當。

在小規(guī)模( 256 個連接及以下)下,具有 RTTCC 的 ZTR 在啟用 ECN 擁塞控制(傳統(tǒng) RoCE )的 RoCE 的 99% 范圍內執(zhí)行。

通過 16000 多個連接,具有 RTTCC 吞吐量的 ZTR 是傳統(tǒng) RoCE 吞吐量的 98% 。

帶有 RTTCC 的 ZTR 在不需要任何開關配置的情況下,提供了與傳統(tǒng) RoCE 幾乎相同的性能。

圖 2 連接不斷增加的應用程序帶寬

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網絡接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網絡接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

使用mlxconfig(持續(xù)配置)啟用可編程擁塞控制:

mlxconfig -d /dev/mst/mt4125_pciconf0 -y s
ROCE_CC_LEGACY_DCQCN=0

使用mlxfwreset重置設備或重新啟動主機:

mlxfwreset -d /dev/mst/mt4125_pciconf0 -l 3 -y r

完成這些步驟后,當 RDMA-CM 用于增強連接建立( ECE , MLNX _ OFED 版本 5.1 支持)時,將使用 ZTR-RTTCC 。

如果出現(xiàn)錯誤,無論 RDMA-CM 同步狀態(tài)如何,都可以強制使用 ZTR-RTTCC :

mlxreg -d /dev/mst/mt4125_pciconf0 --reg_id 0x506e --reg_len
0x40 --set "0x0.0:8=2,0x4.0:4=15" -y

總結

NVIDIA RTTCC 是 ZTR 的新?lián)砣刂扑惴?,在?shù)據(jù)中心范圍內提供卓越的 RoCE 性能,無需對交換機基礎設施進行任何特殊配置。此增強功能使數(shù)據(jù)中心能夠在現(xiàn)有和新的數(shù)據(jù)中心基礎架構中無縫實現(xiàn) RoCE ,并從即時的應用程序性能改進中獲益。

關于作者

Aviv Barnea 是 NVIDIA 網絡軟件工程的高級主管。他監(jiān)督網絡適配器 RDMA 軟件和擁塞控制機制的開發(fā),實現(xiàn)高速、低延遲的數(shù)據(jù)中心連接。 Aviv 是 RDMA 和 RoCE 通信協(xié)議方面的專家,擁有該領域的多項專利,在推動 RDMA / RoCE 在業(yè)界的發(fā)展方面發(fā)揮了重要作用,在客戶和合作伙伴大規(guī)模部署加速網絡解決方案時與他們密切合作,并實現(xiàn)了無與倫比的性能和易用性。 Aviv 擁有特拉維夫大學工商管理碩士學位和理工學院物理與電氣工程學士學位。

Itay Ozery 是 NVIDIA 網絡產品營銷總監(jiān)。他為 Mellanox 的云網絡解決方案推動戰(zhàn)略性產品營銷和產品管理計劃。 Itay 在網絡安全領域領導了大規(guī)模的業(yè)務和項目,并與數(shù)據(jù)中心和電信服務提供商在 IT 系統(tǒng)和網絡工程領域擔任過多個職位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關注

    關注

    33

    文章

    9005

    瀏覽量

    153783
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106469
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從哈希極化到擁塞:主動路徑規(guī)劃在RoCE網絡的負載均衡實踐

    智算集群對網絡性能,特別是高吞吐、低延遲和無損特性有著嚴苛要求,RoCE因此被廣泛應用。然而,主流Clos組網架構下,傳統(tǒng)的ECMP路由機制存在天然的局限性,容易引發(fā)哈希極化問題,成為制約
    的頭像 發(fā)表于 07-21 17:27 ?120次閱讀
    從哈希極化到<b class='flag-5'>零</b>擁塞:主動路徑規(guī)劃在<b class='flag-5'>RoCE</b>網絡<b class='flag-5'>中</b>的負載均衡實踐

    RDMA over RoCE V2設計2:ip 整體框架設計考慮

    ,設計使用標準化的 AXI4 及 AXI-Stream 總線接口進行數(shù)據(jù)傳輸,同時使用標準化的 AXI-Lite 總線接口提供系統(tǒng)控制功能,保證傳輸性能的同時,使得本設計更容易集成到應用、生產環(huán)境。 5
    發(fā)表于 07-16 08:51

    RDMA簡介3之四種子協(xié)議對比

    CPU卸載到RDMA網卡處理。僅需要使用普通以太網交換機和iWARP網卡即可實現(xiàn)路由。但在大規(guī)模部署時,由于TCP/IP協(xié)議點對點連接的特性,將會占用大量的內存資源,對系統(tǒng)規(guī)格的要求更高在對比這四種
    發(fā)表于 06-04 16:05

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、低延遲、遠距離的拷貝網絡數(shù)據(jù)傳輸?;谌诤弦蕴W的遠程直接內存訪問(RoCE)提供了一種基于以太網的RDMA技術實現(xiàn)方法,相較于IB(InfiniBand)、互聯(lián)網廣域
    發(fā)表于 06-03 14:38

    算力革命:RoCE實測推理時延比InfiniBand低30%的底層邏輯

    AI 訓練與推理的網絡效率瓶頸,助力數(shù)據(jù)中心高帶寬、低延遲、高可靠性的需求下實現(xiàn)算力資源的最優(yōu)配置
    的頭像 發(fā)表于 05-28 14:08 ?631次閱讀
    算力革命:<b class='flag-5'>RoCE</b>實測推理時延比InfiniBand低30%的底層邏輯

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經輻射場(NeRF)與三維高斯?jié)姙R(3DGS)技術視覺SLAM展現(xiàn)出令人鼓舞的突破性成果。然而,當前主流方法多依賴RGBD傳感器,并且僅適用于室內環(huán)境。
    的頭像 發(fā)表于 05-27 14:13 ?353次閱讀
    三維高斯?jié)姙R<b class='flag-5'>大規(guī)模</b>視覺SLAM系統(tǒng)解析

    大規(guī)模 GOA 液晶線路修復方法

    液晶面板制造領域,GOA(Gate Driver on Array)技術因其諸多優(yōu)勢得到廣泛應用。然而,大規(guī)模生產過程,不可避免會出現(xiàn)線路故障,如何高效修復這些線路,成為保障產能與
    的頭像 發(fā)表于 04-24 13:46 ?324次閱讀
    <b class='flag-5'>大規(guī)模</b> GOA 液晶線路修復方法

    廣和通助力昶氪科技實現(xiàn)智能割草機器人大規(guī)模商用

    近日,2025世界移動通信大會(MWC Barcelona 2025)期間,廣和通宣布:其為永強集團旗下昶氪科技提供的圍線式智能割草機器人解決方案已實現(xiàn)大規(guī)模量產商用,滿足歐洲等市
    的頭像 發(fā)表于 03-12 09:23 ?662次閱讀

    i.MX RT處理器上使用PXP實現(xiàn)縮放和旋轉組合操作

    本文主要探討如何使用PXP實現(xiàn)縮放和旋轉組合操作,PXP是NXP推出的一個2D圖形加速器,主要完成對圖像的數(shù)據(jù)格式轉換、固定角度旋轉(90°,180°,270°),任意比例縮放、混色,移位以及翻轉等功能。運行平臺為i.MX RT
    的頭像 發(fā)表于 02-20 10:53 ?1166次閱讀
    <b class='flag-5'>在</b>i.MX RT處理器上使用PXP<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>縮放</b>和旋轉組合操作

    AGV大規(guī)模定制化生產中的應用

    AGV智能工廠大規(guī)模定制生產中發(fā)揮重要作用,通過不同形式滿足多樣化物料搬運需求,提高生產效率與靈活度,降低勞動力與成本,助力企業(yè)實現(xiàn)智能車間和工廠的升級改造。
    的頭像 發(fā)表于 02-13 18:09 ?374次閱讀
    AGV<b class='flag-5'>在</b><b class='flag-5'>大規(guī)模</b>定制化生產中的應用

    RoCE與IB對比分析(二):功能應用篇

    在上一篇,我們對RoCE、IB的協(xié)議棧層級進行了詳細的對比分析,二者本質沒有不同,但基于實際應用的考量,RoCE開放性、成本方面更勝一籌。本文我們將繼續(xù)分析
    的頭像 發(fā)表于 11-15 14:03 ?1301次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(二):功能應用篇

    RoCE與IB對比分析(一):協(xié)議棧層級篇

    AI 算力建設, RDMA 技術是支持高吞吐、低延遲網絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現(xiàn):Infiniband和
    的頭像 發(fā)表于 11-15 13:58 ?2221次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協(xié)議棧層級篇

    FPGA仿真黑科技\"EasyGo Vs Addon \",助力大規(guī)模電力電子系統(tǒng)仿真

    可以輕松地將其與各種硬件和協(xié)議連接,增強測試系統(tǒng)的靈活性。二、產品亮點▍超強FPGA芯片與接口配置,助力大規(guī)模電力電子系統(tǒng)仿真EasyGo Vs Addon支持的PXIe 7891搭載全新
    發(fā)表于 10-23 18:18

    云平臺大規(guī)模設備管理和數(shù)據(jù)分析的作用

    在當代數(shù)字化轉型的浪潮,云平臺作為信息技術基礎設施的核心組件,扮演著無可替代的角色,尤其大規(guī)模設備管理和數(shù)據(jù)分析領域,其重要性和影響力日益凸顯。本文旨在深入探討云平臺如何通過其獨特
    的頭像 發(fā)表于 09-19 17:22 ?717次閱讀
    云平臺<b class='flag-5'>在</b><b class='flag-5'>大規(guī)模</b>設備管理和數(shù)據(jù)分析<b class='flag-5'>中</b>的作用

    使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放

    電子發(fā)燒友網站提供《使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放.pdf》資料免費下載
    發(fā)表于 09-19 11:27 ?0次下載
    使用DSPLIB FFT<b class='flag-5'>實現(xiàn)實現(xiàn)</b>實際輸入,無需數(shù)據(jù)<b class='flag-5'>縮放</b>