一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一起來看看RDMA讓網(wǎng)絡實現(xiàn)低時延的絕招

鮮棗課堂 ? 來源:中興文檔 ? 作者:中興文檔 ? 2022-11-24 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長,給數(shù)據(jù)中心的處理能力帶來了很大的挑戰(zhàn)。

計算、存儲和網(wǎng)絡,是推動數(shù)據(jù)中心發(fā)展的三駕馬車。

計算隨著CPUGPUFPGA的發(fā)展,算力得到了極大的提升。存儲隨著閃存盤(SSD)的引入,數(shù)據(jù)存取時延已大幅降低。

但是,網(wǎng)絡的發(fā)展明顯滯后,傳輸時延高,逐漸成為了數(shù)據(jù)中心高性能的瓶頸。

fb502ce2-6b27-11ed-8abf-dac502259ad0.png

在數(shù)據(jù)中心內,70%的流量為東西向流量(服務器之間的流量)。這些流量,一般為數(shù)據(jù)中心進行高性能分布式并行計算時的過程數(shù)據(jù)流,通過TCP/IP網(wǎng)絡傳輸。

如果服務器之間的TCP/IP傳輸速率提升了,數(shù)據(jù)中心的性能自然也會跟著提升。

fb63bde8-6b27-11ed-8abf-dac502259ad0.png

下面,我們就來看看服務器之間數(shù)據(jù)TCP/IP傳輸?shù)倪^程,了解一下“時間都去哪了”,才好“對癥下藥”。

服務器間的TCP/IP傳輸

在數(shù)據(jù)中心,服務器A向服務器B發(fā)送數(shù)據(jù)的過程如下: fb9f5d1c-6b27-11ed-8abf-dac502259ad0.png

1、CPU控制數(shù)據(jù)由A的APP Buffer拷貝到操作系統(tǒng)Buffer。

2、CPU控制數(shù)據(jù)在操作系統(tǒng)(OS)Buffer中添加TCP、IP報文頭。

3、添加TCP、IP報文頭后的數(shù)據(jù)傳送到網(wǎng)卡(NIC),添加以太網(wǎng)報文頭。

4、報文由網(wǎng)卡發(fā)送,通過以太網(wǎng)絡傳輸?shù)椒掌鰾網(wǎng)卡。

5、服務器B網(wǎng)卡卸載報文的以太網(wǎng)報文頭后,將其傳輸?shù)讲僮飨到y(tǒng)Buffer。

6、CPU控制操作系統(tǒng)Buffer中的報文卸載TCP、IP報文頭。

7、CPU控制卸載后的數(shù)據(jù)傳輸?shù)紸PP Buffer中。

從數(shù)據(jù)傳輸?shù)倪^程可以看出,數(shù)據(jù)在服務器的Buffer內多次拷貝,在操作系統(tǒng)中需要添加/卸載TCP、IP報文頭,這些操作既增加了數(shù)據(jù)傳輸時延,又消耗了大量的CPU資源,無法很好得滿足高性能計算的需求。

那么,如何構造高吞吐量、超低時延和低CPU開銷的高性能數(shù)據(jù)中心網(wǎng)絡呢?

RDMA技術可以做到。

什么是RDMA

RDMA( Remote Direct Memory Access,遠程直接地址訪問技術 )是一種新的內存訪問技術,可以讓服務器直接高速讀寫其他服務器的內存數(shù)據(jù),而不需要經(jīng)過操作系統(tǒng)/CPU耗時的處理。

RDMA不算是一項新技術,已經(jīng)廣泛應用于高性能(HPC)科學計算中。隨著數(shù)據(jù)中心高帶寬、低時延的發(fā)展需求,RDMA也開始逐漸應用于某些要求數(shù)據(jù)中心具備高性能的場景中。

舉個例子,2021年某大型網(wǎng)上商城的雙十一交易額再創(chuàng)新高,達到5000多億,比2020年又增長了近10%。如此巨大的交易額背后是海量的數(shù)據(jù)處理,該網(wǎng)上商城采用了RDMA技術來支撐高性能網(wǎng)絡,保障了雙十一的順暢購物。

下面我們一起來看看RDMA讓網(wǎng)絡實現(xiàn)低時延的絕招吧。

RDMA將服務器應用數(shù)據(jù)直接由內存?zhèn)鬏數(shù)?a href="http://www.www27dydycom.cn/v/" target="_blank">智能網(wǎng)卡(固化RDMA協(xié)議),由智能網(wǎng)卡硬件完成RDMA傳輸報文封裝,解放了操作系統(tǒng)和CPU。

fbe20df6-6b27-11ed-8abf-dac502259ad0.png

這使得RDMA具有兩大優(yōu)勢:

Zero Copy(零拷貝):無需將數(shù)據(jù)拷貝到操作系統(tǒng)內核態(tài)并處理數(shù)據(jù)包頭部的過程,傳輸延遲會顯著減小。

Kernel Bypass(內核旁路)和Protocol Offload(協(xié)議卸載):不需要操作系統(tǒng)內核參與,數(shù)據(jù)通路中沒有繁瑣的處理報頭邏輯,不僅會使延遲降低,而且也大大節(jié)省了CPU的資源。

fc0fb8dc-6b27-11ed-8abf-dac502259ad0.png

三大RDMA網(wǎng)絡

目前,大致有三類RDMA網(wǎng)絡,分別是InfiniBand、RoCE(RDMA over Converged Ethernet,RDMA過融合以太網(wǎng))和iWARP(RDMAover TCP,互聯(lián)網(wǎng)廣域RDMA協(xié)議)。

RDMA最早專屬于Infiniband網(wǎng)絡架構,從硬件級別保證可靠傳輸,而RoCE和iWARP都是基于以太網(wǎng)的RDMA技術。

InfiniBand

InfiniBand是一種專為RDMA設計的網(wǎng)絡。

采用Cut-Through轉發(fā)模式(直通轉發(fā)模式),減少轉發(fā)時延。

基于Credit的流控機制(基于信用的流控機制),保證無丟包。

要求InfiniBand專用的網(wǎng)卡、交換機和路由器,建網(wǎng)成本最高。

RoCE

傳輸層為InfiniBand協(xié)議。

RoCE有兩個版本:RoCEv1基于以太網(wǎng)鏈路層實現(xiàn),只能在L2層傳輸;RoCEv2基于UDP承載RDMA,可部署于三層網(wǎng)絡。

需要支持RDMA專用智能網(wǎng)卡,不需要專用交換機和路由器(支持ECN/PFC等技術,降低丟包率),建網(wǎng)成本最低。

iWARP

傳輸層為iWARP協(xié)議。

iWARP是以太網(wǎng)TCP/IP協(xié)議中TCP層實現(xiàn),支持L2/L3層傳輸,大型組網(wǎng)TCP連接會消耗大量CPU,所以應用很少。

iWARP只要求網(wǎng)卡支持RDMA,不需要專用交換機和路由器,建網(wǎng)成本介于InfiniBand和RoCE之間。

Infiniband技術先進,但是價格高昂,應用局限在HPC高性能計算領域,隨著RoCE和iWARPC的出現(xiàn),降低了RDMA的使用成本,推動了RDMA技術普及。

在高性能存儲、計算數(shù)據(jù)中心中采用這三類RDMA網(wǎng)絡,都可以大幅度降低數(shù)據(jù)傳輸時延,并為應用程序提供更高的CPU資源可用性。

其中,InfiniBand網(wǎng)絡為數(shù)據(jù)中心帶來極致的性能,傳輸時延低至百納秒,比以太網(wǎng)設備延時要低一個量級。

RoCE和iWARP網(wǎng)絡為數(shù)據(jù)中心帶來超高性價比,基于以太網(wǎng)承載RDMA,充分利用了RDMA的高性能和低CPU使用率等優(yōu)勢,同時網(wǎng)絡建設成本也不高。

基于UDP協(xié)議的RoCE比基于TCP協(xié)議的iWARP性能更好,結合無損以太網(wǎng)的流控技術,解決了丟包敏感的問題。RoCE網(wǎng)絡,已廣泛應用于各行業(yè)高性能數(shù)據(jù)中心中。

結語

隨著5G人工智能、工業(yè)互聯(lián)網(wǎng)等新型領域的發(fā)展,RDMA技術的應用會越來越普及,RDMA將成為助力數(shù)據(jù)中心高性能的一大功臣。







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    13

    文章

    9795

    瀏覽量

    87971
  • SSD
    SSD
    +關注

    關注

    21

    文章

    2984

    瀏覽量

    119590
  • HPC
    HPC
    +關注

    關注

    0

    文章

    333

    瀏覽量

    24330
  • TCP協(xié)議
    +關注

    關注

    1

    文章

    101

    瀏覽量

    12459
  • RDMA
    +關注

    關注

    0

    文章

    85

    瀏覽量

    9292

原文標題:到底什么是RDMA?為什么數(shù)據(jù)中心需要它?

文章出處:【微信號:鮮棗課堂,微信公眾號:鮮棗課堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RDMA over RoCE V2設計1:通用,穩(wěn)定及高性能!

    )設計目標: RDMA技術采用無感傳輸機制,消除傳統(tǒng)網(wǎng)絡傳輸中需要CPU介入下的多重數(shù)據(jù)復制與內核參與環(huán)節(jié),實現(xiàn)直接跨主機內存訪問的機制。其設計目標為優(yōu)化分布式環(huán)境下的數(shù)據(jù)傳輸效率,
    發(fā)表于 07-15 10:54

    技術故障率降低20%,關鍵在于這套IoT軟硬件體化方案...

    設備運行不穩(wěn)定、現(xiàn)場環(huán)境惡劣、網(wǎng)絡集成困難?一起來看看這個案例怎么破局吧
    的頭像 發(fā)表于 07-02 10:48 ?74次閱讀
    技術故障率降低20%,關鍵在于這套IoT軟硬件<b class='flag-5'>一</b>體化方案...

    RDMA簡介3之四種子協(xié)議對比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)RDMA API,但在具體的網(wǎng)絡層級
    發(fā)表于 06-04 16:05

    RDMA簡介2之A技術優(yōu)勢分析

    隨著數(shù)據(jù)中心對于網(wǎng)絡帶寬和延遲的要求日益增長,傳統(tǒng)的TCP/IP網(wǎng)絡已無法滿足性能要求,RDMA網(wǎng)絡則憑借其高帶寬、延時的特性脫穎而出。相
    發(fā)表于 06-04 11:35

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、延遲、遠距離的零拷貝網(wǎng)絡數(shù)據(jù)傳輸。基于融合以太網(wǎng)的遠程直接內存訪問(RoCE)提供了種基于以太網(wǎng)的RDMA技術實現(xiàn)方法,相
    發(fā)表于 06-03 14:38

    創(chuàng)建列表 (List) 介紹,一起來看看是做什么的

    開始到距離結束端10vp的位置,畫條粗細為1vp的分割線,可以實現(xiàn)圖9設置列表分隔線的樣式。 說明: 分隔線的寬度會使ListItem之間存在定間隔,當List設置的內容間距小于分隔線
    發(fā)表于 04-30 07:06

    文詳解以太網(wǎng)RDMA技術

    在現(xiàn)代計算機網(wǎng)絡中,傳輸效率和是高性能計算、云計算、分布式存儲等應用的關鍵需求。而遠程直接內存訪問(RDMA,Remote Direct Memory Access)技術因其高效
    的頭像 發(fā)表于 03-10 11:09 ?2614次閱讀
    <b class='flag-5'>一</b>文詳解以太網(wǎng)<b class='flag-5'>RDMA</b>技術

    如何實現(xiàn)開源開放生態(tài)下的RDMA網(wǎng)絡監(jiān)控?

    在當今AI、大模型飛速發(fā)展的時代,RDMA(Remote Direct Memory Access,遠程直接內存訪問)網(wǎng)絡技術憑借其延遲、高吞吐量的特性,在數(shù)據(jù)中心、高性能計算等領域得到了廣泛應用
    的頭像 發(fā)表于 03-03 13:42 ?484次閱讀
    如何<b class='flag-5'>實現(xiàn)</b>開源開放生態(tài)下的<b class='flag-5'>RDMA</b><b class='flag-5'>網(wǎng)絡</b>監(jiān)控?

    磁致伸縮位移傳感器的品牌有哪些?一起來看看吧!

    磁致伸縮位移傳感器的品牌有哪些?MTS 在全球磁致伸縮位移傳感器市場中處于領先地位。其產(chǎn)品廣泛應用于石油、化工、電力、冶金、機械設備、汽車、船舶、制藥、食品、木材加工、水利、環(huán)保、航空航天等眾多行業(yè)。MTS 憑借其卓越的性能和品質,在該領域具有較高的知名度和市場影響力。CARLEN德國卡倫在工業(yè)自動化領域具有較高的知名度,其磁致伸縮位移傳感器廣泛應用于石油、
    的頭像 發(fā)表于 12-30 16:28 ?1013次閱讀
    磁致伸縮位移傳感器的品牌有哪些?<b class='flag-5'>一起來看看</b>吧!

    測速電機的工作原理和種類與性能 目前見過最全的 一起來看看

    測速電機的工作原理和種類與性能:測速電機是種特殊的電機,主要由電機和測速器兩部分組成。其中測速器通常采用霍爾元件、磁敏感元件或光電傳感器等。其作用主要是測量和控制電機轉速,通過感應電機轉子的位置
    的頭像 發(fā)表于 11-20 15:57 ?1262次閱讀
    測速電機的工作原理和種類與性能 目前見過最全的 <b class='flag-5'>一起來看看</b>吧

    RoCE與IB對比分析():協(xié)議棧層級篇

    在 AI 算力建設中, RDMA 技術是支持高吞吐、延遲網(wǎng)絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現(xiàn):Infiniband和Ro
    的頭像 發(fā)表于 11-15 13:58 ?2184次閱讀
    RoCE與IB對比分析(<b class='flag-5'>一</b>):協(xié)議棧層級篇

    以太網(wǎng)RDMA RoCE的技術局限

    上期我們講到了RDMA的WHY,WHAT & HOW(AI網(wǎng)絡背景下RDMA的Why,What & How),這期我們來談
    的頭像 發(fā)表于 10-22 10:02 ?1339次閱讀
    以太網(wǎng)<b class='flag-5'>RDMA</b> RoCE的技術局限

    請問tas5731m PBTL模式,單聲道輸出(AB連一起,CD連一起)如何實現(xiàn)左右聲道的混音輸出?

    請問tas5731m PBTL模式,單聲道輸出(AB連一起,CD連一起)如何實現(xiàn)左右聲道的混音輸出 還有開發(fā)軟件里能直接拉線么
    發(fā)表于 10-17 06:23

    選2088還是3051?一起來說說TA們的不同~

    作為工業(yè)實踐中最常用的現(xiàn)場儀表,變送器被廣泛應用于各種工業(yè)自控環(huán)境,涉及水利水電、鐵路交通、智能建筑、生產(chǎn)自控、航空航天、石化、油井、電力、船舶、機床、管道等眾多行業(yè)。今天我們一起來看看「2088壓力變送器」、「3051差壓變送器」這兩款變送器有啥區(qū)別?
    的頭像 發(fā)表于 09-02 10:40 ?1366次閱讀
    選2088還是3051?<b class='flag-5'>一起來</b>說說TA們的不同~

    物聯(lián)網(wǎng)在智慧校園中的應用有哪些?一起來看!

    隨著物聯(lián)網(wǎng)技術的快速發(fā)展,其在智慧校園中的應用正逐漸改變傳統(tǒng)的教育方式和校園管理模式。本文將深入探討物聯(lián)網(wǎng)在智慧校園中的多種應用。物聯(lián)網(wǎng)在智慧校園中的應用涵蓋了多個方面:、智能化管理校園設施物聯(lián)網(wǎng)
    的頭像 發(fā)表于 07-23 09:06 ?3026次閱讀
    物聯(lián)網(wǎng)在智慧校園中的應用有哪些?<b class='flag-5'>一起來看</b>!