一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是RDMA?什么是RoCE網(wǎng)絡(luò)技術(shù)?

ZYNQ ? 來源:ZYNQ ? 2023-07-24 17:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人們對網(wǎng)絡(luò)的要求更加嚴(yán)苛。然而傳統(tǒng)的TCP / IP以太網(wǎng)連接占用了大量的CPU資源,并且需要額外的數(shù)據(jù)處理,已無法再滿足當(dāng)前更快、更高效和可擴(kuò)展性的網(wǎng)絡(luò)需求。在這種情況下,RoCE(RDMA over Converged Ethernet )走進(jìn)了人們的視野。

什么是RDMA?

RDMA(遠(yuǎn)程直接數(shù)據(jù)存?。┚褪菫榱私鉀Q網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲而產(chǎn)生的,無需使用CPU,就可以從一個主機(jī)或服務(wù)器的內(nèi)存直接訪問另一主機(jī)或服務(wù)器的內(nèi)存。它釋放了CPU去執(zhí)行其應(yīng)做的工作,比如運行應(yīng)用程序和處理大量數(shù)據(jù)。這既提高了帶寬又降低了延遲、抖動和 CPU 消耗。

ac0f91b4-2a02-11ee-a368-dac502259ad0.jpg

RDMA技術(shù)

因此,RDMA可以簡單理解為利用相關(guān)的硬件和網(wǎng)絡(luò)技術(shù),服務(wù)器1的網(wǎng)卡可以直接讀寫服務(wù)器2的內(nèi)存,最終達(dá)到高帶寬、低延遲和低資源利用率的效果。

如下圖所示,應(yīng)用程序不需要參與數(shù)據(jù)傳輸過程,只需要指定內(nèi)存讀寫地址,開啟傳輸并等待傳輸完成即可。

ac33da7e-2a02-11ee-a368-dac502259ad0.jpg

目前,大致有三類RDMA網(wǎng)絡(luò),分別是Infiniband、RoCE、iWARP。其中,Infiniband是一種專為RDMA設(shè)計的網(wǎng)絡(luò),從硬件級別保證可靠傳輸 ,而RoCE 和 iWARP都是基于以太網(wǎng)的RDMA技術(shù),支持相應(yīng)的verbs接口。

什么是RoCE?

顧名思義,RoCE是在InfiniBand Trade Association(IBTA)標(biāo)準(zhǔn)中定義的網(wǎng)絡(luò)協(xié)議,允許通過以太網(wǎng)絡(luò)使用RDMA。簡而言之,它可以看作是RDMA技術(shù)在超融合數(shù)據(jù)中心、云、存儲和虛擬化環(huán)境中的應(yīng)用。

RoCE的類型

RoCE協(xié)議存在RoCEv1和RoCEv2兩個版本,這取決于所使用的網(wǎng)絡(luò)適配器或網(wǎng)卡。

RoCE v1:RoCE v1是基于以太網(wǎng)鏈路層實現(xiàn)的RDMA協(xié)議(交換機(jī)需要支持PFC等流控技術(shù),在物理層保證可靠傳輸),允許在同一個VLAN中的兩臺主機(jī)進(jìn)行通信。RoCE V1協(xié)議在以太層的typeID是0x8915。

RoCE v2:RoCE v2克服了RoCE v1綁定到單個VLAN的限制。通過改變數(shù)據(jù)包封裝,包括IP和UDP標(biāo)頭,RoCE v2現(xiàn)在可以跨L2和L3網(wǎng)絡(luò)使用。

ac7fc240-2a02-11ee-a368-dac502259ad0.jpg

RoCE v1與RoCE v2數(shù)據(jù)包格式

如何實現(xiàn)RoCE?

通常,為了實現(xiàn)RoCE,可以安裝支持RoCE的網(wǎng)卡或卡驅(qū)動程序。所有以太網(wǎng)NIC都需要RoCE網(wǎng)絡(luò)適配器卡。RoCE驅(qū)動程序在Red Hat、Linux、Microsoft Windows和其他常見操作系統(tǒng)中使用。RoCE有兩種可用方式:對于網(wǎng)絡(luò)交換機(jī),可以選擇使用支持PFC(優(yōu)先流控制)操作系統(tǒng)的交換機(jī);對于機(jī)架服務(wù)器或主機(jī),需要使用網(wǎng)卡。

acaa4b78-2a02-11ee-a368-dac502259ad0.jpg

RoCE的好處

低CPU占用率:訪問遠(yuǎn)程交換機(jī)或服務(wù)器的內(nèi)存,無需消耗遠(yuǎn)程服務(wù)器上的CPU周期,從而可以充分利用可用帶寬和更高的可伸縮性。

零復(fù)制:向遠(yuǎn)程緩沖區(qū)發(fā)送數(shù)據(jù)和接收數(shù)據(jù)。

高效:由于RoCE改善了延遲和吞吐量,網(wǎng)絡(luò)性能得到了很大提高。

節(jié)省成本:借助RoCE,無需購買新設(shè)備或更換以太網(wǎng)基礎(chǔ)設(shè)施即可處理大量數(shù)據(jù),從而大大節(jié)省了公司的資本支出。

acd373cc-2a02-11ee-a368-dac502259ad0.jpg

關(guān)于RoCE的常見問題

下面列出了一些有關(guān)RoCE的常見問題。

1. RoCE與iWARP、InfiniBand的技術(shù)對比

RDMA最早在Infiniband傳輸網(wǎng)絡(luò)上實現(xiàn),技術(shù)先進(jìn),但是價格高昂,后來業(yè)界廠家把RDMA移植到傳統(tǒng)Ethernet以太網(wǎng)上,降低了RDMA的使用成本,推動了RDMA技術(shù)普及。在Ethernet以太網(wǎng)上,根據(jù)協(xié)議棧融合度的差異,分為iWARP和RoCE兩種技術(shù),而RoCE又包括RoCEv1和RoCEv2兩個版本(RoCEv2的最大改進(jìn)是支持IP路由),各RDMA網(wǎng)絡(luò)協(xié)議棧的對比如下圖所示。

ad144e60-2a02-11ee-a368-dac502259ad0.png

Infiniband,支持RDMA的新一代網(wǎng)絡(luò)協(xié)議。由于這是一種新的網(wǎng)絡(luò)技術(shù),因此需要支持該技術(shù)的NIC和交換機(jī)。

RoCE,一個允許在以太網(wǎng)上執(zhí)行RDMA的網(wǎng)絡(luò)協(xié)議。其較低的網(wǎng)絡(luò)標(biāo)頭是以太網(wǎng)標(biāo)頭,其較高的網(wǎng)絡(luò)標(biāo)頭(包括數(shù)據(jù))是InfiniBand標(biāo)頭。這支持在標(biāo)準(zhǔn)以太網(wǎng)基礎(chǔ)設(shè)施(交換機(jī))上使用RDMA。只有網(wǎng)卡應(yīng)該是特殊的,支持RoCE。

iWARP,一個允許在TCP上執(zhí)行RDMA的網(wǎng)絡(luò)協(xié)議。IB和RoCE中存在的功能在iWARP中不受支持。這支持在標(biāo)準(zhǔn)以太網(wǎng)基礎(chǔ)設(shè)施(交換機(jī))上使用RDMA。只有網(wǎng)卡應(yīng)該是特殊的,并且支持iWARP(如果使用CPU卸載),否則所有iWARP堆棧都可以在軟件中實現(xiàn),并且喪失了大部分RDMA性能優(yōu)勢。

RoCE和iWARP,一個是基于無連接協(xié)議UDP,一個是基于面向連接的協(xié)議(如TCP)。RoCEv1只能局限在一個二層廣播域內(nèi),而RoCEv2和iWARP都能夠支持三層路由。相比RoCE,在大型組網(wǎng)的情況下,iWARP的大量TCP連接會占用大量的額內(nèi)存資源,對系統(tǒng)規(guī)格要求更高。另外,RoCE支持組播,而iWARP還沒有相關(guān)的標(biāo)準(zhǔn)定義。

2. RoCE適配器可以與其他適配器類型(例如iWARP)通信嗎?

RoCE適配器只能與其他RoCE適配器通信,如果混合適配器類型配置的話,例如RoCE適配器與iWARP適配器組合,都可能會恢復(fù)為傳統(tǒng)的TCP / IP連接。

結(jié)論

在數(shù)據(jù)中心中運行RDMA,可以減輕數(shù)據(jù)移動的負(fù)擔(dān),并為應(yīng)用程序提供更高的CPU資源可用性。RoCE協(xié)議可以從RDMA的功能中受益,而無需更改其網(wǎng)絡(luò)基礎(chǔ)架構(gòu)。通過減少以太網(wǎng)延遲和CPU開銷,RoCE可以提高搜索、存儲、數(shù)據(jù)庫和高事務(wù)處理率應(yīng)用程序的性能。通過提高CPU效率和應(yīng)用程序性能,RoCE可以減少所需的服務(wù)器數(shù)量,從而節(jié)省能源,并減少基于以太網(wǎng)的數(shù)據(jù)中心的占用空間。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    41

    文章

    5635

    瀏覽量

    175984
  • 網(wǎng)絡(luò)適配器

    關(guān)注

    0

    文章

    43

    瀏覽量

    11813
  • VLAN技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    6582
  • PFC電路
    +關(guān)注

    關(guān)注

    9

    文章

    98

    瀏覽量

    20950
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    85

    瀏覽量

    9297

原文標(biāo)題:什么是RoCE網(wǎng)絡(luò)技術(shù)?

文章出處:【微信號:ZYNQ,微信公眾號:ZYNQ】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RDMA RNIC虛擬化方案

    主要包括Inifiband、RoCE以及iWARP。實現(xiàn)RDMA協(xié)議的I/O設(shè)備被稱為RNIC。主流云服務(wù)提供商已經(jīng)開始廣泛部署RNIC,例如亞馬遜云推出的彈性網(wǎng)絡(luò)適配器(Elastic Network Adapter,ENA)
    的頭像 發(fā)表于 01-23 17:23 ?3030次閱讀
    <b class='flag-5'>RDMA</b> RNIC虛擬化方案

    RoCE與IB對比分析(一):協(xié)議棧層級篇

    在 AI 算力建設(shè)中, RDMA 技術(shù)是支持高吞吐、低延遲網(wǎng)絡(luò)通信的關(guān)鍵。目前,RDMA技術(shù)主要通過兩種方案實現(xiàn):Infiniband和
    的頭像 發(fā)表于 11-15 13:58 ?2200次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協(xié)議棧層級篇

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、低延遲、遠(yuǎn)距離的零拷貝網(wǎng)絡(luò)數(shù)據(jù)傳輸?;谌诤弦蕴W(wǎng)的遠(yuǎn)程直接內(nèi)存訪問(RoCE)提供了一種基于以太網(wǎng)的RDMA技術(shù)實現(xiàn)方法,相較于IB(InfiniBand)、互聯(lián)網(wǎng)廣域
    發(fā)表于 06-03 14:38

    RDMA簡介3之四種子協(xié)議對比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的
    發(fā)表于 06-04 16:05

    RDMA簡介4之ROcE V2初析

    RoCE v2原語 (1)RDMA READ操作將遠(yuǎn)端主機(jī)內(nèi)存中的數(shù)據(jù)讀取到本地。具體流程為:本地主機(jī)將需要請求數(shù)據(jù)的地址、長度及對應(yīng)的遠(yuǎn)程訪問密鑰發(fā)送給遠(yuǎn)程主機(jī),遠(yuǎn)程主機(jī)比對密鑰通過后,則將數(shù)據(jù)
    發(fā)表于 06-05 15:20

    RDMA over RoCE V2設(shè)計1:通用,穩(wěn)定及高性能!

    一)設(shè)計目標(biāo): RDMA技術(shù)采用無感傳輸機(jī)制,消除傳統(tǒng)網(wǎng)絡(luò)傳輸中需要CPU介入下的多重數(shù)據(jù)復(fù)制與內(nèi)核參與環(huán)節(jié),實現(xiàn)直接跨主機(jī)內(nèi)存訪問的機(jī)制。其設(shè)計目標(biāo)為優(yōu)化分布式環(huán)境下的數(shù)據(jù)傳輸效率,降低CPU負(fù)載
    發(fā)表于 07-15 10:54

    RDMA over RoCE V2設(shè)計2:ip 整體框架設(shè)計考慮

    ,完成網(wǎng)絡(luò)層級中網(wǎng)絡(luò)層及應(yīng)用層功能。該模塊負(fù)責(zé)將來自系統(tǒng)控制模塊的功能請求轉(zhuǎn)換為RoCE v2 指令,如建鏈、斷鏈、數(shù)據(jù)傳輸,并執(zhí)行指令提交及完成機(jī)制。此外,該模塊還實現(xiàn)了 RDMA
    發(fā)表于 07-16 08:51

    通信、網(wǎng)絡(luò)技術(shù)會議

    第十二屆無線通信、網(wǎng)絡(luò)技術(shù)與移動計算國際學(xué)術(shù)會議(WiCOM 2016)將于2016年9月25-27日在古城西安舉行。本屆大會將繼續(xù)遵循學(xué)術(shù)性、國際性的原則,特邀國內(nèi)外無線通信、網(wǎng)絡(luò)技術(shù)與移動計算
    發(fā)表于 04-25 17:08

    RDMA技術(shù)簡介

    RDMA 指的是一種遠(yuǎn)程直接存儲器訪問技術(shù)。具體到協(xié)議層面,它主要包含 InfiniBand、RoCE 和 iWARP 三種協(xié)議。三種協(xié)議都符合 RDMA 標(biāo)準(zhǔn),共享相同的上層用戶接口
    的頭像 發(fā)表于 04-13 10:48 ?4569次閱讀

    RDMA技術(shù)簡介

    iWARP(Internet Wide Area RDMA Protocol)是 IETF 定義的基于 TCP 的 RDMA,它和RoCE v2 都可以路由。因為 TCP 是面向連接的可靠協(xié)議,這使
    的頭像 發(fā)表于 04-20 09:49 ?3868次閱讀
    <b class='flag-5'>RDMA</b><b class='flag-5'>技術(shù)</b>簡介

    RDMA和TCP/IP有什么區(qū)別

    在分布式存儲網(wǎng)絡(luò)中,我們使用的協(xié)議有RoCE、Infiniband(IB)和TCP/IP。其中RoCE和IB屬于RDMA (RemoteDirect Memory Access)
    的頭像 發(fā)表于 11-30 09:19 ?2672次閱讀
    <b class='flag-5'>RDMA</b>和TCP/IP有什么區(qū)別

    以太網(wǎng)RDMA RoCE技術(shù)局限

    上期我們講到了RDMA的WHY,WHAT & HOW(AI網(wǎng)絡(luò)背景下RDMA的Why,What & How),這一期我們來談一談RDMA的不足。
    的頭像 發(fā)表于 10-22 10:02 ?1361次閱讀
    以太網(wǎng)<b class='flag-5'>RDMA</b> <b class='flag-5'>RoCE</b>的<b class='flag-5'>技術(shù)</b>局限

    加速網(wǎng)絡(luò)性能:融合以太網(wǎng) RDMA (RoCE) 的影響

    直接內(nèi)存訪問 (RDMA) (RoCE)。這項突破性技術(shù)促進(jìn)了系統(tǒng)之間的直接數(shù)據(jù)傳輸,無需 CPU 干預(yù),從而顯著減少延遲并提高整體系統(tǒng)性能。[愛波]一家著名的 FPGA 設(shè)計公司處于這一進(jìn)步的最前沿,通過將 AMD 的 ERN
    的頭像 發(fā)表于 01-25 11:50 ?866次閱讀
    加速<b class='flag-5'>網(wǎng)絡(luò)</b>性能:融合以太網(wǎng) <b class='flag-5'>RDMA</b> (<b class='flag-5'>RoCE</b>) 的影響

    如何實現(xiàn)開源開放生態(tài)下的RDMA網(wǎng)絡(luò)監(jiān)控?

    在當(dāng)今AI、大模型飛速發(fā)展的時代,RDMA(Remote Direct Memory Access,遠(yuǎn)程直接內(nèi)存訪問)網(wǎng)絡(luò)技術(shù)憑借其低延遲、高吞吐量的特性,在數(shù)據(jù)中心、高性能計算等領(lǐng)域得到了廣泛應(yīng)用
    的頭像 發(fā)表于 03-03 13:42 ?492次閱讀
    如何實現(xiàn)開源開放生態(tài)下的<b class='flag-5'>RDMA</b><b class='flag-5'>網(wǎng)絡(luò)</b>監(jiān)控?

    RDMA over RoCE V2設(shè)計1:為什么要設(shè)計它?

    基于PC-PC或GPU-GPU之間RDMA設(shè)計已有較多廠商投入,雖然有的大廠投入幾年后折羽而歸,但不影響PC領(lǐng)域成熟應(yīng)用產(chǎn)品的推廣。這里主要討論在FPGA上設(shè)計RDMA over RoCE V2,雖然已有xilinx的ernic
    的頭像 發(fā)表于 07-15 10:58 ?127次閱讀
    <b class='flag-5'>RDMA</b> over <b class='flag-5'>RoCE</b> V2設(shè)計1:為什么要設(shè)計它?