一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談:RDMA能給數(shù)據(jù)中心帶來什么?

SDNLAB ? 來源:SDNLAB ? 作者:SDNLAB ? 2022-11-29 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)中心現(xiàn)狀

隨著“新基建”將5G、人工智能、工業(yè)互聯(lián)網(wǎng)列為新型基礎(chǔ)領(lǐng)域,機器學(xué)習(xí)、智能語音交互、自動駕駛等一大批基于高性能計算的應(yīng)用層出不窮,這些應(yīng)用帶來了數(shù)據(jù)的爆炸式增長,給數(shù)據(jù)中心的處理能力帶來了很大的挑戰(zhàn)。計算、存儲和網(wǎng)絡(luò)是推動數(shù)據(jù)中心發(fā)展的三駕馬車。計算隨著CPU、GPUFPGA的發(fā)展,算力得到了極大的提升。存儲隨著閃存盤(SSD)的引入,數(shù)據(jù)存取時延已大幅降低。但是網(wǎng)絡(luò)的發(fā)展明顯滯后,傳輸時延高,逐漸成為了數(shù)據(jù)中心高性能的瓶頸。

fb1ab2ba-6fbe-11ed-8abf-dac502259ad0.png

在數(shù)據(jù)中心內(nèi),70%的流量為東西向流量(服務(wù)器之間的流量),這些流量一般為數(shù)據(jù)中心進行高性能分布式并行計算時的過程數(shù)據(jù)流,通過TCP/IP網(wǎng)絡(luò)傳輸。如果服務(wù)器之間的TCP/IP 傳輸速率提升了,數(shù)據(jù)中心的性能自然也會跟著提升。

fb42d128-6fbe-11ed-8abf-dac502259ad0.png

下面我們就來看看服務(wù)器之間數(shù)據(jù)TCP/IP 傳輸?shù)倪^程,了解下“時間都去哪了”,才好“對癥下藥”。

服務(wù)器間的TCP/IP傳輸

在數(shù)據(jù)中心,服務(wù)器A向服務(wù)器B發(fā)送數(shù)據(jù)的過程如下: 1、CPU控制數(shù)據(jù)由A的APP Buffer拷貝到操作系統(tǒng)Buffer。 2、CPU控制數(shù)據(jù)在操作系統(tǒng)(OS)Buffer中添加TCP、IP報文頭。 3、添加TCP、IP報文頭后的數(shù)據(jù)傳送到網(wǎng)卡(NIC),添加以太網(wǎng)報文頭。 4、報文由網(wǎng)卡發(fā)送,通過以太網(wǎng)絡(luò)傳輸?shù)椒?wù)器B網(wǎng)卡。 5、服務(wù)器B網(wǎng)卡卸載報文的以太網(wǎng)報文頭后,將其傳輸?shù)讲僮飨到y(tǒng)Buffer。 6、CPU控制操作系統(tǒng)Buffer中的報文卸載TCP、IP報文頭。 7、CPU控制卸載后的數(shù)據(jù)傳輸?shù)紸PP Buffer中。

fb6401ae-6fbe-11ed-8abf-dac502259ad0.png

從數(shù)據(jù)傳輸?shù)倪^程可以看出,數(shù)據(jù)在服務(wù)器的Buffer內(nèi)多次拷貝,在操作系統(tǒng)中需要添加/卸載TCP、IP報文頭,這些操作既增加了數(shù)據(jù)傳輸時延,又消耗了大量的CPU資源,無法很好得滿足高性能計算的需求。 那么,如何構(gòu)造高吞吐量、超低時延和低CPU開銷的高性能數(shù)據(jù)中心網(wǎng)絡(luò)呢?RDMA技術(shù)可以做到。

什么是RDMA

RDMA( Remote Direct Memory Access,遠程直接地址訪問技術(shù) )是一種新的內(nèi)存訪問技術(shù),可以讓服務(wù)器直接高速讀寫其他服務(wù)器的內(nèi)存數(shù)據(jù),而不需要經(jīng)過操作系統(tǒng)/CPU耗時的處理。 RDMA不算是一項新技術(shù),已經(jīng)廣泛應(yīng)用于高性能(HPC)科學(xué)計算中。隨著數(shù)據(jù)中心高帶寬、低時延的發(fā)展需求,RDMA也開始逐漸應(yīng)用于某些要求數(shù)據(jù)中心具備高性能的場景中。舉個例子,2021年某大型網(wǎng)上商城的雙十一交易額再創(chuàng)新高,達到5000多億,比2020年又增長了近10%。如此巨大的交易額背后是海量的數(shù)據(jù)處理,該網(wǎng)上商城采用了RDMA技術(shù)來支撐高性能網(wǎng)絡(luò),保障了雙十一的順暢購物。 下面我們一起來看看RDMA讓網(wǎng)絡(luò)實現(xiàn)低時延的絕招吧。 RDMA將服務(wù)器應(yīng)用數(shù)據(jù)直接由內(nèi)存?zhèn)鬏數(shù)街悄芫W(wǎng)卡(固化RDMA協(xié)議),由智能網(wǎng)卡硬件完成RDMA傳輸報文封裝,解放了操作系統(tǒng)和CPU。

fb85d856-6fbe-11ed-8abf-dac502259ad0.png

這使得RDMA具有兩大優(yōu)勢: 1、Zero Copy(零拷貝):無需將數(shù)據(jù)拷貝到操作系統(tǒng)內(nèi)核態(tài)并處理數(shù)據(jù)包頭部的過程,傳輸延遲會顯著減小。 2、Kernel Bypass(內(nèi)核旁路)和Protocol Offload(協(xié)議卸載):不需要操作系統(tǒng)內(nèi)核參與,數(shù)據(jù)通路中沒有繁瑣的處理報頭邏輯,不僅會使延遲降低,而且也大大節(jié)省了CPU的資源。

fba074b8-6fbe-11ed-8abf-dac502259ad0.png

三大RDMA網(wǎng)絡(luò)

目前,大致有三類RDMA網(wǎng)絡(luò),分別是InfiniBand、RoCE(RDMA over Converged Ethernet,RDMA過融合以太網(wǎng))和iWARP(RDMA over TCP,互聯(lián)網(wǎng)廣域RDMA協(xié)議)。RDMA最早專屬于Infiniband網(wǎng)絡(luò)架構(gòu),從硬件級別保證可靠傳輸,而RoCE 和 iWARP都是基于以太網(wǎng)的RDMA技術(shù)。

#

InfiniBand

1、InfiniBand是一種專為RDMA設(shè)計的網(wǎng)絡(luò)。

2、采用Cut-Through轉(zhuǎn)發(fā)模式(直通轉(zhuǎn)發(fā)模式),減少轉(zhuǎn)發(fā)時延。

3、基于Credit的流控機制(基于信用的流控機制),保證無丟包。

4、要求InfiniBand專用的網(wǎng)卡、交換機和路由器,建網(wǎng)成本最高。

#

RoCE

1、傳輸層為InfiniBand協(xié)議。

2、RoCE有兩個版本:RoCEv1基于以太網(wǎng)鏈路層實現(xiàn),只能在L2層傳輸;RoCEv2基于UDP承載RDMA,可部署于三層網(wǎng)絡(luò)。

3、需要支持RDMA專用智能網(wǎng)卡,不需要專用交換機和路由器(支持ECN/PFC等技術(shù),降低丟包率),建網(wǎng)成本最低。

#

iWARP

1、傳輸層為iWARP協(xié)議。

2、iWARP是以太網(wǎng)TCP/IP協(xié)議中TCP層實現(xiàn),支持L2/L3層傳輸,大型組網(wǎng)TCP連接會消耗大量CPU,所以應(yīng)用很少。

3、iWARP只要求網(wǎng)卡支持RDMA,不需要專用交換機和路由器,建網(wǎng)成本介于InfiniBand和RoCE之間。

Infiniband技術(shù)先進,但是價格高昂,應(yīng)用局限在HPC高性能計算領(lǐng)域,隨著RoCE和iWARPC的出現(xiàn),降低了RDMA的使用成本,推動了RDMA技術(shù)普及。 在高性能存儲、計算數(shù)據(jù)中心中采用這三類RDMA網(wǎng)絡(luò),都可以大幅度降低數(shù)據(jù)傳輸時延,并為應(yīng)用程序提供更高的CPU資源可用性。其中InfiniBand網(wǎng)絡(luò)為數(shù)據(jù)中心帶來極致的性能,傳輸時延低至百納秒,比以太網(wǎng)設(shè)備延時要低一個量級。RoCE和iWARP網(wǎng)絡(luò)為數(shù)據(jù)中心帶來超高性價比,基于以太網(wǎng)承載RDMA,充分利用了RDMA的高性能和低CPU使用率等優(yōu)勢,同時網(wǎng)絡(luò)建設(shè)成本也不高?;赨DP協(xié)議的RoCE比基于TCP協(xié)議的iWARP性能更好,結(jié)合無損以太網(wǎng)的流控技術(shù),解決了丟包敏感的問題,RoCE網(wǎng)絡(luò)已廣泛應(yīng)用于各行業(yè)高性能數(shù)據(jù)中心中。

結(jié) 語

隨著5G、人工智能、工業(yè)互聯(lián)網(wǎng)等新型領(lǐng)域的發(fā)展,RDMA技術(shù)的應(yīng)用會越來越普及,RDMA將成為助力數(shù)據(jù)中心高性能的一大功臣。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5230

    瀏覽量

    73533
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    85

    瀏覽量

    9299
  • 工業(yè)互聯(lián)網(wǎng)

    關(guān)注

    28

    文章

    4362

    瀏覽量

    95101

原文標題:淺談:RDMA能給數(shù)據(jù)中心帶來什么?

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    中型數(shù)據(jù)中心的定義與特點 中型數(shù)據(jù)中心通常服務(wù)于中大型企業(yè)、科研機構(gòu)或地方行業(yè)節(jié)點,具備50至200個機柜,部署多臺服務(wù)器、交換設(shè)備、存儲系統(tǒng)與光通信鏈路等,強調(diào)高帶寬、低延遲與高可用性。關(guān)鍵設(shè)備
    發(fā)表于 07-01 16:33

    小型數(shù)據(jù)中心晶振選型關(guān)鍵參數(shù)全解

    小型數(shù)據(jù)中心的定義與應(yīng)用 小型數(shù)據(jù)中心通常是為中小型企業(yè)、邊緣計算、物聯(lián)網(wǎng)(IoT)設(shè)備及其他特定業(yè)務(wù)需求提供計算、存儲和網(wǎng)絡(luò)服務(wù)的設(shè)施。與大型數(shù)據(jù)中心相比,小型數(shù)據(jù)中心的物理空間較小
    發(fā)表于 06-11 13:37

    RDMA簡介2之A技術(shù)優(yōu)勢分析

    隨著數(shù)據(jù)中心對于網(wǎng)絡(luò)帶寬和延遲的要求日益增長,傳統(tǒng)的TCP/IP網(wǎng)絡(luò)已無法滿足性能要求,RDMA網(wǎng)絡(luò)則憑借其高帶寬、低延時的特性脫穎而出。相較于傳統(tǒng)TCP/IP協(xié)議,RDMA具有零拷貝、不需要CPU
    發(fā)表于 06-04 11:35

    RDMA簡介1之RDMA開發(fā)必要性

    解決FPGA存儲容量不足的問題。 直接內(nèi)存訪問技術(shù)提供了一種不經(jīng)過CPU的數(shù)據(jù)傳輸方式,其具有高性能、低延遲、CPU旁路等多種優(yōu)勢,在現(xiàn)代數(shù)據(jù)中心和計算機系統(tǒng)中得到廣泛應(yīng)用 。DMA技術(shù)通常被部署在高級微控制器
    發(fā)表于 06-03 14:38

    數(shù)據(jù)中心都在用的差分晶振,看完你就懂了

    數(shù)據(jù)中心
    FCom富士晶振
    發(fā)布于 :2025年05月30日 13:12:30

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)

    隨著人工智能(AI)技術(shù)的迅猛發(fā)展,數(shù)據(jù)中心面臨著前所未有的計算和網(wǎng)絡(luò)壓力。從大語言模型(LLM)訓(xùn)練到生成式AI應(yīng)用,海量數(shù)據(jù)處理需求推動了網(wǎng)絡(luò)帶寬的快速增長。在此背景下,800G網(wǎng)絡(luò)技術(shù)應(yīng)運而生
    發(fā)表于 03-25 17:35

    優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案

    隨著技術(shù)的飛速發(fā)展,數(shù)據(jù)中心正在從100G和400G演進到800G時代,對高速數(shù)據(jù)傳輸?shù)男枨笈c日俱增。因此,選擇高效且可靠的布線解決方案對于800G數(shù)據(jù)中心至關(guān)重要。本文將深入探討800G數(shù)據(jù)
    發(fā)表于 03-24 14:20

    速看!Atlassian云版與數(shù)據(jù)中心版的創(chuàng)新進展

    數(shù)據(jù)中心
    龍智DevSecOps
    發(fā)布于 :2024年11月22日 17:29:05

    如何選擇數(shù)據(jù)中心服務(wù)

    在選擇數(shù)據(jù)中心服務(wù)時,需要考慮多個關(guān)鍵因素以確保選擇的服務(wù)能夠滿足業(yè)務(wù)需求并確保數(shù)據(jù)的安全、可靠性和性能。以下是一些關(guān)鍵步驟和考慮因素: 一、明確業(yè)務(wù)需求 首先,需要明確自己的業(yè)務(wù)需求,包括數(shù)據(jù)中心
    的頭像 發(fā)表于 10-24 16:14 ?573次閱讀

    數(shù)據(jù)中心產(chǎn)品通常包括哪些

    人工智能快速發(fā)展帶來了海量的大數(shù)據(jù),數(shù)據(jù)中心計算機的需求正在急劇增長。數(shù)據(jù)中心基礎(chǔ)設(shè)施承擔(dān)著數(shù)據(jù)傳遞、加速、展示、計算和存儲等功能。隨著
    的頭像 發(fā)表于 10-11 11:12 ?1533次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>產(chǎn)品通常包括哪些

    怎樣保障數(shù)據(jù)中心不間斷電源不斷電 提供可靠安全的供配電#數(shù)據(jù)中心

    數(shù)據(jù)中心配電系統(tǒng)
    安科瑞王金晶
    發(fā)布于 :2024年08月29日 14:51:36

    數(shù)據(jù)中心使用智能負載組是個好主意#負載 #負載組

    數(shù)據(jù)中心
    深圳崧皓電子
    發(fā)布于 :2024年08月19日 07:43:30

    混合冷卻在數(shù)據(jù)中心中仍將是必不可少的#混合冷卻

    數(shù)據(jù)中心
    深圳崧皓電子
    發(fā)布于 :2024年08月06日 06:58:06