1.RDMA 傳輸系統(tǒng)架構(gòu)設(shè)計(jì)目的
隨著數(shù)據(jù)中心對(duì)于網(wǎng)絡(luò)帶寬和延遲的要求日益增長(zhǎng),傳統(tǒng)的 TCP/IP 網(wǎng)絡(luò)已無法滿足性能要求, RDMA 網(wǎng)絡(luò)則憑借其高帶寬、低延時(shí)的特性脫穎而出錯(cuò)誤!未找到引用源。相較于傳統(tǒng) TCP/IP 協(xié)議, RDMA 具有零拷貝、不需要 CPU 接入、消息基于事務(wù)等特點(diǎn)。
該系統(tǒng)架構(gòu)主要解決適合于FPGA端的RDMA傳輸。它支持FPGA之間,F(xiàn)PGA與PC之間高速通信。只需一根光纖(當(dāng)然,PC端需要轉(zhuǎn)接卡,將光纖轉(zhuǎn)入PC端,例如100G的CX455A-ECAT 100Gbe網(wǎng)卡 就可以)。它注重通用性強(qiáng),性能優(yōu)越,非私有化協(xié)議設(shè)計(jì),以便用戶后續(xù)升級(jí)或更換IP。
2. RDMA 協(xié)議與傳統(tǒng) TCP/IP 協(xié)議在通信過程中的區(qū)別
如圖 1 所示,左側(cè)部分為傳統(tǒng) TCP/IP 協(xié)議的通信過程,首先使操作系統(tǒng)進(jìn)入內(nèi)核態(tài),而后傳輸?shù)臄?shù)據(jù)通過 BUFFER 拷貝進(jìn) TCP/IP 協(xié)議棧進(jìn)行組包處理,而后通過網(wǎng)卡(NIC)驅(qū)動(dòng)下發(fā)到網(wǎng)卡內(nèi)的 BUFFER。右側(cè)部分則為 RDMA 協(xié)議的通信過程,其將 RDMA 協(xié)議部署在融合以太網(wǎng)卡(RNIC)上,在對(duì)數(shù)據(jù)包的組裝和拆解過程中,不需要 CPU 及操作系統(tǒng)介入干預(yù),也不需要進(jìn)行內(nèi)存拷貝操作。當(dāng)發(fā)送數(shù)據(jù)包時(shí),直接由應(yīng)用程序通知網(wǎng)卡要發(fā)送的數(shù)據(jù)在內(nèi)存中的起始地址及數(shù)據(jù)長(zhǎng)度,而后 RNIC 則讀取其已經(jīng)在內(nèi)存中注冊(cè)好的區(qū)域數(shù)據(jù)并依照協(xié)議規(guī)范進(jìn)行數(shù)據(jù)包的組裝及傳輸。
3.系統(tǒng)架構(gòu)如圖2:
圖2 系統(tǒng)架構(gòu)圖
對(duì)IP的簡(jiǎn)單控制由Microblaze完成,DDR負(fù)責(zé)讀寫等數(shù)據(jù)緩存。該架構(gòu)也可以換成zynq的arm控制,便于后續(xù)NVMe oF開發(fā)。
視頻可以搜B站 用戶名: 專注與守望
4測(cè)試
在xilinx開發(fā)平臺(tái)測(cè)試,網(wǎng)卡支持100G,選用的是CX455A-ECAT 100Gbe。該IP支持 RoCE V2。實(shí)測(cè)數(shù)據(jù):
SEND71Gbps
READ91 Gbps(PC端給FPGA發(fā)包,受PC性能限制多一點(diǎn))
WRITE 96 Gbps
審核編輯 黃宇
-
FPGA
+關(guān)注
關(guān)注
1645文章
22050瀏覽量
618554 -
內(nèi)存
+關(guān)注
關(guān)注
8文章
3125瀏覽量
75271 -
傳輸系統(tǒng)
+關(guān)注
關(guān)注
0文章
160瀏覽量
37696 -
RDMA
+關(guān)注
關(guān)注
0文章
85瀏覽量
9296
發(fā)布評(píng)論請(qǐng)先 登錄
知合計(jì)算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計(jì)算
RDMA over RoCE V2設(shè)計(jì)1:通用,穩(wěn)定及高性能!
SL3065:高性能40V同步降壓DC/DC控制器,替代RT7272B
RDMA簡(jiǎn)介1之RDMA開發(fā)必要性
開售RK3576 高性能人工智能主板
一文詳解以太網(wǎng)RDMA技術(shù)

鴻蒙原生頁(yè)面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用
圣誕特輯 |開源芯片系列講座第25期:RISC-V架構(gòu)在高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

在A/D轉(zhuǎn)換過程中,高速ADC與低速ADC在提高性能指標(biāo)上,考慮的點(diǎn)有什么不同?
AI高性能計(jì)算平臺(tái)是什么
高性能連接器的選擇與應(yīng)用
Wolfspeed碳化硅助力實(shí)現(xiàn)高性能功率系統(tǒng)
名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
基于望獲實(shí)時(shí)Linux的高性能運(yùn)動(dòng)控制器適配

帶你了解什么是高性能計(jì)算(HPC)

評(píng)論