NVIDIA BLUVELD-2 數(shù)據(jù)處理器( DPU )提供了不匹配的軟件定義網(wǎng)絡( SDN )性能、可編程性和可擴展性。它集成了八個 Arm CPU 內(nèi)核、安全的高級 ConnectX-6 Dx 云網(wǎng)絡接口和硬件加速器,這些硬件加速器共同卸載、加速和隔離 SDN 功能,執(zhí)行連接跟蹤、流匹配和高級數(shù)據(jù)包處理。
這篇文章概述了精確SDN性能基準的基本原理,并演示了在NVIDIA CONTROX-6DX 上實現(xiàn)的實際結(jié)果。 BlueField-2 和下一代 BlueField-3 DPU 包括額外的加速功能,并為更廣泛的用例提供更高的性能。
SDN 性能基準最佳實踐
BlueField DPU 或 ConnectX SmartNICs 的任何 SDN 性能評估都應充分利用硬件加速器的全部功能。 BLUBELFIED-2 的分組處理動作是通過NVIDIA ASAP 編程的2(加速交換和數(shù)據(jù)包處理)引擎。 BlueField DPU 和 ConnectX SmartNICs 上的 SDN 加速器都依賴于 ASAP2以及其他可編程硬件加速器,以實現(xiàn)線速率網(wǎng)絡性能。
NVIDIA 盡快2支持已集成到上游 Linux 內(nèi)核和數(shù)據(jù)平面開發(fā)工具包( DPDK )框架中,并可在一系列 Linux 操作系統(tǒng)發(fā)行版和云管理平臺中隨時獲得。
從 Linux 內(nèi)核 5.6 開始,可以使用連接跟蹤加速。最佳實踐是使用現(xiàn)代企業(yè) Linux 操作系統(tǒng),例如 Ubuntu 20.04 、 Red Hat enterprise Linux 8.4 等等。這些較新的內(nèi)核包括對 SDN 的收件箱支持,以及對 ConnectX-6 Dx SmartNICs 和 BlueField-2 DPU 的連接跟蹤加速?;趦?nèi)核過時的 Linux 系統(tǒng),通過連接跟蹤對 SDN 進行基準測試可能會產(chǎn)生誤導。
最后,要使任何 SDN 基準有效,它必須代表在現(xiàn)實世界的云數(shù)據(jù)中心中實現(xiàn)的 SDN 管道,而在現(xiàn)實世界中,數(shù)十萬個連接是常態(tài)。 ConnectX-6 Dx SmartNICs 和 BlueField-2 DPU 都是為超規(guī)模環(huán)境而設計和部署的,并在云級別提供突破性的網(wǎng)絡性能。
加速 SDN 性能
看看NVIDIA CONTROX-6DX 性能。以下基準測試顯示了啟用連接跟蹤硬件加速的 SDN 管道性能的吞吐量和延遲。我們使用與其他報告結(jié)果類似的系統(tǒng)設置、測試工具和程序進行測試。我們運行了 Open VSwitch ( OVS ) DPDK ,以便在 ConnectX-6 Dx SmartNIC 上無縫地實現(xiàn)連接跟蹤加速。
以下圖表描述了使用 iperf3 工具對 4 個和 16 個 iperf 實例(每個實例一個流)觀察到的 SDN 性能。
圖 1 。使用 iperf3 工具觀察了 4 個實例的 SDN 性能 s
圖 2 。使用 16 個 iperf 實例觀察 SDN 性能 s
主要發(fā)現(xiàn):
ConnectX-6 Dx 提供了更高的吞吐量,對于所有測試的數(shù)據(jù)包大小, 4 個和 16 個實例的吞吐量分別高達 120% 和 150% 。
ConnectX-6 Dx 對于小到 1 KB 的數(shù)據(jù)包的傳輸速率大于 90% ,而其他產(chǎn)品的傳輸速率為 8 KB 。
下表顯示了在同一系統(tǒng)設置上具有 32 個實例的 SDN 管道的觀察性能。結(jié)果表明,隨著流量的增加, ConnectX-6 Dx 提供了更好的可擴展性,吞吐量提高了 4 倍。
圖 3 。 使用 32 個 iperf 實例觀察 SDN 性能 s
以下基準測試使用 sockperf 測量延遲。結(jié)果表明,對于測試的所有數(shù)據(jù)包大小,與其他產(chǎn)品相比, ConnectX-6 Dx 的延遲降低了約 20-30% 。
圖 4 。 觀察到帶有連接跟蹤的 SDN 管道的單向延遲
非加速連接跟蹤實現(xiàn)會在主機 CPU 上造成瓶頸。將連接跟蹤轉(zhuǎn)移到片上加速器意味著在這些基準測試中實現(xiàn)的性能并不強烈依賴于主機 CPU 或其驅(qū)動測試臺的能力。這些結(jié)果也表明了集成了 ConnectX-6 Dx 的 BlueField-2 DPU 可實現(xiàn)的性能。
BlueField-3 支持更高的性能級別
NVIDIA 歡迎有機會測試和展示 ConnectX-6 Dx 和 BlueField-2 的性能,同時遵守行業(yè)最佳實踐和操作標準。本文中顯示的數(shù)據(jù)將 ConnectX-6 Dx 的性能基準測試結(jié)果與其他地方報告的結(jié)果進行了比較。與其他產(chǎn)品相比, ConnectX-6 Dx 的吞吐量提高了 4 倍,延遲降低了 30% 。這些基準測試結(jié)果證明了NVIDIA 在 SDN 加速技術(shù)中的領(lǐng)導地位。
BlueField-3 是下一代 NVIDIA DPU ,集成了先進的 ConnectX-7 適配器和其他加速引擎。 BlueField-3 提供 400 Gb / s 的網(wǎng)絡、更強大的 Arm CPU 內(nèi)核和高度可編程的數(shù)據(jù)路徑加速器( DPA ),提供更高級別的性能和可編程性,以解決大規(guī)模數(shù)據(jù)中心中最苛刻的工作負載。使用 DOCA 在 BlueField-2 上構(gòu)建的現(xiàn)有 DPU 加速 SDN 應用程序?qū)⑹芤嬗?BlueField-3 帶來的性能增強,而無需任何代碼更改。
關(guān)于作者
Tal Roll 是 NVIDIA 網(wǎng)絡產(chǎn)品營銷總監(jiān)。好未來在云基礎設施、網(wǎng)絡安全和 HPC / AI 領(lǐng)域擁有 20 多年的經(jīng)驗,在定義和推出成功產(chǎn)品方面有著良好的業(yè)績記錄。 Tal 擁有 IDC 大學和沃頓大學的工商管理 MBA 學位,以及特拉維夫大學的電氣工程和計算機科學理學學士學位。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19884瀏覽量
235012 -
cpu
+關(guān)注
關(guān)注
68文章
11075瀏覽量
216964 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5304瀏覽量
106323
發(fā)布評論請先 登錄
STM32定時器基本原理及常見問題之培訓資料
無刷電機電調(diào)的基本原理
鋅合金犧牲陽極的基本原理及性能特點
AN-282: 采樣數(shù)據(jù)系統(tǒng)基本原理[中文版]
![AN-282: 采樣數(shù)據(jù)系統(tǒng)<b class='flag-5'>基本原理</b>[中文版]](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
如何設計ADC和DAC的基準源,以及基準源如何影響ADC與DAC那些性能?
RNN的基本原理與實現(xiàn)
高斯濾波的基本原理有哪些
3DP工藝基本原理
數(shù)據(jù)采集系統(tǒng)組成和基本原理
濾波器的基本原理、分類及實現(xiàn)方式
Aigtek功率放大器的基本原理及性能參數(shù)介紹

評論