現(xiàn)代數(shù)據(jù)中心變得越來越難以管理。應(yīng)用程序和 PB 級日志數(shù)據(jù)之間有數(shù)十億條可能的連接路徑。靜態(tài)規(guī)則不足以適應(yīng)動態(tài)微服務(wù)的安全策略,而且人工已經(jīng)無法應(yīng)對數(shù)量龐大的日志數(shù)據(jù)的分析。
AI 是通往未來安全和自主管理式數(shù)據(jù)中心的唯一出路。
NVIDIA 融合加速器在業(yè)界率先推出 AI 增強(qiáng)型 DPU。它將 GPU 的強(qiáng)大計算能力與 DPU 的網(wǎng)絡(luò)加速和安全優(yōu)勢相結(jié)合,為 AI 增強(qiáng)型數(shù)據(jù)中心管理創(chuàng)造了統(tǒng)一平臺。融合加速器可將 AI 生成的規(guī)則應(yīng)用于數(shù)據(jù)中心網(wǎng)絡(luò)中的每個數(shù)據(jù)包,為實現(xiàn)實時安全和管理創(chuàng)造新的可能性。圖像展示了將 BlueField2 DPU 和 Ampere GPU 相結(jié)合的 NVIDIA 新型融合加速器。
圖 1.在標(biāo)準(zhǔn)模式下,BlueField-2 DPU 和 GPU 通過專用 PCIe 4.0 交換機(jī)連接以獲得完整帶寬,獨立于主機(jī) PCIE 系統(tǒng)帶寬。
在 NVIDIA GTC 大會上,我們推出了兩款新型融合加速器。A100X 在單一模組中融合了 A100 Tensor Core GPU 和 NVIDIA BlueField-2 數(shù)據(jù)處理器。A30X 則融合了 A30 Tensor Core GPU 和相同的 BlueField-2 DPU。融合卡具有獨特的能力,除了BlueField-2 的卸載、隔離和加速網(wǎng)絡(luò)功能,進(jìn)一步拓展到 AI 推理和訓(xùn)練功能。
兩款加速器都包含一個集成的 PCIe 交換機(jī)實現(xiàn)DPU 和 GPU 連接。集成交換機(jī)能夠消除對主機(jī)資源的爭用,實現(xiàn)線速 GPUDirect RDMA 性能。集成交換機(jī)還通過隔離 GPU 和網(wǎng)卡之間移動的數(shù)據(jù)來提高安全性。
AI 增強(qiáng)型 DPU
融合加速器支持兩種運行模式:
標(biāo)準(zhǔn)模式 – BlueField-2 DPU 和 GPU 分別獨立運行。
BlueField-X模式 – PCI 交換機(jī)進(jìn)行了重新配置,GPU 將專用于 DPU,并且對于主機(jī)系統(tǒng)不可見。
在 BlueField-X 模式下,只有DPU 上運行的操作系統(tǒng)可見到GPU。BlueField-X 模式在業(yè)界首創(chuàng)了一種新型加速器類型:GPU 加速的 DPU。圖像展示了在 BlueField-X 模式下,主機(jī)服務(wù)器中的 CPU 連接到融合加速器。融合加速器的 PCIe 交換機(jī)連接到 CPU 和 DPU。而GPU 僅通過PCIe 交換機(jī)與 DPU連接。
圖 2.在 BlueField-X 模式下,x86 主機(jī)只能看到 BlueField-2 DPU,支持 DPU 在網(wǎng)絡(luò)數(shù)據(jù)上運行 AI 工作負(fù)載。
在 BlueField-X 模式下,GPU 可以對流經(jīng) DPU 的數(shù)據(jù)運行 AI 模型,成為“bump in the wire”。保障安全同時,無性能損耗。AI 模型無需消耗主機(jī)資源,實現(xiàn)完全加速。
BlueField-X 為網(wǎng)絡(luò)安全、數(shù)據(jù)中心管理和 I/O 加速解鎖新穎使用場景。例如,Morpheus 網(wǎng)絡(luò)安全框架使用機(jī)器學(xué)習(xí)對以往無法識別的安全威脅進(jìn)行有效處理。Morpheus 通過 DPU 從數(shù)據(jù)中心的各個服務(wù)器獲取遙測數(shù)據(jù),并將其發(fā)送到配備 GPU 的服務(wù)器進(jìn)行分析。
有了 BlueField-X,AI 模型可以在每個服務(wù)器的融合加速器上直接本地運行。這使 Morpheus 能夠更快地分析更多數(shù)據(jù),同時消除代價很高的數(shù)據(jù)移動,并縮小惡意攻擊面。由 BlueField-X 加速的 Morpheus 使用案例包括惡意軟件檢測、數(shù)據(jù)泄漏預(yù)防和動態(tài)防火墻規(guī)則創(chuàng)建等。
Morpheus 示例僅僅是BlueField-X實現(xiàn)加速的一種使用場景。我們的客戶經(jīng)常與我們分享一些我們尚未考慮到的新想法。為了對 AI 增強(qiáng)的網(wǎng)絡(luò)進(jìn)行更多創(chuàng)造性的探索,我們現(xiàn)正推出 NVIDIA 融合加速器開發(fā)套件。
結(jié)合此開發(fā)套件,我們?yōu)橛幸鈽?gòu)建新一代加速 AI 網(wǎng)絡(luò)應(yīng)用的特定客戶和合作伙伴提供 A30X 加速器的搶先體驗計劃。在邊緣計算或數(shù)據(jù)中心管理中探索 BlueField-X 的新應(yīng)用場景。以下例子為您做參考:
透明視頻預(yù)處理 – Bump in the wire視頻預(yù)處理(解密、交錯、格式轉(zhuǎn)換等),以提高 IVA 吞吐量和攝像頭密度。
小基站RU 解決方案 – RAN 信號處理聚合加速器,以增加商業(yè) gNodeB 服務(wù)器上的用戶密度和吞吐量。
計算存儲 – Bump in the wire存儲加密、索引和哈希,為長期存儲主機(jī)數(shù)據(jù)準(zhǔn)備處理卸載昂貴的 CPU 資源。
作弊檢測 – 檢測流式游戲服務(wù)中的惡意游戲/作弊
開始使用 NVIDIA 融合加速器開發(fā)套件
NVIDIA 融合加速器開發(fā)套件包含有結(jié)合 CUDA 和 NVIDIA DOCA 的示例應(yīng)用程序,以及幫助您安裝、配置新型融合加速器的文檔。最重要的是,我們可以提供 A30X 及應(yīng)用支持來換取您的寶貴反饋。
關(guān)于作者
Jacob Liberman 是 NVIDIA 企業(yè)和邊緣加速集團(tuán)的產(chǎn)品經(jīng)理。他利用 20 多年的技術(shù)計算經(jīng)驗提供高性能、云計算原生邊緣人工智能解決方案。此前,他曾在紅帽、 AMD 和戴爾擔(dān)任產(chǎn)品管理和工程職務(wù)。
Pete Lumbis 是 NVIDIA 以太網(wǎng)網(wǎng)絡(luò)技術(shù)營銷總監(jiān)。 Pete 幫助客戶構(gòu)建、設(shè)計、自動化和加速下一代數(shù)據(jù)中心網(wǎng)絡(luò)。皮特是 CCIE # 28677 和 CCDE 2012 :: 3 。
審核編輯:郭婷
-
amd
+關(guān)注
關(guān)注
25文章
5543瀏覽量
135640 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5193瀏覽量
105479 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9603瀏覽量
87019 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3316瀏覽量
58556
發(fā)布評論請先 登錄
是德科技推出AI數(shù)據(jù)中心構(gòu)建器
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

Cadence 利用 NVIDIA Grace Blackwell 加速AI驅(qū)動的工程設(shè)計和科學(xué)應(yīng)用
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......
數(shù)據(jù)中心中的FPGA硬件加速器


NVIDIA加速AI在日本各行各業(yè)的應(yīng)用
日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新
華迅光通AI計算加速800G光模塊部署
適用于數(shù)據(jù)中心應(yīng)用中的硬件加速器的直流/直流轉(zhuǎn)換器解決方案

八大科技巨頭攜手推進(jìn)UALink,加速數(shù)據(jù)中心AI互聯(lián)
美國限制向中東AI加速器出口,審查國家安全
HNS 2024:星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時代新動能

評論