一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從NVIDIA BlueField DPU 看加速計算的未來發(fā)展

? 來源:電子發(fā)燒友網(wǎng) ? 作者:廠商供稿 ? 2022-05-31 19:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在歐洲和美國,HPC 開發(fā)者正在利用 NVIDIA BlueField-2 DPU 內(nèi)的 Arm 核和加速器的強大功能為超級計算機提供強大助力。
美國洛斯阿拉莫斯國家實驗室 (LANL) 正在與 NVIDIA 進行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應(yīng)用的性能提高 30 倍。
LANL 研究人員預(yù)計,使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上運行的 DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用 BlueField 以及NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。

面向 DPU 的開放式 API

這些努力還將有助于進一步定義 OpenSNAPI,任何人都可通過該應(yīng)用接口來控制 DPU。這是統(tǒng)計計算框架( Unified Communication Framework) 的一個項目,Unified Communication Framework 是一個旨在實現(xiàn) HPC 應(yīng)用異構(gòu)計算的聯(lián)盟,成員包括 Arm、IBM、NVIDIA、美國國家實驗室和美國的一些大學(xué)。
LANL 已經(jīng)感受到網(wǎng)絡(luò)計算的強大功能,這要歸功于其創(chuàng)建的 DPU 賦能的存儲系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達同類存儲系統(tǒng)的 30 倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數(shù)據(jù)移動,從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?br />

德克薩斯州打造出云原生超級計算平臺

德克薩斯高級計算中心 (TACC) 近期也開始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2。它將在 InfiniBand 網(wǎng)絡(luò)上使用 DPU,使其 Lonestar6 系統(tǒng)成為云原生超級計算的開發(fā)平臺。
TACC 的 Lonestar6 為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開發(fā)者,以及一些研究中心和教職人員提供服務(wù)。

MPI 獲得加速

在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個 HPC 熱門編程模型的運行速度提高 26%。
他們通過卸載消息傳遞接口 (MPI) 的關(guān)鍵部分,加速了 P3DFFT,這是一個用于眾多大規(guī)模 HPC 仿真的數(shù)學(xué)庫。
俄亥俄州立大學(xué)計算機科學(xué)與工程專業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開源軟件團隊推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載?!?br />

HPC 中心和云中的 DPU

對于運行藥物研發(fā)或飛機設(shè)計等 HPC 仿真應(yīng)用的超級計算機而言,高達兩位數(shù)的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶的生產(chǎn)力,他已收到多個 HPC 中心的代碼請求。
Quantum InfiniBand 網(wǎng)絡(luò)以及 NVIDIA SHARP 特性,助力他高效完成工作。
他說:“其他人還在談?wù)摼W(wǎng)絡(luò)計算,而 InfiniBand 已經(jīng)在為它提供支持?!?br />

達勒姆開發(fā)負載均衡

歐洲的多個研究團隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負載。
例如,英格蘭北部的達勒姆大學(xué)正在開發(fā)一款軟件,用于在 16 個節(jié)點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現(xiàn) MPI 作業(yè)的負載均衡。該項目的首席調(diào)查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設(shè)施更高效地處理更好算法鋪平道路。

劍橋大學(xué)和慕尼黑的 DPU 應(yīng)用

劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU。
倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機處理器之間移動數(shù)據(jù),以便在需要時數(shù)據(jù)已然就位。
Dell PowerEdge 服務(wù)器內(nèi)的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機 CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時,慕尼黑工業(yè)大學(xué)計算機體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統(tǒng)任務(wù),這是 EuroHPC 項目的一部分。
在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實驗室合作,利用 BlueField-2 DPU 加速分子動力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達 20%,且不會損失模擬的準(zhǔn)確性。
NVIDIA BlueField DPU極大推動了全球超級計算中心的發(fā)展,我們看到了加速計算未來的無限可能。

不斷擴展的網(wǎng)絡(luò)

本月早些時候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)平臺。
NEC 將使用 H100 的為筑波大學(xué)計算科學(xué)中心構(gòu)建算力大約為 6 PFLOPS 超級計算機。研究人員將使用該系統(tǒng)實現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。
與此同時,Panda 等研究人員已經(jīng)開始考慮如何使用 BlueField-3 DPU 的核心功能。
他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106423
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    393

    瀏覽量

    24938
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了
    的頭像 發(fā)表于 07-04 14:27 ?341次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點解析

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進的技術(shù),云到 PC 加速代理式 AI 應(yīng)用的
    的頭像 發(fā)表于 05-27 14:03 ?365次閱讀

    第三屆NVIDIA DPU黑客松開啟報名

    碰撞的絕佳機會。本次競賽采用開放式主題,參與者將通過 NVIDIA DOCA 軟件框架構(gòu)建創(chuàng)新的加速應(yīng)用程序,充分挖掘 NVIDIA BlueField
    的頭像 發(fā)表于 05-27 10:16 ?432次閱讀

    NVIDIA Cosmos加速機器人和自動駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預(yù)測未來世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI 的發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?552次閱讀
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>機器人和自動駕駛汽車物理AI<b class='flag-5'>發(fā)展</b>

    NVIDIA使用加速計算與AI推動精準(zhǔn)醫(yī)學(xué)發(fā)展

    在加利福尼亞州圣克拉拉舉行的精準(zhǔn)醫(yī)學(xué)世界大會上,NVIDIA 因推動了醫(yī)學(xué)成像、基因組學(xué)、計算化學(xué)和 AI 驅(qū)動機器人技術(shù)的發(fā)展而受到表彰。NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛榮獲“
    的頭像 發(fā)表于 02-17 17:14 ?536次閱讀

    利用NVIDIA DPF引領(lǐng)DPU加速計算未來

    越來越多的企業(yè)開始采用加速計算,從而滿足生成式 AI、5G 電信和主權(quán)云的需求。NVIDIA 推出了 DOCA 平臺框架(DPF),該框架提供了基礎(chǔ)構(gòu)建模塊來釋放 NVIDIA
    的頭像 發(fā)表于 01-24 09:29 ?719次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領(lǐng)<b class='flag-5'>DPU</b><b class='flag-5'>加速</b>云<b class='flag-5'>計算</b>的<b class='flag-5'>未來</b>

    NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優(yōu)勢

    WEKA是可擴展軟件定義數(shù)據(jù)平臺的先驅(qū),NVIDIA 正在與其合作,將 WEKA 先進的數(shù)據(jù)平臺解決方案與功能強大的NVIDIA BlueField DPU相結(jié)合。
    的頭像 發(fā)表于 01-07 09:43 ?678次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField</b>-3 <b class='flag-5'>DPU</b>上運行WEKA客戶端的實際優(yōu)勢

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 - NVIDIA GPU:詳細列出了支持
    發(fā)表于 12-16 14:25

    NVIDIA加速全球大多數(shù)超級計算機推動科技進步

    HPCwire 讀者和編輯選擇獎。 自 2006 年發(fā)布 CUDA 以來,NVIDIA 不斷推動 AI 和加速計算的進步,最新發(fā)布的全球最強超級計算機 TOP500 榜單突顯了該公司
    的頭像 發(fā)表于 11-24 14:38 ?673次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多數(shù)超級<b class='flag-5'>計算</b>機推動科技進步

    NVIDIA加速計算如何推動醫(yī)療健康

    近日,NVIDIA 企業(yè)平臺副總裁 Bob Pette 在 AI Summit 一場演講中重點談?wù)摿?NVIDIA 加速計算如何推動醫(yī)療健康、網(wǎng)絡(luò)安全和制造等行業(yè)實現(xiàn)轉(zhuǎn)型。他表示,
    的頭像 發(fā)表于 11-20 09:10 ?680次閱讀

    特斯拉智能駕駛未來發(fā)展

    編者語:「智駕最前沿」微信公眾號后臺回復(fù):C-0587,獲取本文參考報告:《特斯拉視角,智能駕駛研究框架》pdf下載方式。 隨著自動駕駛技術(shù)的快速發(fā)展,智能駕駛已成為汽車行業(yè)技術(shù)競爭的焦點
    的頭像 發(fā)表于 11-16 16:49 ?1971次閱讀
    <b class='flag-5'>從</b>特斯拉<b class='flag-5'>看</b>智能駕駛<b class='flag-5'>未來</b><b class='flag-5'>發(fā)展</b>

    NVIDIA加速計算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財年可持續(xù)發(fā)展報告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計算和生成式
    的頭像 發(fā)表于 09-09 09:18 ?921次閱讀

    NVIDIA 加速人形機器人發(fā)展

    —SIGGRAPH— 當(dāng)?shù)貢r間 2024 年 7 月 29 日— 為加速全球人形機器人的發(fā)展NVIDIA 于今日宣布,為全球領(lǐng)先的機器人制造商、AI 模型開發(fā)者和軟件制造商提供一套服務(wù)、模型以及
    發(fā)表于 07-30 09:15 ?956次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>加速</b>人形機器人<b class='flag-5'>發(fā)展</b>

    借助NVIDIA超級計算加速量子計算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?919次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    了可觀的經(jīng)濟效益。這種正向循環(huán)促進了相關(guān)技術(shù)棧的快速迭代與成熟,也幫助他們發(fā)展成為云計算業(yè)務(wù)領(lǐng)域的領(lǐng)軍企業(yè)。 隨著眾多芯片廠商投身到 DPU 技術(shù)領(lǐng)域后,業(yè)界對 DPU 的產(chǎn)品形態(tài)定義
    發(fā)表于 07-24 15:32