一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過全棧創(chuàng)新推動高性能計算

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-06-21 15:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高性能計算(HPC)已成為科學(xué)發(fā)現(xiàn)的基本工具。

無論是發(fā)現(xiàn)新的拯救生命的藥物,對抗氣候變化,還是創(chuàng)建精確的世界模擬,這些解決方案都需要巨大且快速增長的處理能力。它們越來越超出傳統(tǒng)計算方法的范圍。

這就是為什么業(yè)界接受 NVIDIA GPU加速計算的原因。與人工智能相結(jié)合,它為科學(xué)進步帶來了性能上百萬倍的飛躍。如今,2700個應(yīng)用程序可以從 NVIDIA GPU 的加速中受益,而且這個數(shù)字在不斷增長的300萬開發(fā)者社區(qū)的支持下繼續(xù)上升。

HPC 應(yīng)用程序性能改進

要在整個 HPC 應(yīng)用程序范圍內(nèi)實現(xiàn)數(shù)倍的加速,需要在堆棧的各個級別進行不懈的創(chuàng)新。這從芯片和系統(tǒng)開始,一直到應(yīng)用程序框架本身。

NVIDIA 平臺每年都在繼續(xù)提供顯著的性能改進,在體系結(jié)構(gòu)和整個 NVIDIA 軟件堆棧方面都取得了不懈的進步。與六年前發(fā)布的 P100 相比, H100 Tensor Core GPU 預(yù)計性能將提高 26 倍,比摩爾定律快 3 倍多。

pYYBAGKxbzWACbucAAB-hWVUDoU496.png

圖 1 NVIDIA HPC + AI 平臺性能從 P100 到 H100

圖 2 NVIDIA HPC SDK 為每個功能提供了開發(fā)人員資產(chǎn)。

NVIDIA 平臺的核心是功能豐富且高性能的軟件堆棧。為了促進 GPU 在最廣泛的 HPC 應(yīng)用中的加速,該平臺包括 NVIDIA HPC SDK 。 SDK 提供了無與倫比的開發(fā)人員靈活性,支持使用標(biāo)準(zhǔn)語言、指令和 CUDA 創(chuàng)建和移植 GPU 加速的應(yīng)用程序。

NVIDIA HPC SDK 的強大功能在于一整套高度優(yōu)化的 GPU 加速數(shù)學(xué)庫 ,使您能夠充分發(fā)揮 NVIDIA GPU 的性能潛力。為了獲得最佳的多 GPU 和多節(jié)點性能, NVIDIA HPC SDK 還提供了功能強大的通信庫:

NVSHMEM 為跨越多個 GPU 內(nèi)存的數(shù)據(jù)創(chuàng)建全局地址空間。

NVIDIA 集體通信庫( NCCL ) 優(yōu)化了 GPU 之間的通信。

總之,該平臺提供了最高的性能和靈活性,以支持不斷增長的 GPU 加速 HPC 應(yīng)用程序。

HPC 性能和能效

為了展示 NVIDIA 全棧創(chuàng)新如何轉(zhuǎn)化為 accelerated HPC 的最高性能,我們比較了 HPE 服務(wù)器與四個 NVIDIA GPU 服務(wù)器的性能,以及基于其他供應(yīng)商同等數(shù)量加速器模塊的類似配置服務(wù)器的性能。

我們使用各種數(shù)據(jù)集測試了一組五個廣泛使用的 HPC 應(yīng)用程序。雖然 NVIDIA 平臺可以加速 2700 個跨行業(yè)的應(yīng)用程序,但我們在比較中可以使用的應(yīng)用程序受到其他供應(yīng)商加速器可用軟件和應(yīng)用程序版本選擇的限制。

對于除分子動力學(xué)模擬軟件 NAMD 以外的所有工作負(fù)載,我們的結(jié)果是使用多個數(shù)據(jù)集的結(jié)果幾何平均值計算的,以最小化異常值的影響,并代表客戶體驗。

我們還在多 GPU 和單 GPU 場景中測試了這些應(yīng)用程序。

在多 GPU 場景中,測試系統(tǒng)中的所有加速器都用于運行單個模擬,基于 A100 Tensor Core GPU 的服務(wù)器提供的性能比備選方案高出 2.1 倍。

poYBAGKxbzyATqPHAABoKvu2OeU771.png

圖 3 NVIDIA A100 four- GPU 性能比較

在計算性能不斷進步的推動下,分子動力學(xué)領(lǐng)域正朝著在更長的模擬時間內(nèi)模擬更大的原子系統(tǒng)的方向發(fā)展。這些進展使研究人員能夠模擬越來越多的生化機制,如光合電子傳遞和視覺信號轉(zhuǎn)導(dǎo)。這些和其他過程長期以來一直是科學(xué)辯論的主題,因為它們已經(jīng)超出了模擬的范圍,模擬是驗證的主要工具。這是由于完成模擬所需的時間過長。

然而,我們認(rèn)識到,并非所有這些應(yīng)用程序的用戶在每次模擬時都使用多個 GPU 來運行它們。為了獲得最佳吞吐量,最佳執(zhí)行方法通常是為每個模擬分配一個 GPU 。

當(dāng)在 NVIDIA A100上的單個加速器模塊上運行這些相同的應(yīng)用程序時,基于 NVIDIA A100的系統(tǒng)的性能提高了1.9倍。

poYBAGKxb0KAC18OAABliRdEc-I637.png

圖 4 NVIDIA A100 單 – GPU 性能比較

能源成本占數(shù)據(jù)中心和超級計算中心總體擁有成本( TCO )的很大一部分,這突出了節(jié)能計算平臺的重要性。我們的測試表明, NVIDIA 平臺提供的每瓦吞吐量比其他產(chǎn)品高出 2.8 倍。

pYYBAGKxb0qARA-FAABX2KZXRmk192.png

圖 5 NVIDIA A100 能效比較

顯示 A100 與 MI250 的效率比– NVIDIA 的效率越高越好。對每個應(yīng)用程序的多個數(shù)據(jù)集(不同)進行 Geomean 。效率是指 GPU 使用 NVIDIA SMI 和 ROCm 中的等效功能測量的性能/功耗(瓦特)|

AMD MI250 在千兆字節(jié) M262-HD5-00 上測量,具有( 2 )個 AMD EPYC 7763 和 4 個 AMD Instinct ? MI250 OAM ( 128 GB HBM2e ) 500W GPU 帶 AMD Infinity 結(jié)構(gòu)? 技術(shù) NVIDIA 在 ProLiant XL645d Gen10 Plus 上運行,使用雙 EPYC 7713 CPU 和 4x A100 ( 80 GB ) SXM4

LAMMPS develop \ u db00b49 ( AMD ) develop \ u 2a35ec2 ( NVIDIA )數(shù)據(jù)集 ReaxFF / c 、 Tersoff 、 Leonard Jones 、 SNAP | NAMD 3.0alpha9 數(shù)據(jù)集 STMV \ u NVE | OpenMM 7.7.0 數(shù)據(jù)集的集成運行: amber20 STMV 、 amber20 Cellular 、 apoa1pme 、 pme |

GROMACS 2021.1 ( AMD ) 2022 ( NVIDIA )數(shù)據(jù)集 ADH-Dodec (氫鍵), STMV (氫鍵)|琥珀色 20 。 xx \ U rocm \ U mr \ U 202108 ( AMD )和 20.12-AT \ U 21.12 ( NVIDIA )數(shù)據(jù)集 Cellular \ u NVE 、 STMV \ u NVE | 1x MI250 有 2x GCD

NVIDIA A100 GPU 卓越的性能和電源效率是多年不懈的軟硬件協(xié)同優(yōu)化的結(jié)果,以最大限度地提高應(yīng)用程序性能和效率。

A100 還以單處理器的形式出現(xiàn)在操作系統(tǒng)中,只需要啟動一個 MPI 列即可充分利用其性能。而且,由于節(jié)點中所有 GPU 之間的 600 GB / s NVLink 連接 , A100 在規(guī)模上提供了優(yōu)異的性能。

AI 和 HPC 融合

正如加速計算為建模和仿真應(yīng)用帶來了數(shù)倍的加速一樣, AI 和 HPC 的結(jié)合將帶來性能的下一步功能提升,開啟下一波科學(xué)發(fā)現(xiàn)。

關(guān)于作者

Ashraf Eassa 是NVIDIA 加速計算集團內(nèi)部的高級產(chǎn)品營銷經(jīng)理。

Chris 是 NVIDIA HPC 和 AI 的高級技術(shù)營銷經(jīng)理。此前,他在 IBM 擔(dān)任聚合 HPC 和 AI 的產(chǎn)品經(jīng)理,將 HPC 、 AI 和優(yōu)化產(chǎn)品推向市場,專注于電子設(shè)計、航空航天和汽車行業(yè)。 Chris 擁有航空工程碩士學(xué)位,專注于設(shè)計優(yōu)化。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 電源
    +關(guān)注

    關(guān)注

    185

    文章

    18372

    瀏覽量

    256341
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235277
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106422
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    知合計算:RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計算

    在2025 RISC-V中國峰會上,知合計算處理器設(shè)計總監(jiān)劉暢就高性能RISC-V處理器架構(gòu)探索與實踐進行了精彩分享。 在以X86和ARM為代表的處理器架構(gòu)之下,RISC-V在高性能計算
    的頭像 發(fā)表于 07-18 14:17 ?1133次閱讀

    高性能計算集群在AI領(lǐng)域的應(yīng)用前景

    隨著人工智能技術(shù)的飛速發(fā)展,高性能計算集群(HPC)在AI領(lǐng)域的應(yīng)用前景日益受到關(guān)注。HPC提供的計算能力與AI的智能分析能力相結(jié)合,為解決復(fù)雜問題和推動科學(xué)研究提供了新的動力。1、H
    的頭像 發(fā)表于 06-23 13:07 ?440次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群在AI領(lǐng)域的應(yīng)用前景

    使用樹莓派構(gòu)建 Slurm 高性能計算集群:分步指南!

    在這篇文章中,我將分享我嘗試使用樹莓派構(gòu)建Slurm高性能計算集群的經(jīng)歷。一段時間前,我開始使用這個集群作為測試平臺,來創(chuàng)建一個更大的、支持GPU計算高性能
    的頭像 發(fā)表于 06-17 16:27 ?503次閱讀
    使用樹莓派構(gòu)建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>集群:分步指南!

    佑駕創(chuàng)新獲長安汽車量產(chǎn)定點 為其提供高性能輔助駕駛域控制器產(chǎn)品

    佑駕創(chuàng)新(2431.HK)近日宣布,與長安汽車達成重要合作,獲得其旗下新能源自主品牌主力車型的定點項目。佑駕創(chuàng)新作為選定供應(yīng)商,將為其提供高性能輔助駕駛域控制器產(chǎn)品,共同助推全場景輔助駕駛技術(shù)
    的頭像 發(fā)表于 06-06 09:54 ?1009次閱讀

    高性能計算面臨的芯片挑戰(zhàn)

    高性能計算(簡稱HPC)聽起來像是科學(xué)家在秘密實驗室里才會用到的東西,但它實際上是當(dāng)今世界上最重要的技術(shù)之一。從預(yù)測天氣到研發(fā)新藥,甚至訓(xùn)練人工智能,高性能計算系統(tǒng)都能幫助解決普通
    的頭像 發(fā)表于 05-27 11:08 ?410次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>面臨的芯片挑戰(zhàn)

    Synaptics發(fā)布高性能AI MCU,推動邊緣計算新突破

    新突思科技發(fā)布SR系列高性能自適應(yīng)微控制器(MCU),基于Astra?原生AI平臺,專為邊緣AI情境感知設(shè)計。該系列支持三種功耗模式(性能、超低功耗、持續(xù)運行),搭載Arm Cortex-M55內(nèi)核
    的頭像 發(fā)表于 04-23 10:00 ?539次閱讀
    Synaptics發(fā)布<b class='flag-5'>高性能</b>AI MCU,<b class='flag-5'>推動</b>邊緣<b class='flag-5'>計算</b>新突破

    RAKsmart高性能服務(wù)器集群:驅(qū)動AI大語言模型開發(fā)的算力引擎

    RAKsmart高性能服務(wù)器集群憑借其創(chuàng)新的硬件架構(gòu)與優(yōu)化能力,成為支撐大語言模型開發(fā)的核心算力引擎。下面,AI部落小編帶您了解RAKsmart如何為AI開發(fā)者提供從模型訓(xùn)練到落地
    的頭像 發(fā)表于 04-15 09:40 ?246次閱讀

    研華科技式Edge AI產(chǎn)品助力工業(yè)智能化升級

    在2025慕尼黑上海電子設(shè)備展上,研華展示了其式Edge AI產(chǎn)品,助力工業(yè)智能化升級。通過邊緣計算與AI技術(shù)的深度融合,研華賦能智能制造,推動
    的頭像 發(fā)表于 03-28 17:23 ?751次閱讀

    Banana Pi 與瑞薩電子攜手共同推動開源創(chuàng)新:BPI-AI2N

    的理想選擇。瑞薩電子作為全球領(lǐng)先的半導(dǎo)體解決方案提供商,在嵌入式處理器、工業(yè)控制和智能系統(tǒng)等領(lǐng)域具有深厚的技術(shù)積累。結(jié)合 Banana Pi 在開源生態(tài)和開發(fā)者社區(qū)的影響力,以及瑞薩電子在高性能計算
    發(fā)表于 03-12 09:43

    PAD國產(chǎn)飛騰主板,開啟高性能運算時代

    隨著AI應(yīng)用的爆發(fā),算力基礎(chǔ)設(shè)施的需求不斷增加。高性能服務(wù)器和集群技術(shù)在數(shù)據(jù)中心、科研機構(gòu)和高校等領(lǐng)域有著廣泛的應(yīng)用前景?。未來,高性能計算將繼續(xù)推動技術(shù)
    的頭像 發(fā)表于 02-27 08:49 ?378次閱讀

    高性能計算,名副其實的“算力皇冠”

    和推理的高性能計算技術(shù)。今天,我們就來聊一聊高性能計算計算機科學(xué)的“皇冠”初次涉及高性能
    的頭像 發(fā)表于 02-08 14:27 ?865次閱讀
    <b class='flag-5'>高性能</b><b class='flag-5'>計算</b>,名副其實的“算力皇冠”

    深度解析研華式AI產(chǎn)品布局

    在人工智能邁向邊緣智能化的浪潮中,研華科技通過“Edge AI+生態(tài)協(xié)同”戰(zhàn)略推動AIoT 2.0時代的產(chǎn)業(yè)落地。本文專訪研華科技產(chǎn)品總監(jiān)邱柏儒,深度解析研華式AI產(chǎn)品布局、差異化
    的頭像 發(fā)表于 12-05 09:51 ?1040次閱讀

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI高性能計算平臺的介紹,由AI部落小編
    的頭像 發(fā)表于 11-11 09:56 ?706次閱讀

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書

    AWS 與阿里云在 DPU 的應(yīng)用方面也有成功案例,借助其軟硬件自研的優(yōu)勢,快速完成了云計算系統(tǒng)的改造工作,實現(xiàn)了 DPU 大規(guī)模落地部署,在降低自身運營成本的同時為客戶提供更好的使用體驗,并產(chǎn)生
    發(fā)表于 07-24 15:32

    帶你了解什么是高性能計算(HPC)

    受益于HPC更高的速度處理大量數(shù)據(jù)的能力,全球正在進入HPC大周期,高性能計算的發(fā)展水平已經(jīng)成為衡量一個國家綜合實力和高科技發(fā)展水平的重要標(biāo)志,美國、歐盟、日本、英國都高度重視高性能計算
    的頭像 發(fā)表于 07-20 08:28 ?1341次閱讀
    帶你了解什么是<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>(HPC)