一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Fugaku超級計(jì)算機(jī)程序已實(shí)現(xiàn)100倍的速度提升

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2021-12-28 09:26 ? 次閱讀

在不到18個(gè)月的時(shí)間里,密歇根大學(xué)的一個(gè)團(tuán)隊(duì)采用GPU,為一個(gè)基于復(fù)雜數(shù)學(xué)的程序?qū)崿F(xiàn)了20倍的提速。該程序?yàn)榱孔涌茖W(xué)奠定了基礎(chǔ)。

Vikram Gavini 的實(shí)驗(yàn)室以創(chuàng)紀(jì)錄的速度,跨越了微觀世界的一座重要里程碑。

這支由三人組成的密歇根大學(xué)團(tuán)隊(duì)創(chuàng)建了一個(gè)使用復(fù)雜的數(shù)學(xué)來深入觀察原子世界的程序。該程序?qū)⑼苿?dòng)許多科學(xué)領(lǐng)域的發(fā)展,以及多重領(lǐng)域的設(shè)計(jì)工作——從更輕的汽車到更高效的藥物。

憑借 GPU ,該團(tuán)隊(duì)開放源碼庫中的代碼在短短18個(gè)月內(nèi)實(shí)現(xiàn)了20倍速度提升。

通往Summit的旅程

2018年年中,當(dāng)該團(tuán)隊(duì)正準(zhǔn)備發(fā)布一個(gè)在 CPU 上運(yùn)行的代碼版本時(shí),他們收到了橡樹嶺國家實(shí)驗(yàn)室 GPU 黑客馬拉松的邀請。全球最快的超級計(jì)算機(jī)之一—— Summit 就位于該實(shí)驗(yàn)室。

機(jī)械工程和材料科學(xué)教授 Gavini 表示:“我們當(dāng)時(shí)的想法是看看我們能實(shí)現(xiàn)什么?!?/p>

該實(shí)驗(yàn)室的博士后 Sambit Das 參加了這場為期五天的活動(dòng)。他認(rèn)為:“我們很快意識到我們的代碼可以充分發(fā)揮GPU大規(guī)模并行處理的能力?!?/p>

在活動(dòng)結(jié)束前, Das 和另一位實(shí)驗(yàn)室成員 Phani Motamarri 將代碼轉(zhuǎn)移到 CUDA 及其庫中,實(shí)現(xiàn)了5倍速度提升。這也讓他們意識到,未來能實(shí)現(xiàn)的還有更多。

6個(gè)月內(nèi)實(shí)現(xiàn)從5倍到20倍的速度提升

在接下來的幾個(gè)月里,該實(shí)驗(yàn)室繼續(xù)對該程序進(jìn)行調(diào)優(yōu),使其能夠?qū)?萬個(gè)鎂原子中的10萬個(gè)電子進(jìn)行分析。到2019年初,該程序已經(jīng)可以在 Summit 上運(yùn)行。

隨著 Summit 的節(jié)點(diǎn)數(shù)量不斷增加,該實(shí)驗(yàn)室采用迭代法,在節(jié)點(diǎn)上運(yùn)行越來越多的代碼。截止4月,該實(shí)驗(yàn)室使用了該系統(tǒng)27,000個(gè) GPU 中的大部分,實(shí)現(xiàn)了近 46 petaflops 的性能,達(dá)到了之前的20倍。

對于一個(gè)基于密度泛函理論(DFT)的程序來說,這是一個(gè)前所未有的結(jié)果。密度函數(shù)理論是一項(xiàng)解釋亞原子粒子之間量子相互作用的復(fù)雜數(shù)學(xué)理論。

適用于高難度算法的分布式計(jì)算

DFT 算法的復(fù)雜性和基礎(chǔ)性使其目前占用了所有公共研究計(jì)算機(jī)四分之一的時(shí)間。在被引用次數(shù)最多的100篇科學(xué)論文中,有12篇是 DFT 為主題的。該計(jì)算還被用來分析從天體物理學(xué)到 DNA 鏈的一切。

最初,根據(jù)該實(shí)驗(yàn)室的報(bào)告,該程序使用了 Summit 的頂尖理論性能的近30%,這是一個(gè)異常高的效率。相比之下,大多數(shù)其他 DFT 代碼除了能夠使用數(shù)個(gè)處理器之外,很難實(shí)現(xiàn)進(jìn)一步的擴(kuò)展,因此就連效率報(bào)告都沒有。

Gavini 表示:“能實(shí)現(xiàn)這一前所未有的效率令我們感到非常高興?!?/p>

聲名鵲起

2019年底,該團(tuán)隊(duì)被提名為戈登貝爾獎(jiǎng)的入圍者。這是該實(shí)驗(yàn)室首次參加這一“高性能計(jì)算領(lǐng)域諾貝爾獎(jiǎng)”的評選。

Gavini 表示:“這為我們的實(shí)驗(yàn)室和大學(xué)帶來了很高的知名度,我認(rèn)為這次努力還只是一個(gè)開始?!?/p>

事實(shí)上,自評選以來,實(shí)驗(yàn)室在 Summit 上,將代碼的性能提升到了 64 petaflops ,效率亦達(dá)到38%。并且該實(shí)驗(yàn)室已經(jīng)在探索在其他系統(tǒng)和應(yīng)用上的使用。

尋求更多的應(yīng)用和更高的性能

最初,這項(xiàng)工作被用于分析鎂。這種比當(dāng)今汽車和飛機(jī)使用的鋼和鋁輕得多的金屬有望大幅節(jié)省燃料。去年,該實(shí)驗(yàn)室與另一團(tuán)隊(duì)合作,研究電子在 DNA 中的移動(dòng)方式,這項(xiàng)工作可以幫助其他研究者研發(fā)出更有效的藥物。

接下來重要的一步是在 Perlmutter 上運(yùn)行代碼。這是一臺使用最新 NVIDIA A100 Tensor Core GPU 的超級計(jì)算機(jī)。根據(jù)Das的報(bào)告,基于A100 GPU對TensorFloat-32的支持,與 Summit GPU 相比,這臺計(jì)算機(jī)目前已經(jīng)實(shí)現(xiàn)了4倍速度提升。TensorFloat-32 是一種既能提供快速結(jié)果,又能實(shí)現(xiàn)高精度的混合精度格式。

與其他 DFT 代碼相比,該實(shí)驗(yàn)室程序已實(shí)現(xiàn)100倍的速度提升,但 Gavini 并沒有就此止步。他已經(jīng)在考慮在 Fugaku 上測試它。Fugaku 是基于 Arm 系統(tǒng)的全球最快的超級計(jì)算機(jī)。

他表示:“眼下的收獲總會(huì)令人欣喜,但‘路漫漫其修遠(yuǎn)兮,吾將上下而求索’。這次的成果也是我們新征程的開始?!?/p>

原文標(biāo)題:借助數(shù)學(xué)的力量:密歇根團(tuán)隊(duì)破解亞原子世界的密碼

文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:彭菁
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4886

    瀏覽量

    130428
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7611

    瀏覽量

    89881
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4882

    瀏覽量

    70046

原文標(biāo)題:借助數(shù)學(xué)的力量:密歇根團(tuán)隊(duì)破解亞原子世界的密碼

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    加州理工學(xué)院開發(fā)出超100GHz時(shí)鐘速度的全光計(jì)算機(jī)

    加州理工學(xué)院的研究人員取得重大突破,開發(fā)出一款能實(shí)現(xiàn)超過100GHz時(shí)鐘速度的全光計(jì)算機(jī)。 長期以來,電子計(jì)算機(jī)時(shí)鐘頻率在近20年停滯于5G
    的頭像 發(fā)表于 01-23 10:32 ?344次閱讀

    NVIDIA 推出高性價(jià)比的生成式 AI 超級計(jì)算機(jī)

    計(jì)算機(jī),具有更高的性價(jià)比,通過軟件升級即可實(shí)現(xiàn)性能提升。 ? 全新 NVIDIA Jetson Orin Nano Super 開發(fā)者套件只有手掌大小,能夠?yàn)樯虡I(yè) AI 開發(fā)者、科技愛好者和學(xué)生等各類
    發(fā)表于 12-18 17:01 ?647次閱讀
    NVIDIA 推出高性價(jià)比的生成式 AI <b class='flag-5'>超級</b><b class='flag-5'>計(jì)算機(jī)</b>

    云端超級計(jì)算機(jī)使用教程

    云端超級計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?424次閱讀

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    超越世界上最強(qiáng)大的超級計(jì)算機(jī),完成以前不可想象的任務(wù)!這意味著量子計(jì)算機(jī)可能會(huì)徹底改變我們的生活。 在本文中,我們將先了解普通計(jì)算機(jī)的工作原理,再深入探討量子
    的頭像 發(fā)表于 11-24 11:00 ?1118次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    丹麥推出首臺AI超級計(jì)算機(jī)Gefion

    超級計(jì)算機(jī)由1528個(gè)英偉達(dá)H100 Tensor Core GPU驅(qū)動(dòng),并采用了英偉達(dá)DGX SuperPOD架構(gòu)設(shè)計(jì)。這些高性能計(jì)算單元通過英偉達(dá)Quantum-2 InfiniB
    的頭像 發(fā)表于 10-29 15:13 ?657次閱讀

    NVIDIA助力丹麥發(fā)布首臺AI超級計(jì)算機(jī)

    這臺丹麥最大的超級計(jì)算機(jī)由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級計(jì)算機(jī)
    的頭像 發(fā)表于 10-27 09:42 ?731次閱讀

    云端超級計(jì)算機(jī)怎么用

    云端超級計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?371次閱讀

    計(jì)算機(jī)接口位于什么之間

    計(jì)算機(jī)接口是計(jì)算機(jī)硬件和軟件之間、計(jì)算機(jī)與外部設(shè)備之間以及計(jì)算機(jī)各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在
    的頭像 發(fā)表于 10-14 14:02 ?917次閱讀

    計(jì)算機(jī)進(jìn)行程序控制工作的基本原理是怎樣的

    計(jì)算機(jī)程序控制是計(jì)算機(jī)科學(xué)中的一個(gè)核心概念,它涉及到計(jì)算機(jī)如何根據(jù)預(yù)設(shè)的指令序列執(zhí)行任務(wù)。 1. 計(jì)算機(jī)硬件基礎(chǔ) 在深入
    的頭像 發(fā)表于 09-04 16:57 ?1223次閱讀

    借助NVIDIA超級計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過使用 NVIDIA 驅(qū)動(dòng)的超級計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?756次閱讀

    Quantinuum推出業(yè)界首款離子阱56量子位計(jì)算機(jī),打破關(guān)鍵基準(zhǔn)記錄

    Quantinuum和JPMorganChase使用Quantinuum的H2-1量子計(jì)算機(jī)實(shí)現(xiàn)了相比現(xiàn)有行業(yè)基準(zhǔn)的100提升 布魯姆菲爾
    的頭像 發(fā)表于 06-07 10:45 ?451次閱讀

    工業(yè)計(jì)算機(jī)與普通計(jì)算機(jī)的區(qū)別

    在信息化和自動(dòng)化日益發(fā)展的今天,計(jì)算機(jī)已經(jīng)成為了我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡墓ぞ?。然而,?b class='flag-5'>計(jì)算機(jī)領(lǐng)域中,工業(yè)計(jì)算機(jī)和普通計(jì)算機(jī)雖然都具備基本的計(jì)算
    的頭像 發(fā)表于 06-06 16:45 ?2163次閱讀

    NVIDIA和Recursion利用AI超級計(jì)算機(jī)加快新藥研發(fā)

    BioHive 由 NVIDIA AI 驅(qū)動(dòng),用于加速醫(yī)療領(lǐng)域科學(xué)家的工作。在全球超級計(jì)算機(jī) TOP500 榜單中,它的排名上升了 100 多位。
    的頭像 發(fā)表于 05-16 09:46 ?1530次閱讀
    NVIDIA和Recursion利用AI<b class='flag-5'>超級</b><b class='flag-5'>計(jì)算機(jī)</b>加快新藥研發(fā)

    富士通使用富岳超級計(jì)算機(jī)訓(xùn)練LLM

    盡管富士通的富岳超級計(jì)算機(jī)不再是超級計(jì)算機(jī)500強(qiáng)名單中最快的機(jī)器,但它仍然是一個(gè)非常強(qiáng)大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負(fù)載,例如AI。
    的頭像 發(fā)表于 05-13 14:18 ?775次閱讀

    日本超算富岳助力構(gòu)建大規(guī)模語言模型Fugaku-LLM

    在昨日公布的新聞稿中,研究團(tuán)隊(duì)表示他們成功發(fā)掘了富岳超級計(jì)算機(jī)的潛能,使矩陣乘法運(yùn)算速度提升,通信
    的頭像 發(fā)表于 05-11 17:07 ?1082次閱讀