一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT背后,是微軟超級(jí)昂貴的超級(jí)計(jì)算機(jī)

傳感器技術(shù) ? 來源:新智元 ? 2023-03-21 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】ChatGPT背后,是微軟超級(jí)昂貴的超級(jí)計(jì)算機(jī),耗資數(shù)億美元,用了英偉達(dá)數(shù)萬顆芯片。

ChatGPT能成為如今火遍全球的頂流模型,少不了背后超強(qiáng)的算力。

數(shù)據(jù)顯示,ChatGPT的總算力消耗約為3640PF-days(即假如每秒計(jì)算一千萬億次,需要計(jì)算3640天)。

那么,作為依托的那臺(tái)微軟專為OpenAI打造的超級(jí)計(jì)算機(jī),又是如何誕生的呢?

周一,微軟在官博上連發(fā)兩文,親自解密這臺(tái)超級(jí)昂貴的超級(jí)計(jì)算機(jī),以及Azure的重磅升級(jí)——加入成千上萬張英偉達(dá)最強(qiáng)的H100顯卡以及更快的InfiniBand網(wǎng)絡(luò)互連技術(shù)。

基于此,微軟也官宣了最新的ND H100 v5虛擬機(jī),具體規(guī)格如下:

8個(gè)NVIDIA H100 Tensor Core GPU通過下一代NVSwitch和NVLink 4.0互聯(lián)

每個(gè)GPU有400 Gb/s的NVIDIA Quantum-2 CX7 InfiniBand,每個(gè)虛擬機(jī)有3.2Tb/s的無阻塞胖樹型網(wǎng)絡(luò)

NVSwitch和NVLink 4.0在每個(gè)虛擬機(jī)的8個(gè)本地GPU之間具有3.6TB/s的雙向帶寬

第四代英特爾至強(qiáng)可擴(kuò)展處理器

PCIE Gen5到GPU互連,每個(gè)GPU有64GB/s帶寬

16通道4800MHz DDR5 DIMM

數(shù)億美元撐起來的算力

大約五年前,OpenAI向微軟提出了一個(gè)大膽的想法——建立一個(gè)可以永遠(yuǎn)改變?nèi)藱C(jī)交互方式的人工智能系統(tǒng)。

當(dāng)時(shí),沒人能想到,這將意味著AI可以用純語(yǔ)言創(chuàng)造出人類所描述的任何圖片,人類可以用聊天機(jī)器人來寫詩(shī)、寫歌詞、寫論文、寫郵件、寫菜單……

為了建立這個(gè)系統(tǒng),OpenAI需要很多算力——可以真正支撐起超大規(guī)模計(jì)算的那種。

但問題是,微軟能做到嗎?

畢竟,當(dāng)時(shí)既沒有能滿足OpenAI需要的硬件,也無法確定在Azure云服務(wù)中構(gòu)建這樣龐大的超級(jí)計(jì)算機(jī)會(huì)不會(huì)直接把系統(tǒng)搞崩。

隨后,微軟便開啟了一段艱難的摸索。

為了構(gòu)建支持OpenAI項(xiàng)目的超級(jí)計(jì)算機(jī),它斥資數(shù)億美元,在Azure云計(jì)算平臺(tái)上將幾萬個(gè)Nvidia A100芯片連接在一起,并改造了服務(wù)器機(jī)架。

此外,為了給OpenAI量身打造這個(gè)超算平臺(tái),微軟十分盡心,一直在密切關(guān)注著OpenAI的需求,隨時(shí)了解他們?cè)谟?xùn)練AI時(shí)最關(guān)鍵的需要。

這么一個(gè)大工程,成本究竟是多少呢?微軟負(fù)責(zé)云計(jì)算和人工智能的執(zhí)行副總裁Scott Guthrie不愿透露具體數(shù)目,但他表示,「可能不止」幾億美元。

OpenAI出的難題

微軟負(fù)責(zé)戰(zhàn)略合作伙伴關(guān)系的高管Phil Waymouth指出,OpenAI訓(xùn)練模型所需要的云計(jì)算基礎(chǔ)設(shè)施規(guī)模,是業(yè)內(nèi)前所未有的。

呈指數(shù)級(jí)增長(zhǎng)的網(wǎng)絡(luò)GPU集群規(guī)模,超過了業(yè)內(nèi)任何人試圖構(gòu)建的程度。

微軟之所以下定決心與OpenAI 合作,是因?yàn)閳?jiān)信,這種前所未有的基礎(chǔ)設(shè)施規(guī)模將改變歷史,造出全新的AI,和全新的編程平臺(tái),為客戶提供切實(shí)符合他們利益的產(chǎn)品和服務(wù)。

現(xiàn)在看來,這幾億美元顯然沒白花——寶押對(duì)了。

在這臺(tái)超算上,OpenAI能夠訓(xùn)練的模型越來越強(qiáng)大,并且解鎖了AI工具令人驚嘆的功能,幾乎開啟人類第四次工業(yè)革命的ChatGPT,由此誕生。

非常滿意的微軟,在1月初又向OpenAI狂砸100億美元。

8eb0088a-c4b1-11ed-bfe3-dac502259ad0.png

可以說,微軟突破AI超算界限的雄心,已經(jīng)得到了回報(bào)。而這背后體現(xiàn)的,是從實(shí)驗(yàn)室研究,到AI產(chǎn)業(yè)化的轉(zhuǎn)變。

目前,微軟的辦公軟件帝國(guó)已經(jīng)初具規(guī)模。

ChatGPT版必應(yīng),可以幫我們搜索假期安排;Viva Sales中的聊天機(jī)器人可以幫營(yíng)銷人員寫郵件;GitHub Copilot可以幫開發(fā)者續(xù)寫代碼;Azure OpenAI 服務(wù)可以讓我們?cè)L問OpenAI的大語(yǔ)言模型,還能訪問Azure的企業(yè)級(jí)功能。

8f30f72e-c4b1-11ed-bfe3-dac502259ad0.png

和英偉達(dá)聯(lián)手

其實(shí),在去年11月,微軟就曾官宣,要與Nvidia聯(lián)手構(gòu)建「世界上最強(qiáng)大的AI超級(jí)計(jì)算機(jī)之一」,來處理訓(xùn)練和擴(kuò)展AI所需的巨大計(jì)算負(fù)載。

這臺(tái)超級(jí)計(jì)算機(jī)基于微軟的Azure云基礎(chǔ)設(shè)施,使用了數(shù)以萬計(jì)個(gè)Nvidia H100和A100Tensor Core GPU,及其Quantum-2 InfiniBand網(wǎng)絡(luò)平臺(tái)。

Nvidia在一份聲明中表示,這臺(tái)超級(jí)計(jì)算機(jī)可用于研究和加速DALL-E和Stable Diffusion等生成式AI模型。

8f5b14d2-c4b1-11ed-bfe3-dac502259ad0.png

隨著AI研究人員開始使用更強(qiáng)大的GPU來處理更復(fù)雜的AI工作負(fù)載,他們看到了AI模型更大的潛力,這些模型可以很好地理解細(xì)微差別,從而能夠同時(shí)處理許多不同的語(yǔ)言任務(wù)。

簡(jiǎn)單來說,模型越大,你擁有的數(shù)據(jù)越多,你能訓(xùn)練的時(shí)間越長(zhǎng),模型的準(zhǔn)確性就越好。

但是這些更大的模型很快就會(huì)到達(dá)現(xiàn)有計(jì)算資源的邊界。而微軟明白,OpenAI需要的超級(jí)計(jì)算機(jī)是什么樣子,需要多大的規(guī)模。

這顯然不是說,單純地購(gòu)買一大堆GPU并將它們連接在一起之后,就可以開始協(xié)同工作的東西。

微軟Azure高性能計(jì)算和人工智能產(chǎn)品負(fù)責(zé)人Nidhi Chappell表示:「我們需要讓更大的模型訓(xùn)練更長(zhǎng)的時(shí)間,這意味著你不僅需要擁有最大的基礎(chǔ)設(shè)施,你還必須讓它長(zhǎng)期可靠地運(yùn)行?!?/p>

Azure全球基礎(chǔ)設(shè)施總監(jiān)Alistair Speirs表示,微軟必須確保它能夠冷卻所有這些機(jī)器和芯片。比如,在較涼爽的氣候下使用外部空氣,在炎熱的氣候下使用高科技蒸發(fā)冷卻器等。

此外,由于所有的機(jī)器都是同時(shí)啟動(dòng)的,所以微軟還不得不考慮它們和電源的擺放位置。就像你在廚房里同時(shí)打開微波爐、烤面包機(jī)和吸塵器時(shí)可能會(huì)發(fā)生的情況,只不過是數(shù)據(jù)中心的版本。

大規(guī)模AI訓(xùn)練

完成這些突破,關(guān)鍵在哪里?

難題就是,如何構(gòu)建、操作和維護(hù)數(shù)萬個(gè)在高吞吐量、低延遲InfiniBand網(wǎng)絡(luò)上互連的共置GPU。

這個(gè)規(guī)模,已經(jīng)遠(yuǎn)遠(yuǎn)超出了GPU和網(wǎng)絡(luò)設(shè)備供應(yīng)商測(cè)試的范圍,完全是一片未知的領(lǐng)域。沒有任何人知道,在這種規(guī)模下,硬件會(huì)不會(huì)崩。

微軟Azure高性能計(jì)算和人工智能產(chǎn)品負(fù)責(zé)人Nidhi Chappell解釋道,在LLM的訓(xùn)練過程中,涉及到的大規(guī)模計(jì)算通常會(huì)被劃分到一個(gè)集群中的數(shù)千個(gè)GPU上。

在被稱為allreduce的階段,GPU之間會(huì)互相交換它們所做工作的信息。此時(shí)就需要通過InfiniBand網(wǎng)絡(luò)進(jìn)行加速,從而讓GPU在下一塊計(jì)算開始之前完成。

Nidhi Chappell表示,由于這些工作跨越了數(shù)千個(gè)GPU,因此除了要確?;A(chǔ)設(shè)施的可靠外,還需要大量很多系統(tǒng)級(jí)優(yōu)化才能實(shí)現(xiàn)最佳的性能,而這是經(jīng)過許多代人的經(jīng)驗(yàn)總結(jié)出來的。

所謂系統(tǒng)級(jí)優(yōu)化,其中就包括能夠有效利用GPU和網(wǎng)絡(luò)設(shè)備的軟件。

在過去的幾年里,微軟已經(jīng)開發(fā)出了這種技術(shù),在使訓(xùn)練具有幾十萬億個(gè)參數(shù)的模型的能力得到增長(zhǎng)的同時(shí),降低了訓(xùn)練和在生產(chǎn)中提供這些模型的資源要求和時(shí)間。

Waymouth指出,微軟和合作伙伴也一直在逐步增加GPU集群的容量,發(fā)展InfiniBand網(wǎng)絡(luò),看看他們能在多大程度上推動(dòng)保持GPU集群運(yùn)行所需的數(shù)據(jù)中心基礎(chǔ)設(shè)施,包括冷卻系統(tǒng)、不間斷電源系統(tǒng)和備用發(fā)電機(jī)。

微軟AI平臺(tái)公司副總裁Eric Boyd表示,這種為大型語(yǔ)言模型訓(xùn)練和下一波AI創(chuàng)新而優(yōu)化的超算能力,已經(jīng)可以在Azure云服務(wù)中直接獲得。

并且微軟通過與OpenAI的合作,積累了大量經(jīng)驗(yàn),當(dāng)其他合作方找來、想要同樣的基礎(chǔ)設(shè)施時(shí),微軟也可以提供。

現(xiàn)在,微軟的Azure數(shù)據(jù)中心已經(jīng)覆蓋了全球60多個(gè)地區(qū)。

全新虛擬機(jī):ND H100 v5

在上面這個(gè)基礎(chǔ)架構(gòu)上,微軟一直在繼續(xù)改進(jìn)。

今天,微軟就官宣了全新的可大規(guī)模擴(kuò)展虛擬機(jī),這些虛擬機(jī)集成了最新的NVIDIA H100 Tensor Core GPU 和 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)。

通過虛擬機(jī),微軟可以向客戶提供基礎(chǔ)設(shè)施,根據(jù)任何AI任務(wù)的規(guī)模進(jìn)行擴(kuò)展。據(jù)微軟稱,Azure的新ND H100 v5 虛擬機(jī)為開發(fā)者提供卓越的性能,同時(shí)調(diào)用數(shù)千個(gè)GPU。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49028

    瀏覽量

    249544
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1210

    瀏覽量

    8922
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1590

    瀏覽量

    9106

原文標(biāo)題:揭秘ChatGPT背后天價(jià)超算!上萬顆英偉達(dá)A100,燒光微軟數(shù)億美元

文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    現(xiàn)代高性能計(jì)算不僅使得更快的計(jì)算成為可能,它正驅(qū)動(dòng)著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。 高性能計(jì)算經(jīng)歷了多次迭代,每一次都源于對(duì)技術(shù)的創(chuàng)造性再利用。例如,早期的超級(jí)
    的頭像 發(fā)表于 06-26 19:39 ?504次閱讀
    NVIDIA驅(qū)動(dòng)的現(xiàn)代<b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>如何突破速度極限并推動(dòng)科學(xué)發(fā)展

    Blue Lion超級(jí)計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行

    德國(guó)萊布尼茨超算中心(LRZ)將迎來全新超級(jí)計(jì)算機(jī) Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計(jì)算機(jī)提升了約 30 倍。這臺(tái)新的超級(jí)
    的頭像 發(fā)表于 06-12 15:39 ?414次閱讀

    NVIDIA技術(shù)賦能歐洲最快超級(jí)計(jì)算機(jī)JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺(tái)的 JUPITER 超級(jí)計(jì)算機(jī)成為歐洲最快超級(jí)計(jì)算機(jī),其運(yùn)行 HPC 和 AI 工作負(fù)載的速度是第二名的兩倍以上。
    的頭像 發(fā)表于 06-12 15:33 ?507次閱讀

    NVIDIA助力全球最大量子研究超級(jí)計(jì)算機(jī)

    NVIDIA 宣布將開設(shè)量子-AI 技術(shù)商業(yè)應(yīng)用全球研發(fā)中心(G-QuAT),該中心部署了全球最大量子計(jì)算研究專用超級(jí)計(jì)算機(jī) ABCI-Q。
    的頭像 發(fā)表于 05-22 09:44 ?330次閱讀

    超級(jí)計(jì)算與 HPC 之間的界限日趨模糊

    本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自semiengineering由于人工智能和分解而加速的性能改進(jìn)正在推動(dòng)計(jì)算前沿的重大變革。由于人工智能的普及,超級(jí)計(jì)算機(jī)和高性能計(jì)算機(jī)
    的頭像 發(fā)表于 03-17 10:33 ?536次閱讀
    <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算</b>與 HPC 之間的界限日趨模糊

    NVIDIA推出個(gè)人AI超級(jí)計(jì)算機(jī)Project DIGITS

    NVIDIA 推出個(gè)人 AI 超級(jí)計(jì)算機(jī) NVIDIA Project DIGITS,全球的 AI 研究員、數(shù)據(jù)科學(xué)家和學(xué)生都可獲取 NVIDIA Grace Blackwell 平臺(tái)的強(qiáng)大功能。
    的頭像 發(fā)表于 01-08 11:03 ?826次閱讀

    聯(lián)發(fā)科與NVIDIA合作 為NVIDIA 個(gè)人AI超級(jí)計(jì)算機(jī)設(shè)計(jì)NVIDIA GB10超級(jí)芯片

    聯(lián)發(fā)科近日宣布與NVIDIA合作設(shè)計(jì)NVIDIA GB10 Grace Blackwell超級(jí)芯片,將應(yīng)用于NVIDIA 的個(gè)人AI超級(jí)計(jì)算機(jī)NVIDIA? Project DIGITS。 聯(lián)發(fā)科在
    的頭像 發(fā)表于 01-07 16:26 ?598次閱讀

    NVIDIA發(fā)布高性價(jià)比生成式AI超級(jí)計(jì)算機(jī)

    NVIDIA近日推出了一款全新的生成式AI超級(jí)計(jì)算機(jī)——Jetson Orin Nano Super開發(fā)者套件,這款超級(jí)計(jì)算機(jī)不僅體積小巧,而且性價(jià)比極高,為商業(yè)AI開發(fā)者、科技愛好者
    的頭像 發(fā)表于 12-24 10:44 ?644次閱讀

    云端超級(jí)計(jì)算機(jī)使用教程

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?550次閱讀

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    超越世界上最強(qiáng)大的超級(jí)計(jì)算機(jī),完成以前不可想象的任務(wù)!這意味著量子計(jì)算機(jī)可能會(huì)徹底改變我們的生活。 在本文中,我們將先了解普通計(jì)算機(jī)的工作原理,再深入探討量子
    的頭像 發(fā)表于 11-24 11:00 ?1493次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    市的 Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)是專為多租戶
    發(fā)表于 10-30 09:33 ?357次閱讀
    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>

    丹麥推出首臺(tái)AI超級(jí)計(jì)算機(jī)Gefion

    近日,丹麥正式推出了該國(guó)首臺(tái)人工智能超級(jí)計(jì)算機(jī),命名為Gefion,以紀(jì)念丹麥神話中的女神。此次揭幕儀式由英偉達(dá)首席執(zhí)行官黃仁勛與丹麥國(guó)王共同出席,彰顯了該項(xiàng)目的重要性和影響力。 Gefion AI
    的頭像 發(fā)表于 10-29 15:13 ?812次閱讀

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大的超級(jí)計(jì)算機(jī)由該國(guó)政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD 超級(jí)計(jì)算機(jī)。
    的頭像 發(fā)表于 10-27 09:42 ?902次閱讀

    云端超級(jí)計(jì)算機(jī)怎么用

    云端超級(jí)計(jì)算機(jī)是一種基于云計(jì)算的高性能計(jì)算服務(wù),它將大量計(jì)算資源和存儲(chǔ)資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?482次閱讀

    借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展

    科學(xué)期刊《自然》(Nature)本月早些時(shí)候發(fā)表了一項(xiàng)研究,通過使用 NVIDIA 驅(qū)動(dòng)的超級(jí)計(jì)算機(jī),驗(yàn)證了量子計(jì)算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?919次閱讀