一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)「黃氏定律」讓未來的AI算力每年能夠提升一倍

454398 ? 來源:機(jī)器之心 ? 作者:李澤南 ? 2020-12-20 07:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年的 GTC China 黃仁勛沒有露面,但黃式定律無處不在。

從翻倍提高 TensorCore 計算效能的新技術(shù),到下一代光通信技術(shù),再到一行代碼為所有模型提供 GPU 加速的軟件工具,為了讓未來的 AI 算力每年能夠提升一倍,英偉達(dá)找到了不少新方向。

12 月 15 日上午,英偉達(dá) GTC 大會中國站在線上舉行,全球最負(fù)盛名的計算機(jī)科學(xué)家之一、NVIDIA 研究院負(fù)責(zé)人 Bill Dally 在活動中發(fā)表了主題演講。

科技領(lǐng)域里,很多人都知道摩爾定律:前英特爾 CEO 大衛(wèi)·豪斯(David House)曾提出,人類制造出的芯片,每 18 個月計算效率就會提高一倍。這一「規(guī)律」在過去長達(dá)五十年間一直被實踐驗證,但在最近五六年中,由于晶體管尺寸越來越小,制程陷入瓶頸,摩爾定律逐漸失效。

而另一方面,人類對于計算機(jī)的算力需求是無限的,人工智能技術(shù)的發(fā)展更是加大了這種需求。近十年來,GPU正在讓人工智能算法的性能每年都在成倍提升,英偉達(dá)的研究人員通過架構(gòu)的提升,正在不斷尋找進(jìn)一步加快AI推理速度的芯片。

英偉達(dá)提出了以自己創(chuàng)始人黃仁勛名字命名的黃氏定律(Huang’s Law)對單芯片AI推理能力進(jìn)行了預(yù)測,提出每 12 月其數(shù)字將翻一倍。

如果我們還需要在未來的一段時間里使用硅芯片,那么摩爾定律之后,我們還可以仰賴「黃氏定律」保持AI技術(shù)的發(fā)展速度。

在芯片本身無法快速提升的情況下,英偉達(dá)把目光轉(zhuǎn)向了計算架構(gòu)的很多其他方面,Bill Dally 認(rèn)為「這些方向其中的任何一個如果有效,都可以在接下來幾代的產(chǎn)品中幫助我們延續(xù)性能每年提升一倍的目標(biāo)?!?/p>

首先是單卡計算效率。即使是英偉達(dá)目前的二代 Tensor Core,在進(jìn)行推理時也無法把所有功耗用在數(shù)學(xué)運(yùn)算上——效率被浪費(fèi)在了數(shù)據(jù)傳輸上。英偉達(dá)設(shè)計了 MAGNet 系統(tǒng),用于探索更為高效的芯片架構(gòu)設(shè)計。

如果可以通過一個全局控制器,把數(shù)據(jù)從內(nèi)存不同的部分移動到不同計算單元以執(zhí)行計算,并針對神經(jīng)網(wǎng)絡(luò)計算的特性在數(shù)據(jù)流中加入一個存儲層,便可以解除瓶頸,將大部分能量用于計算。在特定的單元上,英偉達(dá)尚未發(fā)布的硬件產(chǎn)品可以實現(xiàn)每瓦 100 Teraops 的推理能力,而在 2019 年達(dá)到的效率還只有 29 Teraops。

看來下一代的 Tensor Core 性能又要有巨大的提升了。

其次是多卡的數(shù)據(jù)傳輸,英偉達(dá)的 GPU 通過 NVlink 和 NVswitch 互相連接,然而基于電信號的方式目前已經(jīng)接近極限了,人們預(yù)估,想要繼續(xù)讓 NVLink 中信號傳輸?shù)膸捗看嵘槐叮瑢⒆兊脴O其困難。目前英偉達(dá)能夠?qū)崿F(xiàn)的數(shù)字是每線對 50Gb/s,可預(yù)見的未來大約可以實現(xiàn)到 100-200Gb/s。英偉達(dá)也在和英特爾等科技巨頭一樣思考如何盡快把基于光學(xué)通信技術(shù)應(yīng)用于實踐。

作為一名研究者,Bill Dally 曾牽頭研發(fā)英偉達(dá)對于光信號傳輸?shù)脑妇埃汗馔ㄐ挪粌H可以大幅度提升帶寬(從幾百 Gb/s 到幾 Tb/s),提升傳輸空間(從幾十厘米到 20-100 米)并減少系統(tǒng)的復(fù)雜程度。

在英偉達(dá)的設(shè)計中,DGX 卡縱置排列,右側(cè)為光源,可為光線提供多種不同波長的光線,光學(xué)引擎以極高的數(shù)據(jù)速率把光轉(zhuǎn)換為信號。每根光纖都可以同時傳輸不同波長的光,而每種波長的光都可以用 25-50Gb/s 的速度傳輸信號。這樣一來,總數(shù)據(jù)速率將為 400Gb/s,而每根光纖的傳輸速率「保守估計」就可以達(dá)到數(shù)個 Tb/s,而且能耗還要比電信號要小。英偉達(dá)的研究團(tuán)隊正在與哥倫比亞大學(xué)的研究人員密切合作,探討如何利用電信供應(yīng)商在其核心網(wǎng)絡(luò)中所采用的技術(shù),通過一條光纖來傳輸數(shù)十路信號——有了光通信,僅需一條 NVLink 就可以連接規(guī)模更大的系統(tǒng)。

英偉達(dá)還在嘗試一種名為「密集波分復(fù)用」的技術(shù), 有望在僅一毫米大小的芯片上實現(xiàn) Tb/s 級數(shù)據(jù)的傳輸,是如今互連密度的十倍以上。

除了更大的吞吐量,光鏈路也有助于打造更為密集型的系統(tǒng)。Dally 舉例展示了一個未來將搭載 160 多個 GPU 的 NVIDIA DGX 系統(tǒng)模型。

除了硬件方面的革新,還有軟件。今天有很多應(yīng)用都在被 GPU 加速,遠(yuǎn)超英偉達(dá)開發(fā)者們更新 CUDA 程序的速度,人們急需一種簡化的編程方式。NVIDIA 的研究人員開發(fā)了全新編程系統(tǒng)原型 Legate。開發(fā)者借助 Legate,即可在任何規(guī)模的系統(tǒng)上,運(yùn)行針對單一 GPU 編寫的程序——甚至適用于諸如 Selene 等搭載數(shù)千個 GPU 的巨型超級計算機(jī)。

對于大多數(shù)人來說,使用 Legate 我們就可以無需更改代碼即讓 Python 程序無感運(yùn)行在從 Jetson Nano 到 DGX SuperPOD 等所有包含英偉達(dá) cuda 核心的設(shè)備上。開發(fā)者所做的是基于原始的 Python 代碼,將原本的「import NumPy as NP」更改為「import legate.numpy as NP」就可以了。隨后 Legate 庫會開始運(yùn)行,自動完成之后的操作。

它的運(yùn)行速率有多快呢?從上表中可以看到,Legate 的處理速度不僅快于目前效率最高的庫,同時在并行化時也能盡量保持住自己的優(yōu)勢。

英偉達(dá)也分享了目前國內(nèi)合作伙伴使用新一代芯片的情況:阿里云、百度智能云、滴滴云、騰訊云的大型數(shù)據(jù)中心正在遷移至基于英偉達(dá) Ampere 架構(gòu)的平臺。圖像識別、語音識別,以及包括計算流體動力學(xué)、計算金融學(xué)、分子動力學(xué)在內(nèi)的 GPU 加速高性能計算場景的快速增長,催生了更多對云實例的需求。

在硬件方面,新華三、浪潮、聯(lián)想、寧暢等中國領(lǐng)先系統(tǒng)制造商也在將 A100 GPU 引入到自身產(chǎn)品中,并推出了多款針對不同應(yīng)用場景的系列產(chǎn)品,為超大型數(shù)據(jù)中心提供基于 Ampere 架構(gòu)的加速系統(tǒng),進(jìn)而為用戶提供兼具超強(qiáng)性能與靈活性的 AI 計算平臺。
編輯:hfy
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4945

    瀏覽量

    131228
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7662

    瀏覽量

    90790
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279784
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3952

    瀏覽量

    93756
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    進(jìn)步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    2024年3月19日,[英偉達(dá)]CEO[仁勛]在GTC大會上公布了新AI芯片架構(gòu)BLACKWELL,并推出基于該架構(gòu)的超級芯片GB20
    發(fā)表于 05-13 17:16

    【AD新聞】AI時代,美元能夠買到多強(qiáng)的?

    當(dāng)真正需要在嵌入式終端設(shè)備中使用AI技術(shù)時,客戶的訴求更多的集中在功耗、響應(yīng)時間、成本等方面,對性能的無盡追求反而不是重點,這和很多人之前的預(yù)想并不致?;?b class='flag-5'>一美元或瓦電能買到多強(qiáng)的
    發(fā)表于 03-23 15:27

    英偉達(dá)GPU慘遭專業(yè)礦機(jī)碾壓,仁勛宣布砍掉加密貨幣業(yè)務(wù)!

    加密貨幣專用產(chǎn)品上的預(yù)期營收降至1億美元,實際營收只有1800萬美元。預(yù)計未來業(yè)務(wù)對公司的貢獻(xiàn)可以忽略不計?!?b class='flag-5'>英偉達(dá)CEO仁勛也做出類
    發(fā)表于 08-24 10:11

    英偉達(dá)DPU的過“芯”之處

    ,AI硬件正成為越來越多數(shù)據(jù)中心擴(kuò)容建設(shè)的關(guān)鍵所在。當(dāng)超強(qiáng)AI成為數(shù)據(jù)中心的剛需,英偉達(dá)GP
    發(fā)表于 03-29 14:42

    英偉達(dá)嵌入式電腦可為機(jī)器人設(shè)計引入AI

    英偉達(dá)在硅谷召開了GTC 2019主題演講,英偉達(dá) CEO仁勛發(fā)表演講,正式發(fā)布了機(jī)器人開發(fā)者工具箱Jetson Nano,可以為機(jī)器人設(shè)
    發(fā)表于 08-12 17:09 ?1094次閱讀

    英偉達(dá)正式發(fā)布NVIDIA A100,擁有比原來強(qiáng)大20AI

    GPU,為此前在網(wǎng)上盛傳的,被稱為安培(Ampere)的產(chǎn)品。公司創(chuàng)始人兼 CEO 仁勛介紹稱,其包含 540 億晶體管,擁有比原來強(qiáng)大 20 AI
    發(fā)表于 05-15 11:34 ?6896次閱讀

    英偉達(dá):GPUAI的性能每年都成倍提升

    英偉達(dá)首席科學(xué)家Bill Dally在一年一度的中國GPU技術(shù)大會召開前接受第財經(jīng)記者獨家專訪時表示,GPU人工智能(
    的頭像 發(fā)表于 12-15 13:37 ?2853次閱讀

    英偉達(dá)官方認(rèn)可“定律”,摩爾定律會失效嗎?

    :摩爾定律失效后,該如何進(jìn)步提高處理器的能效?針對這個問題,些公司已經(jīng)找到了自己的答案,比如英偉達(dá)。 過去幾年來,
    的頭像 發(fā)表于 12-18 16:27 ?3431次閱讀

    英偉達(dá)霸主之路 “卷王”英偉達(dá)的真面目

    了臺積電4納米制程工藝,集成1800億個晶體管,浮點計算能力相比前代A100快了三,被看作英偉達(dá)的新代“核彈”。
    的頭像 發(fā)表于 04-05 14:11 ?2959次閱讀

    角逐AI,比英偉達(dá)最多快10,光芯片能成為國產(chǎn)之光嗎?

    中信建投指出,近年來光計算在AI領(lǐng)域呈現(xiàn)高速的發(fā)展,具有廣闊的應(yīng)用前景。以Lightmatter和Lightelligence為代表的公司,推出了新型的硅光計算芯片,性能遠(yuǎn)超目前的AI
    的頭像 發(fā)表于 07-17 14:47 ?1852次閱讀
    角逐<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,比<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>最多快10<b class='flag-5'>倍</b>,光芯片能成為國產(chǎn)之光嗎?

    英偉達(dá)A100的是多少?

    ,但 A100 的是前者的 20 。 A100是英偉達(dá)推出的款強(qiáng)大的數(shù)據(jù)中心GPU,采用
    的頭像 發(fā)表于 08-08 15:28 ?4.1w次閱讀

    英偉達(dá)H200怎么樣

    英偉達(dá)H200的非常強(qiáng)大。作為新AI芯片,H200在性能上有了顯著的
    的頭像 發(fā)表于 03-07 16:15 ?3308次閱讀

    英偉達(dá)最新AI芯片Blackwell GPU,AI力能力較上代提升30!

    仁勛說:"我們已經(jīng)來到了個臨界點,因此需要種新的計算方式來加速整個行業(yè)的發(fā)展效率。那么英偉達(dá)能夠
    的頭像 發(fā)表于 03-19 13:39 ?2945次閱讀

    英偉達(dá)宣布每年設(shè)計代全新AI芯片,加快其他產(chǎn)品線更新速度

    英偉達(dá)CEO仁勛宣布,公司將每年推出全新AI芯片,以滿足市場需求。他表示,Blackwell后將有新款芯片問世,且
    的頭像 發(fā)表于 05-23 10:41 ?1128次閱讀

    英偉達(dá)Blackwell芯片已投產(chǎn),預(yù)告未來AI芯片發(fā)展

    英偉達(dá)創(chuàng)始人兼CEO仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是英偉達(dá)A
    的頭像 發(fā)表于 06-04 09:23 ?2258次閱讀