一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦黃氏定律:NVIDIA 首席科學(xué)家 Bill Dally 介紹推動(dòng) GPU 性能提升的關(guān)鍵因素

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-10-12 19:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在近期舉行的處理器和系統(tǒng)工程師年度盛會(huì)Hot Chips上,NVIDIA 首席科學(xué)家 Bill Dally 發(fā)表了主題演講。在演講中,其描述了后摩爾定律時(shí)代計(jì)算機(jī)性能正在發(fā)生結(jié)構(gòu)性的變化。

點(diǎn)擊觀看 Bill Dally 在 Hot Chips 主題演講完整視頻

他表示,每一款新處理器都具備獨(dú)創(chuàng)性,需要經(jīng)過(guò)不懈的努力,發(fā)明并驗(yàn)證新的電子元件。這與上一代產(chǎn)品的開(kāi)發(fā)截然不同,當(dāng)時(shí)的工程師主要依賴于芯片更小、更快的物理特性。

Dally 在 NVIDIA Research 領(lǐng)導(dǎo)著一支 300 多人的團(tuán)隊(duì),過(guò)去十年間他們將單個(gè) GPUAI 推理性能提高了 1000 倍(詳見(jiàn)下圖)。

wKgaomUt2zaAUzc7AADX7XjyyqQ650.jpg

IEEE Spectrum 最先以 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛的名字將這一驚人的性能提升命名為 "黃氏定律(Huang’s Law) ",后來(lái)《華爾街日?qǐng)?bào)》的一篇專欄文章又讓該定律廣為流傳。

這樣的飆升速度是對(duì)以同樣驚人的速度崛起的大語(yǔ)言模型的回應(yīng),該模型用于生成式 AI,并且每年都以數(shù)量級(jí)的速度增長(zhǎng)。

Dally 說(shuō):"這為硬件行業(yè)的發(fā)展設(shè)定了步調(diào),因?yàn)槲覀儽仨殱M足這種需求。”

在演講中,Dally 詳細(xì)介紹了推動(dòng)性能提升 1000 倍的要素。

其中,提升幅度最大的一次達(dá)到了 16 倍,這源于人們找到了更簡(jiǎn)單的方法來(lái)表示計(jì)算機(jī)運(yùn)算使用的數(shù)字。

新的運(yùn)算方法

最新的 NVIDIA Hopper 架構(gòu)及其 Transformer 引擎采用 8 位和 16 位浮點(diǎn)與整數(shù)運(yùn)算的動(dòng)態(tài)組合。這種運(yùn)算方法專為滿足當(dāng)今生成式 AI 模型的需求而量身定制。Dally 詳細(xì)介紹了該運(yùn)算方法帶來(lái)的性能提升和節(jié)能效果。

Dally 領(lǐng)導(dǎo)的團(tuán)隊(duì)通過(guò)編寫(xiě)高級(jí)指令,指導(dǎo) GPU 組織工作,實(shí)現(xiàn)了 12.5 倍的性能提升。這些復(fù)雜的指令有助于以更低的能耗做更多的工作。

因此,計(jì)算機(jī)就可以像“專用加速器一樣高效,同時(shí)保留 GPU 的所有可編程性”,Dally 介紹道。

此外,NVIDIA Ampere 架構(gòu)還增加了結(jié)構(gòu)化稀疏功能,這種創(chuàng)新方法可以在不影響模型精度的前提下簡(jiǎn)化了 AI 模型的權(quán)重。Dally 表示,這項(xiàng)技術(shù)將性能提高了兩倍,并且未來(lái)有望實(shí)現(xiàn)更大的性能提升。

Dally 還介紹了可實(shí)現(xiàn) GPU 之間高速互聯(lián)的 NVLink 以及用于系統(tǒng)間的 NVIDIA 網(wǎng)絡(luò)如何使單個(gè) GPU 的性能提高 1000 倍。

進(jìn)步之路不止步

Dally 指出,盡管 NVIDIA 在過(guò)去十年里將 GPU 的半導(dǎo)體節(jié)點(diǎn)從 28 納米推進(jìn)到 5 納米,但這種技術(shù)僅僅貢獻(xiàn)了性能提升總量的 2.5 倍。

與摩爾定律下的前一代計(jì)算機(jī)設(shè)計(jì)相比,這是巨大的轉(zhuǎn)變。摩爾定律認(rèn)為,隨著芯片變得越來(lái)越小、越來(lái)越快,處理器的性能每隔兩年翻一倍。

登納德縮放比例定律(Dennard scaling)在某種程度上對(duì)此進(jìn)行了描述。該定律由 IBM 科學(xué)家 Robert Denard 在 1974 年與人合著的一篇論文中提出。但遺憾的是,物理微縮遇到了自然限制,例如更小、更快的器件所能承受的熱量。

前景樂(lè)觀

Dally 表示,盡管摩爾定律提出的性能提升在放緩,但黃氏定律仍將繼續(xù)存在,他對(duì)此充滿信心。

例如,他概括介紹了未來(lái)的幾個(gè)機(jī)會(huì),包括進(jìn)一步簡(jiǎn)化數(shù)字表示方式、在 AI 模型中創(chuàng)建更多稀疏性以及設(shè)計(jì)更優(yōu)的內(nèi)存和通信電路。

因?yàn)槊恳淮碌男酒拖到y(tǒng)都需要新的創(chuàng)新,所以這是屬于計(jì)算機(jī)工程師的美好時(shí)代,Dally 補(bǔ)充說(shuō)。

Dally 相信,計(jì)算機(jī)設(shè)計(jì)領(lǐng)域的新動(dòng)態(tài)為 NVIDIA 工程師們提供了他們最渴望的三個(gè)機(jī)會(huì):成為致勝團(tuán)隊(duì)的一員、與聰明人共事以及從事有影響力的設(shè)計(jì)。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國(guó)加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開(kāi)放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息。

wKgaomUt2zaAC-fDAAFtccdApf0108.jpg


原文標(biāo)題:聚焦黃氏定律:NVIDIA 首席科學(xué)家 Bill Dally 介紹推動(dòng) GPU 性能提升的關(guān)鍵因素

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3952

    瀏覽量

    93759

原文標(biāo)題:聚焦黃氏定律:NVIDIA 首席科學(xué)家 Bill Dally 介紹推動(dòng) GPU 性能提升的關(guān)鍵因素

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    影響圖像采集卡性能關(guān)鍵因素

    關(guān)鍵因素,對(duì)于選擇合適的采集卡、優(yōu)化系統(tǒng)配置、提高應(yīng)用效率具有重要意義。本文將從分辨率與幀率、接口類型與帶寬、信號(hào)處理能力、觸發(fā)與同步機(jī)制、軟件支持與兼容性、噪
    的頭像 發(fā)表于 07-03 15:20 ?140次閱讀
    影響圖像采集卡<b class='flag-5'>性能</b>的<b class='flag-5'>關(guān)鍵因素</b>

    選擇適合微機(jī)消諧器的關(guān)鍵因素

    選擇適合的微機(jī)消諧器是保障電力系統(tǒng)(尤其是中性點(diǎn)非有效接地系統(tǒng))安全穩(wěn)定運(yùn)行的重要環(huán)節(jié)。以下是關(guān)鍵因素的詳細(xì)分條列舉: 選擇適合微機(jī)消諧器的關(guān)鍵因素: 1. ?系統(tǒng)基本參數(shù)匹配性: ? ? ?額定
    的頭像 發(fā)表于 06-13 16:27 ?95次閱讀

    DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用

    力集群的部署過(guò)程中,帶寬瓶頸成為制約算力發(fā)揮的關(guān)鍵因素,而光模塊的速率躍升成為突破這一瓶頸的核心驅(qū)動(dòng)力。 光模塊速率躍升 隨著算力集群的規(guī)模不斷擴(kuò)展,AI應(yīng)用所需的帶寬要求也在急劇上升。傳統(tǒng)
    發(fā)表于 03-25 12:00

    商湯絕影王曉剛亮相NVIDIA GTC 2025并發(fā)表主題演講

    商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛在NVIDIA GTC 2025發(fā)表演講《激發(fā)通用人工智能的創(chuàng)造力,引領(lǐng)智能汽車(chē)走向全新的未來(lái)》。
    的頭像 發(fā)表于 03-21 14:37 ?586次閱讀

    焊接質(zhì)量評(píng)估:關(guān)鍵因素與檢測(cè)方法綜述

    的匹配性、焊接工藝的選擇以及焊接過(guò)程中的熱影響區(qū)等多方面因素。本文將從焊接質(zhì)量的關(guān)鍵因素和檢測(cè)方法兩個(gè)方面進(jìn)行綜述。 ### 關(guān)鍵因素 #### 1. 材料選擇 焊接材料
    的頭像 發(fā)表于 02-18 09:17 ?670次閱讀
    焊接質(zhì)量評(píng)估:<b class='flag-5'>關(guān)鍵因素</b>與檢測(cè)方法綜述

    NVIDIA攜手多家機(jī)構(gòu)推動(dòng)醫(yī)療健康產(chǎn)業(yè)變革

    合作的目標(biāo)直指規(guī)模高達(dá)10萬(wàn)億美元的醫(yī)療健康與生命科學(xué)產(chǎn)業(yè)。NVIDIA將憑借其強(qiáng)大的AI和加速計(jì)算技術(shù),助力合作伙伴在藥物發(fā)現(xiàn)、基因組研究等領(lǐng)域?qū)崿F(xiàn)突破性進(jìn)展。通過(guò)加速計(jì)算,科學(xué)家們能夠更高效地處理和分析海量的醫(yī)療數(shù)據(jù),從而大
    的頭像 發(fā)表于 01-14 14:28 ?1271次閱讀

    借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計(jì)算效率

    本案例中魯班系統(tǒng)高性能 CAE 軟件利用 NVIDIA性能 GPU,實(shí)現(xiàn)復(fù)雜產(chǎn)品的快速仿真,加速產(chǎn)品開(kāi)發(fā)和設(shè)計(jì)迭代,縮短開(kāi)發(fā)周期,提升產(chǎn)
    的頭像 發(fā)表于 12-27 16:24 ?676次閱讀

    鋰電池品牌廠家影響光伏逆變器效率提升的兩個(gè)關(guān)鍵因素

    電子元器件的質(zhì)量和散熱設(shè)計(jì)是影響光伏逆變器效率提升的兩個(gè)關(guān)鍵因素。我們需要選擇高質(zhì)量的電子元器件,采用合理的散熱設(shè)計(jì),以提高光伏逆變器的效率和可靠性。同時(shí),我們還需要不斷地進(jìn)行技術(shù)創(chuàng)新和優(yōu)化,推動(dòng)光伏逆變器技術(shù)的發(fā)展和進(jìn)步。
    的頭像 發(fā)表于 12-19 15:19 ?498次閱讀
    鋰電池品牌廠家影響光伏逆變器效率<b class='flag-5'>提升</b>的兩個(gè)<b class='flag-5'>關(guān)鍵因素</b>

    西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這一點(diǎn)在西湖大學(xué)的科研項(xiàng)目中已得到體現(xiàn)。 成立于2018年的西湖大學(xué)是由施一公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學(xué)研究的研究型大學(xué),該校鼓勵(lì)科學(xué)家們探索AI與各學(xué)科交叉融合,為科研創(chuàng)新提速。為此,西湖大學(xué)在浪潮信息
    的頭像 發(fā)表于 12-12 15:59 ?586次閱讀
    西湖大學(xué):<b class='flag-5'>科學(xué)家</b>+AI,科研新范式的樣本

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對(duì)卷積核優(yōu)化的思考。 GPU的存儲(chǔ)體系采用了獨(dú)特的倒金字塔結(jié)構(gòu),在我看來(lái)這是其計(jì)算性能關(guān)鍵。大容量寄存器設(shè)計(jì)破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機(jī)制巧妙解決了內(nèi)存帶寬限制。NVIDIA
    發(fā)表于 11-24 17:12

    螞蟻集團(tuán)收購(gòu)邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室首席科學(xué)家

    學(xué)習(xí)領(lǐng)域的研究與發(fā)展。令人矚目的是,邊塞科技的創(chuàng)始人吳翼已正式加入該實(shí)驗(yàn)室,并擔(dān)任首席科學(xué)家一職。 吳翼在其個(gè)人社交平臺(tái)上對(duì)這一變動(dòng)進(jìn)行了回應(yīng)。他表示,自己最近接受了螞蟻集團(tuán)的邀請(qǐng),負(fù)責(zé)大模型強(qiáng)化學(xué)習(xí)領(lǐng)域的研究工
    的頭像 發(fā)表于 11-22 11:14 ?1578次閱讀

    NVIDIA加速計(jì)算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學(xué)家僅在一
    的頭像 發(fā)表于 11-20 10:03 ?732次閱讀
    將<b class='flag-5'>NVIDIA</b>加速計(jì)算引入Polars

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時(shí),AI技術(shù)的引入也催生了一種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動(dòng)的研究范式,這種范式強(qiáng)調(diào)從大量數(shù)據(jù)中提取有價(jià)值的信息,從而推動(dòng)
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的效率,還為科學(xué)研究提供了前所未有的洞察力和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識(shí)別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書(shū)中強(qiáng)調(diào),人工智能的應(yīng)用促進(jìn)了多個(gè)
    發(fā)表于 10-14 09:12

    硅谷VPS優(yōu)勢(shì)及關(guān)鍵因素

    硅谷VPS是一個(gè)虛擬專用服務(wù)器(VPS)的集群,它位于美國(guó)硅谷,為各類在線業(yè)務(wù)和科技企業(yè)提供了強(qiáng)大的計(jì)算能力和穩(wěn)定的網(wǎng)絡(luò)連接。Rak部落為您整理發(fā)布硅谷VPS優(yōu)勢(shì)及關(guān)鍵因素。
    的頭像 發(fā)表于 08-09 11:46 ?458次閱讀