一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

始于硬件卻也被硬件所限的深度學(xué)習(xí)

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-12-05 01:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))深度學(xué)習(xí)硬件在AI時(shí)代已經(jīng)引領(lǐng)了不少設(shè)計(jì)創(chuàng)新,無(wú)論是簡(jiǎn)單的邊緣推理,還是大規(guī)模自然語(yǔ)言模型的訓(xùn)練,都有了性能上的突破。作為業(yè)內(nèi)在深度學(xué)習(xí)上投入最多的公司之一,英偉達(dá)無(wú)疑是這類硬件的領(lǐng)軍者。

近日,在伯克利大學(xué)的電子工程與電腦科學(xué)學(xué)院研討會(huì)上,英偉達(dá)的首席科學(xué)家、研究部門高級(jí)副總裁同時(shí)兼任該校副教授的BillDally,分享了從他這個(gè)從業(yè)人士看來(lái),發(fā)生在深度學(xué)習(xí)硬件上的一些趨勢(shì)。

硬件成為限制

AI的浪潮其實(shí)早在20世紀(jì)就被多次掀起過(guò),但真正成為人們不可忽視的巨浪,還是這十幾年的事,因?yàn)檫@時(shí)候AI有了天時(shí)地利人和:算法與模型,大到足夠訓(xùn)練這些模型的數(shù)據(jù)集,以及能在合理的時(shí)間內(nèi)訓(xùn)練出這些模型的硬件。

但從帶起第一波深度學(xué)習(xí)的AlexNet,到如今的GPT-3TuringNLG等,人們不斷在打造更大的數(shù)據(jù)集和更大的模型,加上大語(yǔ)言模型的興起,對(duì)訓(xùn)練的要求也就越來(lái)越高。可在摩爾定律已經(jīng)放緩的當(dāng)下,訓(xùn)練時(shí)間也在被拉長(zhǎng)。

poYBAGOM0tGAQZM8AAn0_Rgb1Iw971.png

基于Hopper架構(gòu)的H100GPU/英偉達(dá)

以英偉達(dá)為例,到了帕斯卡這一代,他們才真正開(kāi)始考慮單芯片的深度學(xué)習(xí)性能,并結(jié)合到GPU的設(shè)計(jì)中去,所以才有了Hopper這樣超高規(guī)格的AI硬件出現(xiàn)。但我們?cè)谟?xùn)練這些模型的時(shí)候,并沒(méi)有在硬件規(guī)模上有所減少,仍然需要用到集成了數(shù)塊HopperGPUDGX系統(tǒng),甚至打造一個(gè)超算。很明顯,單從硬件這一個(gè)方向出發(fā)已經(jīng)有些不夠了,至少不是一個(gè)“高性價(jià)比”的方案。

軟硬件全棧投入

硬件推出后,仍要針對(duì)特定的模型進(jìn)行進(jìn)一步的軟件優(yōu)化,因此即便是同樣的硬件,其AI性能也會(huì)在未來(lái)呈現(xiàn)數(shù)倍的飛躍。從上個(gè)月的MLPerf的測(cè)試結(jié)果就可以看出,在A100GPU推出的2.5年內(nèi),英偉達(dá)就靠軟件優(yōu)化實(shí)現(xiàn)了最高2.5倍的訓(xùn)練性能提升,當(dāng)然了最大的性能提升還是得靠H100這樣的新硬件來(lái)實(shí)現(xiàn)。

BillDally表示這就是英偉達(dá)的優(yōu)勢(shì)所在,雖然這幾年投入進(jìn)深度學(xué)習(xí)硬件的資本不少,但隨著經(jīng)濟(jì)下行,不少投資者已經(jīng)喪失了信心,所以不少AI硬件初創(chuàng)公司都沒(méi)能撐下去,他自己也在這段時(shí)間看到了不少向英偉達(dá)投遞過(guò)來(lái)的簡(jiǎn)歷。

他認(rèn)為不少這些公司都已經(jīng)打造出了自己的矩陣乘法器,但他們并沒(méi)有在軟件上有足夠的投入,所以即便他們一開(kāi)始給出的指標(biāo)很好看,也經(jīng)常拿英偉達(dá)的產(chǎn)品作為對(duì)比,未來(lái)的性能甚至比不過(guò)英偉達(dá)的上一代硬件,更別說(shuō)Hopper這類新產(chǎn)品了。

加速器

相較傳統(tǒng)的通用計(jì)算硬件,加速器在深度學(xué)習(xí)上明顯要高效多了,因?yàn)榧铀倨魍际亲鳛橐环N專用單元存在的,比如針對(duì)特定的數(shù)據(jù)類型和運(yùn)算。加速器可以在一個(gè)運(yùn)算周期內(nèi)就完成通常需要花上10秒或100秒才能完成的工作量,效率最高可提升1000倍。

pYYBAGOM0tuAc7h7AAFHR6jFQlY35.jpeg

A100H100MLPerf跑分/英偉達(dá)

當(dāng)然了要追求純粹的性能提升,而不是效率提升的話,這些加速器也可以采用大規(guī)模并行設(shè)計(jì),比如典型的32x32矩陣乘法單元,同時(shí)運(yùn)行的運(yùn)算有了千百倍的提升。加速器在內(nèi)存設(shè)計(jì)上也更具有優(yōu)勢(shì),比如針對(duì)特定的數(shù)據(jù)結(jié)構(gòu)和運(yùn)算,選擇優(yōu)化過(guò)的高帶寬低能耗內(nèi)存,同時(shí)盡可能使用本地內(nèi)存,減少數(shù)據(jù)搬運(yùn)來(lái)控制開(kāi)銷。

對(duì)于英偉達(dá)來(lái)說(shuō),他們?cè)诩铀倨魃系难芯扛袷菫?/span>GPU準(zhǔn)備的試驗(yàn)田,一旦有優(yōu)秀的成果出現(xiàn),這些加速器就會(huì)成為GPU上的新核心。

小結(jié)

BillDally的分享中,我們可以看出英偉達(dá)這樣的巨頭在深度學(xué)習(xí)上選擇的技術(shù)路線,以及他們?yōu)楹文茉诒姸喑鮿?chuàng)公司涌現(xiàn)、大廠入局的當(dāng)下巋然不動(dòng)的底氣。這并不是說(shuō)深度學(xué)習(xí)硬件的道路只有這一條,類腦芯片等技術(shù)的出現(xiàn)也提供了新的破局機(jī)會(huì),但有了前人經(jīng)驗(yàn)的借鑒后,在兼顧性能、數(shù)值精度、模型的同時(shí),還是得在軟件上下大功夫才行。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    453

    瀏覽量

    39331
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279209
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5560

    瀏覽量

    122765
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電子硬件工程師如何從零開(kāi)始學(xué)習(xí)?(文末免費(fèi)分享從零開(kāi)始學(xué)習(xí)資料)

    經(jīng)常有用戶咨詢,如何學(xué)習(xí)和提升電子硬件能力,有沒(méi)有適合小白學(xué)習(xí)的資料等等;電子硬件工程師是一個(gè)結(jié)合理論、實(shí)踐和創(chuàng)新能力的職業(yè),需要掌握電路設(shè)計(jì)、元器件選型、PCB設(shè)計(jì)、嵌入式系統(tǒng)、測(cè)試
    的頭像 發(fā)表于 06-04 07:36 ?439次閱讀
    電子<b class='flag-5'>硬件</b>工程師如何從零開(kāi)始<b class='flag-5'>學(xué)習(xí)</b>?(文末免費(fèi)分享從零開(kāi)始<b class='flag-5'>學(xué)習(xí)</b>資料)

    硬件:我就說(shuō)還得靠我

    硬件
    揚(yáng)興科技
    發(fā)布于 :2025年05月26日 18:27:09

    硬件原理圖學(xué)習(xí)筆記

    這一個(gè)星期認(rèn)真學(xué)習(xí)硬件原理圖的知識(shí),做了一些筆記,方便以后查找。硬件原理圖分為三類1.管腳類(gpio)和門電路類輸入輸出引腳,上拉電阻,三極管與門,或門,非門上拉電阻:正向標(biāo)志作用,給懸空的引腳
    的頭像 發(fā)表于 04-30 18:40 ?826次閱讀
    <b class='flag-5'>硬件</b>原理圖<b class='flag-5'>學(xué)習(xí)</b>筆記

    硬件工程師學(xué)習(xí)路線,不吹牛規(guī)劃

    心理,才能觸發(fā)你的好奇心,去學(xué)下去,這也是成為工程師的首要條件,但這是遠(yuǎn)遠(yuǎn)不夠,還需要一條可供參考的學(xué)習(xí)路線,再加上99%的汗水和1%的靈感才可以。硬件設(shè)計(jì),可以
    的頭像 發(fā)表于 04-16 19:33 ?919次閱讀
    <b class='flag-5'>硬件</b>工程師<b class='flag-5'>學(xué)習(xí)</b>路線,不吹牛規(guī)劃

    擁有一顆熱愛(ài)學(xué)習(xí)硬件開(kāi)發(fā)的決心!

    有沒(méi)有大佬能教教硬件開(kāi)發(fā)設(shè)計(jì)和pcb,目前轉(zhuǎn)行在,想學(xué)習(xí)硬件工程師這塊!
    發(fā)表于 04-02 14:46

    移遠(yuǎn)通信×扣子:AI與硬件深度融合,加速AI智能體高效開(kāi)發(fā)新生態(tài)

    3月22日,由扣子Coze與火山引擎聯(lián)合主辦的“扣子AI工坊·硬件專場(chǎng)”在深圳、北京、杭州、成都四城圓滿落幕。作為Coze與火山引擎的重要合作伙伴,移遠(yuǎn)通信受邀全程深度參與本次活動(dòng),攜兩大AI創(chuàng)新
    的頭像 發(fā)表于 03-22 20:37 ?562次閱讀
    移遠(yuǎn)通信×扣子:AI與<b class='flag-5'>硬件</b><b class='flag-5'>深度</b>融合,加速AI智能體高效開(kāi)發(fā)新生態(tài)

    智算中心的核心硬件是什么?

    與各種AI算法協(xié)同工作,滿足對(duì)算力的極高需求。當(dāng)前主流的AI加速計(jì)算芯片包括:1、GPU(圖形處理器)GPU是智算中心的算力擔(dān)當(dāng),其強(qiáng)大的并行計(jì)算能力使其在深度學(xué)習(xí)領(lǐng)
    的頭像 發(fā)表于 02-17 14:42 ?1102次閱讀
    智算中心的核心<b class='flag-5'>硬件</b>是什么?

    如何快速學(xué)習(xí)硬件電路

    對(duì)于想要學(xué)習(xí)硬件電路的新手來(lái)說(shuō),一開(kāi)始可能感到有些困難,但只要掌握了正確的學(xué)習(xí)方法和技巧,就能夠快速地成為一名優(yōu)秀的硬件電路工程師。 首先,新手需要了解基本的電路知識(shí),例如電阻、電容、
    的頭像 發(fā)表于 01-20 11:11 ?1138次閱讀
    如何快速<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>硬件</b>電路

    學(xué)習(xí)硬件的第一節(jié)課:學(xué)習(xí)讀懂原理圖

    學(xué)習(xí)硬件的第一節(jié)課:學(xué)習(xí)讀懂原理圖 讀懂原理圖對(duì)嵌入式軟件工程師和程序員尤為重要。在深入細(xì)節(jié)之前請(qǐng)注意,對(duì)所有的嵌入式設(shè)計(jì)人員來(lái)說(shuō)、能懂得硬件工程師創(chuàng)建和使用的來(lái)描述其
    的頭像 發(fā)表于 12-16 16:04 ?2367次閱讀
    <b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>硬件</b>的第一節(jié)課:<b class='flag-5'>學(xué)習(xí)</b>讀懂原理圖

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計(jì)的硬件加速器,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對(duì)深度學(xué)習(xí)算法優(yōu)化的處理器,它與傳統(tǒng)的CPU和G
    的頭像 發(fā)表于 11-14 15:17 ?1892次閱讀

    pcie在深度學(xué)習(xí)中的應(yīng)用

    深度學(xué)習(xí)模型通常需要大量的數(shù)據(jù)和強(qiáng)大的計(jì)算能力來(lái)訓(xùn)練。傳統(tǒng)的CPU計(jì)算資源有限,難以滿足深度學(xué)習(xí)的需求。因此,GPU(圖形處理單元)和TPU(張量處理單元)等專用
    的頭像 發(fā)表于 11-13 10:39 ?1337次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識(shí)別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識(shí)別、自動(dòng)駕駛等領(lǐng)域,GPU廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過(guò)程。 二、自然語(yǔ)言處理 自然語(yǔ)言處理(NLP)是深度
    的頭像 發(fā)表于 10-27 11:13 ?1330次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個(gè)熱門研究方向。以下是一些FPGA加速深度學(xué)習(xí)模型的案例: 一、基于FPG
    的頭像 發(fā)表于 10-25 09:22 ?1201次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    并行計(jì)算的能力,可以在硬件層面并行處理大量數(shù)據(jù)。這種并行處理能力使得 FPGA 在執(zhí)行深度學(xué)習(xí)算法時(shí)速度遠(yuǎn)超傳統(tǒng)處理器,能夠提供更低的延遲和更高的吞吐量,從而加速模型訓(xùn)練和推理過(guò)程,滿足實(shí)時(shí)性要求較高
    發(fā)表于 09-27 20:53

    如何幫助孩子高效學(xué)習(xí)Python:開(kāi)源硬件實(shí)踐是最優(yōu)選擇

    家長(zhǎng)們常常擔(dān)心孩子在學(xué)習(xí)Python時(shí)所面臨的挑戰(zhàn),如復(fù)雜性、興趣保持、學(xué)習(xí)進(jìn)度和可用資源。對(duì)于希望有效教授孩子Python的家長(zhǎng)而言,了解硬件的作用至關(guān)重要,因?yàn)榻Y(jié)合硬件項(xiàng)目的Pyt
    的頭像 發(fā)表于 09-06 09:49 ?672次閱讀