一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

加速計(jì)算25年,英偉達(dá)GPU帝國(guó)的三塊新版圖

jf_1689824270.4192 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:jf_1689824270.4192 ? 2019-12-19 13:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

加速計(jì)算領(lǐng)域25年,英偉達(dá)用15億塊GPU的出貨量交上了一份學(xué)霸成績(jī)單。

這每一塊GPU都兼容CUDA,都采用同一個(gè)架構(gòu)——這是黃仁勛的GPU帝國(guó)中最可圈可點(diǎn)的一筆。統(tǒng)一的架構(gòu),可以用于各種工作負(fù)載去實(shí)現(xiàn)加速計(jì)算;在芯片起點(diǎn)之上,通過(guò)完整的堆棧工程可進(jìn)一步實(shí)現(xiàn)加速。

CUDA平臺(tái)具有豐富的庫(kù)、工具和應(yīng)用程序,僅去年就發(fā)布了500多個(gè)SDK和庫(kù),其中既有全新內(nèi)容,也有更新版本。通過(guò)不斷優(yōu)化,深度學(xué)習(xí)訓(xùn)練在3年內(nèi)提升了4倍、深度學(xué)習(xí)推理在1年內(nèi)提高了2倍。

過(guò)去幾年內(nèi),AI取得了巨大的進(jìn)展,開(kāi)始逐步改變各個(gè)行業(yè)。從圖象識(shí)別、圖象分類(lèi)到識(shí)別不同的物體等,甚至能夠識(shí)別圖象中的每一個(gè)像素。這背后,深度學(xué)習(xí)的驅(qū)動(dòng)力量是巨大的。在今年的GTC上,黃仁勛也重點(diǎn)介紹了英偉達(dá)在推薦系統(tǒng)和會(huì)話式AI二大方向的重大進(jìn)展。

在線推薦系統(tǒng)為“雙11”提速

推薦系統(tǒng)已經(jīng)成為互聯(lián)網(wǎng)的重要引擎。我們?cè)诰€購(gòu)物時(shí)有數(shù)十億的產(chǎn)品有待選擇,上萬(wàn)億的網(wǎng)頁(yè)可供瀏覽、上百萬(wàn)的視頻以及應(yīng)用……如何將合適的內(nèi)容、產(chǎn)品在合適的時(shí)間推送給用戶?這是所有電商平臺(tái)、社交媒體等面臨的最大痛點(diǎn)。

這背后需要非常深入地理解每一個(gè)用戶的偏好、歷史行為等,以及每一個(gè)產(chǎn)品多種多樣的特性,這幾乎形成了一個(gè)TB級(jí)的數(shù)據(jù)集。

而一個(gè)最為生動(dòng)的案例就是阿里巴巴的年度購(gòu)物節(jié)“雙11”。今年“雙11”,阿里巴巴創(chuàng)造了380億美元的銷(xiāo)售額,相比于去年的310億美元,增長(zhǎng)了近四分之一,是“黑色星期五”和“網(wǎng)購(gòu)星期一”的網(wǎng)購(gòu)銷(xiāo)售額總和的兩倍多。

對(duì)于阿里巴巴來(lái)說(shuō),推薦系統(tǒng)是一個(gè)至關(guān)重要的應(yīng)用程序。該系統(tǒng)可以向用戶展示與其喜好相匹配的商品,從而提高點(diǎn)擊率。而點(diǎn)擊率在電商行業(yè)一直都是提高銷(xiāo)售量的重要驅(qū)動(dòng)力。點(diǎn)擊率的每一次小幅提高都會(huì)直接影響用戶的體驗(yàn)和商家的營(yíng)收。

阿里巴巴使用NVIDIA GPU支持資源分配、模型量化和圖變換三項(xiàng)優(yōu)化策略,從而提高吞吐量和響應(yīng)性。通過(guò)NVIDIA T4 GPU,能夠?yàn)橥扑]模型提供加速,實(shí)現(xiàn)每秒處理780個(gè)查詢(xún),遠(yuǎn)遠(yuǎn)領(lǐng)先于基于CPU每秒3個(gè)查詢(xún)的推理。

英偉達(dá)加速計(jì)算產(chǎn)品管理總監(jiān)Paresh Kharya表示,推薦系統(tǒng)所面臨的挑戰(zhàn)是巨大的,主要體現(xiàn)在兩方面:第一,這些模型極其復(fù)雜,因?yàn)樾枰幚淼臄?shù)據(jù)量是海量的。為了提升推薦的相關(guān)度,必須要對(duì)所有參數(shù)來(lái)進(jìn)行建模。比如:用戶的一些購(gòu)買(mǎi)記錄、瀏覽記錄等,要處理的參數(shù)非常多。第二,這些模型要做出實(shí)時(shí)的計(jì)算,因?yàn)橛脩粼跒g覽時(shí)需要立刻看到推薦結(jié)果,不可能等待很長(zhǎng)時(shí)間。

這兩大挑戰(zhàn)都需要以非??斓乃俣韧瓿捎?jì)算,阿里巴巴從CPU轉(zhuǎn)移到GPU的使用后,點(diǎn)擊通過(guò)率提升了10%。而事實(shí)上,這樣的“點(diǎn)擊率”每提升一點(diǎn)點(diǎn)都是非常困難的,GPU由于其實(shí)時(shí)性、大規(guī)模運(yùn)行的特性能夠用于這一系統(tǒng)中。

而不僅僅是電子商務(wù)領(lǐng)域,只要是需要將產(chǎn)品與人之間進(jìn)行匹配都需要用到這樣的推薦系統(tǒng)。百度、快手、美團(tuán)、微軟必應(yīng),甚至一些傳統(tǒng)企業(yè)如:沃爾瑪、美國(guó)郵政等等,都在其推薦系統(tǒng)中采用了英偉達(dá)的GPU平臺(tái)。

值得一提的是,其他的處理器FPGA目前也在發(fā)力推薦系統(tǒng)這一領(lǐng)域。Paresh Kharya表示,AI的更新迭代非常快,模型的規(guī)模非常大,每隔幾分鐘就在進(jìn)行更新,整個(gè)推理過(guò)程不斷在變化,因此需要不斷對(duì)這些模型進(jìn)行訓(xùn)練,才可以進(jìn)行有效的推薦,這需要大量的算力。GPU可以說(shuō)是AI領(lǐng)域的專(zhuān)用芯片,有指令集優(yōu)勢(shì)、全可編程、并且是軟件定義的。此外,架構(gòu)也是向前兼容的,整個(gè)硬件架構(gòu)可以隨著軟件不斷更新,而且是在軟件庫(kù)就可以直接更新。

不光是GPU能提供的算力,英偉達(dá)也在通過(guò)工具和軟件來(lái)提供支持。比如通過(guò)最新的TensorRT來(lái)支持模型在各種情景下的部署,并且支持上百萬(wàn)用戶在每秒內(nèi)做數(shù)十億的搜索。

會(huì)話式AI通往真正的人工智能人機(jī)交互

在會(huì)話式AI方面,黃仁勛宣布了最新版本的推理軟件NVIDIA Tensor RT7,它能夠?qū)崿F(xiàn)更智能的AI人機(jī)交互,可實(shí)現(xiàn)與語(yǔ)音代理、聊天機(jī)器人和推薦引擎等應(yīng)用進(jìn)行實(shí)時(shí)互動(dòng)。

實(shí)現(xiàn)會(huì)話式AI的難點(diǎn)主要在于什么?Paresh Kharya表示,要實(shí)現(xiàn)會(huì)話式AI,首先,需要理解用戶到底在說(shuō)什么,然后將他所說(shuō)的語(yǔ)音轉(zhuǎn)化成文字,然后理解文字的意思,再把它轉(zhuǎn)化成語(yǔ)言,所以涉及很多模型同時(shí)發(fā)揮作用,需要多種多樣的神經(jīng)網(wǎng)絡(luò)提供支持。第二,所有這個(gè)復(fù)雜計(jì)算的過(guò)程必須要在300毫秒之內(nèi)完成,假設(shè)如果需要幾秒鐘的話,這在實(shí)際的對(duì)話中是無(wú)法容忍的時(shí)延,會(huì)話式AI也就失去了意義。

TensorRT 7內(nèi)置新型深度學(xué)習(xí)編譯器。該編譯器能夠自動(dòng)優(yōu)化和加速遞歸神經(jīng)網(wǎng)絡(luò)與基于轉(zhuǎn)換器的神經(jīng)網(wǎng)絡(luò)。與在CPU上運(yùn)行時(shí)相比,會(huì)話式AI組件速度提高了10倍以上,從而得以實(shí)現(xiàn)所需的300毫秒閾值以下。

對(duì)于在會(huì)話式AI領(lǐng)域的投入,黃仁勛表示:“我們已進(jìn)入了一個(gè)機(jī)器可以實(shí)時(shí)理解人類(lèi)語(yǔ)言的AI新時(shí)代。TensorRT 7使這成為可能,為世界各地的開(kāi)發(fā)者提供工具,使他們能夠構(gòu)建和部署更快、更智能的會(huì)話式AI服務(wù),實(shí)現(xiàn)更自然的AI人機(jī)交互。”

TensorRT是英偉達(dá)的推理優(yōu)化軟件。英偉達(dá)的GPU不論是用在自動(dòng)駕駛、數(shù)據(jù)中心,還是嵌入式設(shè)備等領(lǐng)域,都需要運(yùn)行在PyTorch、TensorFlow等多個(gè)框架中訓(xùn)練自我優(yōu)化的AI模型,TensorRT能夠提供這種優(yōu)化的模型。

由于AI有多種多樣的使用場(chǎng)景,不同場(chǎng)景由不同的神經(jīng)網(wǎng)絡(luò)提供支持。而為了優(yōu)化AI性能,也需要優(yōu)化各種各樣的神經(jīng)網(wǎng)絡(luò)。TensorRT 7的推出算是跨出了巨大的一步,Transformer和RNN這些模型,都可以用TensorRT 7來(lái)進(jìn)行優(yōu)化。其中,Transformer典型的模型是BERT,有很多非常先進(jìn)的自然語(yǔ)言理解的功能;RNN的典型例子就是語(yǔ)音識(shí)別或者將文本轉(zhuǎn)化成語(yǔ)音。

英偉達(dá)對(duì)TensorRT 7也進(jìn)行了大量的優(yōu)化,例如很多數(shù)學(xué)的運(yùn)算,確保能夠更加高效、并且減少使用的內(nèi)存。另外,TensorRT 7中引入了內(nèi)核生成的功能,用任何RNN都可以生成一個(gè)優(yōu)化的內(nèi)核。對(duì)比TensorRT 5僅能支持種類(lèi)很少的幾個(gè)神經(jīng)網(wǎng)絡(luò),TensorRT 7基本上可以支持各大類(lèi)神經(jīng)網(wǎng)絡(luò),這些模型對(duì)于“會(huì)話式AI”是至關(guān)重要的。

首次兼容arm架構(gòu)做加速計(jì)算

在GTC上,英偉達(dá)還釋放出了一個(gè)很值得玩味的信息:宣布推出基于arm的首個(gè)參考架構(gòu)——NVIDIA HPC for arm.雙方這一合作,究竟是英偉達(dá)加入arm的生態(tài),還是arm擁抱英偉達(dá)的江湖?

英偉達(dá)方面只是淡淡一句:希望不論是數(shù)據(jù)中心還是邊緣計(jì)算,不論是AI還是高性能計(jì)算,都能給客戶更多選擇。之前arm不支持CUDA,客戶已反復(fù)要求我們使用CUDA加速arm,并將arm服務(wù)器打造成HPC和AI的理想選擇。

全球有1500億臺(tái)基于arm架構(gòu)的設(shè)備,為客戶想實(shí)現(xiàn)的創(chuàng)新提供多種功能:包括互聯(lián)、內(nèi)存、CPU內(nèi)核、計(jì)算能力等多元化的支持。

在邊緣計(jì)算領(lǐng)域,英偉達(dá)已有arm架構(gòu)許可;超算領(lǐng)域,雙方于今年6月宣布了合作。兩個(gè)強(qiáng)大平臺(tái)和生態(tài)的握手,也并不意外。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106438
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4949

    瀏覽量

    131271
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93811
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率

    解決方案在英偉達(dá) GPU英偉達(dá) CUDA-X庫(kù)上所實(shí)現(xiàn)的加速 基于
    發(fā)表于 03-19 17:59 ?282次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過(guò)加速對(duì)話框啟用,打開(kāi)求解器對(duì)話框,點(diǎn)擊“
    發(fā)表于 12-16 14:25

    英偉達(dá)加速認(rèn)證星新型AI存儲(chǔ)芯片

    近日,英偉達(dá)首席執(zhí)行官黃仁勛近日在接受采訪時(shí)透露,英偉達(dá)正在全力加速對(duì)星最新推出的AI存儲(chǔ)芯片
    的頭像 發(fā)表于 11-26 10:22 ?607次閱讀

    英偉達(dá)加速認(rèn)證星AI內(nèi)存芯片

    近日,英偉達(dá)公司正在積極推進(jìn)對(duì)星AI內(nèi)存芯片的認(rèn)證工作。據(jù)英偉達(dá)CEO透露,他們正在不遺余力地加速
    的頭像 發(fā)表于 11-25 14:34 ?596次閱讀

    英偉達(dá)與谷歌聯(lián)手加速量子計(jì)算設(shè)備設(shè)計(jì)

    近日,據(jù)外媒最新報(bào)道,英偉達(dá)與谷歌兩大科技巨頭宣布攜手合作,共同加速下一代量子計(jì)算設(shè)備的設(shè)計(jì)進(jìn)程。 雙方在一份聯(lián)合聲明中透露,谷歌的量子人工智能部門(mén)將充分利用
    的頭像 發(fā)表于 11-21 11:08 ?761次閱讀

    英偉達(dá)與谷歌攜手加速量子計(jì)算設(shè)備設(shè)計(jì)

    英偉達(dá)近日宣布,將與谷歌量子AI團(tuán)隊(duì)展開(kāi)合作,共同推進(jìn)量子計(jì)算軟硬件工具的研發(fā)。雙方將利用英偉達(dá)CUDA-Q平臺(tái)提供的模擬支持,加快設(shè)計(jì)谷歌
    的頭像 發(fā)表于 11-19 16:21 ?546次閱讀

    軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU

    軟銀公司宣布,其正在擴(kuò)展的日本頂級(jí)人工智能計(jì)算平臺(tái)已安裝了約4000顆英偉達(dá)Hopper GPU。這一舉措顯著提升了平臺(tái)的計(jì)算能力。據(jù)悉,該
    的頭像 發(fā)表于 11-04 16:18 ?880次閱讀

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來(lái)加速科學(xué)
    的頭像 發(fā)表于 10-25 09:23 ?602次閱讀

    英偉達(dá)Blackwell GPU未來(lái)一訂單爆滿

    據(jù)摩根士丹利(大摩)透露,人工智能(AI)芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)(NVIDIA)的管理層在近期的一系列與投資人的會(huì)議中,分享了關(guān)于其下一代繪圖處理器(GPU)Blackwell的強(qiáng)勁市場(chǎng)需求情況。
    的頭像 發(fā)表于 10-17 16:52 ?896次閱讀

    英偉達(dá)股價(jià)一個(gè)月內(nèi)上漲25%

    統(tǒng)計(jì)數(shù)據(jù)顯示,在過(guò)去一個(gè)月中,英偉達(dá)公司的股價(jià)上漲了 25%,股價(jià)目前已經(jīng)接近了歷史高位,英偉達(dá)公司的市值已超越微軟公司,成為市值第二高的公
    的頭像 發(fā)表于 10-11 15:23 ?851次閱讀

    Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉達(dá)GPU

    近日,人工智能技術(shù)公司Inflection AI宣布了一項(xiàng)重要決策,其最新的企業(yè)平臺(tái)將放棄采用英偉達(dá)(Nvidia)的GPU,轉(zhuǎn)而選擇英特爾的Gaudi 3加速器。
    的頭像 發(fā)表于 10-10 17:21 ?778次閱讀

    英偉達(dá)Blackwell GPU量產(chǎn)加速,Q4營(yíng)收沖刺百億美元大關(guān)

    近日,全球領(lǐng)先的圖形處理單元(GPU)及人工智能芯片制造商英偉達(dá)傳來(lái)重大利好消息。據(jù)摩根士丹利最新發(fā)布的行業(yè)分析報(bào)告指出,英偉達(dá)基于Blac
    的頭像 發(fā)表于 09-26 15:58 ?649次閱讀

    星電子HBM3E內(nèi)存獲英偉達(dá)認(rèn)證,加速AI GPU市場(chǎng)布局

    近日,知名市場(chǎng)研究機(jī)構(gòu)TrendForce在最新發(fā)布的報(bào)告中宣布了一項(xiàng)重要進(jìn)展:星電子的HBM3E內(nèi)存產(chǎn)品已成功通過(guò)英偉達(dá)驗(yàn)證,并正式開(kāi)啟出貨流程。具體而言,星的HBM3E 8Hi
    的頭像 發(fā)表于 09-05 17:15 ?1043次閱讀

    英偉達(dá)發(fā)布新版NVIDIAApp

    英偉達(dá)推出了 NVIDIA App 測(cè)試版?10.0.2 版本,?NVIDIA App新版本新增功能包括顯示設(shè)置、RTX 視頻增強(qiáng)控制、應(yīng)用排序,以及面向其他國(guó)家 / 地區(qū)用戶的應(yīng)用翻譯功能等。
    的頭像 發(fā)表于 08-07 16:16 ?1149次閱讀