日前,英偉達(dá)GTC 2018(GPU Technology Conference 2018,以下簡稱GTC)在美國圣何塞舉行。英偉達(dá)再一次在提升計算力的路上越走越遠(yuǎn)。GPU產(chǎn)品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都進(jìn)行了更新。
新產(chǎn)品—全世界最大的GPU只要399
全新Tesla V100顯存將從原來的16GB提升至32GB。2017年5月11日,英偉達(dá)正式發(fā)布了全新Volta架構(gòu)GPU——NVIDIA Tesla V100,它擁有超過210億個晶體管,是上代TeslaP100的1.37倍。它的單精度浮點性能高達(dá)15 TFLOPS,雙精度浮點7.5 TFLOPS。
基于此前的NVIDIA NVLink架構(gòu),英偉達(dá)還推出了全新的NVSwitch架構(gòu)。這一互聯(lián)架構(gòu)的帶寬比PCle交換機(jī)高5倍,足以支持更大規(guī)模和復(fù)雜的數(shù)據(jù)集運算,讓開發(fā)者和科學(xué)家可以構(gòu)建更高級的系統(tǒng)。
基于Tesla V100的升級和全新的NVSwitch架構(gòu),英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。
在2016年的GTC上英偉達(dá)正式發(fā)布DGX 1,它擁有8顆帕斯卡架構(gòu)GP100核心的Tesla P100 GPU,以及7TB的SSD,由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內(nèi)存驅(qū)動。售價為129000美元。2017年9月份,英偉達(dá)推出了一款基于Volta架構(gòu)的DGX 1V,擁有8塊Tesla V100。
而DGX 2應(yīng)用了最新的NVSwitch架構(gòu),通過12個NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間,總計512 GB HBM2存儲,能實現(xiàn)每秒高達(dá)2千萬次的浮點運算。此外,基于NVSwitch架構(gòu)的應(yīng)用,16塊GPU可以實現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。
DGX 2內(nèi)含16顆Tesla V100芯片
“這是全球最大的GPU?!?a href="http://www.www27dydycom.cn/tags/黃仁勛/" target="_blank">黃仁勛表示,他還用“美麗、性感”等詞語來形容這一款最新的DGX系列產(chǎn)品。
DGX 2的售價,黃仁勛首先給出的是150萬美元,最后直接減價為39.9萬美元,將在今年的第三季度正式開放購買。
面向藝術(shù)及設(shè)計領(lǐng)域,英偉達(dá)還推出了搭載了NVIDIA RTX(實時光線追蹤)技術(shù)的NVIDIA Quadro GV100 GPU。單塊GPU擁有32GB內(nèi)存,可以基于NVLink技術(shù)將兩塊GV100 GPU并聯(lián),從而將內(nèi)存提升至64GB。在前一周的游戲開發(fā)者大會上,英偉達(dá)正式推出了NVIDIA RTX技術(shù)。
GV100 GPU基于最新的Volta架構(gòu),可以提供每秒7.4萬億次浮點運算的雙精度性能,每秒14.8萬億次浮點運算的單精度性能,以及每秒118.5萬億次浮點運算的深度學(xué)習(xí)性能。
黃仁勛手中的GV100 GPU
這款產(chǎn)品主要針對傳媒娛樂從業(yè)者、產(chǎn)品設(shè)計師、建筑設(shè)計師等專業(yè)設(shè)計與流媒體專業(yè)人員。其中,NVIDIA RTX內(nèi)置的NVIDIA OpitX AI-denoiser可以實現(xiàn)實時的AI降噪去噪。
硬件之外,英偉達(dá)還發(fā)布了針對軟件的更新——TensorRT 4軟件。這一軟件可用于優(yōu)化、驗證和部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車GPU平臺中經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
為了籠絡(luò)更多的開發(fā)者,英偉達(dá)與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中。
自動駕駛—暫停自動駕駛研發(fā)
自動駕駛?cè)栽诒敬蜧TC的討論之列
英偉達(dá)的自動駕駛平臺可以統(tǒng)稱為Drive PX系列。但是其實,Drive PX只是NVIDIA車載AI平臺的系列名稱。而這個系列目前主要包括兩代產(chǎn)品:已經(jīng)量產(chǎn)的Drive PX 2平臺,以及在2018年初展示的新一代平臺Xavier。
不過黃仁勛卻在GTC 2018上宣布英偉達(dá)將暫停自動駕駛的研發(fā)工作,雖然沒有說明何時能再推進(jìn)這一進(jìn)程,但是他也表示“不會太久?!?/p>
在2018年2月9日對外發(fā)布的2018財年第四季度及全年財報中,英偉達(dá)曾經(jīng)提到過與Uber、Aurora合作打造自動駕駛汽車,采用的就是開源的NVIDIA Drive人工智能自動駕駛平臺。
美國當(dāng)?shù)貢r間3月18日晚上,亞利桑那州一名女子被Uber自動駕駛汽車撞傷,之后不幸身亡。這是全球首例自動駕駛車輛致人死亡的事故,隨后Uber宣布將暫停其在美國和加拿大的自動駕駛項目。隨后在26日,亞利桑那州州長宣布暫禁Uber在亞利桑那州公路測試自駕車。
黃仁勛在回答媒體關(guān)于該案件的提問時表示,英偉達(dá)對于這個意外感到悲傷,但是自動駕駛的研究本身是沒有錯的,應(yīng)該從這個案件中吸取經(jīng)驗,提升自動駕駛的安全性。作為Uber在自動駕駛領(lǐng)域的合作方之一,英偉達(dá)暫停自動駕駛的研發(fā)可能和Uber的自動駕駛汽車撞人致死案有關(guān),但其并沒有完全放棄自動駕駛項目。
英偉達(dá)的DRIVE Constellation仿真系統(tǒng)
英偉達(dá)在GTC上推出了針對自動駕駛汽車測試的仿真系統(tǒng)——DRIVE Constellation。
DRIVE Constellation仿真系統(tǒng)是一套使用照片級真實感模擬,基于云的自動駕駛汽車測試系統(tǒng)。它基于兩個不同的服務(wù)器,第一臺服務(wù)器運行的是DRIVE Sim軟件,可以模擬自動駕駛汽車的傳感器,比如攝像頭、激光雷達(dá)和雷達(dá)等。
DRIVE Sim軟件可以通過生成照片級的數(shù)據(jù)流,從而創(chuàng)建不同的測試環(huán)境,比如晴天、暴雨、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況、急轉(zhuǎn)彎或陡坡等不同的路面狀況。并且在模擬過程中設(shè)置各種危險和突發(fā)狀況,比如行人突然穿越馬路等,以測試自動駕駛汽車的反應(yīng)能力,以確定其不會對人帶來安全威脅。
第二臺服務(wù)器搭載的是NVIDIA DRIVE Pegasus AI汽車計算平臺,運行完整的自動駕駛汽車軟件堆棧,并能夠處理傳感器搜集模擬數(shù)據(jù)。經(jīng)過處理的數(shù)據(jù)會被反饋給傳感器,一直進(jìn)行數(shù)據(jù)的循環(huán)。
從時間來看,英偉達(dá)推出的這個仿真系統(tǒng)和Uber的自動駕駛汽車撞人致死案并無太大關(guān)聯(lián),不過在長遠(yuǎn)的未來,它將能有效幫助提升自動駕駛汽車測試的安全性。
英偉達(dá)還宣布與ARM達(dá)成了合作,共同為全球數(shù)十億臺IoT設(shè)備提供深度學(xué)習(xí)的能力。雙方將開源的英偉達(dá)深度學(xué)習(xí)加速器整合到ARM的Project Trillium機(jī)器學(xué)習(xí)平臺上。
2018年2月23日,ARM推出了Project Trillium項目,這是一套包括新的高度可擴(kuò)展處理器的ARM IP組合,這些產(chǎn)品可以提供增強(qiáng)的機(jī)器學(xué)習(xí)(ML)和神經(jīng)網(wǎng)絡(luò)(NN)功能。當(dāng)前的技術(shù)產(chǎn)品主要針對移動設(shè)備市場,將讓全新的搭載機(jī)器學(xué)習(xí)功能的設(shè)備具有先進(jìn)的計算能力,包括先進(jìn)的目標(biāo)檢測功能。
在將英偉達(dá)深度學(xué)習(xí)加速器整合到Project Trillium之后,全球數(shù)十億臺的消費電子設(shè)備上的IoT芯片將具備機(jī)器學(xué)習(xí)能力。
GTC之外—計算力提升從創(chuàng)新驅(qū)動變?yōu)樾枨篁?qū)動
提到英偉達(dá)和黃仁勛,就不得不提到CPU。在2017年的GTC上,黃仁勛曾聲稱摩爾定律已經(jīng)終結(jié),設(shè)計人員無法再創(chuàng)造出可以實現(xiàn)更高指令集并行的GPU架構(gòu),晶體管數(shù)量每年增長50%,但CPU的性能每年僅增長10%。
在演講中,黃仁勛沒有放過任何一次揶揄CPU的機(jī)會。不管是更新后的Tesla V100、DGX 2,還是最新發(fā)布的GV100 GPU,黃仁勛聲稱“在提供相同的計算力下,它們都比CPU組成的集群要更節(jié)能、高效,占用更少的空間。”
“買得越多,省得越多?!币呀?jīng)成了他的口頭禪。然而回歸到英偉達(dá)本身,其本身的高速增長很大一部分是依賴于市場對圖形芯片的巨大需求。
在英偉達(dá)公布的2018財年第四季度財報中,雖然數(shù)據(jù)中心業(yè)務(wù)同比實現(xiàn)了一倍多的增長達(dá)到6.06億美元。但游戲圖形芯片業(yè)務(wù)的營收達(dá)17.4億美元,同比增長29%,占該季度總營收的一半以上。
“加密貨幣市場的強(qiáng)勁需求超出了我們的預(yù)期?!?英偉達(dá)首席財務(wù)官科萊特·克雷斯表示,“盡管加密貨幣對我們業(yè)務(wù)的總體貢獻(xiàn)仍難以量化,但我們認(rèn)為,其在營收中所比例高于上一季度?!?/p>
從產(chǎn)品本身來說, GPU目前只能是不斷疊加性能,帶來的驚喜越來越少。以DGX系列為例,內(nèi)含的GPU芯片從4顆變成了8顆,今年從8顆增長到了16顆,改變的只不過是互聯(lián)的架構(gòu)。單顆芯片的算力提升越來越難,英偉達(dá)的“橫向發(fā)展”只是另辟蹊徑。
不過,英特爾的Nervana芯片,谷歌的TPU(目前只在谷歌內(nèi)部使用)對于英偉達(dá)來說是潛在的競爭對手。有競爭在,更大的驚喜才有可能會到來。
未來智能實驗室是人工智能學(xué)家與科學(xué)院相關(guān)機(jī)構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機(jī)構(gòu)。
未來智能實驗室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,開展世界人工智能智商評測;開展互聯(lián)網(wǎng)(城市)云腦研究計劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106431 -
gpu
+關(guān)注
關(guān)注
28文章
4948瀏覽量
131259 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249598
原文標(biāo)題:Nvidia黃仁勛發(fā)布了全球最大GPU
文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
NVIDIA GPU助力科研人員探索外星世界
0xmd公司通過NVIDIA GPU打造醫(yī)療AI解決方案
NVIDIA在CES 2025展示全新產(chǎn)品
NVIDIA推出GeForce RTX 50系列臺式機(jī)和筆記本電腦GPU
NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布
借助NVIDIA GPU提升魯班系統(tǒng)CAE軟件計算效率
《CST Studio Suite 2024 GPU加速計算指南》
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機(jī)

AMD與NVIDIA GPU優(yōu)缺點

新款Nvidia Titan GPU正在開發(fā)中?或?qū)魯∥?b class='flag-5'>發(fā)布的RTX 5090

NVIDIA全面轉(zhuǎn)向開源GPU內(nèi)核模塊

評論