一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)發(fā)布新一代H200,搭載HBM3e,推理速度是H100兩倍!

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-11-15 01:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,英偉達(dá)正式宣布,在目前最強(qiáng)AI芯片H100的基礎(chǔ)上進(jìn)行一次大升級(jí),發(fā)布新一代H200芯片。H200擁有141GB的內(nèi)存、4.8TB/秒的帶寬,并將與H100相互兼容,在推理速度上幾乎達(dá)到H100的兩倍。H200預(yù)計(jì)將于明年二季度開(kāi)始交付。此外,英偉達(dá)還透露,下一代Blackwell B100 GPU也將在2024年推出。

wKgZomVTSeqAc4mwAABD6e_8I4c101.jpg
英偉達(dá)新發(fā)布的H200性能大幅提升(來(lái)源:英偉達(dá)官網(wǎng))


首款搭載HBM3e的GPU,推理速度幾乎是H100的兩倍

與A100和H100相比,H200最大的變化就是內(nèi)存。搭載世界上最快的內(nèi)存HBM3e技術(shù)的H200在性能上得到了直接提升,141GB的內(nèi)存幾乎是A100和H100最高80GB內(nèi)存的2倍,4.8TB每秒的帶寬達(dá)到A100的2.4倍,顯著高于H100 3.35TB每秒的帶寬。

今年早些時(shí)候,就有消息稱,包括英偉達(dá)在內(nèi),全球多個(gè)科技巨頭都在競(jìng)購(gòu)SK海力士第五代高帶寬內(nèi)存HBM3e。 HBM是由AMD和SK海力士發(fā)起的基于3D堆棧工藝的高性能DRAM,適用于高存儲(chǔ)器帶寬需求的應(yīng)用場(chǎng)合。如今HBM已經(jīng)發(fā)展出HBM2、HBM2e以及HBM3,HBM3e是HBM3的新一代產(chǎn)品。英偉達(dá)、AMD等企業(yè)的高端AI芯片大多搭載HBM。

電子發(fā)燒友此前報(bào)道過(guò),英偉達(dá)歷代主流訓(xùn)練芯片基本都配置HBM,其2016年發(fā)布的首個(gè)采用帕斯卡架構(gòu)的顯卡TeslaP100已搭載了HBM2,隨后TeslaV100也采用了HBM2;2017年初,英偉達(dá)發(fā)布的Quadro系列專業(yè)卡中的旗艦GP100也采用了HBM2;2021年推出的TeslaA100計(jì)算卡也搭載了HBM2E,2022年推出了面向大陸地區(qū)的A800,同樣也配置HBM2E;2022年推出了市面上最強(qiáng)的面向AI服務(wù)器的GPU卡H100,采用的HBM3。

AMD今年6月推出的號(hào)稱是最強(qiáng)的AI芯片MI300X,就是搭載由SK海力士及三星電子供應(yīng)的HBM。AMD稱,MI300X提供的HBM密度最高是英偉達(dá)AI芯片H100的2.4倍,其HBM帶寬最高是H100的1.6倍。這意味著,AMD的芯片可以運(yùn)行比英偉達(dá)芯片更大的模型。

如今英偉達(dá)新發(fā)布的H200搭載HBM3e,可想而知在性能上將會(huì)更上一層。H200配備141GB的HBM3e內(nèi)存,運(yùn)行速率約為6.25 Gbps,六個(gè)HBM3e堆棧為每個(gè)GPU帶來(lái)4.8 TB/s的總帶寬。原有的H100配備80GB的HBM3,對(duì)應(yīng)的總帶寬為3.35 TB/s,這是一個(gè)巨大的進(jìn)步。相比于H100的SXM版本,H200的SXM版本將內(nèi)存容量和總帶寬分別提高了76%和43%。

英偉達(dá)表示,基于與H100相同的Hopper架構(gòu),H200將具有H100的一切功能,例如可以用來(lái)加速基于Transformer架構(gòu)搭建的深度學(xué)習(xí)模型的Transformer Engine功能。

根據(jù)其官網(wǎng)信息,H200在大模型Llama 2、GPT-3.5的輸出速度上分別是H100的1.9倍和1.6倍,在高性能計(jì)算HPC方面的速度更是達(dá)到了雙核x86 CPU的110倍。

TF32 Tensor Core(張量核心)中,H200可達(dá)到989萬(wàn)億次浮點(diǎn)運(yùn)算;INT8張量核心下提供3,958 TFLOPS(每秒3958萬(wàn)億次的浮點(diǎn)運(yùn)算)。

不僅如此,基于H200芯片構(gòu)建的HGX H200加速服務(wù)器平臺(tái),擁有 NVLink 和 NVSwitch的高速互連支持。8個(gè)HGX H200則提供超過(guò)32 petaflops(每秒1000萬(wàn)億次的浮點(diǎn)運(yùn)算)的FP8深度學(xué)習(xí)計(jì)算和 1.1TB 聚合高帶寬內(nèi)存,可為科學(xué)研究和 AI 等應(yīng)用的工作負(fù)載提供更高的性能支持,包括超1750億參數(shù)的大模型訓(xùn)練和推理。

英偉達(dá)副總裁Ian Buck表示,為了訓(xùn)練生成式AI和高性能計(jì)算應(yīng)用,必須使用高性能GPU。有了H200,行業(yè)領(lǐng)先的AI超級(jí)計(jì)算平臺(tái)可以更快地解決一些世界上最重要的挑戰(zhàn)。

目前,英偉達(dá)的全球合作伙伴服務(wù)器制造商生態(tài)系統(tǒng)包括華擎 Rack、華碩、戴爾科技、Eviden、技嘉、慧與、英格拉科技、聯(lián)想、QCT、Supermicro、緯創(chuàng)資通和緯穎科技等,可以直接使用H200更新其現(xiàn)有系統(tǒng)。除了英偉達(dá)自己投資的CoreWeave、Lambda和 Vultr之外,亞馬遜網(wǎng)絡(luò)服務(wù)、谷歌云、微軟Azure 和甲骨文云等云服務(wù)提供商將從明年開(kāi)始首批部署H200。

如果沒(méi)有獲得出口許可,新H200不會(huì)銷往中國(guó)

這款H200能否對(duì)華出口也是大家關(guān)心的問(wèn)題。對(duì)此,英偉達(dá)表示,如果沒(méi)有出口許可,新的H200將不會(huì)銷往中國(guó)。去年9月,英偉達(dá)高端GPU對(duì)中國(guó)出口就受到限制,當(dāng)時(shí)英偉達(dá)表示,美國(guó)通過(guò)公司向中國(guó)出口A100和H100芯片將需要新的許可證要求,同時(shí)DGX或任何其他包含A100或H100芯片的產(chǎn)品,以及未來(lái)性能高于A100的芯片都將受到新規(guī)管制。

根據(jù)美國(guó)商務(wù)部的法規(guī),其主要限制的是算力和帶寬,算力上線是4800 TOPS,帶寬上線是600 GB/s。為了應(yīng)對(duì)這個(gè)問(wèn)題,英偉達(dá)后來(lái)向中國(guó)企業(yè)提供了替代版本A800和H800。A800的帶寬為400GB/s,低于A100的600GB/s,H800據(jù)透露約為H100的一半。這意味著A800、H800在進(jìn)行AI模型訓(xùn)練的時(shí)候,需要耗費(fèi)更長(zhǎng)的時(shí)間。

然而美國(guó)政府認(rèn)為,H800在某些情況下算力仍然不亞于H100。為了進(jìn)一步加強(qiáng)對(duì)AI芯片的出口管制,美國(guó)計(jì)劃用多項(xiàng)新的標(biāo)準(zhǔn)來(lái)替換掉之前針對(duì)“帶寬參數(shù)”。今年10月,美國(guó)商務(wù)部工業(yè)與安全局(BIS)發(fā)布更新針對(duì)AI芯片的出口管制規(guī)定,根據(jù)新規(guī)定,美國(guó)商務(wù)部計(jì)劃引入一項(xiàng)被稱為“性能密度”的參數(shù),來(lái)防止企業(yè)尋找到變通的方案,修訂后的出口管制措施將禁止美國(guó)企業(yè)向中國(guó)出售運(yùn)行速度達(dá)到300teraflops(即每秒可計(jì)算 3億次運(yùn)算)及以上的數(shù)據(jù)中心芯片。根據(jù)這樣的規(guī)定,在沒(méi)有獲得許可的情況下,英偉達(dá)新發(fā)布的H200必然是沒(méi)有辦法向中國(guó)企業(yè)出售。


事實(shí)上,在美國(guó)政府今年10月發(fā)布的新規(guī)下,英偉達(dá)不少產(chǎn)品都在限制范圍內(nèi),包括但并不限于A100、A800、H100、H800、L40、L40 以及RTX 4090。任何集成了一個(gè)或多個(gè)以上芯片的系統(tǒng),包括但不限于英偉達(dá)DGX、HGX系統(tǒng),也在新規(guī)涵蓋范圍之內(nèi)。

針對(duì)此情況,有消息稱,本月初英偉達(dá)已經(jīng)向經(jīng)銷商公布“中國(guó)特供版”HGX H20、L20 PCle、L2 PCle產(chǎn)品信息,分別針對(duì)訓(xùn)練、推理和邊緣場(chǎng)景,最快將于11月16日公布,量產(chǎn)時(shí)間為2023年12月至2024年1月。其中,HGX H20在帶寬、計(jì)算速度等方面均有所限制,理論綜合算力要比英偉達(dá)H100降80%左右。

此外,據(jù)英特爾供應(yīng)鏈透露,英特爾也已經(jīng)針對(duì)最新發(fā)布的Gaudi2推出降規(guī)版出貨,預(yù)計(jì)將不受新禁令影響。不過(guò)無(wú)論是英偉達(dá),還是英特爾針對(duì)中國(guó)市場(chǎng)推出的特供版,可想而知性能必然是會(huì)大打折扣的,而且從美國(guó)政府的舉措來(lái)看,特供版是否能夠長(zhǎng)久供應(yīng)也是未知數(shù)。

總結(jié)

可以看到,英偉達(dá)此次發(fā)布的H100,是全球首款搭載HBM3e的GPU,擁有141GB的內(nèi)存、4.8TB/秒的帶寬,推理速度幾乎達(dá)到H100的兩倍??上攵?,有了H200,當(dāng)前備受關(guān)注的AI大模型的訓(xùn)練和部署應(yīng)用將會(huì)得到更快速地發(fā)展。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93807
  • HBM3
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    329
  • HBM3E
    +關(guān)注

    關(guān)注

    0

    文章

    80

    瀏覽量

    470
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    風(fēng)景獨(dú)好?12層HBM3E量產(chǎn),16層HBM3E在研,產(chǎn)業(yè)鏈涌動(dòng)

    海力士宣布公司已開(kāi)始量產(chǎn)12H HBM3E芯片,實(shí)現(xiàn)了現(xiàn)有HBM產(chǎn)品中最大的36GB容量。該產(chǎn)品堆疊12顆3GB DRAM芯片,實(shí)現(xiàn)與現(xiàn)有的8層產(chǎn)品相同的厚度,同時(shí)容量提升50%。運(yùn)行
    的頭像 發(fā)表于 10-06 01:03 ?4589次閱讀
    風(fēng)景獨(dú)好?12層<b class='flag-5'>HBM3E</b>量產(chǎn),16層<b class='flag-5'>HBM3E</b>在研,產(chǎn)業(yè)鏈涌動(dòng)

    HBM3E量產(chǎn)后,第六HBM4要來(lái)了!

    有消息說(shuō)提前到2025年。其他家三星電子和美光科技的HBM4的量產(chǎn)時(shí)間在2026年。英偉達(dá)、AMD等處理器大廠都規(guī)劃了HBM4與自家GPU
    的頭像 發(fā)表于 07-28 00:58 ?5833次閱讀
    <b class='flag-5'>HBM3E</b>量產(chǎn)后,第六<b class='flag-5'>代</b><b class='flag-5'>HBM</b>4要來(lái)了!

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見(jiàn)故障有哪些?

    ABSTRACT摘要本文主要介紹英偉達(dá)H100常見(jiàn)的故障類型和問(wèn)題。JAEALOT2025年5月5日今年,國(guó)家政府報(bào)告提出要持續(xù)推進(jìn)“人工智能+”行動(dòng),大力發(fā)展人工智能行業(yè),市場(chǎng)上對(duì)算力的需求持續(xù)
    的頭像 發(fā)表于 05-05 09:03 ?995次閱讀
    GPU 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> GPU <b class='flag-5'>H100</b> 常見(jiàn)故障有哪些?

    三星與英偉達(dá)高層會(huì)晤,商討HBM3E供應(yīng)

    其高帶寬存儲(chǔ)器HBM3E產(chǎn)品中的初始缺陷問(wèn)題,并就三星第五HBM3E產(chǎn)品向英偉達(dá)供應(yīng)的相關(guān)事宜進(jìn)行了深入討論。 此次高層會(huì)晤引發(fā)了外界的廣
    的頭像 發(fā)表于 02-18 11:00 ?569次閱讀

    英偉達(dá)A100H100比較

    英偉達(dá)A100H100都是針對(duì)高性能計(jì)算和人工智能任務(wù)設(shè)計(jì)的GPU,但在性能和特性上存在顯著差異。以下是對(duì)這款GPU的比較: 1. 架構(gòu)
    的頭像 發(fā)表于 02-10 17:05 ?4478次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比較

    英偉達(dá)加速認(rèn)證三星AI內(nèi)存芯片

    芯片。作為當(dāng)前市場(chǎng)上最先進(jìn)的內(nèi)存技術(shù)之,HBM3E(High Bandwidth Memory 3 Enhanced)以其超高的帶寬和低功耗特性而備受矚目。英偉
    的頭像 發(fā)表于 11-25 14:34 ?596次閱讀

    英偉達(dá)H100芯片市場(chǎng)降溫

    隨著英偉達(dá)新一代AI芯片GB200需求的不斷攀升,其上一代明星產(chǎn)品H100芯片卻遭遇了市場(chǎng)的冷落
    的頭像 發(fā)表于 10-28 15:42 ?1670次閱讀

    三星電子HBM3E商業(yè)化遇阻,或重新設(shè)計(jì)1a DRAM電路

    近日,業(yè)界傳出三星電子HBM3E商業(yè)化進(jìn)程遲緩的消息,據(jù)稱這狀況或與HBM核心芯片DRAM有關(guān)。具體而言,1a DRAM的性能問(wèn)題成為了三星電子向英偉
    的頭像 發(fā)表于 10-23 17:15 ?929次閱讀

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢(shì)挑戰(zhàn)市場(chǎng)

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號(hào)H1
    的頭像 發(fā)表于 09-26 16:16 ?1197次閱讀

    亞馬遜云科技宣布Amazon EC2 P5e實(shí)例正式可用 由英偉達(dá)H200 GPU提供支持

    現(xiàn)已正式可用。亞馬遜云科技是首個(gè)將英偉達(dá)H200 GPU用于生產(chǎn)環(huán)境的領(lǐng)先云提供商。與基于英偉達(dá)H100
    的頭像 發(fā)表于 09-19 16:16 ?893次閱讀

    三星電子HBM3E內(nèi)存獲英偉達(dá)認(rèn)證,加速AI GPU市場(chǎng)布局

    近日,知名市場(chǎng)研究機(jī)構(gòu)TrendForce在最新發(fā)布的報(bào)告中宣布了項(xiàng)重要進(jìn)展:三星電子的HBM3E內(nèi)存產(chǎn)品已成功通過(guò)英偉達(dá)驗(yàn)證,并正式開(kāi)啟
    的頭像 發(fā)表于 09-05 17:15 ?1043次閱讀

    TrendForce:三星HBM3E內(nèi)存通過(guò)英偉達(dá)驗(yàn)證,8Hi版本正式出貨

    9月4日最新資訊,據(jù)TrendForce集邦咨詢的最新報(bào)告透露,三星電子已成功完成其HBM3E內(nèi)存產(chǎn)品的驗(yàn)證流程,并正式啟動(dòng)了HBM3E 8Hi(即24GB容量版本)的出貨,該產(chǎn)品主要面向英偉
    的頭像 發(fā)表于 09-04 15:57 ?1196次閱讀

    三星HBM3E內(nèi)存挑戰(zhàn)英偉達(dá)訂單,SK海力士霸主地位受撼動(dòng)

    進(jìn)入八月,市場(chǎng)傳言四起,韓國(guó)存儲(chǔ)芯片巨頭三星電子(簡(jiǎn)稱“三星”)的8層HBM3E內(nèi)存(新一代高帶寬內(nèi)存產(chǎn)品)已順利通過(guò)英偉達(dá)嚴(yán)格測(cè)試。然而,三星迅速澄清,表示這
    的頭像 發(fā)表于 08-23 15:02 ?1090次閱讀

    英偉達(dá)或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達(dá)在美國(guó)加利福尼亞州圣何塞會(huì)議中心召開(kāi)的GTC 2024大會(huì)上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B20
    的頭像 發(fā)表于 08-08 17:19 ?1021次閱讀

    三星否認(rèn)HBM3E芯片通過(guò)英偉達(dá)測(cè)試

    近日,有關(guān)三星的8層HBM3E芯片已通過(guò)英偉達(dá)測(cè)試的報(bào)道引起了廣泛關(guān)注。然而,三星電子迅速對(duì)此傳聞進(jìn)行了回應(yīng),明確表示該報(bào)道并不屬實(shí)。
    的頭像 發(fā)表于 08-08 10:06 ?881次閱讀