一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高端GPU芯片拉警報(bào),國(guó)產(chǎn)算力芯片能力如何?

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-09-03 07:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,英偉達(dá)高端GPU對(duì)中國(guó)供應(yīng)受到限制的消息,引起熱議。8月31日,英偉達(dá)發(fā)布公告稱,美國(guó)通知公司向中國(guó)出口A100和H100芯片將需要新的許可證要求,同時(shí)DGX或任何其他包含A100或H100芯片的產(chǎn)品,以及未來(lái)性能高于A100的芯片都將受到新規(guī)管制。

9月1日,英偉達(dá)方面又表示已經(jīng)獲得出口許可。盡管如此,美國(guó)這番操作必然引起國(guó)內(nèi)相關(guān)企業(yè)的警惕,接下來(lái)中國(guó)的互聯(lián)網(wǎng)、云服務(wù)廠商可能會(huì)積極自研芯片,或者更多采用國(guó)內(nèi)企業(yè)提供的算力芯片,然而目前國(guó)內(nèi)的算力芯片能力如何呢?

A100和H100出口限制,對(duì)中國(guó)有何影響

英偉達(dá)是全球GPU領(lǐng)域的絕對(duì)龍頭,A100是其2020年推出的數(shù)據(jù)中心級(jí)云端加速芯片,擁有540億晶體管,采用臺(tái)積電7nm工藝制程,支持FP16、FP32和FP64浮點(diǎn)運(yùn)算,為人工智能、數(shù)據(jù)分析和HPC數(shù)據(jù)中心等提供算力。

相比于上一代V100,A100在AI訓(xùn)練和推理、HPC上性能都有很大的改進(jìn)。據(jù)英偉達(dá)在今年8月透露,特斯拉采用了7000塊A100芯片升級(jí)了其用來(lái)訓(xùn)練自動(dòng)駕駛系統(tǒng)的超算中心。

poYBAGMSCayAc3f3AAF7v2n0KIY487.png?

H100是英偉達(dá)今年3月發(fā)布的最新一代數(shù)據(jù)中心GPU,集成800億晶體管,采用臺(tái)積電定制的4nm工藝,預(yù)計(jì)在今年下半年正式發(fā)貨,英偉達(dá)CEO黃仁勛此前表示,這款GPU具有超強(qiáng)的計(jì)算能力,20個(gè)H100 GPU便可承托相當(dāng)于全球互聯(lián)網(wǎng)的流量。相比于A100,H100在FP16、FP32和FP64計(jì)算上比A100快三倍,非常適用于當(dāng)下流行且訓(xùn)練難度高的大模型。

如果A100和H100芯片出口受到限制,對(duì)中國(guó)有何影響?目前國(guó)內(nèi)高端場(chǎng)景基本采用英偉達(dá)的A100,包括OEM廠商浪潮、聯(lián)想等,云服務(wù)公司阿里、騰訊、百度等,對(duì)于即將量產(chǎn)的H100,國(guó)內(nèi)主流廠商也已經(jīng)預(yù)定,如阿里云、百度云和騰訊云等,而且目前國(guó)內(nèi)沒(méi)有能夠與其相對(duì)標(biāo)的硬件產(chǎn)品,如果限制,這些廠商在一些高端的應(yīng)用上將無(wú)法買(mǎi)到可替代產(chǎn)品。

不過(guò)有行業(yè)分析師表示,如果出口限制,確實(shí)只是對(duì)一些高端廠商的應(yīng)用有影響,而在更普遍的應(yīng)用場(chǎng)景中,英偉達(dá)的產(chǎn)品并不在限制的范圍,而且國(guó)內(nèi)也有可替代的產(chǎn)品。

國(guó)產(chǎn)算力芯片如何突圍

從長(zhǎng)遠(yuǎn)來(lái)看,加速算力芯片的發(fā)展是必然的,那么國(guó)內(nèi)算力芯片的能力怎樣,如何突圍呢?目前服務(wù)器加速,主要采用的是GPU芯片,占比接近90%,另外則是ASIC、FPGA等。

GPGPU芯片廣泛用于商業(yè)計(jì)算和大數(shù)據(jù)處理,如天氣預(yù)報(bào)、工業(yè)設(shè)計(jì)、基因工程、藥物發(fā)現(xiàn)、金融工程等,在人工智能領(lǐng)域,使用GPGPU在云端運(yùn)行模型訓(xùn)練算法,可以顯著縮短海量訓(xùn)練數(shù)據(jù)的訓(xùn)練時(shí)長(zhǎng),減少能源消耗,從而進(jìn)一步降低人工智能的應(yīng)用成本。

不同應(yīng)用領(lǐng)域,對(duì)芯片計(jì)算能力及運(yùn)算精度要求也有所不同,比如用于商業(yè)計(jì)算和大數(shù)據(jù)處理(CAE仿真、物理化學(xué)、石油勘探、生命科學(xué)、氣象環(huán)境等),需要雙精度浮點(diǎn)、單精度浮點(diǎn)、32位整型運(yùn)算;人工智能(模型訓(xùn)練、應(yīng)用推理),要求混合精度浮點(diǎn)、半精度浮點(diǎn)、16位整型、8位整型運(yùn)算。

近幾年國(guó)內(nèi)不少企業(yè)在這方面取得進(jìn)展,包括海光信息、壁仞科技、燧原科技、摩爾線程等。

海光信息成立于2014年,不久前在科創(chuàng)板上市,海光信息的產(chǎn)品包括通用處理器CPU)和協(xié)處理器(DCU),海光DCU屬于GPGPU的一種。

海光DCU 8000系列,典型功耗260-350W,支持INT4、INT8、FP16、FP32、FP64運(yùn)算精度,支持4個(gè)HBM2內(nèi)存通道,最高內(nèi)存帶寬為1TB/s、最大內(nèi)存容量為32GB。海光DCU協(xié)處理器全面兼容ROCm GPU計(jì)算生態(tài),由于ROCm和CUDA在生態(tài)、編程環(huán)境等方面具有高度的相似性,CUDA用戶可以以較低代價(jià)快速遷移至ROCm平臺(tái)。

可以看到,海光DCU是國(guó)內(nèi)唯一支持FP64雙精度浮點(diǎn)運(yùn)算的產(chǎn)品,英偉達(dá)的A100、H100都支持FP64,從這一點(diǎn)來(lái)看,海光DCU在這方面是比較領(lǐng)先的。

壁仞科技今年8月發(fā)布的首款通用GPU BR100,集成770億晶體管,支持FP16半精度浮點(diǎn)運(yùn)算,在這方面相比英偉達(dá)、海光DCU較弱,不過(guò)據(jù)該公司介紹,BR100的16位浮點(diǎn)算力能達(dá)到1000T以上,8位定點(diǎn)算力達(dá)到2000T以上,超過(guò)英偉達(dá)的A100。

另外燧原科技此前發(fā)布的第二代人工智能訓(xùn)練產(chǎn)品邃思2.0,支持從FP32、TF32、FP16、BF16 到INT8運(yùn)算,單精度FP32峰值算力40 TFLOPS,單精度張量TF32峰值算力160 TFLOPS。

天數(shù)智芯的BI芯片,集成240億晶體管,采用7納米先進(jìn)制程,支持FP32、FP16、BF16、INT8等多精度數(shù)據(jù)混合訓(xùn)練,單芯算力每秒147T@FP16。

另外值得關(guān)注的還有,寒武紀(jì)2021年11月發(fā)布的第三代云端AI芯片思元370,相比于上一代芯片,思元370全面加強(qiáng)了FP16、BF16以及FP32的浮點(diǎn)算力,在全新MLUarch03架構(gòu)和7nm先進(jìn)工藝加持下,8位定點(diǎn)算力最高為256TOPS。

對(duì)比來(lái)看,目前國(guó)內(nèi)廠商的芯片水平,相比于英偉達(dá)的A100和H100是存在差距的。不過(guò)在國(guó)內(nèi)市場(chǎng)需求和美國(guó)出口限制的背景下,這些芯片廠商具有足夠的技術(shù)和經(jīng)驗(yàn)積累,去實(shí)現(xiàn)進(jìn)一步的突破。

那么國(guó)內(nèi)的芯片廠商需要如何突圍呢?難度肯定是大的,燧原科技創(chuàng)始人趙立東在日前世界人工智能大會(huì)的論壇上談到,國(guó)際巨頭用幾代人、數(shù)十年的時(shí)間投入積攢下的技術(shù)實(shí)力,我們想靠?jī)纱蛶资?a target="_blank">工程師就超越,是不可能的。

要縮短差距,除了資金、人力等的高密集投入外,也需要有更快的更迭,還有就是架構(gòu)創(chuàng)新,趙立東認(rèn)為,唯有架構(gòu)實(shí)現(xiàn)原始創(chuàng)新,才能真正擁抱開(kāi)放生態(tài),使產(chǎn)業(yè)得到健康發(fā)展。

另外與國(guó)外芯片執(zhí)著于先進(jìn)的制程,國(guó)內(nèi)不少?gòu)S商開(kāi)始通過(guò)更先進(jìn)的封裝工藝、異構(gòu)芯片等來(lái)尋求突破。比如寒武紀(jì)思元370采用chiplet技術(shù),在一顆芯片中封裝2顆AI計(jì)算芯粒(MLU-Die),每一個(gè) MLU-Die 具備獨(dú)立的AI計(jì)算單元、內(nèi)存、IO以及 MLU-Fabric控制和接口,通過(guò)MLU-Fabric保證兩個(gè)MLU-Die間的高速通訊,可以通過(guò)不同MLU-Die組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場(chǎng)景的高性價(jià)比AI芯片,壁仞科技今年8月發(fā)布的GPU BR100GPU芯片也采用了Chiplet技術(shù)。

小結(jié)

整體而言,美國(guó)限制英偉達(dá)高端GPU芯片A100和H100的出口,短期來(lái)看對(duì)中國(guó)的影響不是很大,反而對(duì)于國(guó)內(nèi)算力芯片的發(fā)展或許具有促進(jìn)作用。

從目前國(guó)內(nèi)芯片廠商的產(chǎn)品來(lái)看,與英偉達(dá)A100和H100存在差距,不過(guò)也有海光信息、壁仞科技等在某些方面已經(jīng)取得突破的企業(yè),未來(lái)想要超越仍然存在困難,然而卻讓人相信一點(diǎn)點(diǎn)取得突破是有可能的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52494

    瀏覽量

    440704
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4944

    瀏覽量

    131223
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書(shū)中的芯片知識(shí)是比較接近當(dāng)前的頂尖
    發(fā)表于 06-18 19:31

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實(shí)踐

    代提升1.5倍,內(nèi)存容量達(dá)288GB,適配千億參數(shù)模型訓(xùn)練需求。 國(guó)產(chǎn)突破?:國(guó)內(nèi)首款6nm高性能GPU芯片于2025年5月成功點(diǎn)亮,性能對(duì)標(biāo)國(guó)際中端產(chǎn)品,已獲億元級(jí)訂單;國(guó)產(chǎn)
    的頭像 發(fā)表于 05-29 07:44 ?146次閱讀
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實(shí)踐

    芯片的生態(tài)突圍與革命

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)大芯片,即具備強(qiáng)大計(jì)算能力的集成電路芯片,主要應(yīng)用于高性能計(jì)算(HPC)、人工智能(AI)、數(shù)據(jù)中心、
    的頭像 發(fā)表于 04-13 00:02 ?1717次閱讀

    GPU租用平臺(tái)有什么好處

    當(dāng)今,GPU租用平臺(tái)為科研機(jī)構(gòu)、企業(yè)乃至個(gè)人開(kāi)發(fā)者提供了靈活高效的解決方案。下面,AI部落小編帶您深入探討
    的頭像 發(fā)表于 02-07 10:39 ?459次閱讀

    DeepSeek對(duì)芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構(gòu)的DeepSeek-V3,對(duì)芯片的要求產(chǎn)生了深遠(yuǎn)影響。為了更好地理解這一影響,我們可以從幾個(gè)方面進(jìn)行分析。一.MOE架構(gòu)對(duì)
    的頭像 發(fā)表于 02-07 10:02 ?1120次閱讀
    DeepSeek對(duì)<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響

    中心的如何衡量?

    (ComputationalPower)是指智中心通過(guò)其內(nèi)部的計(jì)算設(shè)備(如CPU、GPU、AI芯片等)對(duì)數(shù)據(jù)進(jìn)行處理和計(jì)算的能力。它體現(xiàn)了智
    的頭像 發(fā)表于 01-16 14:03 ?2472次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對(duì)GPU架構(gòu)和張量運(yùn)算充滿好奇。閱讀《芯片》第7-9章,讓我對(duì)這些關(guān)鍵技術(shù)有了全新認(rèn)識(shí)。
    發(fā)表于 11-24 17:12

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解芯片GPU

    著色器(Pixel shader)是圖形流水線中相當(dāng)強(qiáng)大的功能單元,因?yàn)樗梢詾槊總€(gè)片段執(zhí)行復(fù)雜的計(jì)算,從而為最終渲染的圖像添加細(xì)節(jié)和視覺(jué)效果。 DirectX API推動(dòng) GPU 演進(jìn)
    發(fā)表于 11-03 12:55

    【一文看懂】大白話解釋“GPUGPU

    隨著大模型的興起,“GPU”這個(gè)詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計(jì)等工作場(chǎng)景中,什么是GPU,它與CPU的區(qū)別是什么?以及到底什么是GPU
    的頭像 發(fā)表于 10-29 08:05 ?2582次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>”

    一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)
    的頭像 發(fā)表于 10-23 14:48 ?864次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解芯片CPU

    。 █在芯片設(shè)計(jì)中,芯片拓?fù)?Topology)結(jié)構(gòu)非常重要。 ●環(huán)形(Ring)拓?fù)浞绞绞且环N將多個(gè)處理單元連接成環(huán)形結(jié)構(gòu)的片上總線技術(shù)結(jié)構(gòu)中,每個(gè)處理單元都與環(huán)上的兩個(gè)相鄰處理
    發(fā)表于 10-20 12:03

    GPU租用平臺(tái)是什么

    GPU租用平臺(tái)是一種基于云計(jì)算的服務(wù)模式,它允許用戶通過(guò)互聯(lián)網(wǎng)按需租用高性能GPU資源,而無(wú)需自行購(gòu)買(mǎi)、部署和維護(hù)這些硬件。
    的頭像 發(fā)表于 10-16 10:15 ?677次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書(shū)概覽

    、GPU、NPU,給我們剖析了芯片的微架構(gòu)。書(shū)中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解
    發(fā)表于 10-15 22:08

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    這個(gè)想法被否決了,因?yàn)橥度胼^大、難以落地,且客戶對(duì)的認(rèn)同遠(yuǎn)不及今天這種高度。 這幾年間其實(shí)我們聯(lián)系甚少,但是作者一直沒(méi)有脫離對(duì)芯片的應(yīng)用和關(guān)注。特別是目睹GPU從消費(fèi)電子轉(zhuǎn)向
    發(fā)表于 09-02 10:09

    服務(wù)器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,需求日益增長(zhǎng)。智中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計(jì)算的核心設(shè)備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務(wù)器也進(jìn)入了大眾的視野,成為高性能計(jì)算的首選。那
    的頭像 發(fā)表于 07-25 08:28 ?1339次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服務(wù)器為什么選擇<b class='flag-5'>GPU</b>