一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD正式發(fā)布了新一代Instinct MI100計(jì)算卡

lhl545545 ? 來源:快科技 ? 作者:上方文Q ? 2020-11-18 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

昨日晚間,AMD正式發(fā)布了新一代Instinct MI100計(jì)算卡,首次采用針對(duì)HPC高性能計(jì)算、AI人工智能全新設(shè)計(jì)的CDNA架構(gòu),和游戲向的RDNA架構(gòu)截然不同。

Instinct MI100計(jì)算卡采用臺(tái)積電7nm工藝制造,集成120個(gè)計(jì)算單元、7680個(gè)流處理器,核心頻率最高1502MHz,并專門加入了Matrix Core(矩陣核心),用于加速HPC、AI運(yùn)算。

它整合封裝了32GB HBM2顯存,位寬4096-bit,頻率1.2GHz,帶寬1228.8GB/s,支持ECC。

該卡支持PCIe 4.0 x16,具備三條Infinity Fabric互連總線,峰值帶寬92GB/s,整卡熱設(shè)計(jì)功耗300W,雙8針輔助供電。

這塊卡的特殊之處還在于頂部設(shè)置了橋接金手指,通過橋接器可以將四塊卡綁定在一起,而搭配雙路的AMD霄龍?zhí)幚砥鳎梢詫?shí)現(xiàn)八卡并行。

類似之前的計(jì)算卡,甚至是R9 Fury X、Vega 64/56這樣的游戲卡,Instinct MI110也是將GPU芯片、HBM芯片整合封裝在了一起,不過如今的HBM2單顆容量已達(dá)8GB。

對(duì)比CDNA(上)、RDNA(下)架構(gòu)圖,可以發(fā)現(xiàn)二者整體框架有些相似之處,但各種單元模塊和布局已經(jīng)截然不同。

Infinity Fabric互連總線、顯存控制器、PCIe 4.0控制器、多媒體引擎、著色器引擎、ACE異步計(jì)算引擎等等都還在(當(dāng)然也不完全一樣了),而和圖形渲染輸出相關(guān)的都沒了,比如圖形指令處理器、幾何處理器、光柵器、顯示引擎、原語單元等等,同時(shí)增加了XGMI連接控制器用于多卡互連,一二級(jí)緩存也完全不同。

作為AMD GPU的最基本模塊,計(jì)算單元(CU)也完全不同了,現(xiàn)在叫做增強(qiáng)型計(jì)算單元(XCU),組成模塊包括調(diào)度器、分支與信息單元、12.8KB ECC標(biāo)量單元、512KB ECC標(biāo)量寄存器、矢量寄存器、矢量ALU操作單元、矩陣數(shù)據(jù)操作單元、四個(gè)矢量/矩陣SIMD單元、64KB ECC本地?cái)?shù)據(jù)共享單元、載入/存儲(chǔ)單元、16KB ECC一級(jí)緩存等等。

顯然,這一些都是為計(jì)算服務(wù)的,而用于圖形的著色器、紋理相關(guān)單元自然都不見了,即便有些單元名字一樣,規(guī)格和作用也不同了。

計(jì)算性能方面,F(xiàn)MA64/FP64雙精度為11.5TFlops(每秒1.15億億次),F(xiàn)MA32/FP32單精度為23.1TFlops(每秒2.31億億次),F(xiàn)P32 Matrix單精度矩陣計(jì)算為46.1TFlops(每秒4.61億億次),F(xiàn)P16 Matrix半精度矩陣計(jì)算為184.6TFlops(每秒18.46億億次),Bfloat16浮點(diǎn)為92.3TFlops(每秒9.23億億次)。

這樣的一塊卡,已經(jīng)相當(dāng)于20年前的世界頂級(jí)超級(jí)計(jì)算機(jī),而體積、功耗都不可同日而語。

對(duì)比NVIDIA安培架構(gòu)的最新計(jì)算卡A100,AMD也給出了一些對(duì)比數(shù)據(jù),F(xiàn)P32單精度性能領(lǐng)先18.5%,F(xiàn)P64雙精度性能領(lǐng)先18.6%,AI與機(jī)器學(xué)習(xí)性能更是領(lǐng)先兩倍多,而且功耗低了足足100W。

而對(duì)比上代產(chǎn)品MI50,新卡的FP64雙精度、FP32單精度性能均提升74%,F(xiàn)P32矩陣性能提升接近2.5倍,AI負(fù)載性能更是幾乎7倍的飛躍。

當(dāng)然,除了紙面計(jì)算性能優(yōu)秀,軟件開發(fā)也必須跟上,尤其是這種計(jì)算性的產(chǎn)品。NVIDIA在這方面要強(qiáng)得多,生態(tài)更加穩(wěn)固和豐富,AMD ROCm平臺(tái)正在奮起直追中。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5589

    瀏覽量

    136381
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280045
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249601
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AMD最強(qiáng)AI芯片,性能強(qiáng)過英偉達(dá)H200,但市場仍不買賬,生態(tài)是最大短板?

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)當(dāng)?shù)貢r(shí)間本周四,AMDAMD Advancing AI 2024上發(fā)布系列新品,包括全新旗艦AI芯片、服
    的頭像 發(fā)表于 10-14 01:32 ?4317次閱讀
    <b class='flag-5'>AMD</b>最強(qiáng)AI芯片,性能強(qiáng)過英偉達(dá)H200,但市場仍不買賬,生態(tài)是最大短板?

    重磅!AMD將恢復(fù)向中國出口MI308芯片!

    出貨?!?此前美國政府針對(duì)Instinct MI308產(chǎn)品出貨至中國進(jìn)行出口管制,該產(chǎn)品與英偉達(dá)H20樣禁止向中國銷售。 ? 如今,MI308也將恢復(fù)供貨,以滿足國內(nèi)AI基礎(chǔ)設(shè)施建設(shè)
    的頭像 發(fā)表于 07-15 20:52 ?1871次閱讀

    德州儀器與庫發(fā)布新一代工業(yè)機(jī)器人控制器

    在今年慕尼黑上海電子展期間,德州儀器 (TI) 與美的集團(tuán)旗下庫(后簡稱“庫”)合作發(fā)布新一代工業(yè)機(jī)器人控制器 KR C5 micro
    的頭像 發(fā)表于 04-18 14:34 ?648次閱讀

    新思科技推出基于AMD芯片的新一代原型驗(yàn)證系統(tǒng)

    近日,新思科技宣布推出全新基于AMD Versal? Premium VP1902自適應(yīng)系統(tǒng)級(jí)芯片(SoC)的HAPS?原型驗(yàn)證系統(tǒng),以此進(jìn)步升級(jí)其硬件輔助驗(yàn)證(HAV)產(chǎn)品組合。 此次推出的全新一代
    的頭像 發(fā)表于 02-19 17:12 ?688次閱讀

    AMD將DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布項(xiàng)重要進(jìn)展,成功將全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。這
    的頭像 發(fā)表于 02-06 09:41 ?574次閱讀

    消息稱AMD Instinct MI400 AI加速器將配備8個(gè)計(jì)算芯片

    對(duì)比,目前的 MI300 系列加速器中每個(gè) AID 僅包含 2 個(gè)加速計(jì)算芯片 ,MI400 在芯片數(shù)量上實(shí)現(xiàn)翻倍。如此來,
    的頭像 發(fā)表于 02-05 15:07 ?967次閱讀

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布項(xiàng)重要的技術(shù)進(jìn)展,即將全新的DeepSeek-V3模型成功集成到其旗艦級(jí)GPU產(chǎn)品——Instinct MI300X上。這
    的頭像 發(fā)表于 02-05 13:58 ?539次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    的GPU不能在單個(gè)主機(jī)系統(tǒng)中組合使用。 - AMD GPU:目前只有時(shí)域求解器(FIT)支持AMD GPU,如Instinct MI 210、Radeon VII等,并給出了相關(guān)規(guī)格
    發(fā)表于 12-16 14:25

    IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力

    近日,據(jù)外媒最新報(bào)道,國際商業(yè)機(jī)器公司(IBM)與超威半導(dǎo)體公司(AMD)已正式宣布達(dá)成項(xiàng)重要合作。雙方將攜手在IBM Cloud上部署AMDInstinct
    的頭像 發(fā)表于 11-21 11:07 ?737次閱讀

    IBM將在云平臺(tái)部署AMD加速器

    IBM與AMD近期宣布項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺(tái)上部署AMD Instinct M
    的頭像 發(fā)表于 11-19 16:24 ?601次閱讀

    IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器

    近日,全球領(lǐng)先的科技企業(yè)IBM與AMD共同宣布項(xiàng)重要合作。雙方計(jì)劃在IBM云上部署AMDInstinct
    的頭像 發(fā)表于 11-19 11:03 ?857次閱讀

    AMD發(fā)布新版Instinct MI325X

    今日,芯片行業(yè)的老牌巨頭AMD在AI領(lǐng)域交出了份令人矚目的答卷。   美國時(shí)間10月10日,AMD在舊金山成功舉辦了Advancing AI發(fā)布會(huì)。會(huì)上,
    的頭像 發(fā)表于 10-12 16:54 ?1294次閱讀

    AMD發(fā)布新一代AI芯片MI325X

    在舊金山舉辦的Advancing AI 2024大會(huì)上,AMD正式推出了其新一代AI芯片——GPU AMD Instinct MI325X。
    的頭像 發(fā)表于 10-11 15:55 ?927次閱讀

    三星首度引入AMD MI300X,緩解AI GPU短缺

    三星電子近日斥資約270億韓元(約合1.42億元人民幣),購買了AMD Instinct MI300X加速器。這舉措標(biāo)志著三星電子首次引入非英偉達(dá)品牌的AI GPU,以應(yīng)對(duì)企業(yè)內(nèi)部算
    的頭像 發(fā)表于 10-10 17:15 ?873次閱讀

    Snap發(fā)布新一代Spectacles AR眼鏡

    Snap公司近日震撼發(fā)布其第五Spectacles AR眼鏡,再次引領(lǐng)可穿戴設(shè)備領(lǐng)域的創(chuàng)新潮流。這款新一代AR眼鏡不僅設(shè)計(jì)時(shí)尚,更實(shí)現(xiàn)
    的頭像 發(fā)表于 09-19 16:40 ?777次閱讀