一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)Grace Hopper CPU架構(gòu)

半導(dǎo)體產(chǎn)業(yè)縱橫 ? 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 作者:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 2022-08-23 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達(dá)的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初發(fā)布。

英偉達(dá)在下周的 Hot Chips 34 發(fā)布會(huì)之前宣布了有關(guān)Grace CPU Superchip的新細(xì)節(jié),并透露該芯片采用4N工藝制造。英偉達(dá)還分享了有關(guān)架構(gòu)、數(shù)據(jù)結(jié)構(gòu)、性能和效率基準(zhǔn)的更多信息。Grace芯片和服務(wù)器將在2023年上半年投入市場(chǎng)。

英偉達(dá)的Grace CPU是該公司第一款專為數(shù)據(jù)中心設(shè)計(jì)的CPU專用Arm芯片,在一塊主板上有兩個(gè)芯片,共144個(gè)核心,而Grace Hopper超級(jí)芯片則將Hopper GPU和Grace CPU結(jié)合在同一塊板上。在披露中,英偉達(dá)最終正式確認(rèn) Grace CPU 使用 TSMC 4N 工藝。臺(tái)積電在其5nm節(jié)點(diǎn)系列中列出了“N4”4nm工藝,將其描述為5nm節(jié)點(diǎn)的增強(qiáng)版。英偉達(dá)使用該節(jié)點(diǎn)的專用變體,稱為“4N”,專門針對(duì)其GPU和CPU進(jìn)行了優(yōu)化。

隨著摩爾定律的減弱,這些類型的專用節(jié)點(diǎn)變得越來越普遍,隨著每個(gè)新節(jié)點(diǎn)的出現(xiàn),晶體管的縮小變得越來越困難,成本也越來越高。為了實(shí)現(xiàn)英偉達(dá)4N等定制工藝節(jié)點(diǎn),芯片設(shè)計(jì)公司和代工廠攜手合作,使用設(shè)計(jì)技術(shù)協(xié)同優(yōu)化(DTCO)為其特定產(chǎn)品輸入定制功率、性能和面積(PPA)特性。

英偉達(dá)此前曾透露,其 Grace CPU 使用現(xiàn)成的Arm Neoverse內(nèi)核作為其Grace CPU,但該公司尚未指定使用哪種特定版本。然而,英偉達(dá)披露,Grace使用Arm v9內(nèi)核并支持SVE2,Neoverse N2平臺(tái)是Arm第一個(gè)支持Arm V7和SVE2等擴(kuò)展的IP。N2 Perseus 平臺(tái)采用 5nm 設(shè)計(jì)(N4 屬于 TSMC 的 5nm 系列)并支持 PCIe Gen 5.0、DDR5、HBM3、CCIX 2.0 和 CXL 2.0。Perseus 設(shè)計(jì)針對(duì)每功率性能(瓦特)和每面積性能進(jìn)行了優(yōu)化。Arm 表示,其下一代核心 Poseidon 要到 2024 年才會(huì)上市,考慮到 Grace 2023 年初的發(fā)布日期,這些核心不太可能成為候選者。

英偉達(dá)Grace Hopper CPU 架構(gòu)

英偉達(dá)的新NVDIA calable Coherency Fabric (SCF) 是一種網(wǎng)狀互連,與Arm Neoverse核心使用的標(biāo)準(zhǔn)CMN-700相干網(wǎng)狀網(wǎng)絡(luò)非常相似。

英偉達(dá)SCF 在各種 Grace 芯片單元(如 CPU 內(nèi)核、內(nèi)存和 I/O)之間提供 3.2 TB/s 的雙向帶寬,更不用說將芯片連接到主板上其他單元(無論是另一個(gè)Grace CPU還是Hopper GPU)的NVLink-C2C接口。

1010cdb0-2070-11ed-ba43-dac502259ad0.png

該網(wǎng)格支持 72+ 個(gè)內(nèi)核,每個(gè) CPU 有 117MB 的總 L3 緩存。英偉達(dá)表示,上面圖片中的第一個(gè)方框圖是“出于說明目的的可能拓?fù)浣Y(jié)構(gòu)”,其對(duì)齊方式與第二個(gè)方框圖不完全一致。

此圖顯示了具有8個(gè)SCF緩存分區(qū)(SCC)的芯片,這些分區(qū)看起來是L3緩存片以及8個(gè)CPU單元。SCC 和內(nèi)核以兩個(gè)一組連接到緩存交換節(jié)點(diǎn) (CSN),然后 CSN 駐留在 SCF 網(wǎng)狀結(jié)構(gòu)上,以提供CPU核心和芯片其余部分的存儲(chǔ)器之間的接口。SCF 還通過 Coherent NVLink 支持多達(dá)四個(gè)插槽的一致性。

103d07a4-2070-11ed-ba43-dac502259ad0.png

英偉達(dá)還分享了上圖,顯示每個(gè)Grace CPU支持多達(dá)68個(gè)PCIe通道和多達(dá)4個(gè)PCIe 5.0 x16連接。每個(gè)x16連接支持高達(dá)128 GB/s的雙向吞吐量(x16鏈路可以分成兩個(gè)x8鏈路),還有16個(gè)雙通道LPDDR5X內(nèi)存控制器(MC)。然而,這張圖與第一張圖不同——它將 L3 緩存顯示為連接到四核 CPU 集群的兩個(gè)連續(xù)塊,這比之前的圖更有意義,芯片中總共有 72 個(gè)內(nèi)核。但是,我我們?cè)诘谝粡垐D中沒有看到單獨(dú)的SCF分區(qū)或CSN節(jié)點(diǎn)。

英偉達(dá)官方表示,Scalable Coherency Fabric (SCF) 是其專有設(shè)計(jì),但 Arm 允許其合作伙伴通過調(diào)整核心數(shù)量、緩存大小和使用不同類型的內(nèi)存(如 DDR5 和 HBM)來定制 CMN-700 網(wǎng)格,以及選擇各種接口,如 PCIe 5.0、CXL 和 CCIX。這意味著 英偉達(dá)有可能為片上結(jié)構(gòu)使用高度定制的 CMN-700 實(shí)現(xiàn)。

英偉達(dá)Grace Hopper 擴(kuò)展 GPU 內(nèi)存

GPU 需要高的內(nèi)存吞吐量,因此,英偉達(dá)將目光轉(zhuǎn)向提高內(nèi)存吞吐量,不僅是芯片內(nèi)部,還包括CPU和GPU之間。Grace CPU 有 16 個(gè)雙通道 LPDDR5X 內(nèi)存控制器,最多可支持 32 個(gè)通道,支持高達(dá) 512 GB 的內(nèi)存和高達(dá) 546 GB/s 的吞吐量。英偉達(dá)表示,由于容量和成本等多種因素,它選擇了 LPDDR5X 而不是 HBM2e。同時(shí),與標(biāo)準(zhǔn) DDR5 內(nèi)存相比,LPDDR5X 提供了 53% 的帶寬和 1/8 的每 GB 功耗,使其成為更好的選擇。

英偉達(dá)還推出了擴(kuò)展 GPU 內(nèi)存 (EGM),它允許 NVLink 網(wǎng)絡(luò)上的任何 Hopper GPU 訪問網(wǎng)絡(luò)上任何 Grace CPU 的 LPDDR5X 內(nèi)存。

英偉達(dá)的目標(biāo)是提供一個(gè)統(tǒng)一的內(nèi)存池,可以在 CPU 和 GPU 之間共享,從而在簡(jiǎn)化編程模型的同時(shí)提供更高的性能。Grace Hopper CPU+GPU 芯片支持具有共享頁表的統(tǒng)一內(nèi)存,這意味著芯片可以與 CUDA 應(yīng)用程序共享地址空間和頁表,并允許使用系統(tǒng)分配器來分配 GPU 內(nèi)存。

英偉達(dá)NVLink-C2C

CPU 內(nèi)核是計(jì)算引擎,但互連是決定計(jì)算未來的戰(zhàn)場(chǎng)。移動(dòng)數(shù)據(jù)比實(shí)際計(jì)算數(shù)據(jù)消耗更多的能量,因此更快、更有效地移動(dòng)數(shù)據(jù),甚至避免數(shù)據(jù)傳輸,是一個(gè)關(guān)鍵目標(biāo)。

英偉達(dá)的Grace CPU由一塊板上的兩個(gè) CPU 組成,而 Grace Hopper Superchip 則由同一塊板上的一個(gè) Grace CPU 和一個(gè) Hopper GPU 組成,旨在通過專有的NVLink芯片到芯片(C2C)互連最大化單元之間的數(shù)據(jù)傳輸,并提供一致性內(nèi)存,以減少或消除數(shù)據(jù)傳輸。

106865fc-2070-11ed-ba43-dac502259ad0.png

英偉達(dá)分享了有關(guān)其 NVLink-C2C 互連的新細(xì)節(jié),這是一種支持內(nèi)存一致性的芯片到芯片和芯片到芯片互連,可提供高達(dá) 900 GB/s 的吞吐量(是 PCIe 5.0 x16 鏈路帶寬的 7 倍)。該接口使用 NVLink 協(xié)議,英偉達(dá)使用其 SERDES 和 LINK 設(shè)計(jì)技術(shù)精心設(shè)計(jì)了該接口,重點(diǎn)關(guān)注能源和面積效率。NVLink-C2C 也支持行業(yè)標(biāo)準(zhǔn)協(xié)議,如 CXL 和 Arm 的 AMBA 相干集線器接口(CHI — Neoverse CMN-700 網(wǎng)格的CHI-key)。它還支持多種類型的連接,從基于PCB的互連到硅中介層和晶圓級(jí)實(shí)現(xiàn)。

功率效率是所有數(shù)據(jù)結(jié)構(gòu)的一個(gè)關(guān)鍵指標(biāo),如今,英偉達(dá)共享鏈路傳輸?shù)臄?shù)據(jù)每比特消耗1.3微微焦耳(pJ/b)。這是 PCIe 5.0 接口效率的 5 倍,但它是未來將上市的 UCIe 互連(0.5 到 0.25 pJ/b)功率的兩倍多。封裝類型各不相同,C2C link為 英偉達(dá)提供了性能和效率的完美結(jié)合,以滿足其特定的使用情況。

英偉達(dá)Grace CPU 基準(zhǔn)測(cè)試

1093537a-2070-11ed-ba43-dac502259ad0.png

10bad5f8-2070-11ed-ba43-dac502259ad0.png

10caddcc-2070-11ed-ba43-dac502259ad0.png

英偉達(dá)的新基準(zhǔn)是SpecIntRate 2017基準(zhǔn)中單臺(tái)Grace CPU的370分。這英偉達(dá)已經(jīng)共享了一個(gè)多CPU基準(zhǔn),在SPECTINTRATE2017基準(zhǔn)中,兩個(gè)Grace CPU的得分為740。顯然,這表明兩個(gè)芯片的線性縮放改進(jìn)。

AMD目前的第二代EPYC Milan芯片是數(shù)據(jù)中心目前的性能領(lǐng)導(dǎo)者,發(fā)布的規(guī)格結(jié)果從382到424片不等,這意味著高端x86芯片仍將保持領(lǐng)先地位。然而,英偉達(dá)的解決方案將具有許多其他優(yōu)勢(shì),如功率效率和更GPU友好的設(shè)計(jì)。

英偉達(dá)分享了其內(nèi)存吞吐量基準(zhǔn),表明Grace CPU在CPU內(nèi)存吞吐量測(cè)試中可以提供約500 GB/s的吞吐量。英偉達(dá)還聲稱,該芯片還可以將高達(dá)506Gb/s的組合讀/寫吞吐量推送到連接的Hopper GPU,并在讀吞吐量測(cè)試期間將CPU到GPU的帶寬計(jì)時(shí)為429Gb/s,在寫入時(shí)為407Gb/秒。

Grace Hopper ARM系統(tǒng)準(zhǔn)備好了嗎?

英偉達(dá)還宣布 Grace CPU Superchip 將遵守獲得 System Ready 認(rèn)證的必要要求。以獲得系統(tǒng)就緒認(rèn)證。該認(rèn)證意味著Arm芯片將與操作系統(tǒng)和軟件一起“正常工作”,從而簡(jiǎn)化部署。Grace 還將支持虛擬化擴(kuò)展,包括嵌套虛擬化和 S-EL2 支持。英偉達(dá)還列出了對(duì)以下內(nèi)容的支持:

nRAS v1.1 通用中斷控制器 (GIC) v4.1

n內(nèi)存分區(qū)和監(jiān)控 (MPAM)

n系統(tǒng)內(nèi)存管理單元 (SMMU) v3.1

nArm 服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu) (SBSA) 可實(shí)現(xiàn)符合標(biāo)準(zhǔn)的硬件和軟件接口

此外,為了在基于 Grace CPU 的系統(tǒng)上啟用標(biāo)準(zhǔn)引導(dǎo)流程,Grace CPU被設(shè)計(jì)為支持Arm服務(wù)器基本引導(dǎo)要求(SBBR)。

對(duì)于緩存和帶寬分區(qū)以及帶寬監(jiān)控,Grace CPU還支持Arm內(nèi)存分區(qū)和監(jiān)控(MPAM)。Grace CPU 還包括 Arm 性能監(jiān)控單元,允許對(duì) CPU 內(nèi)核以及片上系統(tǒng) (SoC) 架構(gòu)中的其他子系統(tǒng)進(jìn)行性能監(jiān)控。這使得標(biāo)準(zhǔn)工具(例如 Linux perf)能夠用于性能調(diào)查。英偉達(dá)的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初發(fā)布,其中 Hopper 變體適用于 AI 訓(xùn)練、推理和 HPC,而雙 CPU Grace 系統(tǒng)則專為 HPC 和云計(jì)算工作負(fù)載而設(shè)計(jì)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217113
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    528

    瀏覽量

    25987
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93799

原文標(biāo)題:詳解英偉達(dá)Grace Hopper CPU 超級(jí)芯片設(shè)計(jì)

文章出處:【微信號(hào):ICViews,微信公眾號(hào):半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率

    宣布在英偉達(dá) Grace Blackwell 平臺(tái)上實(shí)現(xiàn)高達(dá) 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示了全棧EDA
    發(fā)表于 03-19 17:59 ?280次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會(huì)

    為了實(shí)現(xiàn)這一速度提升,新思科技在GTC全球AI大會(huì)上宣布,正在使用英偉達(dá) CUDA-X庫優(yōu)化其下一代半導(dǎo)體開發(fā)解決方案。公司還在擴(kuò)大對(duì)英偉達(dá)Grac
    的頭像 發(fā)表于 03-19 17:53 ?814次閱讀

    微軟大手筆采購(gòu)英偉達(dá)AI芯片

    據(jù)全球知名市場(chǎng)調(diào)研機(jī)構(gòu)Omdia的最新估計(jì),微軟在2024年的英偉達(dá)Hopper架構(gòu)芯片采購(gòu)計(jì)劃上展現(xiàn)出了驚人的手筆。這一舉動(dòng)旨在幫助微軟在構(gòu)建下一代人工智能(AI)系統(tǒng)的激烈競(jìng)爭(zhēng)中搶
    的頭像 發(fā)表于 12-20 15:50 ?677次閱讀

    英偉達(dá)CEO確認(rèn):液冷Grace Blackwell服務(wù)器無過熱問題

    近日,英偉達(dá)公司的首席執(zhí)行官(CEO)針對(duì)外界關(guān)注的液冷Grace Blackwell服務(wù)器過熱問題,發(fā)表了明確的看法。他強(qiáng)調(diào),采用液冷技術(shù)的Grace Blackwell服務(wù)器并不存
    的頭像 發(fā)表于 11-21 11:45 ?622次閱讀

    英偉達(dá)進(jìn)軍ARM架構(gòu)CPU市場(chǎng),預(yù)計(jì)2025年推出新產(chǎn)品線

    近日,英偉達(dá)公司傳出了一則令人矚目的消息:該公司正在積極開發(fā)一款基于ARM架構(gòu)的新型CPU。這一消息不僅證實(shí)了之前業(yè)界關(guān)于英偉
    的頭像 發(fā)表于 11-11 15:33 ?805次閱讀

    今日看點(diǎn)丨蘋果與富士康接洽,商討在中國(guó)臺(tái)灣生產(chǎn)AI服務(wù)器;英偉達(dá)正在開發(fā)一款基于ARM架構(gòu)的新型CPU

    1. 英偉達(dá)正在開發(fā)一款基于ARM 架構(gòu)的新型CPU ? 據(jù)報(bào)道,英偉達(dá)正在開發(fā)一款基于ARM
    發(fā)表于 11-08 10:47 ?929次閱讀

    英偉達(dá)計(jì)劃2025年推出基于Arm架構(gòu)的消費(fèi)級(jí)CPU,挑戰(zhàn)英特爾和AMD

    11月5日,據(jù)科技媒體DigiTimes于10月31日?qǐng)?bào)道,供應(yīng)鏈消息透露,英偉達(dá)(Nvidia)正計(jì)劃在2025年9月推出其首款基于Arm架構(gòu)的消費(fèi)級(jí)CPU,目標(biāo)直指高端PC市場(chǎng)。
    的頭像 發(fā)表于 11-05 15:29 ?1565次閱讀

    軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU

    軟銀公司宣布,其正在擴(kuò)展的日本頂級(jí)人工智能計(jì)算平臺(tái)已安裝了約4000顆英偉達(dá)Hopper GPU。這一舉措顯著提升了平臺(tái)的計(jì)算能力。據(jù)悉,該平臺(tái)自2023年9月開始運(yùn)行,最初配備了大約2000顆
    的頭像 發(fā)表于 11-04 16:18 ?879次閱讀

    英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練,實(shí)時(shí)大語言模型推理

    。 ????????????????????? 英偉達(dá)Blackwell是通用計(jì)算全棧矩陣的終極解決方案,由多個(gè)英偉達(dá)芯片組成,包括Blackwell GPU、
    的頭像 發(fā)表于 09-04 09:10 ?3728次閱讀

    英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

    英偉達(dá)行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    英偉達(dá)或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達(dá)在美國(guó)加利福尼亞州圣何塞會(huì)議中心召開的GTC 2024大會(huì)上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現(xiàn)行H100/H200,并有與
    的頭像 發(fā)表于 08-08 17:19 ?1017次閱讀

    英偉達(dá)回應(yīng)AI芯片推遲發(fā)布傳聞

    近日,英偉達(dá)就外界廣泛關(guān)注的AI芯片Blackwell推遲發(fā)布傳聞作出正式回應(yīng)。8月4日,英偉達(dá)方面在接受媒體采訪時(shí)明確表示:“正如我們之前所說,H
    的頭像 發(fā)表于 08-05 17:34 ?954次閱讀

    英偉達(dá):Hopper芯片需求強(qiáng)勁 英偉達(dá)發(fā)言人談生產(chǎn)增長(zhǎng)

    據(jù)外媒報(bào)道,英偉達(dá)發(fā)言人透露Hopper芯片需求強(qiáng)勁,而且Blackwell 芯片的廣泛采樣也已經(jīng)開啟。而對(duì)于產(chǎn)量問題;則表示有望在下半年實(shí)現(xiàn)增長(zhǎng)。
    的頭像 發(fā)表于 08-03 17:25 ?2959次閱讀

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28