一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

3.5D Chiplet技術典型案例解讀

奇異摩爾 ? 來源:奇異摩爾 ? 2025-03-03 11:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大模型訓練集群的有效算力

DeepSeek的創(chuàng)新引領大模型基座模型向MoE專家模型進一步演進,未來大模型的參數(shù)將從千億級別向萬億參數(shù)邁進,開啟人工智能的新紀元。在這一過程中,端側(cè)推理模型的誕生離不開原研基座模型的精心訓練。隨著模型參數(shù)的不斷擴大以及AI模型的百舸爭流,訓練側(cè)所需的算力也將進一步激增。由此所依托的AI基礎設施的有效算力已成為下一代AI應用的堅實基石。

智算集群的有效算力由包括單個加速卡的基礎算力、集群規(guī)模、Scale Out與Scale Up所共同構筑的集群線性加速比以及集群有效運營的時間等多個維度因素構建。在不設資源限制的情況下,我們希望擁有最強大的單個計算卡系統(tǒng)來運行整個AI任務,因為,AI任務作為一個單一實體運行。因此,直接獲取最大能力的GPU/xPU是符合邏輯的選擇。

3D IC : 下一代AI芯片的加速引擎

后摩爾時代,算力的增長和芯片的性能提升之間面臨著內(nèi)存墻、功耗墻、面積墻等幾大瓶頸, 采用基于先進封裝的3D Chiplet堆疊芯片帶來的重大升級將有效解決這些瓶頸。

4065d6e4-f4ef-11ef-9310-92fbcf53809c.png

3D-IC 的優(yōu)勢可概括為以下幾點:

1可以降低成本,Chiplet的解耦特性讓先進制程節(jié)點更靈活,讓非所有功能(包括模擬和存儲器)都需要遷移到先進制程節(jié)點;

2更容易滿足高速互連和帶寬要求,幫助先進存儲器技術達到 100Gbps的速度;

33D-IC 支持更小的尺寸,可以節(jié)省電路板和終端產(chǎn)品的空間;

43D-IC 可以降低功耗,因為不再需要大型驅(qū)動器。3D 堆疊可以使用小型 I/O 驅(qū)動器,功耗更低。此外,減少電阻-電感-電容 (RLC)寄生參數(shù)也有助于進一步降低功耗;

5減少了跨封裝之間的互連,可以實現(xiàn)更快的性能和更好的功耗表現(xiàn)。

3.5D技術的引入將顯著提升AI集群的計算密度和功耗效率,使得數(shù)據(jù)中心能夠以更低的能耗處理更大的工作負載。這對于應對生成式AI模型的指數(shù)級增長需求至關重要。本期主要介紹幾個3.5D Chiplet典型案例,分享3D IC設計架構趨勢。

典型案例1

AMD MI300 系列開創(chuàng)3.5D IC先河

408140f0-f4ef-11ef-9310-92fbcf53809c.png

(來源:AMD)

AMD是首批采用3.5D IC設計及工藝的芯片公司,2024年發(fā)布的MI300 X GPU加速器,基于新一代CDNA計算架構。其采用臺積電5nm/6nm FinETH技術,總共1530億個晶體管。

408df8d6-f4ef-11ef-9310-92fbcf53809c.png

(來源:AMD Whitepaper)

XCD計算模塊:共計8個XCD加速計算模塊,每一個XCD擁有38個CU計算單位,所以總共304個計算單元。

IOD互聯(lián)模塊:每兩個XCD為一組,在它們底部放置一個IOD模塊,負責輸入輸出與通信連接,總共4個IOD提供了第四代Infinity Fabric連接通道,總帶寬最高896GB/s,還有多達256MB Infinity Cache無限緩存。該模塊實際上屬于一種3D Base Die,通過TSV硅通孔技術與XCD計算Die模塊形成高密度互聯(lián)。

HBM 部分:IOD與XCD外圍一共有8個HBM3共192GB內(nèi)存(每個HBM3內(nèi)存大小為24GB)。IOD部分又一次采用的是6nm工藝,XCD部分則使用5nm工藝實現(xiàn)計算與IO芯粒解耦,這也是AMD公司常用的一種IO Die芯粒技術。

40a315d6-f4ef-11ef-9310-92fbcf53809c.png

(來源:知乎@sazc)

封裝工藝:上圖顯示的是MI300A APU的封裝工藝,兩者區(qū)別主要在計算Die部分,APU系列是異構芯粒技術同時包含GPU與CPU功能。但在封裝工藝上與MI300X雷同。

8個HBM與其他芯粒使用2.5D先進封裝工藝進行互聯(lián),而IOD模塊(Base Die)與XCD (MI300A還包括CCD)之間直接通過3D TSV堆疊封裝工藝互聯(lián)。

因此,MI300系列無論是A系列還是X系列制造工藝同時覆蓋2.5D和3D先進工藝,總稱3.5D混合封裝。

40b2c648-f4ef-11ef-9310-92fbcf53809c.png

(來源:AMD)

Scale Up互聯(lián)簡介:AMD Instinct MI300X 加速器提供了采用 UBB 業(yè)界標準 OCP 平臺設計的普適性解決方案,支持將 8 個 GPU 整合為一個性能主導型節(jié)點,并且具有全互聯(lián)式點對點環(huán)形設計,單一平臺內(nèi)的 HBM3 顯存總計可達到 1.5 TB提供足以應對各類 AI 或 HPC 工作負載部署的性能密集型解決方案。

典型案例2

CPO帶動Scale Out 互聯(lián)進軍百萬卡集群時代

規(guī)模生成式 AI 模型(如 DeepSeek,Grok3 系列等)的興起,對計算能力的需求呈現(xiàn)出了爆炸式增長。訓練這些復雜的模型往往需要龐大的計算資源,動輒依賴于 100,000 個甚至 100 萬個 XPU 的大規(guī)模集群。近期才發(fā)布的Grok 3模型,馬斯克預計下一代將搭建百萬卡AI數(shù)據(jù)中心,隨著大模型軍備賽在DeepSeek背景下展開地更加劇烈,新的互聯(lián)技術必須為未來百萬卡集群的互聯(lián)構筑可靠的基礎。

40d19726-f4ef-11ef-9310-92fbcf53809c.png

(圖:各國AI大模型軍備賽進行時)

Scale Out互聯(lián)甚至是更大規(guī)模的GPU HBD高帶寬域光進銅退的趨勢越發(fā)明顯,一種在2018年前后就被提及的光互聯(lián)技術CPO隨著AI對訓練的極高要求演進速度加快。

如果要在長程范圍集成更強大的算力/存力(Scale Out互聯(lián)),就需要借助更高帶寬的光互連技術。這也是為何目前光模塊在計算集群中廣泛使用的重要原因。集群要上升到百萬卡互聯(lián)規(guī)模,光互聯(lián)技術將發(fā)揮重要作用,傳統(tǒng)光模塊芯片和交換機芯片在PCB上的電信號傳輸以及GPU卡間互聯(lián)的信號損耗、功耗都遠大于單個Die to Die 互聯(lián)。目前,光模塊成為整個大型集群訓推時出現(xiàn)故障延遲的主要硬件之一。

40dd6236-f4ef-11ef-9310-92fbcf53809c.png

(來源:公眾號光通信女人)

CPO技術可以以解決射頻損耗的方式,將CPO光模塊與交換機主芯片ASIC專有集成電路芯片封裝在一起,降低電信號的互聯(lián)距離,從而降低射頻損耗。

40eb70a6-f4ef-11ef-9310-92fbcf53809c.png

(來源:公眾號光通信女人)

目前產(chǎn)業(yè)界都在研究晶圓級封裝工藝,2024、2025年基于晶圓級扇出式結(jié)構,在逐步克服工藝難點,接近商用。上圖我們可以看到基于晶圓級別的3D TSV工藝實現(xiàn)相比其他工藝實現(xiàn)了更高的互聯(lián)密度。

4103e8d4-f4ef-11ef-9310-92fbcf53809c.png

410bd486-f4ef-11ef-9310-92fbcf53809c.png

PIC(硅光芯片)通過與EIC(電芯片)進行3D堆疊,從而實現(xiàn)電連接更短、尺寸小、功耗低且高帶寬密度的性能。在此配置中,PIC 位于 EIC 頂部。然而,在 EIC 中創(chuàng)建 TSV 可能具有挑戰(zhàn)性,因為它通常需要在先進的晶圓節(jié)點上制造。為了克服這個問題,往往采用晶圓級扇出工藝,形成高銅柱以實現(xiàn)與頂部 PIC 的垂直互連。由此產(chǎn)生的光子 FOPOP 在光耦合方面表現(xiàn)出色,因為 PIC 的懸垂部分允許光邊緣耦合。

實際上,ASIC與CPO的共同封裝同樣屬于一種3.5D IC技術,從光芯片內(nèi)部通過3D堆疊實現(xiàn)高互聯(lián)的密度,更佳的傳輸性能。在交換機芯片側(cè),CPO OE Chiplet封裝在ASIC芯片周圍形成一個系統(tǒng)級的IC。以博通的典型CPO方案為例,整體封裝結(jié)構為CoWoS,計算Die(ASIC)通過Interposer/Package Substrate與CPO互連,互聯(lián)接口為高速IO(例如Serdes/D2D)。

411a2770-f4ef-11ef-9310-92fbcf53809c.png

(來源:Broadcom CPO )

目前,Nvidia也在研究基于硅光集成的CPO光學,并預計2025 Q3針對一款IB交換機啟動CPO方案的驗證。產(chǎn)業(yè)界更多廠家也在不斷研究并推出CPO光模塊樣機如Cisco、博通、Marvell都推出了基于CPO的交換機方案。

典型案例3

博通下一代3.5D IC大規(guī)模提升單卡算力

去年底Broadcom 推出了其 3.5D eXtreme Dimension 系統(tǒng)級封裝 (3.5D XDSiP) 平臺,該平臺適用于適用于 AI 和 HPC 工作負載的超高性能處理器。新平臺依賴于 TSMC 的 CoWoS 和其他先進封裝技術。它使芯片設計人員能夠構建 3D 堆棧邏輯、網(wǎng)絡和 I/O 小芯片以及 HBM 內(nèi)存堆棧的系統(tǒng)級封裝 (SiP)。該平臺允許使用多達 12 個 HBM 模塊實現(xiàn)高達 6000mm2 的 3D 堆疊硅的 SiP。首批 3.5D XDSiP 產(chǎn)品將于 2026 年推出。

博通首次使用F2F(面對面)將一個邏輯Die堆疊到另外一個邏輯Die上;這種使用無凸塊混合銅鍵合直接連接頂部和底部硅芯片的上層金屬層的面對面 (F2F) 堆疊方法,是博通的 3D XDSiP 平臺的主要優(yōu)勢。據(jù) Broadcom 稱,F(xiàn)2F 方法可實現(xiàn)高達 7 倍的信號連接和更短的信號路由,將晶粒間接口的功耗降低 90%,最大限度地減少 3D 堆棧內(nèi)的延遲,并為設計團隊提供額外的靈活性,成就更低功耗更低延遲的ASIC芯片性能。

41763cf4-f4ef-11ef-9310-92fbcf53809c.png

(來源:Broadcom)

此外,它巧妙地融合了 3D 硅片堆疊與 2.5D 封裝技術的精髓。該3.5D xPU計算Die與邏輯Die Face to Face進行鍵合,每個邏輯Die與多組HBM互聯(lián),又與IOD通過D2D互聯(lián)。(更多閱讀:Chiplet&互聯(lián)專題:AI時代變革下 3D IC 芯粒技術的最新應用趨勢解讀)

41a09bf2-f4ef-11ef-9310-92fbcf53809c.png

(來源:Broadcom)

總的來說,3.5D 集成技術通過將 3D 與 2.5D封裝相結(jié)合,能夠在不單純依賴制程工藝提升的情況下,實現(xiàn)芯片性能的顯著提升、功耗的有效降低以及成本的合理控制,從而成為了下一代 XPU 發(fā)展的必然趨勢。預計博通將繼續(xù)加大市場推廣力度,針對不同客戶的需求,提供定制化的 3.5D XPU 解決方案。

3.5D IC技術是Chiplet小芯片發(fā)展旅程中的又一重要里程碑,通過獨特的技術架構和卓越的性能表現(xiàn),為 AI 芯片的發(fā)展開辟了新的道路。在技術原理層面,其高密度互連、低功耗設計、多功能集成以及緊湊尺寸與穩(wěn)定性等核心要素相互協(xié)同,構成了強大的技術競爭力。

奇異摩爾自2021年成立以來先從片內(nèi)互聯(lián)產(chǎn)品系列研發(fā)出發(fā),目前可以提供包括2.5D Central IO Die及3D Base Die等AI單個計算卡算力擴展芯粒方案,未來通過持續(xù)性的行業(yè)標準共建、產(chǎn)業(yè)鏈生態(tài)的互聯(lián)互通,相信在不久的將來,隨著國產(chǎn)Chiplet技術的突破,我們將與產(chǎn)業(yè)鏈伙伴為國產(chǎn)AI算力的釋放潛能鋪就一條寬廣的道路,共同書寫AI智能時代的輝煌篇章。

關于我們

AI網(wǎng)絡全棧式互聯(lián)架構產(chǎn)品及解決方案提供商

奇異摩爾,成立于2021年初,是一家行業(yè)領先的AI網(wǎng)絡全棧式互聯(lián)產(chǎn)品及解決方案提供商。公司依托于先進的高性能RDMA 和Chiplet技術,創(chuàng)新性地構建了統(tǒng)一互聯(lián)架構——Kiwi Fabric,專為超大規(guī)模AI計算平臺量身打造,以滿足其對高性能互聯(lián)的嚴苛需求。

我們的產(chǎn)品線豐富而全面,涵蓋了面向不同層次互聯(lián)需求的關鍵產(chǎn)品,如面向北向Scale out網(wǎng)絡的AI原生智能網(wǎng)卡、面向南向Scale up網(wǎng)絡的GPU片間互聯(lián)芯粒、以及面向芯片內(nèi)算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等。這些產(chǎn)品共同構成了全鏈路互聯(lián)解決方案,為AI計算提供了堅實的支撐。

奇異摩爾的核心團隊匯聚了來自全球半導體行業(yè)巨頭如NXP、Intel、Broadcom等公司的精英,他們憑借豐富的AI互聯(lián)產(chǎn)品研發(fā)和管理經(jīng)驗,致力于推動技術創(chuàng)新和業(yè)務發(fā)展。團隊擁有超過50個高性能網(wǎng)絡及Chiplet量產(chǎn)項目的經(jīng)驗,為公司的產(chǎn)品和服務提供了強有力的技術保障。我們的使命是支持一個更具創(chuàng)造力的芯世界,愿景是讓計算變得簡單。奇異摩爾以創(chuàng)新為驅(qū)動力,技術探索新場景,生態(tài)構建新的半導體格局,為高性能AI計算奠定穩(wěn)固的基石。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249581
  • IC技術
    +關注

    關注

    0

    文章

    9

    瀏覽量

    2371
  • AI芯片
    +關注

    關注

    17

    文章

    1983

    瀏覽量

    35916
  • 大模型
    +關注

    關注

    2

    文章

    3146

    瀏覽量

    4074

原文標題:芯粒案例解讀 | 3.5D IC技術構建下一代大模型訓練集群有效算力

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Chiplet技術在消費電子領域的應用前景

    探討Chiplet技術如何為智能手機、平板電腦等消費電子產(chǎn)品帶來更優(yōu)的性能和能效比。
    的頭像 發(fā)表于 04-09 15:48 ?356次閱讀
    <b class='flag-5'>Chiplet</b><b class='flag-5'>技術</b>在消費電子領域的應用前景

    先進封裝技術:3.5D封裝、AMD、AI訓練降本

    受限,而芯片級架構通過將SoC分解為多個小芯片(chiplets),利用先進封裝技術實現(xiàn)高性能和低成本。 芯片級架構通過將傳統(tǒng)單片系統(tǒng)芯片(SoC)分解為多個小芯片(chiplets),利用先進封裝技術實現(xiàn)高性能和低成本。 3.5D
    的頭像 發(fā)表于 02-14 16:42 ?774次閱讀
    先進封裝<b class='flag-5'>技術</b>:<b class='flag-5'>3.5D</b>封裝、AMD、AI訓練降本

    2.5D集成電路的Chiplet布局設計

    隨著摩爾定律接近物理極限,半導體產(chǎn)業(yè)正在向2.5D和3D集成電路等新型技術方向發(fā)展。在2.5D集成技術中,多個
    的頭像 發(fā)表于 02-12 16:00 ?1290次閱讀
    2.5<b class='flag-5'>D</b>集成電路的<b class='flag-5'>Chiplet</b>布局設計

    解鎖Chiplet潛力:封裝技術是關鍵

    如今,算力極限挑戰(zhàn)正推動著芯片設計的技術邊界。Chiplet的誕生不僅僅是技術的迭代,更是對未來芯片架構的革命性改變。然而,要真正解鎖Chiplet
    的頭像 發(fā)表于 01-05 10:18 ?989次閱讀
    解鎖<b class='flag-5'>Chiplet</b>潛力:封裝<b class='flag-5'>技術</b>是關鍵

    3.5D封裝來了(上)

    當前,半導體行業(yè)正在將 3.5D 作為先進封裝的下一個最佳選擇,這是一種混合方法,包括堆疊邏輯芯片并將它們分別粘合到其他組件共享的基板上。 這種封裝模型既滿足了大幅提升性能的需求,又避開了異構集成
    的頭像 發(fā)表于 12-31 11:41 ?633次閱讀
    <b class='flag-5'>3.5D</b>封裝來了(上)

    3.5D封裝來了(下)

    即使采用所有最新技術并采用 3.5D 封裝,控制熱量仍然是一項挑戰(zhàn),但將熱效應與其他組件隔離的能力是當今可用的最佳選擇,并且可能在未來很長一段時間內(nèi)都是如此。不過,還有其他問題需要解決。即使是
    的頭像 發(fā)表于 12-31 11:37 ?559次閱讀
    <b class='flag-5'>3.5D</b>封裝來了(下)

    一顆芯片面積頂4顆H200,博通推出3.5D XDSiP封裝平臺

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)博通最近推出了3.5D XDSiP的芯片封裝平臺技術,面向下一代高性能AI、HPC應用的定制XPU和ASIC。3.5D XDSiP的最大亮點,在于可以將超過6000
    的頭像 發(fā)表于 12-10 09:15 ?2792次閱讀
    一顆芯片面積頂4顆H200,博通推出<b class='flag-5'>3.5D</b> XDSiP封裝平臺

    高帶寬Chiplet互連的技術、挑戰(zhàn)與解決方案

    需求,業(yè)界采用了基于Chiplet的設計方法,將較大系統(tǒng)分解為更小、更易于管理的組件,這些組件可以分別制造并通過先進封裝技術進行集成[1]。 先進封裝技術 先進封裝技術可以大致分為2
    的頭像 發(fā)表于 12-06 09:14 ?985次閱讀
    高帶寬<b class='flag-5'>Chiplet</b>互連的<b class='flag-5'>技術</b>、挑戰(zhàn)與解決方案

    Chiplet技術有哪些優(yōu)勢

    Chiplet技術,就像用樂高積木拼搭玩具一樣,將芯片的不同功能模塊,例如CPU、GPU、內(nèi)存等,分別制造成獨立的小芯片。
    的頭像 發(fā)表于 11-27 15:53 ?1112次閱讀

    一文理解2.5D和3D封裝技術

    隨著半導體行業(yè)的快速發(fā)展,先進封裝技術成為了提升芯片性能和功能密度的關鍵。近年來,作為2.5D和3D封裝技術之間的一種結(jié)合方案,3.5D封裝
    的頭像 發(fā)表于 11-11 11:21 ?3538次閱讀
    一文理解2.5<b class='flag-5'>D</b>和3<b class='flag-5'>D</b>封裝<b class='flag-5'>技術</b>

    最新Chiplet互聯(lián)案例解析 UCIe 2.0最新標準解讀

    單個芯片性能提升的有效途徑?? ? 隨著半導體制程不斷逼近物理極限,越來越多的芯片廠商為了提升芯片性能和效率開始使用Chiplet技術,將多個滿足特定功能的芯粒單元通過Die-to-Die互聯(lián)技術
    的頭像 發(fā)表于 11-05 11:39 ?2230次閱讀
    最新<b class='flag-5'>Chiplet</b>互聯(lián)案例解析 UCIe 2.0最新標準<b class='flag-5'>解讀</b>

    什么是3.5D封裝?它有哪些優(yōu)勢?

    半導體行業(yè)不斷發(fā)展,不斷推動芯片設計和制造的邊界。隨著逐漸接近傳統(tǒng)平面縮放的極限,先進封裝技術正成為持續(xù)提升性能的關鍵推動力。在這些技術中,3.5D封裝作為當前2.5D解決方案和完全3
    的頭像 發(fā)表于 10-28 09:47 ?1187次閱讀
    什么是<b class='flag-5'>3.5D</b>封裝?它有哪些優(yōu)勢?

    IMEC組建汽車Chiplet聯(lián)盟

    來源:芝能智芯 微電子研究中心imec宣布了一項旨在推動汽車領域Chiplet技術發(fā)展的新計劃。 這項名為汽車Chiplet計劃(ACP)的倡議,吸引了包括Arm、ASE、寶馬、博世、Cadence
    的頭像 發(fā)表于 10-15 13:36 ?657次閱讀
    IMEC組建汽車<b class='flag-5'>Chiplet</b>聯(lián)盟

    Primemas選擇Achronix eFPGA技術用于Chiplet平臺

    高性能 FPGA 和嵌入式FPGA (eFPGA) IP 的領導者 Achronix Semiconductor Corporation 和使用Chiplet 技術開發(fā)創(chuàng)新 SoC Hub
    的頭像 發(fā)表于 09-18 16:16 ?956次閱讀

    國產(chǎn)半導體新希望:Chiplet技術助力“彎道超車”!

    在半導體行業(yè),技術的每一次革新都意味著競爭格局的重新洗牌。隨著摩爾定律逐漸逼近物理極限,傳統(tǒng)芯片制造工藝面臨著前所未有的挑戰(zhàn)。在這一背景下,Chiplet(小芯片或芯粒)技術應運而生,為國產(chǎn)半導體
    的頭像 發(fā)表于 08-28 10:59 ?1273次閱讀
    國產(chǎn)半導體新希望:<b class='flag-5'>Chiplet</b><b class='flag-5'>技術</b>助力“彎道超車”!