一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-04-12 00:57 ? 次閱讀

電子發(fā)燒友網報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據悉,該芯片預計于今年晚些時候面向 Google Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。


在核心亮點層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設計的 TPU 芯片,能夠有力支持大規(guī)模思考與推理 AI 模型。谷歌方面表示,它代表著 AI 發(fā)展從 “響應式” 向 “主動式” 的范式轉變,未來 AI 代理將能夠主動檢索并生成數據,進而提供深度見解,而非僅僅輸出原始數據。

在性能與能效表現上,Ironwood 取得了重大突破。其每瓦性能達到上一代 TPU Trillium 的兩倍,能效近乎首款云 TPU 的 30 倍。單芯片配備 192GB 高帶寬內存(HBM),容量為 Trillium 的 6 倍;HBM 帶寬高達 7.2TB/s,是 Trillium 的 4.5 倍。芯片間互連(ICI)帶寬提升至 1.2TB/s,為 Trillium 的 1.5 倍,這一提升有力地支持了大規(guī)模分布式訓練與推理任務。

此外,Ironwood 還是谷歌首款支持 FP8 浮點格式的 TPU 芯片。在此之前,TPU 僅支持 INT8(用于推理)和 BF16(用于訓練)。采用 FP8 計算可使 AI 訓練吞吐量翻倍,性能相較于 BF16 提升 10 倍。

Ironwood 還配備了增強版 SparseCore 專用加速器,可用于處理高級排名和推薦任務中常見的超大嵌入。憑借這一增強版 SparseCore,其能夠加速更多領域的任務,應用范圍從傳統(tǒng)的 AI 任務拓展至金融和科學等領域。

在系統(tǒng)架構與擴展性方面,Ironwood 可擴展至 9216 個液冷芯片,借助突破性的 ICI 網絡進行連接,功率接近 10 兆瓦。它提供 256 芯片和 9216 芯片兩種 Pod 配置,其中 9216 芯片的 Pod 配置整體 AI 算力可達 42.5 Exaflops。谷歌先進的液冷解決方案能夠確保芯片在持續(xù)繁重的 AI 工作負載下依然保持高性能。

谷歌的 TPU 作為專為機器學習設計的定制化加速芯片,自 2015 年首次亮相以來,已成為 AI 硬件領域的重要力量。TPU 主要應用于訓練和推理大規(guī)模 AI 模型(如 AlphaGo、PaLM、Gemini 等),并深度融入 Google Cloud 以及谷歌內部 AI 服務之中。

截至目前,TPU 已歷經多次版本迭代:TPU v1 支持 INT8 精度,主要用于谷歌內部項目(如 AlphaGo、RankBrain);TPU v2/v3 面向訓練與推理場景,支持浮點運算,v3 進一步增加了內存和互連帶寬;TPU v4 的算力達到 TPU v3 的 2.7 倍,采用液冷技術,支持 4096 芯片互聯的 Pod 集群,適用于超大規(guī)模模型(如 PaLM)。

由此可見,谷歌 TPU 憑借其專用化設計、高能效比以及與 TensorFlow 的深度集成等優(yōu)勢,成為大規(guī)模 AI 模型訓練與推理的核心硬件支撐。如今,Ironwood 的推出不僅將進一步鞏固谷歌在 AI 硬件領域的領先地位,也勢必為生成式 AI 的下一階段發(fā)展提供強大的計算動力。?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6219

    瀏覽量

    107146
  • TPU
    TPU
    +關注

    關注

    0

    文章

    151

    瀏覽量

    21013
收藏 人收藏

    評論

    相關推薦

    Google推出第七TPU芯片Ironwood

    在 Google Cloud Next 25 大會上,我們隆重推出第 7 Tensor Processing Unit (TPU) — Ironwood。這不僅是我們迄今為止性能最高、擴展性最佳的定制
    的頭像 發(fā)表于 04-16 11:20 ?324次閱讀
    Google推出第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b><b class='flag-5'>芯片</b><b class='flag-5'>Ironwood</b>

    谷歌第七TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了
    的頭像 發(fā)表于 04-12 11:10 ?1275次閱讀
    <b class='flag-5'>谷歌</b>第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b> <b class='flag-5'>Ironwood</b>深度解讀:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>時代的硬件革命

    適用于數據中心和AI時代的800G網絡

    ,成為新一代AI數據中心的核心驅動力。 AI時代的兩大數據中心:AI工廠與AIAI時代
    發(fā)表于 03-25 17:35

    讓大模型訓練更高效,奇異摩爾用互聯創(chuàng)新方案定義下一代AI計算

    ? 電子發(fā)燒友網報道(文/吳子鵬)近段時間以來,DeepSeek現象級爆火引發(fā)產業(yè)對大規(guī)模數據中心建設的思考和爭議。在訓練端,DeepSeek以開源模型通過算法優(yōu)化(如稀疏計算、動態(tài)
    的頭像 發(fā)表于 02-18 09:19 ?972次閱讀
    讓大<b class='flag-5'>模型</b>訓練更高效,奇異摩爾用互聯創(chuàng)新方案定義下<b class='flag-5'>一代</b><b class='flag-5'>AI</b>計算

    OpenAI發(fā)布新一代推理模型o3及o3-mini

    近日,OpenAI在為期12天的發(fā)布會上宣布了新一代推理模型o3及其精簡版o3-mini。這兩款模型被專門設計用于在回答問題之前進行更深入的思考,以期提高答案的準確性。 據悉,o3
    的頭像 發(fā)表于 12-24 09:29 ?724次閱讀

    英偉達新一代AI芯片過熱問題引關注

    近日,英偉達新一代Blackwell AI芯片遭遇過熱問題,這消息引發(fā)了業(yè)界的廣泛關注。據悉,搭載該芯片的服務器在運行過程中存在過熱現象,
    的頭像 發(fā)表于 11-19 16:15 ?508次閱讀

    【「大模型時代的基礎架構」閱讀體驗】+ 第、二章學習感受

    ,回憶感瞬間拉滿,魂斗羅、赤色要塞、綠色兵團……,還有兒時玩游戲都能“起飛”的小伙伴! 第章最后介紹了算法的新一代引擎Google TPU,它在計算流程方面,也與CPU、GPU有較大
    發(fā)表于 10-10 10:36

    聯發(fā)科新一代天璣旗艦芯片針對谷歌大語言模型Gemini Nano優(yōu)化

    近日,聯發(fā)科宣布了個重要的技術進展——新一代天璣旗艦芯片已經針對谷歌的大語言模型Gemini Nano進行了深度優(yōu)化。
    的頭像 發(fā)表于 10-09 16:44 ?686次閱讀

    谷歌發(fā)布革命性AI游戲引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驅動的游戲引擎——GameNGen,這創(chuàng)新技術標志著游戲開發(fā)領域的新紀元。GameNGen憑借其強大的計算能力,能夠在單個TPU上實現每秒20幀
    的頭像 發(fā)表于 08-29 18:07 ?1033次閱讀

    TPU v1到Trillium TPU,蘋果等科技公司使用谷歌TPU進行AI計算

    電子發(fā)燒友網報道(文/李彎彎)7月30日消息,蘋果公司周篇技術論文中表示,支撐其人工智能系統(tǒng)Apple Intelligence的兩個人工智能模型是在谷歌設計的云端
    的頭像 發(fā)表于 07-31 01:08 ?3685次閱讀

    螞蟻數科發(fā)布新一代融合AI風控引擎“AIR Engine”

    在數字化浪潮的推動下,金融科技領域的風控技術正迎來新的突破。近日,螞蟻數科旗下的蟻盾風控團隊正式發(fā)布了新一代融合AI風控引擎——“AIR Engine(AIFUSERiskEngine)”,該
    的頭像 發(fā)表于 06-26 18:20 ?1620次閱讀

    谷歌發(fā)布新一代TPU芯片,欲挑戰(zhàn)OpenAI,挑戰(zhàn)語音助手市場

    當日,谷歌在年度I/O開發(fā)者大會上展示了系列人工智能產品,包括新增的旗艦級Gemini AI模型Gemini 1.5 Flash以及AI
    的頭像 發(fā)表于 05-17 09:36 ?584次閱讀

    谷歌發(fā)布第六TPU芯片Trillium,挑戰(zhàn)GPT-4o

    分析人士認為,谷歌積極推進自主研發(fā)芯片,按照其規(guī)劃,第七和第八產品將分別與聯發(fā)科、世芯合作生產。此次第六
    的頭像 發(fā)表于 05-16 18:05 ?1767次閱讀

    谷歌將推出第六數據中心AI芯片Trillium TPU

    在今日舉行的I/O 2024開發(fā)者大會上,谷歌公司震撼發(fā)布了其第六數據中心AI芯片——Trillium Tensor處理器單元(TPU)。
    的頭像 發(fā)表于 05-15 11:18 ?814次閱讀

    步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    性能,加速模型的訓練和推理過程。 2. 生成式 AI 解決方案 與英偉達 Grace CPU、新一代網絡芯片等產品
    發(fā)表于 05-13 17:16