一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌TPU3.0的四大亮點

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-14 08:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google在I/O大會上發(fā)布了TPU3,雖然目前詳細信息不多,但下面幾點還是值得討論:8倍性能;快速迭代;云服務和Benchmark。TPU3到底哪里厲害?

8倍性能

今天的新聞中我們都可以看到如下描述“Google CEO Sundar Pichai said the new TPU is eight times more powerful than last year per pod, with up to 100 petaflops in performance.”也就是說一個TPU3 pod的總處理能力100 PFLOPS是TPU2 pod的8倍。

從下圖我們可以看一下TPU3 pod和TPU2 pod的對比。

TPU2的一個pod包括4個rack,兩個CPU rack(左右兩邊),兩個TPU rack(中間兩個)。每個rack有32個computing unit (板卡),每個TPU板卡有4顆TPU芯片。因此一個pod總共有64 x 4顆TPU2芯片。每顆TPU2芯片的處理能力是45TFLOPS,因此一個pod總的處理能力是45 x 4 x 64 = 11.5 PFLOPS.

對比來看,TPU3的板卡仍然包括4顆芯片。但目測TPU3 pod的rack數(shù)量和板卡的密度(這個看的不是很清楚)和TPU2相比都增加了一倍。因此,一個pod中的TPU3芯片的數(shù)量應該是之前4倍。如果pod的總處理能力是TPU2的8倍,那么TPU3單芯片的處理能力則為TPU2的2倍。

根據(jù)Google的說法,這次他們第一次在Data center采用水冷的散熱方式,這可能和芯片功耗以及板卡密度增加有關系。

Google also said this is the first time the company has had to include liquidcooling in its data centers, CEO Sundar Pichai said.

總得來說,如上圖所描述(來自Google I/O大會的talk:Effective Machine Learning with Google TPU,可以在YouTube上搜索Google io 18 stage 8觀看),TPU3實現(xiàn)的超過100 PFLOPS的處理能力是來自“新的芯片架構(gòu)和大規(guī)模系統(tǒng)”。

快速迭代

從去年I/O大會發(fā)布TPU2到今天不過一年時間,Google的芯片迭代速度還是非常驚人的?!盀槭裁碐oogle能夠?qū)崿F(xiàn)這樣的快速迭代?”這也是一個非常值得探討的話題。

我先簡單談幾點個人看法:

第一,TPU是一個Domain-specific Architecture(參考當我們設計一個專用處理器的時候我們在干什么?(上)),定位準確,架構(gòu)簡單,容易擴展。相比之下,傳統(tǒng)的通用處理器必須考慮靈活性和兼容性,有太重的包袱。當然,TPU這種特點也決定它只能用于有限的應用場景,可能只有Google的體量以及云服務能夠所提供的應用需求才能充分利用TPU這種專用芯片,這一點是得天獨厚的。這也是目前幾乎所有科技巨頭都開始自研芯片的一個基本考量。而傳統(tǒng)的芯片廠商在這一點上就有些尷尬了。

第二,Google的軟件和系統(tǒng)能力超強,TPU以Cloud service出現(xiàn),提高給客戶的是整體服務。芯片硬件可做的tradeoff空間比較大,芯片本身的弱點可以在系統(tǒng)層面彌補。從目前得到的信息分析的,TPU3的處理能力是TPU2的8倍,其中芯片換代的貢獻只有2倍,大部分改進在系統(tǒng)層面。另一方面,目前芯片開發(fā)離不開相關軟件工具,Google的軟件能力和生態(tài)也是其能夠?qū)崿F(xiàn)芯片快速迭代的一個重要因素。

第三,錢很重要。Google不差錢,在芯片實現(xiàn)上可以通過花錢換取時間。

總得來說,Google TPU的意義可能遠遠超過芯片本身。它背后的芯片設計邏輯,實現(xiàn)方法,應用模式和生態(tài)環(huán)境,相較傳統(tǒng)芯片開發(fā)有很大區(qū)別,也許會成為趨勢。

云服務和Benchmark

Google在發(fā)布TPU3的時候同時提到了新的云服務,在之前的Cloud TPU基礎上,今年晚些時候還會發(fā)布Cloud TPU pod(不知道誰能用的起?),可以看出TPU對于Goolge的云端戰(zhàn)略的重要意義。

有意思的是,在Google的talk中強調(diào)了cost的問題,每個例子都給出了相應的training cost,畫風是這樣的。

這里頗有廣告的感覺,不禁讓人想起黃教主的”The more GPUs you buy, The more money you save“。結(jié)合最近Microsoft對Brainwave項目的宣傳,感覺云端機器學習的價格戰(zhàn)馬上就要開始了。

另外,Google也強調(diào)了Benchmark的重要性,還專門展示了他們最近力推的MLPerf。

最近不同平臺之間的對比很多,有比性能的,也有拼成本的。相信隨著越來越多的廠商加入,刷榜應該會非常熱鬧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108200
  • TPU
    TPU
    +關注

    關注

    0

    文章

    154

    瀏覽量

    21214

原文標題:谷歌TPU 3.0到底厲害在哪里?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于碳納米材料的TPU導電長絲制備與性能研究

    、金屬材料與復合材料等各領域的研究開發(fā)、工藝優(yōu)化與質(zhì)量監(jiān)控.基于碳納米材料的TPU導電長絲制備與性能研究【江南大學趙樹強】基于碳納米材料的TPU導電長絲制備與性能研究上海
    的頭像 發(fā)表于 07-11 10:21 ?116次閱讀
    基于碳納米材料的<b class='flag-5'>TPU</b>導電長絲制備與性能研究

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了 NVIDIA BlueField DPU 和 ConnectX SuperNIC 的功能,從而實現(xiàn)了前所未有的 AI 平臺可擴展性和性能。
    的頭像 發(fā)表于 07-04 14:27 ?351次閱讀
    NVIDIA DOCA <b class='flag-5'>3.0</b>版本的<b class='flag-5'>亮點</b>解析

    四大核心要素驅(qū)動汽車智能化創(chuàng)新與相關芯片競爭格局

    當下,功能安全、高效高靈活性的算力、產(chǎn)品生命周期,以及軟件生態(tài)兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創(chuàng)新力和市場競爭力的核心標準。
    的頭像 發(fā)表于 07-01 14:49 ?207次閱讀

    0.1-3.0 GHz 位數(shù)字衰減器 (1 dB LSB) skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()0.1-3.0 GHz 位數(shù)字衰減器 (1 dB LSB)相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有0.1-3.0 GHz 位數(shù)字衰減器 (1 dB LSB)的引腳圖、接
    發(fā)表于 05-26 18:29
    0.1-<b class='flag-5'>3.0</b> GHz <b class='flag-5'>四</b>位數(shù)字衰減器 (1 dB LSB) skyworksinc

    英飛凌碳化硅產(chǎn)品創(chuàng)新的四大支柱綜述(二)

    本文是作者2024年“第十八屆中國半導體行業(yè)協(xié)會半導體分立器件年會”演講稿第二部分,第一部分請見《英飛凌碳化硅SiC技術創(chuàng)新的四大支柱綜述(一)》。英飛凌SiC技術創(chuàng)新到豐富產(chǎn)品的四大支柱SiC
    的頭像 發(fā)表于 05-19 17:32 ?252次閱讀
    英飛凌碳化硅產(chǎn)品創(chuàng)新的<b class='flag-5'>四大</b>支柱綜述(二)

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學習應用設計的硬件加速器。它的開發(fā)源于對人工智能(AI)和機器學習應用的需求,尤其是深度學習中的神經(jīng)網(wǎng)絡計算。
    的頭像 發(fā)表于 04-22 09:41 ?1500次閱讀
    <b class='flag-5'>TPU</b>處理器的特性和工作原理

    Google推出第七代TPU芯片Ironwood

    在 Google Cloud Next 25 大會上,我們隆重推出第 7 代 Tensor Processing Unit (TPU) — Ironwood。這不僅是我們迄今為止性能最高、擴展性最佳的定制 AI 加速器,更是第一款專為推理而設計的 TPU。
    的頭像 發(fā)表于 04-16 11:20 ?609次閱讀
    Google推出第七代<b class='flag-5'>TPU</b>芯片Ironwood

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設計。這款功能強大的 AI 加速器旨在處理
    的頭像 發(fā)表于 04-12 11:10 ?1852次閱讀
    <b class='flag-5'>谷歌</b>第七代<b class='flag-5'>TPU</b> Ironwood深度解讀:AI推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設計的 TPU 芯片,能夠有力支持大規(guī)模思考
    的頭像 發(fā)表于 04-12 00:57 ?2463次閱讀

    TPU編程競賽系列|第九屆集創(chuàng)賽“算能杯”火熱報名中!

    第九屆全國大學生集成電路創(chuàng)新創(chuàng)業(yè)大賽(以下簡稱“集創(chuàng)賽”)正式開始報名。算能在處理器應用方向特別設立了“TPU賦能的邊緣計算架構(gòu)優(yōu)化與創(chuàng)新應用設計”賽題,誠邀各校參賽隊伍充分發(fā)揮TPU的算力優(yōu)勢
    的頭像 發(fā)表于 02-06 13:41 ?1177次閱讀
    <b class='flag-5'>TPU</b>編程競賽系列|第九屆集創(chuàng)賽“算能杯”火熱報名中!

    光纜用tpu外護套用在哪些型號光纜上

    光纜用TPU(熱塑性聚氨酯)外護套因其耐磨、抗拉、柔性好以及優(yōu)良的防潮和阻燃性能,被廣泛應用于多種型號的光纜上,特別是需要較高機械保護和惡劣環(huán)境適應性的光纜。以下是一些可能使用TPU外護套的光纜
    的頭像 發(fā)表于 01-10 10:05 ?778次閱讀

    賽逸展2025響應四大行業(yè)協(xié)會倡議,審慎采購美國芯片!

    ,中國互聯(lián)網(wǎng)協(xié)會、中國汽車工業(yè)協(xié)會、中國半導體行業(yè)協(xié)會、中國通信企業(yè)協(xié)會發(fā)表聲明,呼吁國內(nèi)企業(yè)審慎選擇采購美國芯片。賽逸展堅定不移地與中國四大行業(yè)協(xié)會站在一起,迅速加入四大協(xié)會陣營,全力支持四大協(xié)會的倡議。 賽逸展以實際行動展現(xiàn)
    的頭像 發(fā)表于 12-05 09:56 ?399次閱讀

    UVLED固化機結(jié)構(gòu)的四大模塊

    UVLED固化機作為一種高效、節(jié)能的固化設備,在多個行業(yè)中發(fā)揮著重要作用。其結(jié)構(gòu)設計的合理性直接決定了設備的性能和使用效果。UVLED固化機的四大模塊主要包括光源系統(tǒng)、控制系統(tǒng)、散熱系統(tǒng)和傳送系統(tǒng)
    的頭像 發(fā)表于 11-25 16:10 ?882次閱讀
    UVLED固化機結(jié)構(gòu)的<b class='flag-5'>四大</b>模塊

    探秘四大主流芯片架構(gòu):誰將主宰未來科技?

    在科技日新月異的今天,芯片作為現(xiàn)代電子設備的心臟,其架構(gòu)的選擇與設計顯得尤為重要。目前市場上主流的芯片架構(gòu)有種:X86、ARM、RISC-V和MIPS。它們各具特色,廣泛應用于各種電子設備中。本文將詳細剖析這四大主流芯片架構(gòu)的特點、優(yōu)勢及應用領域。
    的頭像 發(fā)表于 07-31 11:15 ?4911次閱讀
    探秘<b class='flag-5'>四大</b>主流芯片架構(gòu):誰將主宰未來科技?

    TPU v1到Trillium TPU,蘋果等科技公司使用谷歌TPU進行AI計算

    ,在訓練尖端人工智能方面,大型科技公司正在尋找英偉達以外的替代品。 ? 不斷迭代的谷歌TPU 芯片 ? 隨著機器學習算法,特別是深度學習算法在各個領域的廣泛應用,對于高效、低功耗的AI計算硬件需求日益增長。傳統(tǒng)的CPU和GPU在處理這些算法時存在效率較低的問
    的頭像 發(fā)表于 07-31 01:08 ?3968次閱讀