一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

史上最大芯片出爐,專為AI設(shè)計(jì)

lviY_AI_shequ ? 2019-08-29 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

面積42225 平方毫米,擁有1.2 萬(wàn)億個(gè)晶體管,400000 個(gè)核心,片上內(nèi)存18 Gigabytes,內(nèi)存帶寬19 PByte/s,fabric帶寬100 Pbit/s。這就是有史以來(lái)最大的芯片——Cerebras Wafer Scale Engine!

這顆巨型芯片由Cerebras Systems公司推出,芯片發(fā)布后,三位中國(guó)芯片領(lǐng)域?qū)<以谂笥讶α⒓醋龀鲈u(píng)價(jià):

芯片專家唐杉:“膜拜一下Cerebras的巨型芯片,每邊大約9英寸,22cm。我記得我之前寫(xiě)文章還畫(huà)過(guò)一個(gè)類似的對(duì)比圖。[機(jī)智]Wired的文章,看來(lái)Cerebras要走到前臺(tái)了?!?/p>

深鑒科技聯(lián)合創(chuàng)始人姚頌:“Cerebras的Wafer-scale chip確實(shí)壯觀,有一種獨(dú)特的美感,就好像看到大炮巨艦的那種壯麗之情。希望Andrew Feldman一切順利。”

獵戶星空首席戰(zhàn)略官王兵:“一萬(wàn)兩千億晶體管的巨大芯片,300mm wafer能做出的最大芯片,挑戰(zhàn)芯片行業(yè)極限之作。如果能成功必然會(huì)顛覆整個(gè)AI芯片行業(yè)。不過(guò)即便是用了多種錯(cuò)誤冗余技術(shù),量產(chǎn)良品率還將會(huì)是個(gè)巨大的挑戰(zhàn)。”

Cerebras Wafer Scale Engine擁有1.2萬(wàn)億個(gè)晶體管。1971年英特爾首款4004處理器的晶體管數(shù)量為2,300個(gè),最近的AMD處理器擁有320億個(gè)晶體管。

大多數(shù)芯片實(shí)際上是在12英寸硅晶片上創(chuàng)建的芯片集合,并在芯片工廠中批量生產(chǎn)。但Cerebras Systems芯片是在單個(gè)晶圓上互連的單芯片。這些互連設(shè)計(jì)使這些芯片全部保持高速運(yùn)行狀態(tài),萬(wàn)億個(gè)晶體管可以全部一起工作。

通過(guò)這種方式,Cerebras Wafer Scale Engine成為有史以來(lái)最大的處理器,它專門(mén)設(shè)計(jì)用于處理AI應(yīng)用問(wèn)題。該公司在本周在斯坦福大學(xué)舉行的Hot Chips會(huì)議上討論這款“世界最大”的芯片的設(shè)計(jì)。

此前,三星實(shí)際上已制造出了一個(gè)閃存芯片eUFS,擁有2萬(wàn)億個(gè)晶體管。但Cerebras芯片專為流程加工而設(shè)計(jì),擁有400,000個(gè)核心,芯片面積42,225平方毫米。它比最大的Nvidia GPU大56.7倍,后者尺寸為815平方毫米,含211億個(gè)晶體管。

史上最大芯片跟棒球的對(duì)比

WSE還包含3,000倍的高速片上存儲(chǔ)器,并且具有10,000倍的存儲(chǔ)器帶寬。

該芯片來(lái)自Andrew Feldman領(lǐng)導(dǎo)的團(tuán)隊(duì),后者曾創(chuàng)建微型服務(wù)器公司SeaMicro,并以3.34億美元的價(jià)格賣(mài)給了AMD。Cerebras Systems的聯(lián)合創(chuàng)始人兼首席硬件架構(gòu)師Sean Lie將將在Hot Chips大會(huì)上展示Cerebras Wafer Scale Engine。這家位于加州Los Altos的公司擁有194名員工。

Cerebras CEOFieldman與SeaMicro box最初版本合影

芯片尺寸在AI任務(wù)中非常重要,因?yàn)榇蟪叽缧酒梢愿斓靥幚硇畔?,在更短的時(shí)間內(nèi)給出答案。這能夠減少“訓(xùn)練時(shí)間”,使研究人員能夠測(cè)試更多想法,使用更多數(shù)據(jù)并解決新問(wèn)題。谷歌、Facebook、OpenAI、騰訊、百度和許多企業(yè)都認(rèn)為,今天制約AI發(fā)展的基本限制是訓(xùn)練模型需要的時(shí)間太長(zhǎng)。因此,縮短訓(xùn)練時(shí)間有望消除整個(gè)行業(yè)取得進(jìn)步的主要瓶頸。

當(dāng)然,芯片制造商通常不會(huì)制造這么大的芯片。在單個(gè)晶片的制造過(guò)程中通常會(huì)出現(xiàn)一些雜質(zhì)。如果一種雜質(zhì)會(huì)導(dǎo)致一塊芯片發(fā)生故障,那么晶圓上的多種雜質(zhì)就會(huì)導(dǎo)致多塊芯片出問(wèn)題。實(shí)際制造出的芯片產(chǎn)量?jī)H占實(shí)際工作芯片的一小部分。如果晶圓上只有一個(gè)芯片,它有雜質(zhì)的幾率是100%,雜質(zhì)會(huì)使芯片失效。但Cerebras設(shè)計(jì)的芯片留有冗余,一種雜質(zhì)不會(huì)導(dǎo)致整個(gè)芯片都不能用。

單晶圓提供超級(jí)計(jì)算機(jī)級(jí)的計(jì)算能力

“Cerebras WSE”專為人工智能設(shè)計(jì)而設(shè)計(jì),其中包含了不少基礎(chǔ)創(chuàng)新,解決了限制芯片尺寸的長(zhǎng)達(dá)數(shù)十年的技術(shù)挑戰(zhàn) - 如良品率,功率傳送、封裝等,推動(dòng)了最先進(jìn)技術(shù)的發(fā)展。和包裝,每個(gè)架構(gòu)決策都是為了優(yōu)化AI工作的性能。結(jié)果是,Cerebras WSE根據(jù)工作量提供了數(shù)百或數(shù)千倍的現(xiàn)有解決方案的性能,只需很小的功耗和空間?!盋erebras Systems首席執(zhí)行官的Fieldman說(shuō)。

通過(guò)加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的所有元素來(lái)實(shí)現(xiàn)這些性能提升。神經(jīng)網(wǎng)絡(luò)是一種多級(jí)計(jì)算反饋回路。輸入在循環(huán)中移動(dòng)速度越快,循環(huán)學(xué)習(xí)的速度越快,即訓(xùn)練時(shí)間越短。可以通過(guò)加速循環(huán)內(nèi)的計(jì)算和通信來(lái)加速輸入的循環(huán)速度。

Cerebras WSE芯片面積比目前最大的GPU大56.7倍, 并提供更多核心進(jìn)行計(jì)算,有更多核心靠近內(nèi)存,因此內(nèi)核可以高效運(yùn)行。由于這些大量的內(nèi)核和內(nèi)存位于單個(gè)芯片上,因此所有通信都在芯片上進(jìn)行,通信帶寬高、延遲低,因此核心組可以以最高效率進(jìn)行協(xié)作。

Cerebras WSE中的46,225平方毫米的芯片面積上包含40萬(wàn)個(gè)AI優(yōu)化核心,無(wú)緩存、無(wú)開(kāi)銷(xiāo)的計(jì)算內(nèi)核,以及和18千兆字節(jié)的本地化分布式超高速SRAM內(nèi)存。內(nèi)存帶寬為每秒9 PB。這些核心通過(guò)細(xì)粒度、全硬件、片上網(wǎng)狀連接通信網(wǎng)絡(luò)連接在一起,可提供每秒100 petabits的總帶寬。更多核心、更多本地內(nèi)存和低延遲高帶寬結(jié)構(gòu),共同構(gòu)成了面向AI加速任務(wù)的最佳架構(gòu)。

“雖然AI在一般意義上被使用,但沒(méi)有兩個(gè)數(shù)據(jù)集或兩個(gè)AI任務(wù)是相同的。新的AI工作負(fù)載不斷涌現(xiàn),數(shù)據(jù)集也在不斷變大,”Tirias Research首席分析師兼創(chuàng)始人Jim McGregor在一份聲明中表示。

“隨著AI的發(fā)展,芯片和平臺(tái)解決方案也在不斷發(fā)展。Cerebras WSE是半導(dǎo)體和平臺(tái)設(shè)計(jì)方面的一項(xiàng)驚人的工程成就,它在單個(gè)晶圓級(jí)的解決方案中提供了超級(jí)計(jì)算機(jī)級(jí)的計(jì)算能力、高性能內(nèi)存和帶寬。”

Cerebras 表示,如果沒(méi)有多年來(lái)與臺(tái)積電(TSMC)的密切合作,他們不可能取得這個(gè)創(chuàng)紀(jì)錄的成就。臺(tái)積電是全球最大的半導(dǎo)體代工廠,在先進(jìn)工藝技術(shù)方面處于領(lǐng)先地位。WSE芯片由臺(tái)積電采用先進(jìn)的16nm制程技術(shù)制造。

400000個(gè)AI優(yōu)化的內(nèi)核

WSE包含40萬(wàn)個(gè)AI優(yōu)化的計(jì)算內(nèi)核(compute cores)。這種計(jì)算內(nèi)核被稱為稀疏線性代數(shù)核(Sparse Linear Algebra Cores, SLAC),具有靈活性、可編程性,并針對(duì)支持所有神經(jīng)網(wǎng)絡(luò)計(jì)算的稀疏線性代數(shù)進(jìn)行了優(yōu)化。SLAC的可編程性保證了內(nèi)核能夠在不斷變化的機(jī)器學(xué)習(xí)領(lǐng)域運(yùn)行所有的神經(jīng)網(wǎng)絡(luò)算法。

由于稀疏線性代數(shù)內(nèi)核是為神經(jīng)網(wǎng)絡(luò)計(jì)算進(jìn)行優(yōu)化的,因此它們可實(shí)現(xiàn)業(yè)界最佳利用率——通常是GPU的3倍或4倍。此外,WSE核心還包括Cerebras發(fā)明的稀疏捕獲技術(shù),以加速在稀疏工作負(fù)載(包含0的工作負(fù)載)上的計(jì)算性能,比如深度學(xué)習(xí)。

零在深度學(xué)習(xí)計(jì)算中很普遍。通常,要相乘的向量和矩陣中的大多數(shù)元素都是0。然而,乘以0是浪費(fèi)硅,功率和時(shí)間的行為,因?yàn)闆](méi)有新的信息。

因?yàn)镚PU和TPU是密集的執(zhí)行引擎——引擎的設(shè)計(jì)永遠(yuǎn)不會(huì)遇到0——所以它們即使在0時(shí)也會(huì)乘以每一個(gè)元素。當(dāng)50-98%的數(shù)據(jù)為零時(shí),如深度學(xué)習(xí)中經(jīng)常出現(xiàn)的情況一樣,大多數(shù)乘法都被浪費(fèi)了。由于Cerebras的稀疏線性代數(shù)核心永遠(yuǎn)不會(huì)乘以零,所有的零數(shù)據(jù)都被過(guò)濾掉,可以在硬件中跳過(guò),從而可以在其位置上完成有用的工作。

比GPU大3000倍的片上內(nèi)存

內(nèi)存是每一種計(jì)算機(jī)體系結(jié)構(gòu)的關(guān)鍵組成部分??拷?jì)算的內(nèi)存意味著更快的計(jì)算、更低的延遲和更好的數(shù)據(jù)移動(dòng)效率。高性能的深度學(xué)習(xí)需要大量的計(jì)算和頻繁的數(shù)據(jù)訪問(wèn)。這就要求計(jì)算核心和內(nèi)存之間要非常接近,而在GPU中卻不是這樣,GPU中絕大多數(shù)內(nèi)存都很慢,而且離計(jì)算核心很遠(yuǎn)。

Cerebras Wafer Scale Engine包含了比迄今為止任何芯片都要多的內(nèi)核和本地內(nèi)存,并且在一個(gè)時(shí)鐘周期內(nèi)擁有18 GB的片上內(nèi)存。WSE上的核心本地內(nèi)存的集合提供了每秒9 PB的內(nèi)存帶寬——比最好的GPU大3000倍的片上內(nèi)存和10000倍的內(nèi)存帶寬。

低延遲、高帶寬的獨(dú)特通信結(jié)構(gòu)

Swarm通信結(jié)構(gòu)是WSE上使用的處理器間通信結(jié)構(gòu),它以傳統(tǒng)通信技術(shù)功耗的一小部分實(shí)現(xiàn)了帶寬的突破和低延遲。Swarm提供了一個(gè)低延遲、高帶寬的2D網(wǎng)格,它將WSE上的所有400,000個(gè)核連接起來(lái),每秒的帶寬總計(jì)達(dá)100 petabits。

路由、可靠的消息傳遞和同步都在硬件中處理。消息會(huì)自動(dòng)激活每個(gè)到達(dá)消息的應(yīng)用程序處理程序。Swarm為每個(gè)神經(jīng)網(wǎng)絡(luò)提供了一個(gè)獨(dú)特的、優(yōu)化的通信路徑。軟件根據(jù)正在運(yùn)行的特定用戶定義的神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),配置通過(guò)400,000個(gè)核心的最優(yōu)通信路徑,以連接處理器。

典型的消息遍歷一個(gè)具有納秒延遲的硬件鏈接。一個(gè)Cerebras WSE的總帶寬是每秒100 PB。不需要TCP/IP和MPI等通信軟件,因此可以避免性能損失。這種結(jié)構(gòu)的通信能量成本遠(yuǎn)低于遠(yuǎn)低于每比特 1 焦耳,比GPU低了近兩個(gè)數(shù)量級(jí)。結(jié)合了巨大的帶寬和極低的延遲,Swarm通信結(jié)構(gòu)使 Cerebras WSE比任何當(dāng)前可用的解決方案學(xué)習(xí)得更快。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52520

    瀏覽量

    440901
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279881

原文標(biāo)題:史上最大芯片誕生!1.2萬(wàn)億晶體管超級(jí)巨無(wú)霸,專為AI設(shè)計(jì)

文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    iPhone XS創(chuàng)八項(xiàng)紀(jì)錄發(fā)布!最貴、最大、最強(qiáng)AI芯片,雙卡特供中國(guó)

    看點(diǎn):最大屏、最貴、最強(qiáng)AI芯片、首個(gè)雙卡、首款7nm手機(jī)、首個(gè)最大容量?jī)?nèi)存512GB……
    的頭像 發(fā)表于 09-13 09:36 ?6218次閱讀

    AI芯片哪里買(mǎi)?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    2007年10大芯片廠商排名全新出爐

    2007年10大芯片廠商排名全新出爐市場(chǎng)調(diào)研公司Gartner的2007年10大芯片廠商排名和此前iSuppli公布的排名略有不同。在該公司的排名榜中,預(yù)計(jì)英特爾將再度稱雄全球芯片市場(chǎng)
    發(fā)表于 05-26 14:46

    Github發(fā)布史上最大更新

    就在剛剛,Github發(fā)布了史上最大的版本更新。GitHub的平臺(tái)主管薩姆·蘭伯特把這次更新描述為「Github史上最大轉(zhuǎn)變」Github大家都熟悉,前幾個(gè)月剛剛被微軟收購(gòu)了,這一收購(gòu)
    發(fā)表于 10-17 10:03

    AI發(fā)展對(duì)芯片技術(shù)有什么影響?

    現(xiàn)在說(shuō)AI是未來(lái)人類技術(shù)進(jìn)步的一大方向,相信大家都不會(huì)反對(duì)。說(shuō)到AI芯片技術(shù)的關(guān)系,我覺(jué)得主要體現(xiàn)在兩個(gè)方面:第一,AI的發(fā)展要求芯片技術(shù)
    發(fā)表于 08-12 06:38

    云知聲打磨四年的AI芯片出爐

    云知聲打磨四年的AI芯片出爐,中國(guó)造芯勢(shì)力群起
    發(fā)表于 05-05 09:11

    史上規(guī)模最大 252款CPU散熱器排排坐

    史上規(guī)模最大 252款CPU散熱器排排坐 臨近年末,frostytech網(wǎng)站其測(cè)過(guò)的CPU散熱器做了一番總結(jié),散熱器總數(shù)達(dá)到了252款,堪稱史上規(guī)模最大。這252款散熱器按照Inte
    發(fā)表于 12-24 09:02 ?2325次閱讀
    <b class='flag-5'>史上</b>規(guī)模<b class='flag-5'>最大</b> 252款CPU散熱器排排坐

    WAPI終端芯片模塊出爐與WiFi兼容

    WAPI終端芯片模塊出爐與WiFi兼容    近日,WAPI產(chǎn)業(yè)聯(lián)盟及WAPI芯片供應(yīng)商海華科技共同宣布,已推出支持WAPI應(yīng)用的無(wú)線模塊IC
    發(fā)表于 04-25 13:54 ?1822次閱讀

    史上最成功的芯片是什么

    555定時(shí)器,從誕生到現(xiàn)在,銷(xiāo)量過(guò)百億,電路設(shè)計(jì)從沒(méi)有大改變,可以說(shuō)是歷史上最成功的芯片。
    的頭像 發(fā)表于 01-04 13:39 ?6080次閱讀

    賽靈思發(fā)布史上最大容量FPGA芯片VU19P

    在初創(chuàng)企業(yè)Cerebras剛剛推出史上最大芯片(ipad般大,集成1.2萬(wàn)億個(gè)晶體管)WSE不久,F(xiàn)PGA龍頭賽靈思也發(fā)布了史上最大FPG
    發(fā)表于 08-23 14:59 ?3990次閱讀

    華為發(fā)布最外那個(gè)算力AI芯片

    華為史上最強(qiáng)算力AI芯片發(fā)布,開(kāi)源首款國(guó)產(chǎn)全場(chǎng)景AI計(jì)算框架
    的頭像 發(fā)表于 08-23 17:15 ?3541次閱讀

    史上最大芯片將用于這兩個(gè)項(xiàng)目

    今年 8 月,集成 1.2 萬(wàn)億個(gè)晶體管的“史上最大芯片”The Cerebras Wafer Scale Engine(以下簡(jiǎn)稱 WSE)誕生,在 11 月 19 日召開(kāi)
    的頭像 發(fā)表于 11-25 16:09 ?3812次閱讀

    WWDC亮點(diǎn):史上最大MacBook Air 游戲制作人小島秀夫亮相蘋(píng)果春晚

    史上最大的MacBook Air,搭載M2芯片,電池續(xù)航最高可達(dá)18小時(shí),起售價(jià)為1299美元。 15英寸MacBook Air國(guó)行版起售價(jià)為10499元人民幣,6月7日上午9點(diǎn)接受
    的頭像 發(fā)表于 06-07 14:55 ?1176次閱讀
    WWDC亮點(diǎn):<b class='flag-5'>史上</b><b class='flag-5'>最大</b>MacBook Air 游戲制作人小島秀夫亮相蘋(píng)果春晚

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?661次閱讀

    Meta啟動(dòng)史上最大海底電纜項(xiàng)目

    近日,Meta宣布了一項(xiàng)雄心勃勃的計(jì)劃——啟動(dòng)全球史上最大的海底電纜項(xiàng)目Waterworth。該項(xiàng)目預(yù)計(jì)于今年正式動(dòng)工,初步估算成本高達(dá)100億美元。
    的頭像 發(fā)表于 02-18 15:12 ?628次閱讀