一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI初出企業(yè)Cerebras已申請IPO!稱發(fā)布的AI芯片比GPU更適合大模型訓(xùn)練

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-06-26 00:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,據(jù)外媒報道,研發(fā)出世界最大芯片的明星AI芯片獨角獸Cerebras Systems已向證券監(jiān)管機構(gòu)秘密申請IPO。

Cerebras成立于2016年,總部在美國加州,專注于研發(fā)比GPU更適用于訓(xùn)練AI模型的晶圓級芯片,為復(fù)雜的AI應(yīng)用構(gòu)建計算機系統(tǒng),并與阿布扎比科技集團G42等機構(gòu)合作構(gòu)建超級計算機?;谄渥钚缕炫炐酒瑯?gòu)建的服務(wù)器可輕松高效地訓(xùn)練萬億參數(shù)模型。

Cerebras已發(fā)布第三代AI芯片

技術(shù)實力方面,Cerebras公司采用獨特的晶圓級集成技術(shù),將整片晶圓作為一個單獨的芯片來使用,實現(xiàn)了前所未有的集成度和性能。這種技術(shù)使得Cerebras的AI芯片在晶體管數(shù)量、計算能力和內(nèi)存帶寬等方面均達到了業(yè)界領(lǐng)先水平。

Cerebras的AI芯片具有強大的計算能力,能夠支持訓(xùn)練業(yè)界最大的AI模型,包括參數(shù)規(guī)模高達數(shù)十萬億個的模型。這種高性能計算能力使得研究人員能夠更快地測試想法、使用更多數(shù)據(jù)并解決新問題。

Cerebras的AI芯片采用了先進的通信架構(gòu),實現(xiàn)了全局性的低延遲、高帶寬通信。這種通信架構(gòu)使得多個Cerebras芯片之間能夠高效地進行數(shù)據(jù)傳輸和協(xié)作,進一步提升了AI應(yīng)用的性能。

產(chǎn)品方面,Cerebras的核心產(chǎn)品線WSE(Wafer Scale Engine)系列已經(jīng)過更新三代。2019年8月,Cerebras發(fā)布第一顆芯片WSE,WSE作為Cerebras標志性產(chǎn)品,是史上最大的AI芯片之一。其設(shè)計突破了傳統(tǒng)半導(dǎo)體制造的界限,采用了獨特的晶圓級集成(Wafer-Scale Integration, WSI)技術(shù),將整個晶圓作為一個單獨的芯片來使用,這在當時是前所未有的。

這顆芯片采用臺積電16nm制程,在46225mm2面積上集成了40萬個AI核心和1.2萬億顆晶體管。同時,該芯片配備了18GB的片上靜態(tài)隨機存取存儲器(SRAM),這一容量遠大于大多數(shù)芯片的片外存儲(DDR)。帶寬達到100Pb/s(1Pb=1000TB),這一數(shù)值比現(xiàn)有芯片的相關(guān)參數(shù)高出一個單位(3個數(shù)量級)。

2021年,Cerebras推出第二代芯片WSE-2,搭載WSE-2芯片的AI超算系統(tǒng)CS-2也同期發(fā)布。WSE-2在繼承了WSE的晶圓級集成技術(shù)的基礎(chǔ)上,進一步提升了制程工藝和性能,成為當時業(yè)界領(lǐng)先的AI芯片之一。該芯片采用臺積電7nm制程,相較于前代產(chǎn)品WSE的16nm工藝,進一步縮小了晶體管的尺寸,提高了集成度。與WSE相同,WSE-2也采用了整片晶圓作為單一芯片,面積約為462255mm2。晶體管數(shù)量達到了創(chuàng)紀錄的2.6萬億個,相較于WSE的1.2萬億個晶體管,實現(xiàn)了翻倍的增長。

WSE-2集成了85萬個專為AI應(yīng)用優(yōu)化的稀疏線性代數(shù)計算(SLAC)核心,相較于WSE的40萬個核心,有了顯著的提升。片上內(nèi)存提升至40GB,相較于WSE的18GB,增加了近一倍。內(nèi)存帶寬高達20PB/s,相較于WSE的9PB/s,也有了顯著的提升。

今年3月,Cerebras推出了第三代晶圓級芯片WSE-3和AI超級計算機CS-3。WSE-3采用臺積電5nm制程,有90萬個AI核心和4萬億顆晶體管。配備了44GB的片上SRAM緩存,相較于前代產(chǎn)品有了顯著提升。這一大容量片上內(nèi)存能夠支持更大規(guī)模的AI模型訓(xùn)練,無需進行分區(qū)或重構(gòu),大大簡化了訓(xùn)練工作流程。WSE-3的內(nèi)存帶寬高達21PB/s,峰值A(chǔ)I算力高達125 PetaFLOPS,相當于每秒能夠執(zhí)行12.5億億次浮點計算。

Cerebras 的AI芯片被認為更適合大模型訓(xùn)練

Cerebras的芯片被認為比GPU更適合用于大模型訓(xùn)練。其WSE系列芯片具有龐大的規(guī)模和驚人的性能。例如,WSE-3擁有超過4萬億個晶體管和46225mm2的硅片面積,堪稱全球最大的AI芯片。與之相比,傳統(tǒng)GPU的規(guī)模和性能通常較小。Cerebras的芯片能夠在單個設(shè)備上容納和訓(xùn)練比當前熱門模型大得多的下一代前沿模型。

Cerebras的芯片搭載了大量的核心和內(nèi)存。例如,WSE-3擁有900,000個核心和44GB內(nèi)存,這使得它能夠同時處理大量的數(shù)據(jù)和計算任務(wù)。傳統(tǒng)GPU的核心數(shù)量和內(nèi)存通常較小,可能需要多個GPU協(xié)同工作才能達到類似的性能。

Cerebras采用了片上內(nèi)存的設(shè)計,這意味著內(nèi)存和計算核心都在同一個芯片上,從而大大減少了數(shù)據(jù)傳輸?shù)拈_銷和延遲。相比之下,傳統(tǒng)GPU的內(nèi)存和計算核心是分離的,需要通過PCIe等接口進行數(shù)據(jù)傳輸,這可能導(dǎo)致性能瓶頸和延遲。

Cerebras的CS-3系統(tǒng)是基于WSE-3推出的,具備強大的系統(tǒng)支持。該系統(tǒng)擁有高達1.2PB的內(nèi)存容量,能夠訓(xùn)練比GPT-4和Gemini模型大10倍的下一代前沿模型。在大模型訓(xùn)練中,Cerebras的CS-3系統(tǒng)相較于GPU具有更低的代碼復(fù)雜性和更高的易用性。開發(fā)人員可以更加高效地實現(xiàn)和訓(xùn)練大模型。

Cerebras的芯片通過保持整個晶圓的完整性來降低互連和網(wǎng)絡(luò)成本以及功耗。這使得Cerebras的芯片在功耗和成本方面相較于多個GPU協(xié)同工作具有優(yōu)勢。

今年4月,Cerebras發(fā)文比較Cerebras CS-3與英偉達B200,稱CS-3和英偉達DGX B200是2024年上市的兩款最令人興奮的AI硬件新品。從對比數(shù)據(jù)來看,無論AI訓(xùn)練性能還是能效,CS-3都做到倍殺DGX B200。

wKgZomZ6l4uAM3yGAAHe43y7_Gk033.png

寫在最后

目前,AI大模型訓(xùn)練基本離不開GPU的支持,Cerebras發(fā)布的WSE系列芯片,給業(yè)界帶來了新的思路,尤其是其今年發(fā)布的第三代產(chǎn)品WSE-3,能夠支持訓(xùn)練業(yè)界最大的AI模型,包括參數(shù)規(guī)模高達24萬億個的模型。如果其能夠順利上市,一是對于其自身后續(xù)發(fā)展更有利,二是對于英偉達來說它可能會成長為一個較大的競爭對手。







聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4882

    瀏覽量

    130393
  • ipo
    ipo
    +關(guān)注

    關(guān)注

    1

    文章

    1224

    瀏覽量

    33251
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1956

    瀏覽量

    35601
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2941

    瀏覽量

    3683
收藏 人收藏

    評論

    相關(guān)推薦

    海思SD3403邊緣計算AI數(shù)據(jù)訓(xùn)練概述

    模型,將模型轉(zhuǎn)化為嵌入式AI模型,模型升級AI攝像機,進行
    發(fā)表于 04-28 11:11

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    應(yīng)用開發(fā)不用“等平臺”,徹底釋放開發(fā)效率和模型接入自由度。 自DeepSeek橫空出世以來,這種更適合端側(cè)部署,回答效率更高效的訓(xùn)練模式快速引爆了AI行業(yè),主流大
    發(fā)表于 04-13 19:52

    摩爾線程GPU原生FP8計算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI
    的頭像 發(fā)表于 03-17 17:05 ?373次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計算助力<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么處理?

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案?
    發(fā)表于 03-11 07:18

    GPU是如何訓(xùn)練AI模型

    AI模型訓(xùn)練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解
    的頭像 發(fā)表于 12-19 17:54 ?546次閱讀

    亞馬遜轉(zhuǎn)向Trainium芯片,全力投入AI模型訓(xùn)練

    ,亞馬遜AWS推出了兩款芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專注于AI模型
    的頭像 發(fā)表于 12-13 14:14 ?514次閱讀

    訓(xùn)練AI模型需要什么樣的gpu

    訓(xùn)練AI模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效以及良好兼容性和擴展性的GPU。在選擇時,需要根據(jù)具體需求進行權(quán)
    的頭像 發(fā)表于 12-03 10:10 ?454次閱讀

    為什么ai模型訓(xùn)練要用gpu

    GPU憑借其強大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓(xùn)練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?753次閱讀

    AI模型訓(xùn)練數(shù)據(jù)來源分析

    學(xué)術(shù)機構(gòu)、政府組織或企業(yè)公開發(fā)布,涵蓋了各種類型的數(shù)據(jù),如圖像、文本、音頻、視頻等。例如: ImageNet :一個廣泛用于圖像識別任務(wù)的大規(guī)模圖像數(shù)據(jù)集。 Common Crawl :提供了大量的網(wǎng)頁抓取數(shù)據(jù)以供自然語言處理模型
    的頭像 發(fā)表于 10-23 15:32 ?2883次閱讀

    如何訓(xùn)練自己的AI模型

    訓(xùn)練自己的AI模型是一個復(fù)雜且耗時的過程,涉及多個關(guān)鍵步驟。以下是一個詳細的訓(xùn)練流程: 一、明確需求和目標 首先,需要明確自己的需求和目標。不同的任務(wù)和應(yīng)用領(lǐng)域需要不同類型的
    的頭像 發(fā)表于 10-23 15:07 ?4465次閱讀

    Cerebras提交IPO申請,估值達41億美元

    近日,晶圓級AI芯片領(lǐng)域的佼佼者Cerebras Systems正式啟動了在美國納斯達克市場的首次公開募股(IPO)程序,股票代碼定為「CBRS」。此次
    的頭像 發(fā)表于 10-09 17:04 ?716次閱讀

    GPU服務(wù)器在AI訓(xùn)練中的優(yōu)勢具體體現(xiàn)在哪些方面?

    能力特別適合于深度學(xué)習中的大規(guī)模矩陣運算和高維度數(shù)據(jù)處理,這些是AI訓(xùn)練中常見的計算密集型任務(wù)。 2、高效的數(shù)據(jù)處理:AI訓(xùn)練通常涉及大量的
    的頭像 發(fā)表于 09-11 13:24 ?793次閱讀

    蘋果AI模型訓(xùn)練新動向:攜手谷歌,未選英偉達

    近日,蘋果公司發(fā)布的最新研究報告揭示了其在人工智能領(lǐng)域的又一重要戰(zhàn)略選擇——采用谷歌設(shè)計的芯片訓(xùn)練AI模型,而非行業(yè)巨頭英偉達的產(chǎn)品。這
    的頭像 發(fā)表于 08-01 18:11 ?1044次閱讀

    蘋果承認使用谷歌芯片訓(xùn)練AI

    蘋果公司最近在一篇技術(shù)論文中披露,其先進的人工智能系統(tǒng)Apple Intelligence背后的兩個關(guān)鍵AI模型,是在谷歌設(shè)計的云端芯片上完成預(yù)訓(xùn)練的。這一消息標志著在尖端
    的頭像 發(fā)表于 07-30 17:03 ?853次閱讀

    AI初創(chuàng)公司Cerebras秘密申請IPO

    近日,全球科技圈再次掀起波瀾。據(jù)外媒最新報道,被譽為明星AI芯片獨角獸的Cerebras Systems,已經(jīng)悄然向證券監(jiān)管機構(gòu)遞交了首次公開募股(IPO)的秘密
    的頭像 發(fā)表于 06-27 17:44 ?920次閱讀