一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

只能跑Transformer的AI芯片,卻號稱全球最快?

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚 ? 2024-07-01 09:03 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)近日,一家由哈佛輟學生成立的初創(chuàng)公司Etched,宣布了他們在打造的一款“專用”AI芯片Sohu。據(jù)其聲稱該芯片的速度將是英偉達H100的20倍,但只能跑transformer架構的模型。

Sohu,比H100快上20倍

之所以打算Sohu這一自研ASIC AI芯片,是因為Etched認為GPU在性能升級上的速度太慢了。如果以H100的單位面積算力和交期作為參考,那么從2022年到2025年,英偉達的H100迭代至B200,2.5年的時間內(nèi)性能只有15%的提升。所以要想有效提高性能的方式,只有走特化的ASIC芯片一途。

現(xiàn)在發(fā)布的任何AI芯片,在提到性能時,無疑都會把英偉達的H100作為對比參照,Etched的Sohu也不例外。根據(jù)Etched提供的數(shù)據(jù),單個Sohu服務器運行Llama 70B時可以做到50萬Tokens每秒,這一速度是單個H100服務器的20倍以上,也是單個B200服務器的10倍以上。

在服務器的配置上,Sohu服務器和H100服務器均采用的8卡的配置,所以Etched強調(diào)一個8xSohu的服務器就可以替換掉至少160個H100,大大降低成本的同時,也不會有性能損失。

由于Sohu僅支持一種算法,所以絕大多數(shù)的控制流模塊都可以被剔除,芯片可以集成更多的數(shù)學計算單元,在算力利用率上可以達到90%以上,而GPU卻只能做到30%。這也是因為在GPU的電路設計上,用于矩陣乘法的晶體管數(shù)量甚至沒有占到10%。不過Etched對于英偉達的設計還是相當佩服的,指出如果同時想支持CNN、LSTM、SSM等其他模型,確實很難做得比英偉達更好。

當然了,這里的測試條件也必須做一個說明,測試標準為FP8精度的Llama 70B,無稀疏,其中H100是基于最新版本的TensorRT-LLM測試的,而B200由于還未交付,所以其性能是預估的。

為何專攻Transformer模型

市面上的AI芯片和GPU產(chǎn)品為了覆蓋更靈活的客戶需求,盡管不少都采用了ASIC的設計方案,但支持的模型卻不會局限在一類。Etched也在其官網(wǎng)列出了市面上一些競品方案,包括英偉達的GPU、谷歌的TPU、亞馬遜的Trainium、Graphcore的IPU、Tenstorrent的Grayskull和英特爾的Gaudi等等,這些方案無一不對廣泛的AI模型提供了支持。

但我們從市面上頭部的模型來看,幾乎占據(jù)主導地位的都是transformer架構的模型,比如GPT、Sora、Gemini和Stable Diffusion。Etched很大方地表示,如果哪一天transformer被SSM、RWKV或其他新的架構替代了,他們的芯片將變得一無是處,對于千變?nèi)f化的AI市場而言,絕大多數(shù)廠商都不敢沒法做出這樣的預測。

而Etched從2022年底,就賭transformer模型將會統(tǒng)治整個市場。這在當時還沒有ChatGPT的年代,是一個大膽的預測,畢竟當時圖像生成還有基于CNN的U-Net,不少自動駕駛的視覺處理也還在廣泛使用CNN。而且對于一個規(guī)模不算大的設計團隊而言,維護單一架構的軟件棧明顯壓力更小一些,他們只需要為transformer編寫驅動、內(nèi)核即可。

寫在最后

至于Etched的這場豪賭是否能成功,還得看芯片的成品表現(xiàn)如何。雖然他們嘗試的這條路線沒人走過,但財力和研發(fā)能力均在他們之上的廠商也沒能打造出超過英偉達GPU的競品,硅谷的VC們能否造出新神,依然不能過早下定論。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Transformer
    +關注

    關注

    0

    文章

    148

    瀏覽量

    6323
  • AI芯片
    +關注

    關注

    17

    文章

    1956

    瀏覽量

    35601
收藏 人收藏

    評論

    相關推薦

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    集成于同一硬件平臺。內(nèi)置RISC-V AI核,接入ONNXRuntime加速框架,可快速部署Transformer、CNN等主流算法,實現(xiàn)視覺跟蹤、語音交互與自主決策的一體化應用。 低門檻開發(fā) 提供
    發(fā)表于 04-25 17:59

    如何使用MATLAB構建Transformer模型

    Transformer 模型在 2017 年由 Vaswani 等人在論文《Attentionis All You Need》中首次提出。其設計初衷是為了解決自然語言處理(Nature
    的頭像 發(fā)表于 02-06 10:21 ?2754次閱讀
    如何使用MATLAB構建<b class='flag-5'>Transformer</b>模型

    transformer專用ASIC芯片Sohu說明

    的舊圖像模型,也不能運行CNN、RNN或LSTM。 但對于transformer來說,Sohu是有史以來最快芯片。 借助Llama 70B每秒超過50萬個token的吞吐量,Sohu可以讓您構建在GPU上無法實現(xiàn)的產(chǎn)品
    的頭像 發(fā)表于 01-06 09:13 ?853次閱讀
    <b class='flag-5'>transformer</b>專用ASIC<b class='flag-5'>芯片</b>Sohu說明

    Transformer模型的具體應用

    如果想在 AI 領域引領一輪新浪潮,就需要使用到 Transformer。
    的頭像 發(fā)表于 11-20 09:28 ?1258次閱讀
    <b class='flag-5'>Transformer</b>模型的具體應用

    Transformer模型能夠做什么

    盡管名為 Transformer,但它們不是電視銀幕上的變形金剛,也不是電線桿上垃圾桶大小的變壓器。
    的頭像 發(fā)表于 11-20 09:27 ?761次閱讀
    <b class='flag-5'>Transformer</b>模型能夠做什么

    天璣9400權威測試AI能跑分第一,領跑行業(yè)

    聯(lián)發(fā)科近日隆重推出其最新旗艦芯片——天璣9400,這款芯片是天璣家族的第二代全大核SoC,并且成為首款集成智能體AI的5G旗艦芯片。在繼天璣9300成功將生成式
    的頭像 發(fā)表于 10-14 14:57 ?747次閱讀
    天璣9400權威測試<b class='flag-5'>AI</b>性<b class='flag-5'>能跑</b>分第一,領跑行業(yè)

    北京見 | 賽昉科技邀您參加2024全球AI芯片峰會

    9月6-7日,2024全球AI芯片峰會(GACS2024)將在北京遼寧大廈盛大舉辦。全球AI芯片
    的頭像 發(fā)表于 09-04 08:03 ?559次閱讀
    北京見 | 賽昉科技邀您參加2024<b class='flag-5'>全球</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>峰會

    Transformer語言模型簡介與實現(xiàn)過程

    在自然語言處理(NLP)領域,Transformer模型以其卓越的性能和廣泛的應用前景,成為了近年來最引人注目的技術之一。Transformer模型由谷歌在2017年提出,并首次應用于神經(jīng)機器翻譯
    的頭像 發(fā)表于 07-10 11:48 ?2648次閱讀

    使用PyTorch搭建Transformer模型

    Transformer模型自其問世以來,在自然語言處理(NLP)領域取得了巨大的成功,并成為了許多先進模型(如BERT、GPT等)的基礎。本文將深入解讀如何使用PyTorch框架搭建Transformer模型,包括模型的結構、訓練過程、關鍵組件以及實現(xiàn)細節(jié)。
    的頭像 發(fā)表于 07-02 11:41 ?2299次閱讀

    AI芯片會導元件中間商消失嗎?

    元件AI芯片
    芯廣場
    發(fā)布于 :2024年06月19日 18:10:01

    解答超五類網(wǎng)線能跑千兆嗎

    超五類網(wǎng)線不能跑千兆。在千兆以太網(wǎng)中,數(shù)據(jù)傳輸?shù)念l率要比百兆以太網(wǎng)高得多,需要更高質量的網(wǎng)絡線材來支持。千兆以太網(wǎng)中的傳輸頻率為250MHz,而超五類網(wǎng)線只能支持到100MHz的頻率。因此,超五類
    的頭像 發(fā)表于 06-07 10:52 ?1w次閱讀

    2024年全球AI芯片收入將達712.52億美元

    市場調(diào)查機構Gartner近日發(fā)布了一份關于全球AI芯片市場的收入預測報告。據(jù)該機構分析,到2024年,全球AI
    的頭像 發(fā)表于 06-03 14:26 ?922次閱讀

    AI芯片哪里買?

    AI芯片
    芯廣場
    發(fā)布于 :2024年05月31日 16:58:19

    全球AI芯片市場收入預計持續(xù)增長

    根據(jù)市場調(diào)查機構Gartner的最新報告,全球AI芯片市場展現(xiàn)出強勁的增長勢頭。預計2024年,全球AI
    的頭像 發(fā)表于 05-31 10:26 ?733次閱讀

    安霸發(fā)布兩款用于車隊遠程監(jiān)控及信息處理系統(tǒng)的最新一代AI芯片

    兩款新型 5nm 芯片提供業(yè)界領先的每瓦 AI 性能、支持獨特的小巧外形設計、單盒集成視覺 Transformer 和 VLM 分析功能。
    的頭像 發(fā)表于 05-22 09:09 ?723次閱讀