一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知乎用戶曝光的寒武紀下一代云端AI芯片——思元270(MLU270)

DPVg_AI_era ? 來源:lq ? 2019-05-07 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,知乎網(wǎng)友提出一個勁爆問題——如何看待寒武紀新一代人工智能芯片規(guī)格?問題一出便引發(fā)熱議,疑似寒武紀下一代產(chǎn)品“思元270”提前被曝光,有望在低精度訓練領(lǐng)域?qū)崿F(xiàn)重大突破,性能或超越NVIDIA最新一代芯片!

AI芯片領(lǐng)域又有大爆料!

近日,知乎突然出現(xiàn)了一個勁爆提問 “如何看待寒武紀新一代人工智能芯片(疑似思元/MLU270)規(guī)格?”,提問者以匿名方式貼出了疑似寒武紀下一代云端AI芯片MLU270的相關(guān)信息,包括芯片外觀以及某些具體參數(shù)。

知乎鏈接:

https://www.zhihu.com/question/322886889

知乎用戶曝光的寒武紀下一代云端AI芯片——思元270(MLU270)

根據(jù)問題和回答記錄中顯示,似乎已有多家廠商接觸到了相關(guān)資料,經(jīng)他人在網(wǎng)上披露信息后,寒武紀下一代芯片規(guī)格被提前曝光。

智能芯片領(lǐng)域,寒武紀被稱為這一行業(yè)的先行者,“先行者”的行蹤被泄露,自然會吸引眾多從業(yè)者的關(guān)注與討論——“新一代的云端AI芯片規(guī)格到底如何?”。該提問在短時間內(nèi)就受到了知乎網(wǎng)友的廣泛關(guān)注,閱讀次數(shù)迅速過萬。

獨家爆料:“思元”年初悄然注冊,數(shù)據(jù)遭泄,性能或超越NVIDIA最新一代芯片

據(jù)泄露照片顯示,寒武紀的新一代云端AI芯片MLU270已于今年年初研制成功,主要包括如下五點特性:

基于臺積電16nm工藝打造。

架構(gòu)代號從上一代的MLUv01升級到了MLUv02。

內(nèi)建視頻解碼單元(似乎是專門為視頻處理市場配置)。

但按照寒武紀一直把MLU系列芯片定位為通用智能芯片來看,MLU270應(yīng)該能夠繼續(xù)支持語音和自然語言處理等重要AI任務(wù)。

峰值方面,這顆芯片提供int4 256Tops, int8 128Tops的驚人性能,功耗為75w,與全球AI芯片龍頭NVIDIA的最新一代Tesla T4基本持平。

在圍繞新品的討論中,這款新品是否與國際業(yè)內(nèi)巨頭NVIDIA持平也是知乎網(wǎng)友熱議的一點。

大多數(shù)網(wǎng)友的看法都是持積極態(tài)度。雖然NVIDIA在國際范圍內(nèi)頗有“一家獨大”的態(tài)勢,但卓越的學術(shù)成就以及融資優(yōu)勢仍讓很多網(wǎng)友看好寒武紀:對于前途大好的AI芯片市場,玩家越多,越有意思——“有新的競爭者加入進來對業(yè)內(nèi)每一家都是好事”。

但也有網(wǎng)友認為超越NVIDIA絕非易事,峰值高低并不能直接決定市場上的勝負,如何接近核心客戶可能是寒武紀需要跨過的更高門檻,也是能否與NVIDIA等巨頭一決勝負的關(guān)鍵。

另外,業(yè)內(nèi)反饋Tesla T4在75w功耗條件下實測性能距離理論峰值有較大差距,不知寒武紀能否突破這一瓶頸,未來尚需相關(guān)用戶公布實測結(jié)果。

寒武紀思元270芯片內(nèi)部分技術(shù)參數(shù)

值得注意的是,照片中出現(xiàn)的”思元”這個名字,很可能是寒武紀云端芯片品牌

MLU(Machine learning unit)的中文名。筆者順藤摸瓜,查了一下國家商標局的網(wǎng)站(http://sbj.saic.gov.cn/sbcx/),發(fā)現(xiàn)寒武紀已經(jīng)在年初注冊了“思元”商標。

國家商標局網(wǎng)站,寒武紀注冊“思元”信息

有網(wǎng)友在網(wǎng)站回答題主時反饋,“MLU”這個名詞有些拗口,平時和同事交流時容易和“MCU”混淆。新的“思元”品牌,貌似可以解決這個小問題,也有利于打開市場知名度。

知乎匿名用戶評論

來自同行的疑惑:“思元270”專注AI推斷任務(wù)還是兼做訓練任務(wù)?

耐人尋味的另一點是,照片中只包括了整數(shù)性能的數(shù)據(jù),也沒有交代是這顆芯片是專注人工智能的推斷任務(wù)還是兼做訓練任務(wù),令一些同行感到疑惑。

查閱寒武紀以往公開信息,發(fā)現(xiàn)寒武紀不存在任何一款代號是MLU270的芯片產(chǎn)品。寒武紀的上一代產(chǎn)品MLU100已經(jīng)公布,是專注于推理的AI芯片,而且發(fā)布時間尚不滿一年,不太可能是同一產(chǎn)品線自相殘殺式的迭代,更有可能是專注于訓練的新產(chǎn)品。

寒武紀上一代芯片——MLU100

照片中僅公布了低精度整數(shù)性能,存在兩種可能性:

一是表格中有意遺漏了浮點數(shù)據(jù);

二是寒武紀在低精度訓練領(lǐng)域?qū)崿F(xiàn)了關(guān)鍵性突破。

而新智元從業(yè)內(nèi)傳聞看更傾向于第二種可能性。

實際上,低精度訓練的需求在業(yè)界由來已久。算法工程師使用GPU做訓練,通常使用其浮點運算單元,主要是因為在有監(jiān)督學習的BP算法中,只有精確的浮點運算才能記錄訓練時很小的增量。而浮點運算單元占用的芯片面積和功耗相比于整數(shù)運算器都要大很多倍,導致單位芯片面積的處理能力要差很多。

目前業(yè)界在人工智能的推斷類應(yīng)用上,發(fā)現(xiàn)整數(shù)運算可以不影響模型的精度,因此用于推斷的芯片已經(jīng)大量集成了整數(shù)運算器或低精度浮點運算器。但業(yè)界一直在嘗試是否有機會用代價更低的整數(shù)運算器實現(xiàn)更為復雜的訓練功能,這樣可以在不增加芯片面積和功耗的前提下,大幅提升芯片做訓練的運算能力。但這個問題在業(yè)界也還沒有普適的解決方案。

如果寒武紀真的在低精度訓練領(lǐng)域?qū)崿F(xiàn)了突破,那將會是AI芯片領(lǐng)域的重大消息。新智元在發(fā)稿前嘗試聯(lián)系寒武紀確認該技術(shù)信息,但目前尚未有回復。

思元270系列板卡實物照片

據(jù)了解,寒武紀在過去三年一直保持每年一代的產(chǎn)品迭代速度。在終端領(lǐng)域:

2016年推出寒武紀1A處理器IP;

2017年推出雙核的寒武紀1H;

2018年推出寒武紀1M。

迄今已經(jīng)服務(wù)于數(shù)千萬臺終端設(shè)備。

寒武紀CEO陳天石曾表示,寒武紀的云端智能芯片產(chǎn)品,迭代速度會和終端產(chǎn)品一樣快。從這一次的消息泄露來看也確實如此,從去年初的MLU100到今年的MLU270。能夠以一年一代的速度進行研發(fā)的,國內(nèi)也僅有華為海思一家在消費類手機芯片能做到。

在發(fā)稿前,新智元專門回顧了寒武紀去年發(fā)布會的新聞,發(fā)現(xiàn)陳天石博士在去年曾提到一款名為“MLU200”的云端芯片。這次泄露的MLU270芯片已經(jīng)研制成功,但是否就是去年發(fā)布會時陳天石提到的MLU200,抑或是寒武紀還另有名為MLU200的產(chǎn)品?

無論如何,大型AI芯片能在一年時間迭代一代確實令人意外,但如果寒武紀能夠同時研發(fā)多款高復雜度的芯片,這可能意味著寒武紀已經(jīng)具備非常完備的芯片研發(fā)能力,在邁向AI芯片新巨頭的道路上又前進了一步。

我們今天如何造芯?回望寒武紀三年AI修行之路

那么,寒武紀在智能芯片這條路上到底是如何發(fā)展的呢?新智元對此做了一下梳理:

2016年發(fā)布的寒武紀1A處理器(Cambricon-1A),是世界首款商用深度學習專用處理器。

2017年8月,寒武紀科技一億美元的A輪融資消息傳出,在A輪融資后估值達到10億美元,成為全球AI芯片領(lǐng)域第一個獨角獸初創(chuàng)公司。

2016年發(fā)布的寒武紀1A處理器(Cambricon-1A)

2017年11月,寒武紀召開自成立以來的首場發(fā)布會,公布了系列新品及公司未來路線圖——“3年內(nèi)占領(lǐng)10億智能AI終端,占領(lǐng)中國云端高性能芯片1/3市場份額”。發(fā)布會上,寒武紀三款全新的智能處理器IP產(chǎn)品亮相:面向低功耗場景視覺應(yīng)用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16,以及面向智能駕駛領(lǐng)域的寒武紀1M。

2017年11月寒武紀首場發(fā)布會

2018年5月,寒武紀發(fā)布第三代IP產(chǎn)品Cambricon 1M,以及最新一代云端AI芯片MLU100和板卡產(chǎn)品。其中,MLU100采用寒武紀最新的MLUv01架構(gòu)和TSMC 16nm的先進工藝,可工作在平衡模式(1GHz主頻)和高性能模式(1.3GHz主頻)下,平衡模式下的等效理論峰值速度達每秒128萬億次定點運算,高性能模式下的等效理論峰值速度更可達每秒166.4萬億次定點運算,但典型板級功耗僅為80瓦,峰值功耗不超過110瓦。

2018年5月發(fā)布的寒武紀MLU100

2018年6月,寒武紀宣布完成數(shù)億美元的B輪融資,投后整體估值達25億美元,繼續(xù)領(lǐng)跑全球智能芯片創(chuàng)業(yè)公司。

按照寒武紀慣例,今年上半年應(yīng)該會有一次發(fā)布會。在這次發(fā)布會上是否能夠順利地看到此次遭泄露的“思元270”,又是否真如曝光數(shù)據(jù)所示,峰值高達256Tops,亦或像網(wǎng)友猜測的那樣,在低精度訓練領(lǐng)域中實現(xiàn)了關(guān)鍵性突破?值得期待。

那么根據(jù)此次曝光的資料,你更傾向于哪種猜測呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 寒武紀
    +關(guān)注

    關(guān)注

    11

    文章

    200

    瀏覽量

    74335
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1983

    瀏覽量

    35919
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14165
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    寒武紀“炸裂”財報!季度營收增長40倍,積極備貨應(yīng)對“爆單”?

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)寒武紀,交出份炸裂財報!在4月18日,寒武紀公布了2024年年報和2025年季度報告,其中2024年全年營收11.74億
    的頭像 發(fā)表于 04-22 09:07 ?1435次閱讀
    <b class='flag-5'>寒武紀</b>“炸裂”財報!<b class='flag-5'>一</b>季度營收增長40倍,積極備貨應(yīng)對“爆單”?

    寒武紀3000億市值與GPU廠商密集IPO,AI芯片正是當打之年

    大漲超9%,股價度沖至777.77/股,刷新歷史新高。并且寒武紀成為除新股外,A股年度漲幅最大的公司,2024年公司累計漲超387%。 ? 但是寒武紀在2024年前三季度營收僅為1
    的頭像 發(fā)表于 01-20 08:16 ?3727次閱讀
    <b class='flag-5'>寒武紀</b>3000億市值與GPU廠商密集IPO,<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>正是當打之年

    下一代高速芯片晶體管解制造問題解決了!

    ,10埃)開始直使用到A7。 從這些外壁叉片晶體管的量產(chǎn)中獲得的知識可能有助于下一代互補場效應(yīng)晶體管(CFET)的生產(chǎn)。 目前,領(lǐng)先的芯片制造商——英特爾、臺積電和三星——正在利用
    發(fā)表于 06-20 10:40

    寒武紀基于思370芯片MLU370-X8 智能加速卡產(chǎn)品手冊詳解

    MLU370-X8智能加速卡是全面升級的數(shù)據(jù)中心訓推AI加速卡,基于寒武紀全新一代
    的頭像 發(fā)表于 04-24 17:57 ?1475次閱讀
    <b class='flag-5'>寒武紀</b>基于思<b class='flag-5'>元</b>370<b class='flag-5'>芯片</b>的<b class='flag-5'>MLU</b>370-X8 智能加速卡產(chǎn)品手冊詳解

    寒武紀370芯片參數(shù)特性詳解

    寒武紀首次采用chiplet技術(shù)將2顆AI計算芯粒封裝為AI芯片,通過不同芯粒組合規(guī)格多樣化的產(chǎn)品,為
    的頭像 發(fā)表于 04-24 17:49 ?1233次閱讀
    <b class='flag-5'>寒武紀</b><b class='flag-5'>思</b><b class='flag-5'>元</b>370<b class='flag-5'>芯片</b>參數(shù)特性詳解

    下一代云端生產(chǎn)力的核心特征與技術(shù)演進

    下一代云端生產(chǎn)力的核心特征與技術(shù)演進 、算力基礎(chǔ)設(shè)施的全面升級 四算融合架構(gòu)? 中國移動已建成覆蓋通算算力、智能算力、量子算力、超算算力的四算融合網(wǎng)絡(luò),總規(guī)模占全國1/6,其中智能算力達
    的頭像 發(fā)表于 04-22 07:42 ?235次閱讀
    <b class='flag-5'>下一代</b><b class='flag-5'>云端</b>生產(chǎn)力的核心特征與技術(shù)演進

    寒武紀季度營收大漲4230% 凈利潤3.55億 扭虧為盈

    4月18日晚間,國產(chǎn)AI芯片龍頭寒武紀發(fā)布了財務(wù)報告,包括有2025年第季度財務(wù)報告和2024年年度財務(wù)報告。 在2025年第季度,
    的頭像 發(fā)表于 04-19 14:15 ?1043次閱讀

    美國業(yè)務(wù)收入占比低,寒武紀等回應(yīng)加征關(guān)稅

    4月9日,寒武紀公告稱,公司收入主要來自境內(nèi)客戶,境外收入占比較低,2023年及2024年公司境外客戶收入占比均未超過1%。2022年12月美國商務(wù)部工業(yè)和安全局將公司列入實體清單,對公司采購美系
    發(fā)表于 04-12 00:59 ?663次閱讀
    美國業(yè)務(wù)收入占比低,<b class='flag-5'>寒武紀</b>等回應(yīng)加征關(guān)稅

    百度李彥宏談訓練下一代大模型

    “我們?nèi)孕鑼?b class='flag-5'>芯片、數(shù)據(jù)中心和云基礎(chǔ)設(shè)施持續(xù)投入,以打造更好、更智能的下一代模型?!?/div>
    的頭像 發(fā)表于 02-12 10:38 ?475次閱讀

    寒武紀增資全資子公司上海寒武紀

    近日,寒武紀科技公司發(fā)布公告,宣布了項重要的增資計劃。為了保障募投項目的順利實施,并滿足全資子公司上海寒武紀的實際運營需求,寒武紀決定使用募集資金1500萬
    的頭像 發(fā)表于 02-05 13:44 ?764次閱讀

    寒武紀發(fā)布2024年度業(yè)績預告

    。這成績彰顯了寒武紀在智能芯片市場的強勁競爭力和持續(xù)拓展能力。 然而,在凈利潤方面,寒武紀仍面臨定的挑戰(zhàn)。公司預計歸屬于母公司所有者的凈
    的頭像 發(fā)表于 01-15 10:30 ?760次閱讀

    正式公布三季度財報:月活躍用戶數(shù)穩(wěn)步增長

    凈虧損方面取得了顯著的改善。凈虧損大幅收窄至900萬人民幣,這數(shù)字不僅遠低于去年同期,也創(chuàng)下了自上市以來單季度減虧幅度最大且凈虧損額最少的歷史紀錄。 與此同時,
    的頭像 發(fā)表于 11-27 10:44 ?1229次閱讀

    雷諾下一代車載語音助手Reno將引入生成式AI技術(shù)

    11月1日,賽輪軟件技術(shù)公司與雷諾公司宣布深化合作,旨在將生成式AI技術(shù)和類人交互功能融入雷諾下一代多模態(tài)虛擬車載助手Reno中。   雷諾推出的虛擬助手Reno被設(shè)計為智能旅行伴侶,旨在
    的頭像 發(fā)表于 11-01 16:39 ?1798次閱讀

    電流檢測芯片INA270數(shù)據(jù)手冊里的Vsense指的是什么電壓?

    請問下電流檢測芯片INA270數(shù)據(jù)手冊里的Vsense 指的是什么電壓?
    發(fā)表于 09-19 08:27

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI
    發(fā)表于 08-15 11:06 ?0次下載
    <b class='flag-5'>下一代</b>高功能新<b class='flag-5'>一代</b><b class='flag-5'>AI</b>加速器(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統(tǒng)高級<b class='flag-5'>AI</b>中更快的嵌入處理