5 月 3 日,智能芯片公司寒武紀科技在上海舉辦了 2018 產(chǎn)品發(fā)布會。會上,寒武紀正式發(fā)布了多個最新一代終端 IP 產(chǎn)品——采用 7nm 工藝的終端芯片 Cambricon 1M、首款云端智能芯片 MLU100 及搭載了 MLU100 的云端智能處理計算卡。
在人工智能技術的發(fā)展過程中,神經(jīng)網(wǎng)絡正不斷邁向更深、更復雜的方向,而硬件則正朝著機器學習任務處理專用的道路前進。目前,國內(nèi)已出現(xiàn)十余家人工智能芯片公司,而寒武紀是其中的佼佼者。作為全球唯一一家 AI 芯片獨角獸,寒武紀于 2016 年誕生于中國科學院計算技術研究所,并率先推出了商用化的深度學習專用處理器 NPU(神經(jīng)網(wǎng)絡處理器)。
其實,寒武紀科技的產(chǎn)品早已進入普通用戶的手中。去年 10 月,華為發(fā)布了搭載全球首款「人工智能處理器」麒麟 970 的手機 Mate 10 系列(以及其后發(fā)布的華為 P20、榮耀 V10 系列等),其芯片架構中就包含了寒武紀的 Cambricon-1A 神經(jīng)網(wǎng)絡處理器。1A 也由此成為了全球首個成功商用的深度學習處理器 IP 產(chǎn)品。
寒武紀的智能處理器主要針對于人工智能領域計算機視覺、語音識別等方面的任務,面向智能手機、安防監(jiān)控、可穿戴設備、無人機和智能駕駛等各類應用。據(jù)稱,其專為神經(jīng)網(wǎng)絡任務優(yōu)化的架構可以使其達到傳統(tǒng)四核 CPU25 倍以上的性能。
與此前僅面向終端設備的芯片 IP 不同,本次發(fā)布會上,寒武紀推出的芯片不僅性能更強大,而且還出現(xiàn)了面向云端服務器等專業(yè)應用場景的產(chǎn)品。
第三代終端芯片:寒武紀 1M
首先是終端處理器部分。今天發(fā)布的寒武紀 1M 是這家公司的第三代機器學習專用芯片,其性能超越此前廣泛使用的寒武紀 1A 十倍。去年 11 月 6 日,寒武紀在北京舉行了公司成立以來的首場發(fā)布會,陳天石在會上披露了 1M 處理器的發(fā)展計劃。
在本次發(fā)布會上,寒武紀 1M 處理器的具體參數(shù)終于展示在人們的眼前。1M 使用 TSMC 7nm 工藝生產(chǎn),其 8 位運算效能比達 5Tops/watt(每瓦 5 萬億次運算)。寒武紀提供了三種尺寸的處理器內(nèi)核(2Tops/4Tops/8Tops)以滿足不同場景下不同量級智能處理的需求,寒武紀稱,用戶還可以通過多核互聯(lián)進一步提高處理效能。
寒武紀 1M 處理器延續(xù)了前兩代 IP 產(chǎn)品(1H/1A)的完備性,可支持 CNN、RNN、SOM 等多種深度學習模型,此次又進一步支持了 SVM、k-NN、k-Means、決策樹等經(jīng)典機器學習算法的加速。這款芯片支持幫助終端設備進行本地訓練,可為視覺、語音、自然語言處理等任務提供高效計算平臺?!高@意味著使用 1M 的設備可以根據(jù)用戶行為對應用進行個性化定制,」陳天石表示。「本地訓練同時也解決了用戶數(shù)據(jù)隱私的問題。它是全球第一款支持本地機器學習訓練的智能處理器產(chǎn)品。」據(jù)悉,該產(chǎn)品可應用于智能手機、智能音箱、攝像頭、自動駕駛等不同領域。
首款云端智能芯片:MLU 100
在去年 11 月份的發(fā)布會上,陳天石展示了服務器級 AI 處理器 MLU 系列的發(fā)展計劃,寒武紀希望將自己的產(chǎn)品從神經(jīng)網(wǎng)絡加速拓展到機器學習,以及更多任務中。本次發(fā)布的又一大重點就是首次亮相的 Cambricon MLU 100 云端 AI 芯片,以及以此為基礎的云端智能處理計算卡?!冈谌昵?,我們就開始了兩顆測試芯片的研發(fā)了。我們時刻準備著將自己的產(chǎn)品放入云端。」陳天石表示。今天推出的產(chǎn)品正是寒武紀穩(wěn)步推進的成果。
MLU100 采用寒武紀最新的 MLUv01 架構和 TSMC 16nm 工藝,可工作在平衡模式(主頻 1Ghz)和高性能模式(1.3GHz)主頻下,等效理論峰值速度則分別可以達到 128 萬億次定點運算/166.4 萬億次定點運算,而其功耗為 80w/110w。與寒武紀系列的終端處理器相同,MLU100 云端芯片具有很高的通用性,可支持各類深度學習和常用機器學習算法。可滿足計算機視覺、語音、自然語言處理和數(shù)據(jù)挖掘等多種云處理任務。搭載這款芯片的板卡使用了 PCIe 接口。
在發(fā)布會上,寒武紀的合作伙伴們展示了基于寒武紀芯片的部分應用方案。其中聯(lián)想推出了基于 Cambricon MLU100 的服務器 ThinkSystem SR650。該產(chǎn)品為 2U2 路機架式規(guī)格,支持兩個 MLU100 智能處理器計算卡。這款服務器打破了 37 項服務器基準測試的世界紀錄。
創(chuàng)始人兼CEO陳天石公開信內(nèi)容預覽
作為寒武紀的創(chuàng)始人和CEO,我非常自豪地與大家分享一個消息:2018年5月3日,寒武紀已在中國上海發(fā)布了首款云端智能芯片MLU100及相應的板卡產(chǎn)品。MLU100芯片主要用于云端的機器學習推斷任務,可支持視覺、語音、自然語言處理等多種類型的云端應用場景,平衡模式下的等效理論峰值達128萬億次定點運算每秒,高性能模式下的等效理論峰值更可達166.4萬億次定點運算每秒,但典型板級功耗僅為80瓦,峰值功耗不超過110瓦。MLU100芯片是寒武紀發(fā)展歷程上全新的里程碑,標志著寒武紀已成為中國第一家(也是世界上少數(shù)幾家)同時擁有終端和云端智能處理器產(chǎn)品的商業(yè)公司。
寒武紀的創(chuàng)始團隊來自學術界,我本人也是中科院計算所的教授和博士生導師。在過去十年的基礎學術研究中,我們與國際同行緊密合作,為國際學術界和工業(yè)界同仁們奉獻了一系列人工智能與處理器架構交叉研究的新思想。2013年前后,我作為主要參與者,與中科院計算所和法國國家信息與自動化研究所(Inria)的同事們一道見證了DianNao系列深度學習處理器架構在國際學術界引起的轟動性效應。如今我們非常自豪地看到,DianNao系列學術論文已經(jīng)將智能處理器的創(chuàng)新思想播撒到全世界,得到哈佛、斯坦福、麻省理工、普林斯頓、英特爾、谷歌等頂尖國際機構的高頻次學術引用,成為諸多國際頂尖大學處理器架構教學的重要資料,成為全世界每一家智能芯片設計公司無法忽略的參照。光榮屬于中國科學院和Inria,屬于我的長期學術合作者陳云霽教授和Olivier Temam教授,也屬于我優(yōu)秀的學生們;而知識,屬于全人類。
DianNao系列的核心思想內(nèi)涵在于不斷追求智能處理最極致的性能。但要讓學術界之外的普通民眾都能受益于這樣創(chuàng)新的思想,還需要更多的努力和協(xié)作。我走出實驗室創(chuàng)立寒武紀的目的,就是要讓全世界都能用上智能處理器,而不是讓思想停留在論文紙面,落上歷史的灰塵?!耙换í毞挪皇谴?,萬紫千紅春滿園”,寒武紀在成立之初就延續(xù)了學術界開放、協(xié)作的精神,以處理器IP授權的形式與全世界同行共享公司最新的技術成果,幫助我們的全球客戶能夠快速設計和生產(chǎn)具備人工智能處理能力的芯片產(chǎn)品。公司研發(fā)的寒武紀1A(Cambricon-1A)是全球第一款商用終端智能處理器IP產(chǎn)品,賦能華為麒麟970芯片成為世界首款人工智能手機芯片,為華為Mate10、P20等四款手機插上智慧之翼。未來,更多的國內(nèi)外客戶也將陸續(xù)發(fā)布他們集成寒武紀處理器的芯片產(chǎn)品。這次發(fā)布會,我向大家介紹了寒武紀第三代處理器IP產(chǎn)品寒武紀1M的更多細節(jié),期待與全球范圍內(nèi)的客戶通力合作,將智能播撒到每一臺終端,讓整個地球都變得智能。
寒武紀在技術上貫徹“端云協(xié)作”的理念,在研發(fā)和推廣終端處理器IP產(chǎn)品的同時,亦非常重視云端智能芯片的研發(fā)。這次發(fā)布的MLU100云端芯片,不僅其本身可以高效完成多任務、多模態(tài)、低延時、高通量的復雜智能處理任務,還可以與寒武紀1A/1H/1M系列終端處理器完美適配,以端云協(xié)作的方式為廣大客戶提供前所未有的智能應用體驗。MLU100云端芯片是寒武紀的里程碑,是這家偉大創(chuàng)業(yè)公司征程的新起點,更是智能芯片領域的新標桿。我們期待與全世界人工智能和集成電路的上下游同行攜手共進,從“芯”開始鑄造人類社會的智能時代,向著全人類共同的美好未來前進。
-
人工智能
+關注
關注
1807文章
49028瀏覽量
249551 -
AI芯片
+關注
關注
17文章
1983瀏覽量
35915
發(fā)布評論請先 登錄
評論