一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI進(jìn)入爆發(fā)期,千億芯片市場(chǎng)空間

dKBf_eetop_1 ? 來(lái)源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-09-23 06:45 ? 次閱讀

AI爆發(fā),芯片致勝

AI進(jìn)入爆發(fā)期,千億芯片市場(chǎng)空間

AI沉浮數(shù)十載,“預(yù)期-失望-進(jìn)步-預(yù)期”周期中破浪前行。AI(人工智能)概念誕生于1956年達(dá)特茅斯(Dartmouth)會(huì)議,1959年劃時(shí)代論文《計(jì)算機(jī)器與智能》中提出AI領(lǐng)域著名的圖靈測(cè)試;此后算法和研究不斷迭代,經(jīng)歷1956-1974年的推理黃金時(shí)代、1974-1980年的第一次瓶頸期、1980-1987年專家系統(tǒng)發(fā)展、1987-1993年的第二次寒冬及1993-2010年學(xué)習(xí)期復(fù)蘇,之后跟隨大數(shù)據(jù)、云計(jì)算興起,算法模型和并行運(yùn)算的結(jié)合雙輪驅(qū)動(dòng)人工智能發(fā)展,目前進(jìn)入爆發(fā)期,表現(xiàn)在三個(gè)層面:

(1)生態(tài)基礎(chǔ)層面:移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的快速發(fā)展為人工智能產(chǎn)業(yè)奠定生態(tài)基礎(chǔ);

(2)軟件層面:已有數(shù)學(xué)模型被重新發(fā)掘,新興合適算法被發(fā)明,重要成果包括圖模型、圖優(yōu)化、神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)、增強(qiáng)學(xué)習(xí)等;

(3)硬件層面:摩爾定律助力,服務(wù)器強(qiáng)大的計(jì)算能力尤其是并行計(jì)算單元的引入使人工智能訓(xùn)練效果顯著提速,除原有CPU外,GPUFPGA、ASIC(包括TPU、NPU等AI專屬架構(gòu)芯片)各種硬件被用于算法加速,提速人工智能在云端服務(wù)器和終端產(chǎn)品中的應(yīng)用和發(fā)展。

技術(shù)體系分層,核心處理芯片成基礎(chǔ)層關(guān)鍵。人工智能技術(shù)體系分為基礎(chǔ)層、技術(shù)層與應(yīng)用層。基礎(chǔ)層主要包括人工智能核心處理芯片和大數(shù)據(jù),是支撐技術(shù)層的圖像識(shí)別、語(yǔ)音識(shí)別等人工智能算法的基石。人工智能算法需要用到大量的卷積等特定并行運(yùn)算,常規(guī)處理器(CPU)在進(jìn)行這些運(yùn)算時(shí)效率較低,適合AI的核心處理芯片在要求低延時(shí)、低功耗、高算力的各種應(yīng)用場(chǎng)景逐漸成為必須。核心處理芯片和大數(shù)據(jù),成為支撐人工智能技術(shù)發(fā)展的關(guān)鍵要素。

根據(jù)賽迪咨詢發(fā)布報(bào)告,2016年全球人工智能市場(chǎng)規(guī)模達(dá)到293億美元。人工智能芯片是人工智能市場(chǎng)中重要一環(huán),根據(jù)英偉達(dá),AMD賽靈思,谷歌等相關(guān)公司數(shù)據(jù),我們測(cè)算2016年人工智能芯片市場(chǎng)規(guī)模將達(dá)到23.88億美元,約占全球人工智能市場(chǎng)規(guī)模8.15%,而到2020年人工智能芯片市場(chǎng)規(guī)模將達(dá)到146.16億美元,約占全球人工智能市場(chǎng)規(guī)模12.18%。人工智能芯片市場(chǎng)空間極其廣闊。

芯片承載算法,是競(jìng)爭(zhēng)的制高點(diǎn)

人工智能的基礎(chǔ)是算法,深度學(xué)習(xí)是目前最主流的人工智能算法。深度學(xué)習(xí)又叫深度神經(jīng)網(wǎng)絡(luò)(DNN:Deep Neural Networks),從之前的人工神經(jīng)網(wǎng)絡(luò)(ANN:Artificial Neural Networks)模型發(fā)展而來(lái)。這種模型一般采用計(jì)算機(jī)科學(xué)中的圖模型來(lái)直觀表達(dá),深度學(xué)習(xí)的“深度”便指的是圖模型的層數(shù)以及每一層的節(jié)點(diǎn)數(shù)量。神經(jīng)網(wǎng)絡(luò)復(fù)雜度不斷提升,從最早單一的神經(jīng)元,到2012年提出的AlexNet(8個(gè)網(wǎng)絡(luò)層),再到2015年提出的ResNET(150個(gè)網(wǎng)絡(luò)層),層次間的復(fù)雜度呈幾何倍數(shù)遞增,對(duì)應(yīng)的是對(duì)處理器運(yùn)算能力需求的爆炸式增長(zhǎng)。深度學(xué)習(xí)帶來(lái)計(jì)算量急劇增加,對(duì)計(jì)算硬件帶來(lái)更高要求。我們下文首先對(duì)深度學(xué)習(xí)算法進(jìn)行簡(jiǎn)單分析,闡述其和AI芯片的關(guān)系。

深度學(xué)習(xí)算法分“訓(xùn)練”和“推斷”兩個(gè)過(guò)程。簡(jiǎn)單來(lái)講,人工智能需要通過(guò)以大數(shù)據(jù)為基礎(chǔ),通過(guò)“訓(xùn)練”得到各種參數(shù),把這些參數(shù)傳遞給“推斷”部分,得到最終結(jié)果。

“訓(xùn)練”和“推斷”所需要的神經(jīng)網(wǎng)絡(luò)運(yùn)算類型不同。神經(jīng)網(wǎng)絡(luò)分為前向計(jì)算(包括矩陣相乘、卷積、循環(huán)層)和后向更新(主要是梯度運(yùn)算)兩類,兩者都包含大量并行運(yùn)算。“訓(xùn)練”所需的運(yùn)算包括“前向計(jì)算+后向更新”;“推斷”則主要是“前向計(jì)算”。一般而言訓(xùn)練過(guò)程相比于推斷過(guò)程計(jì)算量更大。一般來(lái)說(shuō),云端人工智能硬件負(fù)責(zé)“訓(xùn)練+推斷”,終端人工智能硬件只負(fù)責(zé)“推斷”。

“訓(xùn)練”需大數(shù)據(jù)支撐并保持較高靈活性,一般在“云端”(即服務(wù)器端)進(jìn)行。人工智能訓(xùn)練過(guò)程中,頂層上需要有一個(gè)海量的數(shù)據(jù)集,并選定某種深度學(xué)習(xí)模型。每個(gè)模型都有一些內(nèi)部參數(shù)需要靈活調(diào)整,以便學(xué)習(xí)數(shù)據(jù)。而這種參數(shù)調(diào)整實(shí)際上可以歸結(jié)為優(yōu)化問(wèn)題,在調(diào)整這些參數(shù)時(shí),就相當(dāng)于在優(yōu)化特定的約束條件,這就是所謂的“訓(xùn)練”。云端服務(wù)器收集用戶大數(shù)據(jù)后,依靠其強(qiáng)大的計(jì)算資源和專屬硬件,實(shí)現(xiàn)訓(xùn)練過(guò)程,提取出相應(yīng)的訓(xùn)練參數(shù)。由于深度學(xué)習(xí)訓(xùn)練過(guò)程需要海量數(shù)據(jù)集及龐大計(jì)算量,因此對(duì)服務(wù)器也提出了更高的要求。未來(lái)云端AI服務(wù)器平臺(tái)需具備相當(dāng)數(shù)據(jù)級(jí)別、流程化的并行性、多線程、高內(nèi)存帶寬等特性。

“推斷”過(guò)程可在云端(服務(wù)器端)進(jìn)行,也可以在終端(產(chǎn)品端)進(jìn)行。等待模型訓(xùn)練完成后,將訓(xùn)練完成的模型(主要是各種通過(guò)訓(xùn)練得到的參數(shù))用于各種應(yīng)用場(chǎng)景(如圖像識(shí)別、語(yǔ)音識(shí)別、文本翻譯等)?!皯?yīng)用”過(guò)程主要包含大量的乘累加矩陣運(yùn)算,并行計(jì)算量很大,但和“訓(xùn)練”過(guò)程比參數(shù)相對(duì)固化,不需要大數(shù)據(jù)支撐,除在服務(wù)器端實(shí)現(xiàn)外,也可以在終端實(shí)現(xiàn)?!巴茢唷彼鑵?shù)可由云端“訓(xùn)練”完畢后,定期下載更新到終端。

傳統(tǒng)CPU算力不足,新架構(gòu)芯片支撐AI成必須。核心芯片決定計(jì)算平臺(tái)的基礎(chǔ)架構(gòu)和發(fā)展生態(tài),由于AI所需的深度學(xué)習(xí)需要很高的內(nèi)在并行度、大量浮點(diǎn)計(jì)算能力以及矩陣運(yùn)算,基于CPU的傳統(tǒng)計(jì)算架構(gòu)無(wú)法充分滿足人工智能高性能并行計(jì)算(HPC)的需求,因此需要發(fā)展適合人工智能架構(gòu)的專屬芯片。

專屬硬件加速是新架構(gòu)芯片發(fā)展主流。目前處理器芯片面向人工智能硬件優(yōu)化升級(jí)有兩種發(fā)展路徑:(1)延續(xù)傳統(tǒng)計(jì)算架構(gòu),加速硬件計(jì)算能力:以GPU、FPGA、ASIC(TPU、NPU等)芯片為代表,采用這些專屬芯片作為輔助,配合CPU的控制,專門進(jìn)行人工智能相關(guān)的各種運(yùn)算;(2)徹底顛覆傳統(tǒng)計(jì)算架構(gòu),采用模擬人腦神經(jīng)元結(jié)構(gòu)來(lái)提升計(jì)算能力,以IBM TrueNorth芯片為代表,由于技術(shù)和底層硬件的限制,第二種路徑尚處于前期研發(fā)階段,目前不具備大規(guī)模商業(yè)應(yīng)用的可能性。從技術(shù)成熟度和商業(yè)可行性兩個(gè)角度,我們判斷使用AI專屬硬件進(jìn)行加速運(yùn)算是今后五年及以上的市場(chǎng)主流。

云端終端雙場(chǎng)景,三種芯片顯神通

我們把人工智能硬件應(yīng)用場(chǎng)景歸納為云端場(chǎng)景和終端場(chǎng)景兩大類。云端主要指服務(wù)器端,包括各種共有云、私有云、數(shù)據(jù)中心等業(yè)務(wù)范疇;終端主要指包括安防、車載、手機(jī)、音箱、機(jī)器人等各種應(yīng)用在內(nèi)的移動(dòng)終端。由于算法效率和底層硬件選擇密切相關(guān),“云端”(服務(wù)器端)和“終端”(產(chǎn)品端)場(chǎng)景對(duì)硬件的需求也不同。我們對(duì)目前主要的AI芯片進(jìn)行了列表梳理。

除CPU外,人工智能目前主流使用三種專用核心芯片,分別是GPU,F(xiàn)PGA,ASIC。專業(yè)術(shù)語(yǔ)比較枯燥,打個(gè)形象點(diǎn)的比方。如果把AI運(yùn)算比喻成游泳運(yùn)動(dòng),CPU,GPU,F(xiàn)PGA,ASIC相當(dāng)于四類運(yùn)動(dòng)員:(1)CPU是身體素質(zhì)很好的體校學(xué)員,會(huì)游泳,參賽比較費(fèi)勁;(2)GPU相當(dāng)于十項(xiàng)全能選手,本身就會(huì)游泳,直接可以上場(chǎng)參賽;(3)FPGA相當(dāng)于可以變形的機(jī)器人選手,需預(yù)先變形后下水競(jìng)爭(zhēng),成績(jī)?nèi)Q于編程效果;(4)ASIC相當(dāng)于長(zhǎng)時(shí)間培養(yǎng)的專業(yè)游泳選手,游得最快,但培養(yǎng)一個(gè)優(yōu)秀專業(yè)運(yùn)動(dòng)員需要較長(zhǎng)時(shí)間。

下面分別介紹。

GPU:先發(fā)制人的“十項(xiàng)全能”選手,云端終端均拔頭籌。GPU(Graphics Processing Unit)又稱圖形處理器,之前是專門用作圖像運(yùn)算工作的微處理器。相比CPU,GPU由于更適合執(zhí)行復(fù)雜的數(shù)學(xué)和幾何計(jì)算(尤其是并行運(yùn)算),剛好與包含大量的并行運(yùn)算的人工智能深度學(xué)習(xí)算法相匹配,因此在人工智能時(shí)代剛好被賦予了新的使命,成為人工智能硬件首選,在云端和終端各種場(chǎng)景均率先落地。目前在云端作為AI“訓(xùn)練”的主力芯片,在終端的安防、汽車等領(lǐng)域,GPU也率先落地,是目前應(yīng)用范圍最廣、靈活度最高的AI硬件。

FPGA:“變形金剛”,算法未定型前的階段性最佳選擇。FPGA(Field-ProgrammableGate Array)即現(xiàn)場(chǎng)可編程門陣列,是一種用戶可根據(jù)自身需求進(jìn)行重復(fù)編程的“萬(wàn)能芯片”。編程完畢后功能相當(dāng)于ASIC(專用集成電路),具備效率高、功耗低的特點(diǎn),但同時(shí)由于要保證編程的靈活性,電路上會(huì)有大量冗余,因此成本上不能像ASIC做到最優(yōu),并且工作頻率不能太高(一般主頻低于500MHz)。FPGA相比GPU具有低功耗優(yōu)勢(shì),同時(shí)相比ASIC具有開(kāi)發(fā)周期快,更加靈活編程等特點(diǎn)。FPGA于“應(yīng)用爆發(fā)”與“ASIC量產(chǎn)”夾縫中尋求發(fā)展,是效率和靈活性的較好折衷,“和時(shí)間賽跑”,在算法未定型之前具較大優(yōu)勢(shì)。在現(xiàn)階段云端數(shù)據(jù)中心業(yè)務(wù)中,F(xiàn)PGA以其靈活性和可深度優(yōu)化的特點(diǎn),有望繼GPU之后在該市場(chǎng)爆發(fā);在目前的終端智能安防領(lǐng)域,目前也有廠商采用FPGA方案實(shí)現(xiàn)AI硬件加速。

ASIC:“專精職業(yè)選手”,專一決定效率,AI芯片未來(lái)最佳選擇。ASIC(Application Specific Integrated Circuit)即專用集成電路,本文中特指專門為AI應(yīng)用設(shè)計(jì)、專屬架構(gòu)的處理器芯片。近年來(lái)涌現(xiàn)的類似TPU、NPU、VPU、BPU等令人眼花繚亂的各種芯片,本質(zhì)上都屬于ASIC。無(wú)論是從性能、面積、功耗等各方面,AISC都優(yōu)于GPU和FPGA,長(zhǎng)期來(lái)看無(wú)論在云端和終端,ASIC都代表AI芯片的未來(lái)。但在AI算法尚處于蓬勃發(fā)展、快速迭代的今天,ASIC存在開(kāi)發(fā)周期較長(zhǎng)、需要底層硬件編程、靈活性較低等劣勢(shì),因此發(fā)展速度不及GPU和FPGA。

下面兩章我們分別仔細(xì)分析云端和終端兩種應(yīng)用場(chǎng)景下,這三種專屬AI芯片的應(yīng)用現(xiàn)狀、發(fā)展前景及可能變革。

云端場(chǎng)景:GPU生態(tài)領(lǐng)先,未來(lái)多種芯片互補(bǔ)共存

核心結(jié)論: GPU、TPU等適合并行運(yùn)算的處理器未來(lái)成為支撐人工智能運(yùn)算的主力器件,既存在競(jìng)爭(zhēng)又長(zhǎng)期共存,一定程度可相互配合;FPGA有望在數(shù)據(jù)中心業(yè)務(wù)承擔(dān)較多角色,在云端主要作為有效補(bǔ)充存在;CPU會(huì)“變小”,依舊作為控制中心。未來(lái)芯片的發(fā)展前景取決于生態(tài),有望統(tǒng)一在主流的幾個(gè)軟件框架下,形成云CPU+GPU/TPU+FPGA(可選)的多芯片協(xié)同場(chǎng)景。

依托大數(shù)據(jù),科技巨頭不同技術(shù)路徑布局AI云平臺(tái)

基于云平臺(tái),各大科技巨頭大力布局人工智能。云計(jì)算分為三層,分別是Infrastructure(基礎(chǔ)設(shè)施)-as-a-Service(IaaS),Platform(平臺(tái))-as-a-Service(Paas),Software(軟件)-as-a-Service(Saas)?;A(chǔ)設(shè)施在最下端,平臺(tái)在中間,軟件在頂端。IaaS公司提供場(chǎng)外服務(wù)器,存儲(chǔ)和網(wǎng)絡(luò)硬件。大數(shù)據(jù)為人工智能提供信息來(lái)源,云計(jì)算為人工智能提供平臺(tái),人工智能關(guān)鍵技術(shù)是在云計(jì)算和大數(shù)據(jù)日益成熟的背景下取得了突破性進(jìn)展。目前各大科技巨頭看好未來(lái)人工智能走向云端的發(fā)展態(tài)勢(shì),紛紛在自有云平臺(tái)基礎(chǔ)上搭載人工智能系統(tǒng),以期利用沉淀在云端的大數(shù)據(jù)挖掘價(jià)值。

千億美元云服務(wù)市場(chǎng),AI芯片發(fā)展?jié)摿薮?/span>

千億美元云服務(wù)市場(chǎng),云計(jì)算硬件市場(chǎng)規(guī)模巨大。云計(jì)算的市場(chǎng)規(guī)模在逐漸擴(kuò)大。據(jù)Gartner 的統(tǒng)計(jì),2015年以IaaS、PaaS和SaaS為代表的典型云服務(wù)市場(chǎng)規(guī)模達(dá)到522.4億美元,增速20.6%,預(yù)計(jì)2020年將達(dá)到1435.3億美元,年復(fù)合增長(zhǎng)率達(dá)22%。其中IaaS公司到2020年市場(chǎng)空間達(dá)到615億美元,占整個(gè)云計(jì)算市場(chǎng)達(dá)43%,云計(jì)算硬件市場(chǎng)空間巨大,而云計(jì)算和人工智能各種加速算法關(guān)系密切,未來(lái)的云計(jì)算硬件離不開(kāi)AI芯片加速。

云端AI芯片發(fā)展?jié)摿薮蟆?/span>根據(jù)英偉達(dá)與AMD財(cái)務(wù)數(shù)據(jù),我們預(yù)計(jì)GPU到2020年在數(shù)據(jù)中心業(yè)務(wù)中將達(dá)到約50億美元市場(chǎng)規(guī)模。同時(shí)根據(jù)賽靈思與阿爾特拉等FPGA廠商,我們預(yù)計(jì)2020年FPAG數(shù)據(jù)中心業(yè)務(wù)將達(dá)到20億美元。加上即將爆發(fā)的ASIC云端市場(chǎng)空間,我們預(yù)計(jì)到2020年云端AI芯片市場(chǎng)規(guī)模將達(dá)到105.68億美元,AI芯片在云端會(huì)成為云計(jì)算的重要組成部分,發(fā)展?jié)摿薮蟆?/span>

云端芯片現(xiàn)狀總結(jié):GPU領(lǐng)先,F(xiàn)PGA隨后,ASIC萌芽

AI芯片在云端基于大數(shù)據(jù),核心負(fù)責(zé)“訓(xùn)練”。云端的特征就是“大數(shù)據(jù)+云計(jì)算”,用戶依靠大數(shù)據(jù)可進(jìn)行充分的數(shù)據(jù)分析和數(shù)據(jù)挖掘、提取各類數(shù)據(jù)特征,與人工智能算法充分結(jié)合進(jìn)行云計(jì)算,從而衍生出服務(wù)器端各種AI+應(yīng)用。AI芯片是負(fù)責(zé)加速人工智能各種復(fù)雜算法的硬件。由于相關(guān)計(jì)算量巨大,CPU架構(gòu)被證明不能滿足需要處理大量并行計(jì)算的人工智能算法,需要更適合并行計(jì)算的芯片,所以GPU、FPGA、TPU等各種芯片應(yīng)運(yùn)而生。AI芯片在云端可同時(shí)承擔(dān)人工智能的“訓(xùn)練”和“推斷”過(guò)程。

云端芯片現(xiàn)狀:GPU占據(jù)云端人工智能主導(dǎo)市場(chǎng),以TPU為代表的ASIC目前只運(yùn)用在巨頭的閉環(huán)生態(tài), FPGA在數(shù)據(jù)中心業(yè)務(wù)中發(fā)展較快。

GPU應(yīng)用開(kāi)發(fā)周期短,成本相對(duì)低,技術(shù)體系成熟,目前全球各大公司云計(jì)算中心如谷歌、微軟、亞馬遜、阿里巴巴等主流公司均采用GPU進(jìn)行AI計(jì)算;谷歌除大量使用GPU外,努力發(fā)展自己的AI專屬的ASIC芯片。今年5月推出的TPU與GPU相比耗電量降低60%,芯片面積下降40%,能更好的滿足其龐大的AI算力要求,但由于目前人工智能算法迭代較快,目前TPU只供谷歌自身使用,后續(xù)隨著TensorFlow的成熟,TPU也有外供可能,但通用性還有很長(zhǎng)路要走。

百度等廠商目前在數(shù)據(jù)中心業(yè)務(wù)中也積極采用FPGA進(jìn)行云端加速。FPGA可以看做從GPU到ASIC重點(diǎn)過(guò)渡方案。相對(duì)于GPU可深入到硬件級(jí)優(yōu)化,相比ASIC在目前算法不斷迭代演進(jìn)情況下更具靈活性,且開(kāi)發(fā)時(shí)間更短。AI領(lǐng)域?qū)S眉軜?gòu)芯片(ASIC)已經(jīng)被證明可能具有更好的性能和功耗,有望成為未來(lái)人工智能硬件的主流方向。

云端GPU:云端AI芯片主流,先發(fā)優(yōu)勢(shì)明顯

1.1 發(fā)展現(xiàn)狀:GPU天然適合并行計(jì)算,是目前云端AI應(yīng)用最廣的芯片

GPU目前云端應(yīng)用范圍最廣。目前大量涉足人工智能的企業(yè)都采用GPU進(jìn)行加速。根據(jù)英偉達(dá)官方資料,與英偉達(dá)合作開(kāi)發(fā)深度學(xué)習(xí)項(xiàng)目的公司2016年超過(guò)19000家,對(duì)比2014年數(shù)量1500 家。目前百度、Google、Facebook 和微軟等IT巨頭都采用英偉達(dá)的GPU對(duì)其人工智能項(xiàng)目進(jìn)行加速,GPU目前在云端AI深度學(xué)習(xí)場(chǎng)景應(yīng)用最為廣泛, 由于其良好的編程環(huán)境帶來(lái)的先發(fā)優(yōu)勢(shì),預(yù)計(jì)未來(lái)仍將持續(xù)強(qiáng)勢(shì)。

GPU芯片架構(gòu)脫胎圖像處理,并行計(jì)算能力強(qiáng)大。GPU(Graphics Processing Unit),又稱視覺(jué)處理器,是之前應(yīng)用在個(gè)人電腦、工作站、游戲機(jī)、移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)等芯片內(nèi)部,專門用作圖像運(yùn)算工作的微處理器。與CPU類似可以編程,但相比CPU更適合執(zhí)行復(fù)雜的數(shù)學(xué)和幾何計(jì)算,尤其是并行運(yùn)算。內(nèi)部具有高并行結(jié)構(gòu)(highly paralle lstructure),在處理圖形數(shù)據(jù)和復(fù)雜算法方面擁有比CPU更高的效率。

GPU較CPU結(jié)構(gòu)差異明顯,更適合并行計(jì)算。對(duì)比GPU和CPU在結(jié)構(gòu)上的差異,CPU大部分面積為控制器寄存器,GPU擁有更多的ALU(Arithmetic Logic Unit,邏輯運(yùn)算單元)用于數(shù)據(jù)處理,而非數(shù)據(jù)高速緩存和流控制,這樣的結(jié)構(gòu)適合對(duì)密集型數(shù)據(jù)進(jìn)行并行處理。CPU執(zhí)行計(jì)算任務(wù)時(shí),一個(gè)時(shí)刻只處理一個(gè)數(shù)據(jù),不存在真正意義上的并行,而GPU具有多個(gè)處理器核,同一時(shí)刻可并行處理多個(gè)數(shù)據(jù)。

與CPU相比,GPU在AI領(lǐng)域的性能具備絕對(duì)優(yōu)勢(shì)。深度學(xué)習(xí)在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,需要很高的內(nèi)在并行度、大量的浮點(diǎn)計(jì)算能力以及矩陣運(yùn)算,而GPU可以提供這些能力,并且在相同的精度下,相對(duì)傳統(tǒng)CPU的方式,擁有更快的處理速度、更少的服務(wù)器投入和更低的功耗。在2017年5月11日的加州圣何塞GPU技術(shù)大會(huì)上,NVIDIA就已經(jīng)發(fā)布了Tesla V100。這個(gè)目前性能最強(qiáng)的GPU運(yùn)算架構(gòu)Volta采用臺(tái)積電12nm FFN制程并整合210億顆電晶體,在處理深度學(xué)習(xí)的性能上等同于250顆CPU。

1.2 生態(tài)格局:英偉達(dá)壟斷GPU市場(chǎng)

抓住人工智能契機(jī),英偉達(dá)壟斷GPU市場(chǎng)。英偉達(dá)目前占據(jù)全球GPU行業(yè)的市場(chǎng)份額超過(guò)70%,遠(yuǎn)超AMD等競(jìng)爭(zhēng)對(duì)手。GPU作為英偉達(dá)公司的核心產(chǎn)品占據(jù)其84%的收入份額。英偉達(dá)應(yīng)用領(lǐng)域涵蓋視頻游戲、電影制作、產(chǎn)品設(shè)計(jì)、醫(yī)學(xué)診斷以及科學(xué)研究等各個(gè)門類。主營(yíng)產(chǎn)品包括游戲顯卡GeForceGPU,用于深度學(xué)習(xí)計(jì)算的Tesla GPU,以及為智能汽車處理設(shè)計(jì)Tegra 處理器等。得益于人工智能發(fā)展,英偉達(dá)營(yíng)收利潤(rùn)不斷攀升,成為人工智能產(chǎn)業(yè)最大受益公司之一。

編程環(huán)境良好,是英偉達(dá)GPU壟斷云端AI硬件主流的重要原因。由于廣泛應(yīng)用于圖形圖像處理,GPU具備相對(duì)良好的編程環(huán)境和使用其編程的軟件工程師人群,因此成為目前最主流的深度學(xué)習(xí)硬件。英偉達(dá)公司發(fā)布的CUDA運(yùn)算平臺(tái),是專門針對(duì)開(kāi)發(fā)者提供的一種并行計(jì)算平臺(tái)。開(kāi)發(fā)者能通過(guò)CUDA平臺(tái)使用軟件語(yǔ)言很方便得開(kāi)發(fā)英偉達(dá)GPU實(shí)現(xiàn)運(yùn)算加速。由于CUDA平臺(tái)之前被廣泛認(rèn)可和普及,積累了良好的編程環(huán)境,目前應(yīng)用在人工智能領(lǐng)域、可進(jìn)行通用計(jì)算的GPU市場(chǎng)基本被英偉達(dá)壟斷。

云端數(shù)據(jù)中心及車載等AI相關(guān)領(lǐng)域,成為英偉達(dá)業(yè)務(wù)成長(zhǎng)新引擎。英偉達(dá)公司2017財(cái)年全年?duì)I收創(chuàng)下69.1億美元紀(jì)錄,較上2016財(cái)年的50.1億美元增長(zhǎng)38%。按照終端用戶應(yīng)用領(lǐng)域拆分,英偉達(dá)主營(yíng)業(yè)務(wù)拆分為游戲、數(shù)據(jù)中心、專業(yè)可視化、汽車業(yè)務(wù)。游戲業(yè)務(wù)2017財(cái)年?duì)I收達(dá)到40.6億美元,占總營(yíng)收58.8%,同比增長(zhǎng)44.1%;數(shù)據(jù)中心和汽車的份額分別占總營(yíng)收12%和7%,其中數(shù)據(jù)中心增長(zhǎng)同比達(dá)到144.8%,汽車增長(zhǎng)同比達(dá)到52.2%。公司從2017財(cái)年Q1季度到2018財(cái)年Q1季度,主營(yíng)構(gòu)成變動(dòng)很大,數(shù)據(jù)中心業(yè)務(wù)占比11%增長(zhǎng)至21%,成長(zhǎng)速度迅猛,成為英偉達(dá)業(yè)務(wù)增長(zhǎng)新引擎。

1.3 未來(lái)趨勢(shì):從開(kāi)環(huán)到專精,未來(lái)GPU在云端市場(chǎng)繼續(xù)強(qiáng)勢(shì)

GPU不斷適應(yīng)AI的進(jìn)化路徑,未來(lái)進(jìn)化方向:從“開(kāi)環(huán)”到“專精”。目前云端應(yīng)用范圍最廣、效率最高的AI芯片仍是GPU。但AI芯片并非只有GPU一種路徑,ASIC與FPGA相關(guān)廠商相繼推出針對(duì)人工智能計(jì)算的芯片。谷歌推出ASIC芯片TPU2代,性能達(dá)到45 TFLOPS(一個(gè)TFLOPS等于每秒萬(wàn)億次的浮點(diǎn)運(yùn)算),而功耗僅僅40W。國(guó)內(nèi)公司寒武紀(jì)推出的ASIC芯片DaDianNao性能達(dá)到5.585 TFLOPS,功耗僅為15.97W。眾多專屬ASIC芯片的推出,可能威脅到未來(lái)GPU的霸主地位。英偉達(dá)顯然意識(shí)到這一點(diǎn),不斷推動(dòng)技術(shù)創(chuàng)新,推出性能更加強(qiáng)勁、更適合AI運(yùn)算的產(chǎn)品,不斷對(duì)其GPU進(jìn)行深度優(yōu)化,向更專精AI運(yùn)算方向努力。2017年5月,英偉達(dá)發(fā)布旗艦芯片Tesla V100,對(duì)比上一代TeslaP100,最大變化就是增加了與深度學(xué)習(xí)高度相關(guān)的Tensor單元,Tensor性能可以達(dá)到120TFLOPS。GPU不斷適應(yīng)AI的進(jìn)化路徑,從從“開(kāi)環(huán)通用”到“AI專精”方向進(jìn)化,性能不斷提高,加之生態(tài)環(huán)境的先發(fā)優(yōu)勢(shì),預(yù)計(jì)未來(lái)2~3年,GPU仍是人工智能云端市場(chǎng)最重要的組成部分。

云端ASIC:以TPU為代表,性能取勝,爭(zhēng)奪未來(lái)AI制高點(diǎn)

2.1發(fā)展趨勢(shì):ASIC—未來(lái)人工智能專屬核心芯片

ASIC目前在AI方向上的發(fā)展尚處于早期。ASIC全稱專用集成電路,是應(yīng)針對(duì)特定場(chǎng)景、需求、算法而設(shè)計(jì)的專用芯片。目前人工智能類 ASIC 的發(fā)展仍處于早期。根本原因是目前人工智能算法尚未定型,迭代較快,而ASIC設(shè)計(jì)一旦設(shè)計(jì)制造完成后功能就基本固定,相對(duì)GPU、FPGA而言不夠靈活,且開(kāi)發(fā)周期長(zhǎng)、初期成本高。人工智能ASIC芯片公司需要既具備人工智能算法框架,又擅長(zhǎng)芯片研發(fā),進(jìn)入門檻較高。

ASIC性能、能耗和大規(guī)模量產(chǎn)成本均顯著優(yōu)于GPU和FPGA,是未來(lái)云端人工智能重要發(fā)展方向。針對(duì)特定云端應(yīng)用,作為全定制設(shè)計(jì)的ASIC芯片,性能和能耗都要優(yōu)于FPGA 和 GPU。谷歌最近研發(fā)出人工智能ASIC TPU,和傳統(tǒng)的GPU相比性能提升15倍,更是CPU 浮點(diǎn)性能的30倍。由于ASIC兼具性能和功耗雙重優(yōu)點(diǎn),加之大規(guī)模量產(chǎn)條件下ASIC單片成本大幅下降,我們判斷其定會(huì)成為人工智能未來(lái)的核心芯片。

2.2生態(tài)格局:谷歌TPU為目前自用最強(qiáng)ASIC,期待生態(tài)完善后外供

TPU:目前谷歌自用最強(qiáng)ASIC芯片,期待生態(tài)完善后外供。隨著 AlphaGo 橫掃人類頂尖棋手,谷歌在AlphaGo 中應(yīng)用的 ASIC 芯片TPU受到業(yè)界熱捧,谷歌于 2016年 Google I/O 大會(huì)上正式介紹第一代 TPU 產(chǎn)品,在今年5 月的開(kāi)發(fā)者 I/O 大會(huì)上, Google 正式公布了第二代 TPU,又稱為 Cloud TPU,其最大的特色在于相比初代TPU, 它既可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),又可以用于推理,這既為推理階段進(jìn)行了優(yōu)化,也為訓(xùn)練階段進(jìn)行了優(yōu)化。在性能方面,第二代 TPU 可以達(dá)到 45 TFLOPs 的浮點(diǎn)性能。和傳統(tǒng)的 GPU 相比提升 15 倍,更是CPU浮點(diǎn)性能的30倍。生態(tài)方面,目前TPU僅支持自身的開(kāi)源 TensorFlow 機(jī)器學(xué)習(xí)框架和生態(tài)系統(tǒng)。這和生態(tài)系統(tǒng)非常完善的GPU相比有一定的不足。不過(guò)谷歌也意識(shí)到了這個(gè)不足,為了彌補(bǔ)生態(tài)上面的不足,谷歌提出了TensorFlow Research Cloud計(jì)劃,為愿意分享自己工作成果的研究人員免費(fèi)提供1000個(gè)Cloud TPU。相信隨著TPU生態(tài)的不斷完善,性能更加強(qiáng)悍的TPU將成為云端人工智能的未來(lái)。

3.云端FGPA:云端的有效補(bǔ)充,低延時(shí)場(chǎng)景具備充分優(yōu)勢(shì)

3.1 會(huì)變形的萬(wàn)能芯片,未來(lái)云端AI的最好補(bǔ)充

FPGA可編程,靈活性高。FPGA(Field-Programmable Gate Array),即現(xiàn)場(chǎng)可編程門陣列,它是在PAL、CPLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。FPGA內(nèi)部包含大量重復(fù)的IOB(輸入輸出模塊)、CLB(可配置邏輯塊,內(nèi)部是基本的邏輯門電路,與門、或門等)和布線信道等基本單元。FPGA在出廠時(shí)是“萬(wàn)能芯片”,用戶可根據(jù)自身需求,用硬件描述語(yǔ)言(HDL)對(duì)FPGA的硬件電路進(jìn)行設(shè)計(jì);每完成一次燒錄,F(xiàn)PGA內(nèi)部的硬件電路就有了確定的連接方式,具有了一定的功能。FPGA可隨意定制內(nèi)部邏輯的陣列,并且可以在用戶現(xiàn)場(chǎng)進(jìn)行即時(shí)編程,以修改內(nèi)部的硬件邏輯,從而實(shí)現(xiàn)任意邏輯功能。

3.2 核心優(yōu)勢(shì):在云端算法性能高、功耗和延遲低

FPGA無(wú)指令、無(wú)共享內(nèi)存,并行計(jì)算效率高。CPU、GPU都屬于馮·諾依曼結(jié)構(gòu),需要指令譯碼執(zhí)行、共享內(nèi)存,是傳統(tǒng)意義上的“軟件編程”。而FPGA每個(gè)邏輯單元的功能在重編程(燒寫)時(shí)就已經(jīng)確定,不需要指令,屬于“硬件編程”;FPGA每個(gè)邏輯單元與周圍邏輯單元的連接在重編程時(shí)就已經(jīng)確定,也不需要通過(guò)共享內(nèi)存來(lái)通信。FPGA利用硬件并行的優(yōu)勢(shì),打破順序執(zhí)行的模式,因此在每個(gè)時(shí)鐘周期內(nèi)完成更多的處理任務(wù),執(zhí)行效率大幅提高。

FPGA相對(duì)CPU、GPU能耗優(yōu)勢(shì)明顯。一方面,由于是直接燒錄成專用電路,F(xiàn)PGA沒(méi)有存取指令和指令譯碼操作,因此功耗優(yōu)勢(shì)明顯。Intel的CPU指令譯碼就占整個(gè)芯片能耗的50%;在GPU里面,取指令和譯碼也消耗了10%~20%的功耗。另一方面,F(xiàn)PGA的主頻比CPU與GPU低很多,通常CPU與GPU都在1GHz到3GHz之間,而FPGA主頻一般在500MHz以下。微軟研究院2010年分析了CPU、GPU以及FPGA對(duì)矩陣運(yùn)算的底層庫(kù)相同運(yùn)算的加速性能以及能耗,對(duì)比執(zhí)行GaxPy算法(一種常用矩陣算法)每次迭代的時(shí)間和能耗,結(jié)論是FPGA、GPU相對(duì)于CPU的加速比優(yōu)勢(shì)明顯,與此同時(shí)FPGA的能耗僅是CPU與GPU的8%左右。

對(duì)于計(jì)算/通信密集型任務(wù),F(xiàn)PGA比CPU、GPU延遲低。FPGA同時(shí)可擁有流水線并行和數(shù)據(jù)并行,而GPU幾乎只有數(shù)據(jù)并行(流水線深度受限)。當(dāng)任務(wù)是逐個(gè)而非成批到達(dá)的時(shí)候,流水線并行比數(shù)據(jù)并行可實(shí)現(xiàn)更低的延遲,F(xiàn)PGA比GPU天生有延遲方面的優(yōu)勢(shì)。對(duì)于通信密集型任務(wù),F(xiàn)PGA相比CPU、GPU的低延遲優(yōu)勢(shì)更明顯。使用FPGA和ASIC等低延遲和高吞吐量的硬件,運(yùn)行在網(wǎng)絡(luò)的最低層,保證所有數(shù)據(jù)以安全及時(shí)的方式傳輸,能夠提高網(wǎng)絡(luò)可靠性并節(jié)省負(fù)載。

靈活性和效率的折衷,適應(yīng)數(shù)據(jù)中心不斷變化的算法。FPGA在數(shù)據(jù)中心最大的特點(diǎn)就在高吞吐的同時(shí)能做到低延時(shí)。FPGA內(nèi)部的資源都是可以重配置的,因此它可以很容易進(jìn)行數(shù)據(jù)并行和流水并行,且易于在數(shù)據(jù)并行和流水并行之間平衡。而GPU幾乎只能做數(shù)據(jù)并行。與ASIC相比,F(xiàn)PGA的可編程性體現(xiàn)出很大的優(yōu)勢(shì)?,F(xiàn)在數(shù)據(jù)中心的各種算法每時(shí)每刻都在更新變化,沒(méi)有足夠穩(wěn)定的時(shí)間讓ASIC完成長(zhǎng)周期的開(kāi)發(fā)。比如在一種神經(jīng)網(wǎng)絡(luò)模型出來(lái)之后開(kāi)始把它做成ASIC,也許還未投片生產(chǎn),這個(gè)神經(jīng)網(wǎng)絡(luò)模型已經(jīng)被另一種神經(jīng)網(wǎng)絡(luò)模型所替代。另一方面,F(xiàn)PGA可以在不同的業(yè)務(wù)需求之間做平衡。比如說(shuō)白天用于為搜索業(yè)務(wù)排序的機(jī)器;在晚上請(qǐng)求很少的情況下,可以將這些FPGA重新配置成離線數(shù)據(jù)分析的功能,提供對(duì)離線數(shù)據(jù)進(jìn)行分析的服務(wù)。目前騰訊云和百度云都大量部署FPGA在數(shù)據(jù)中心的服務(wù)器用于加速。

可編程性會(huì)導(dǎo)致面積和功耗冗余,長(zhǎng)期看在云端比終端應(yīng)用更廣泛。FPGA的工作模式,決定了需要預(yù)先布置大量門陣列以滿足用戶的設(shè)計(jì)需求,因此有“以面積換速度”的說(shuō)法:使用大量的門電路陣列,消耗更多的FPGA內(nèi)核資源,用來(lái)提升整個(gè)系統(tǒng)的運(yùn)行速度。因此,F(xiàn)PGA的可編程性和靈活性必然會(huì)導(dǎo)致一定程度上的面積和功耗冗余,但很多場(chǎng)景中可編程性收益遠(yuǎn)高于冗余成本,這些場(chǎng)景往往在云端更多。因?yàn)榻K端只做“推理”,特定場(chǎng)景算法更為固定,成本要求也更高,因此FPGA在終端最終會(huì)被ASIC取代。

3.3 市場(chǎng)空間:緊隨GPU受益云端數(shù)據(jù)中心市場(chǎng)爆發(fā),2020年規(guī)?;蜻_(dá)20億美元

FPGA數(shù)據(jù)中心業(yè)務(wù)將緊隨GPU爆發(fā),預(yù)計(jì)未來(lái)5年潛在市場(chǎng)空間達(dá)20億美元。據(jù) Gartner 統(tǒng)計(jì), 2014 年全球 FPGA 市場(chǎng)規(guī)模達(dá)到 50 億美元,2015-2020 年的年均復(fù)合增長(zhǎng)率為9%,到 2020 年將達(dá)到 84 億美元。FPGA 高性能、低能耗以及可硬件編程的特點(diǎn)使其適用范圍得以擴(kuò)大。據(jù)Synergy Research Group數(shù)據(jù),2016年底超大規(guī)模提供商運(yùn)營(yíng)的大型數(shù)據(jù)中心的數(shù)量已突破300個(gè),預(yù)計(jì)到2018年大型數(shù)據(jù)中心將超過(guò)400個(gè)。數(shù)據(jù)中心的快速發(fā)展必然拉動(dòng)FPGA市場(chǎng)增長(zhǎng),我們預(yù)計(jì)用于數(shù)據(jù)中心的FPGA市場(chǎng)規(guī)模在2020年將達(dá)到20億美元。

數(shù)據(jù)中心“瑜亮之爭(zhēng)”:既有GPU,還需FPGA?由于FPGA是硬件語(yǔ)言編程,需要耗費(fèi)芯片設(shè)計(jì)工程師資源做上層軟件算法的底層硬件的“影射”,加之目前性能、成本上綜合來(lái)看還是GPU更好,所以GPU是目前數(shù)據(jù)中心主流。但未來(lái)FPGA在數(shù)據(jù)中心業(yè)務(wù)中前景光明,原因有兩點(diǎn):第一,云巨頭企業(yè)本質(zhì)上希望其算法優(yōu)化從硬件底層起就可實(shí)現(xiàn),而并非完全受控于英偉達(dá)GPU的編譯和運(yùn)行性能,為未來(lái)底層硬件的自身完全定制化(做自己的ASIC)做準(zhǔn)備,所以部分云廠商愿意面向未來(lái),在FPGA開(kāi)發(fā)上投入成本;第二,F(xiàn)PGA功耗特性較GPU好很多,數(shù)據(jù)中心業(yè)務(wù)運(yùn)算量巨大,未來(lái)必須考慮功耗問(wèn)題,如下表所示,各型號(hào)FPGA功耗比都優(yōu)于GPU。在算法逐步穩(wěn)定以后,針對(duì)數(shù)據(jù)中心不同應(yīng)用場(chǎng)景,F(xiàn)PGA的萬(wàn)能變形優(yōu)勢(shì)會(huì)逐步體現(xiàn)。

3.4 生態(tài)格局:兩公司壟斷,巨頭并購(gòu)?fù)癸@云端AI有效補(bǔ)充地位

Altera與Xilinx兩公司壟斷FPGA市場(chǎng)。目前全球 FPGA 市場(chǎng)主要被 Altera 和 Xilinx瓜分,合計(jì)占有近90%的市場(chǎng)份額,合計(jì)專利達(dá)到 6000 多項(xiàng),剩余份額被 LatticeMicrosemi 兩家占據(jù),合計(jì)共有超過(guò) 3000 項(xiàng)專利。技術(shù)專利的限制和漫長(zhǎng)的開(kāi)發(fā)周期使得 FPGA行業(yè)形成了很高的壁壘,這也進(jìn)一步鞏固了 Altera 和 Xilinx 兩家公司的優(yōu)勢(shì)地位和盈利水平。

Intel收購(gòu)Altera,看好FPGA在未來(lái)數(shù)據(jù)中心的核心價(jià)值。2014年6月,微軟對(duì)外公布其針對(duì)數(shù)據(jù)處理的研發(fā)項(xiàng)目ProjectCatapult,研究結(jié)果顯示,將FPGA應(yīng)用于Intel服務(wù)器,后者性能可以提升10倍,處理效率提升30%以上,能耗也顯著降低。2015年6月,Intel以167億美元收購(gòu)FPGA龍頭公司Altera。Altera對(duì)于Intel的價(jià)值,核心在于數(shù)據(jù)中心業(yè)務(wù)。長(zhǎng)久以來(lái),Intel一直在PC、服務(wù)器、存儲(chǔ)市場(chǎng)以及數(shù)據(jù)中心領(lǐng)域占據(jù)絕對(duì)優(yōu)勢(shì)地位。2017年一季度Intel數(shù)據(jù)中心業(yè)務(wù)收入同比增長(zhǎng)6%至42億美元,二季度收入同比增長(zhǎng)9%至44億美元,增長(zhǎng)勢(shì)頭強(qiáng)勁。Altera FPGA技術(shù)結(jié)合IntelCPU制造技術(shù),能夠?qū)PU的復(fù)雜數(shù)據(jù)處理能力與FPGA的數(shù)據(jù)并行處理能力結(jié)合,未來(lái)在數(shù)據(jù)中心應(yīng)用領(lǐng)域顯現(xiàn)出強(qiáng)強(qiáng)聯(lián)合的優(yōu)勢(shì),構(gòu)建未來(lái)云端人工智能的堅(jiān)實(shí)基礎(chǔ)。

互聯(lián)網(wǎng)巨頭云端積極部署包含F(xiàn)PGA的數(shù)據(jù)中心,未來(lái)可期。由于FPGA在數(shù)據(jù)中心的獨(dú)特優(yōu)勢(shì),亞馬遜、微軟等企業(yè)在數(shù)據(jù)中心均紛紛部署FPGA。國(guó)內(nèi),騰訊云在年初部署了首個(gè)FPGA云服務(wù)器。2017年7月,百度云也宣布在其公有云服務(wù)器中部署基于賽靈思FPGA的應(yīng)用加速服務(wù)。國(guó)內(nèi)外主流云服務(wù)企業(yè)紛紛把目光聚焦在了FPGA上,這顯然不是巧合,這說(shuō)明整個(gè)云服務(wù)行業(yè)似乎已經(jīng)對(duì)FPGA在高性能計(jì)算上的重要性上達(dá)成了一致,F(xiàn)PGA在云端特別是底層的數(shù)據(jù)中心業(yè)務(wù)前景可期。

云端AI芯片未來(lái):各自進(jìn)化,走向融合,生態(tài)定義未來(lái)

云端不同的AI芯片在向彼此學(xué)習(xí)和進(jìn)化。一方面,以英偉達(dá)為代表的GPU從通用到精進(jìn),不斷優(yōu)化其GPU架構(gòu),使其針對(duì)人工智能算法進(jìn)行優(yōu)化,向更加專業(yè)化的人工智能領(lǐng)域擴(kuò)展。另一方面,以谷歌TPU為代表的云端ASIC,為了滿足靈活性和通用性,也設(shè)計(jì)了眾多指令集同時(shí)支持訓(xùn)練和推理,未來(lái)有望實(shí)現(xiàn)從閉環(huán)到開(kāi)環(huán)的拓展。谷歌CEO在2017年5月的開(kāi)發(fā)者大會(huì)上表示,谷歌將免費(fèi)開(kāi)放 1000 臺(tái) Cloud TPU 供開(kāi)發(fā)者和研究人員使用。相信隨著TensorFlow的框架完善、谷歌TPU自身的架構(gòu)優(yōu)化、靈活性加強(qiáng)與通用性的完善,我們預(yù)計(jì)未來(lái)TPU芯片也會(huì)從谷歌內(nèi)部使用改為外供給其他云端服務(wù)器廠商。

云端有望形成“CPU+GPU/TPU+FPGA”的多芯片融合態(tài)勢(shì)。CPU繼續(xù)作為服務(wù)器的控制核心,GPU和ASIC(TPU等)將成為人工智能云端的運(yùn)算主力,F(xiàn)PGA在延時(shí)要求高的計(jì)算/通信密集型任務(wù)中作為有效補(bǔ)充,未來(lái)有望形成CPU+GPU/TPU+FPGA多芯片融合共存的發(fā)展態(tài)勢(shì)。云計(jì)算巨頭紛紛推出多芯片融合的云端平臺(tái)。我們觀察到,2017年微軟在其最新上線的Azure云平臺(tái)中部署FPGA,配合原有的英特爾 CPU 和英偉達(dá)Tesla K80 GPU,實(shí)現(xiàn)性能的最大化提升。2017年3月騰訊云宣布,已形成包含CPU+GPU+FPGA全矩陣AI基礎(chǔ)設(shè)施計(jì)算平臺(tái)。

生態(tài)完善度或決定AI芯片市場(chǎng)未來(lái)

上層生態(tài)完善度或?qū)Q定AI芯片市場(chǎng)未來(lái)。完善的開(kāi)源生態(tài)幫助AI核心芯片擁有更強(qiáng)的用戶粘性,幫助保持市場(chǎng)空間。或?qū)Q定AI芯片市場(chǎng)未來(lái)。AI芯片生態(tài)主要包括AI開(kāi)源平臺(tái)支持與開(kāi)發(fā)環(huán)境支持兩種生態(tài)。

目前開(kāi)源平臺(tái)眾多,江湖未一統(tǒng)。AI開(kāi)源平臺(tái)是一個(gè)深度學(xué)習(xí)的工具箱,用戶可以通過(guò)此開(kāi)放平臺(tái),基于底層計(jì)算芯片運(yùn)行其算法系統(tǒng)。目前AI開(kāi)發(fā)人員主要是利用開(kāi)源平臺(tái)進(jìn)行算法優(yōu)化,因此AI硬件只有具備支持主流開(kāi)源平臺(tái)的特性,才能形成穩(wěn)定的客戶群體,牢牢占據(jù)市場(chǎng)空間。各大科技公司為了占據(jù)生態(tài)優(yōu)勢(shì)也陸續(xù)推出各自的開(kāi)源平臺(tái)系統(tǒng),之前較流行的兩大開(kāi)源平臺(tái)是Tensorflow與Caffe,近來(lái)Caffe2和mxnet也逐步興起,江湖尚未一統(tǒng)。對(duì)AI芯片廠商而言,目前需要選擇開(kāi)源平臺(tái)進(jìn)行支持。

開(kāi)源平臺(tái)生態(tài)支持方面,GPU相對(duì)完善,F(xiàn)PGA與ASIC加速跟進(jìn)。以英偉達(dá)GPU為例,其支持包括Tensorflow,Caffe,Caffe2,CNTK,Torch等幾乎所有的開(kāi)源平臺(tái),完善的生態(tài)優(yōu)勢(shì)使得GPU目前具備極強(qiáng)競(jìng)爭(zhēng)力。FPGA與ASIC相關(guān)廠商也紛紛注意到生態(tài)的重要性,陸續(xù)推出支持主流開(kāi)源平臺(tái)的產(chǎn)品。2016年,谷歌發(fā)布的TPU2代支持其自家的Tensorflow框架。2017年3月,Xilinx推出基于FPGA的reVISION堆棧解決方案,支持Caffe框架,并計(jì)劃未來(lái)拓展到更多的框架比如TensorFlow等框架上。開(kāi)源平臺(tái)是支撐相關(guān)開(kāi)發(fā)的基礎(chǔ),目前尚處于群雄逐鹿階段。未來(lái)平臺(tái)生態(tài)之爭(zhēng)將是各家AI芯片能否占據(jù)市場(chǎng)的一大關(guān)鍵點(diǎn)。AI芯片廠商都會(huì)盡可能支持盡可能多的主流平臺(tái),但相應(yīng)的,也會(huì)帶來(lái)更多的開(kāi)發(fā)任務(wù)量,需要折衷考慮。

在AI硬件開(kāi)發(fā)環(huán)境方面,同樣是GPU占據(jù)優(yōu)勢(shì),F(xiàn)PGA廠商加速完善。AI硬件開(kāi)發(fā)環(huán)境是指專門針對(duì)AI硬件推出的適應(yīng)于硬件計(jì)算的開(kāi)發(fā)環(huán)境,用戶能利用如C,C++等軟件語(yǔ)言更方便的基于AI芯片進(jìn)行頂層應(yīng)用開(kāi)發(fā),并且能起到硬件加速的效果。英偉達(dá)推出的CUDA是目前最流行的AI硬件開(kāi)發(fā)環(huán)境,幾乎所有英偉達(dá)主流GPU都支持CUDA開(kāi)發(fā)。FPGA方面,為了減少FPGA設(shè)計(jì)的復(fù)雜度,Altera推出了 OpenCL SDK開(kāi)發(fā)環(huán)境,Xilinx推出了SDAccel開(kāi)發(fā)環(huán)境,這兩種FPGA開(kāi)發(fā)環(huán)境都大大減輕開(kāi)發(fā)者利用FPGA開(kāi)發(fā)的難度。但目前基于FPGA的開(kāi)發(fā)環(huán)境開(kāi)發(fā)靈活度與推廣度依然不如CUDA。此外,由于ASIC直接采用底層硬件語(yǔ)言開(kāi)發(fā),目前不能用C語(yǔ)言等軟件語(yǔ)言,因此不存在開(kāi)發(fā)環(huán)境問(wèn)題。

未來(lái)有望在統(tǒng)一的軟件框架下,實(shí)現(xiàn)各類芯片在云端的融合共存。我們判斷各種芯片在云端將競(jìng)爭(zhēng)并長(zhǎng)期共存,云端上層會(huì)提供統(tǒng)一的軟件平臺(tái)對(duì)各類芯片進(jìn)行支持。換句話說(shuō),上層的開(kāi)發(fā)者未來(lái)不需要關(guān)心底層的硬件是哪種,可以使用統(tǒng)一的、支持各類底層硬件的開(kāi)源平臺(tái)進(jìn)行開(kāi)發(fā)。云端具體采用哪種芯片架構(gòu),將根據(jù)云端實(shí)際應(yīng)用需求確定。通過(guò)CPU+GPU/TPU+FPGA(可選)的靈活配置,更好地滿足和實(shí)現(xiàn)各種應(yīng)用場(chǎng)景下不斷升級(jí)更新的AI算法的需求,使云端人工智能保持長(zhǎng)期的靈活性。未來(lái)主流框架可能不止一種,類似TensorFlow、Caffe2等都有可能成為主流的Frame框架。

終端場(chǎng)景:按需求逐步落地,未來(lái)集成是趨勢(shì)

AI“下沉”終端,芯片負(fù)責(zé)推斷

云端受限于延時(shí)和安全性,催生AI向終端下沉。云端AI應(yīng)用主要依靠網(wǎng)絡(luò)將云端計(jì)算結(jié)果與終端執(zhí)行結(jié)果數(shù)據(jù)和增量環(huán)境參數(shù)進(jìn)行交換。這個(gè)過(guò)程存在兩個(gè)問(wèn)題:第一,使用網(wǎng)絡(luò)傳輸數(shù)據(jù)到云端會(huì)產(chǎn)生延遲,很可能數(shù)據(jù)計(jì)算的結(jié)果會(huì)需要等待數(shù)秒甚至數(shù)十秒才能傳回終端;第二,使用網(wǎng)絡(luò)傳送數(shù)據(jù),傳輸過(guò)程中數(shù)據(jù)有被劫持的風(fēng)險(xiǎn)。因此,在某些對(duì)延遲和安全性要求較高的場(chǎng)景就有了將AI下沉到終端的需求。

下沉到終端的AI主要是“推斷”部分。由于模型更新快,計(jì)算更為復(fù)雜,且基于大數(shù)據(jù),“訓(xùn)練”一般在云端進(jìn)行。由于數(shù)據(jù)和算力限制,未來(lái)在終端場(chǎng)景下,處理器主要負(fù)責(zé)執(zhí)行人工智能的“推斷”過(guò)程?!巴茢唷毕鲁两K端優(yōu)勢(shì)在于實(shí)時(shí)性,可以在終端進(jìn)行的操作不需要回傳云端處理,更有效滿足AI運(yùn)算的實(shí)時(shí)性需求場(chǎng)景。終端可定期從云端下載訓(xùn)練好的參數(shù)用于推斷參數(shù)更新,同時(shí)可選擇上傳云端需要的“訓(xùn)練”信息。通俗來(lái)說(shuō),未來(lái)終端人工智能“大腦”的進(jìn)化仍在云端進(jìn)行。

需求決定硬件,場(chǎng)景逐漸落地

采用硬件實(shí)現(xiàn)終端人工智能是必然。理論上,智能終端利用原有CPU大腦,運(yùn)行純軟件的AI算法,也可實(shí)現(xiàn)相關(guān)應(yīng)用。但實(shí)時(shí)性要求高的場(chǎng)景(如安防、輔助駕駛等),對(duì)“最差情況下的最大延時(shí)”容忍度很低,如果只用CPU運(yùn)算不能滿足實(shí)時(shí)性要求,必須有專屬硬件加速;而在手機(jī)、音箱、AR/VR眼鏡、機(jī)器人等使用電池、對(duì)功耗敏感的終端場(chǎng)景,采用純軟件運(yùn)算功耗很大,不能滿足用戶對(duì)功耗的苛刻要求,同樣需要采用專屬芯片加速。

終端AI推斷需要硬件支持的需求場(chǎng)景有三種:(1)低延時(shí);(2)低功耗;(3)高算力。按照需求落地先后順序,我們判斷AI芯片落地的終端子行業(yè)分別是:(1)智能安防;(2)輔助駕駛;(3)手機(jī)/音箱/無(wú)人機(jī)/機(jī)器人等其他消費(fèi)終端。三個(gè)領(lǐng)域?qū)K端AI硬件的要求各有側(cè)重:(1)智能安防、智能駕駛由于視頻信號(hào)的數(shù)據(jù)量較大,對(duì)數(shù)據(jù)流計(jì)算速度要求較高;(2)智能駕駛除計(jì)算能力外對(duì)硬件的穩(wěn)定性和突發(fā)狀況處理速度要求較高;(3)智能手機(jī)、音箱、AR/VR終端受限于電池容量,對(duì)低功耗的要求更高些。下面我們逐個(gè)分析幾種AI+場(chǎng)景。

終端落地之AI+安防:GPU和FPGA先發(fā)落地,未來(lái)主控集成ASIC

1.1 智慧安防空間:AI產(chǎn)品持續(xù)滲透,長(zhǎng)期千億市場(chǎng)空間

從“看得見(jiàn)”到“看得清”到“看得懂”,智能大數(shù)據(jù)分析需求迫切,AI+安防趨勢(shì)明顯。高清技術(shù)日益進(jìn)步,圖像分辨率從D1到720P、1080P再到4K逐步進(jìn)階,視頻監(jiān)控設(shè)備持續(xù)高清化升級(jí)換代。根據(jù)IHS 數(shù)據(jù),2013-2016年我國(guó)高清攝像機(jī)占比由13%增長(zhǎng)至59%,首次超過(guò)模擬攝像機(jī),實(shí)現(xiàn)了視頻監(jiān)控從“看得見(jiàn)”到“看得清”的轉(zhuǎn)變,滿足智能化基礎(chǔ)需求。攝像頭高清化產(chǎn)生海量數(shù)據(jù),傳統(tǒng)的人工查看方式已不滿足日益增長(zhǎng)的安防需求。同時(shí),安防領(lǐng)域每年產(chǎn)生大量非結(jié)構(gòu)化數(shù)據(jù),將海量非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化后進(jìn)行智能處理能極大提高追蹤效率,人工智能的引入能滿足從事后追查到事前防范的安防根本需求。安防領(lǐng)域在實(shí)現(xiàn)高清化網(wǎng)絡(luò)化升級(jí)后,急切需要人工智能技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行處理,這些都促使攝像頭目前開(kāi)始向“看得懂”進(jìn)化,智能安防趨勢(shì)明顯。

智慧安防產(chǎn)品首先在政府市場(chǎng)落地,長(zhǎng)期千億市場(chǎng)空間。(1)短期而言:由于AI產(chǎn)品單價(jià)較高,且適用于處理遠(yuǎn)距離的大數(shù)據(jù),因此我們認(rèn)為短期的增量空間主要看政府中的公安、交通等部門。假設(shè)國(guó)內(nèi)/國(guó)外視頻監(jiān)控行業(yè)增速分別為15%/10%,至2020年國(guó)內(nèi)外視頻監(jiān)控市場(chǎng)規(guī)模分別達(dá)1683/1234億元,保守估計(jì),若AI產(chǎn)品滲透率提升至10%,則國(guó)內(nèi)/國(guó)外AI產(chǎn)品市場(chǎng)空間分別為168/148億元。(2)長(zhǎng)期來(lái)看:隨著性價(jià)比更高的芯片解決方推出,海思等主控廠商必然推出包含AI專屬TPU的IPC主控產(chǎn)品,以??禐槭椎陌卜缽S商也必然研發(fā)推出適合自身的AI+芯片終端解決方案,AI產(chǎn)品單價(jià)將逐步回歸理性,智慧產(chǎn)品的滲透范圍有望快速滲透延伸至其他領(lǐng)域。未來(lái)AI產(chǎn)品滲透率若提升至35%,則全球AI產(chǎn)品市場(chǎng)空間將突破千億元。

1.2 現(xiàn)有生態(tài):GPU是目前AI+安防方案主流,行業(yè)巨頭與英偉達(dá)攜手

“AI+安防”方案兩種:前端方案是未來(lái)趨勢(shì),中后端AI方案是目前主流。對(duì)智能安防而言,目前有前端和中后端兩種解決方案。前端方案是AI攝像頭方案,即將AI芯片集成至攝像頭中,實(shí)現(xiàn)視頻采集智能化;中后端方案則是利用普通攝像機(jī)采集視頻信息后傳輸?shù)街泻蠖?,在?shù)據(jù)存儲(chǔ)前利用插入GPU等板卡的智能服務(wù)器進(jìn)行匯總分析。由于中后端方案不需要更換攝像頭、可同時(shí)處理多路數(shù)據(jù)、部署成本相對(duì)較低,算法升級(jí)、運(yùn)維方便,短期內(nèi)中后端方案普及速更快。長(zhǎng)期來(lái)看,海思等攝像頭主控芯片廠商必然在芯片內(nèi)部集成用于AI計(jì)算的專屬硬件模塊,大規(guī)模應(yīng)用后實(shí)現(xiàn)成本會(huì)急劇降低,前端(智能攝像頭)方案有望成為未來(lái)智能安防主流。目前無(wú)論是前端還是中后端解決方案,海康、大華等公司都采用英偉達(dá)GPU(Jetson TX1產(chǎn)品)實(shí)現(xiàn),且以中后端AI方案為主。

安防巨頭緊密攜手英偉達(dá),布局基于GPU的智能設(shè)備產(chǎn)品。目前???、大華兩大安防巨頭的AI算法和相關(guān)產(chǎn)品都基于英偉達(dá)的GPU實(shí)現(xiàn)。 2016年,??低?/u>推出從前端到后端全系列的AI產(chǎn)品,發(fā)布基于英偉達(dá)GPU和深度學(xué)習(xí)技術(shù)“深眸”攝像機(jī)、“超腦”NVR、“臉譜”人臉?lè)治龇?wù)器等多款A(yù)I系列產(chǎn)品。大華股份2016年第三季度成立AI研究院,2017年3月聯(lián)合英偉達(dá)發(fā)布多款“睿智”系列前端和后端智能設(shè)備。

海康威視:首提安防AI+,引領(lǐng)安防智能化發(fā)展。??低曌?006年開(kāi)始智能分析技術(shù)研發(fā),2013年布局深度學(xué)習(xí)。憑借多年深度學(xué)習(xí)研究積累以及高達(dá)9000余人的業(yè)內(nèi)最大研發(fā)團(tuán)隊(duì),公司在全球包括人臉識(shí)別、車輛識(shí)別、文字識(shí)別在內(nèi)的多項(xiàng)圖像檢測(cè)比賽中取得第一。2015年公司率先推出AI 中心產(chǎn)品“獵鷹”、“刀鋒”智能服務(wù)器,2016年公司在安博會(huì)首提“安防AI+”概念,并與英偉達(dá)和Movidius達(dá)成合作,陸續(xù)推出基于GPU/VPU和深度學(xué)習(xí)技術(shù)的“深眸”、“超腦”、“神捕”、“臉譜”系列 AI 前后端產(chǎn)品,并融入相關(guān)解決方案。公司AI產(chǎn)品目前已應(yīng)用到南昌“天網(wǎng)項(xiàng)目二期”、“一帶一路”峰會(huì)安保等重大項(xiàng)目中,有望引領(lǐng)安防智能化發(fā)展。

大華股份:緊隨布局人工智能,AI產(chǎn)品加速落地。大華從2015年開(kāi)始人工智能研究,在深度學(xué)習(xí)基礎(chǔ)上研發(fā)出人臉識(shí)別、視頻結(jié)構(gòu)化、異常行為分析、高密度人群分析等智能技術(shù)。16年大華在向國(guó)際權(quán)威的人臉識(shí)別公開(kāi)測(cè)試庫(kù)LFW 提交測(cè)試結(jié)果,Dahua-FaceImage人臉識(shí)別準(zhǔn)確率為 99.78%,保持世界第一水平。同期公司依托在CPU、DSP、GPU和FGPA等芯片平臺(tái)上多年積累的軟硬件研發(fā)能力,研發(fā)出包括前后端人臉識(shí)別、卡口電警、雙目立體視覺(jué)、多目全景拼接產(chǎn)品在內(nèi)的一系列智能化產(chǎn)品。17年公司聯(lián)合英偉達(dá)發(fā)布多款“睿智”系列前端和后端智能設(shè)備并融入相關(guān)平安城市項(xiàng)目解決方案,大幅提高視頻數(shù)據(jù)利用率,推進(jìn)大數(shù)據(jù)在安防領(lǐng)域加速落地。

1.3 未來(lái)趨勢(shì):基于GPU成本是痛點(diǎn),未來(lái)集成至IPC主芯片是趨勢(shì)

目前基于GPU的智能安防的成本較為昂貴。目前主流的智能安防解決方案多基于英偉達(dá)Jetson TX1 GPU芯片,單個(gè)芯片成本估算在70~150美元左右,模塊成本在200~300美元。依據(jù)配置不同,每個(gè)芯片可支持2~4路視頻流,單路實(shí)現(xiàn)成本較高。相關(guān)調(diào)研顯示,??低暬蛞血?dú)家壟斷英偉達(dá)TX1的GPU芯片供貨。其他安防廠商僅可購(gòu)買英偉達(dá)的TX1模組(即包括芯片、存儲(chǔ)的GPU板),采購(gòu)成本會(huì)更高?;贕PU的智能安防解決方案較為昂貴,目前阻礙了智能安防的滲透率快速提升。

FPGA成當(dāng)前智能安防降低成本的可能方案。智能安防領(lǐng)域,目前國(guó)內(nèi)公司深鑒科技已和大華股份、東方網(wǎng)力等安防廠商展開(kāi)合作,推出基于Xilinx FPGA 的DPU產(chǎn)品,可以實(shí)現(xiàn)相對(duì)于GPU有 1個(gè)數(shù)量級(jí)的能效提升,同樣功耗降低80%。該方案可將AI單路成本控制在20美元以內(nèi),較GPU方案便宜。同時(shí),另一家國(guó)內(nèi)公司地平線機(jī)器人也嘗試將FPGA方案應(yīng)用于安防和車載領(lǐng)域。在專用ASIC產(chǎn)品出現(xiàn)之前,F(xiàn)PGA有望成為部分安防場(chǎng)景降成本的有效手段。

ASIC未來(lái)將成為安防芯片主流。如前文所述,ASIC形態(tài)的AI芯片解決方案具備低成本、低功耗、高算力的優(yōu)點(diǎn)。由于芯片存在大規(guī)模成本邊際效益遞減效應(yīng),專用芯片量產(chǎn)后,由AI模塊帶來(lái)的每顆芯片和相關(guān)存儲(chǔ)成本增加預(yù)計(jì)在2美元以下,采用ASIC方案的AI攝像頭實(shí)現(xiàn)成本將大幅度降低。換句話說(shuō),以后可能實(shí)現(xiàn)攝像頭在成本增加非常小的情況下就可以轉(zhuǎn)化成為AI攝像頭。我們預(yù)計(jì),和手機(jī)芯片集成AI專屬模塊類似,華為海思等攝像頭主控芯片廠商,未來(lái)必然會(huì)集成適合安防場(chǎng)景的專屬AI模塊至主芯片中;同樣的,以??禐槭椎陌卜缽S商,為優(yōu)化自身解決方案,也有望自研或與相關(guān)芯片廠商合作開(kāi)發(fā)其專屬的人工智能專用芯片。伴隨著社會(huì)對(duì)智慧安防能力的需求提升,未來(lái)包含AI功能的 ASIC主控芯片或?qū)⒊蔀榘卜乐髁餍酒?/span>

2. 終端落地之AI+汽車:GPU占據(jù)主導(dǎo),ASIC是未來(lái)趨勢(shì)

2.1 智能駕駛空間,芯片百億市場(chǎng)空間

智能駕駛空間廣闊,ADAS芯片是核心。智能駕駛是集導(dǎo)航、環(huán)境感知、控制與決策、交互等多項(xiàng)功能于一體的綜合汽車智能系統(tǒng),是人工智能落地的重要領(lǐng)域之一。據(jù)iiMediaResearch估計(jì),2016年全球智能駕駛汽車市場(chǎng)規(guī)模為40.0億美元,預(yù)計(jì)至2021年增長(zhǎng)至70.3億美元,復(fù)合增長(zhǎng)率11.8%。智能駕駛核心是高級(jí)駕駛輔助系統(tǒng)(ADAS),ADAS系統(tǒng)的核心是算法和芯片。根據(jù)IHS預(yù)測(cè),2020年全球ADAS芯片市場(chǎng)空間將達(dá)到248億元,2016至2020年期間復(fù)合增長(zhǎng)率高達(dá)10%。未來(lái)人工智能在車載領(lǐng)域具備廣闊的市場(chǎng)空間。

2.2 現(xiàn)有生態(tài):巨頭與技術(shù)初創(chuàng)公司均大力布局AI+汽車

英偉達(dá):2016年9月,Nvidia發(fā)布針對(duì)自動(dòng)駕駛技術(shù)和汽車產(chǎn)品的芯片Xavier,采用自定義的八核CPU 架構(gòu),內(nèi)建全新Volta GPU 架構(gòu)作為自動(dòng)駕駛汽車的計(jì)算機(jī)視覺(jué)加速器。Xavier 采用16nm FinFET 工藝,在提升性能的同時(shí)降低功耗,Xavier 運(yùn)算性能達(dá)到20TOPS,功耗則只需20 瓦。英偉達(dá)在智能汽車領(lǐng)域的客戶包括21家汽車制造商,而且英偉達(dá)是其中16家的連接解決方案一級(jí)供應(yīng)商。它在該領(lǐng)域最重要的客戶是特斯拉,英偉達(dá)的DRIVEPX 2平臺(tái)應(yīng)用于特斯拉所有車輛的AutoPilot系統(tǒng)中,包括Model 3。

高通高通作為移動(dòng)終端處理器的優(yōu)勢(shì)企業(yè),在GMIC 2016上發(fā)布智能汽車芯片驍龍 820A。該處理器采用 CPU+GPU 模式,在快速處理數(shù)據(jù)信息的同時(shí)提升地圖的渲染效果,并降低處理器能耗。處理器包括64位Kryo CPU(中央處理器)、Adreno530 GPU(圖形處理器)。

地平線:2016年3月奇點(diǎn)汽車發(fā)布會(huì)上,國(guó)內(nèi)人工智能公司地平線首次展示了其先進(jìn)輔助駕駛系統(tǒng)(ADAS)原型系統(tǒng)—雨果平臺(tái)。從地平線官方的視頻和圖片資料來(lái)看,這套系統(tǒng)可以實(shí)時(shí)檢測(cè)車輛、車道線和行人,檢測(cè)效果優(yōu)于NVDIA于2016年初CES上提供的展示效果。在2017年1月的CES上,地平線又?jǐn)y手英特爾于全球消費(fèi)電子展CES共同發(fā)布基于BPU架構(gòu)的最新的高級(jí)輔助駕駛系統(tǒng)。在硬件方面,地平線將其BPU架構(gòu)實(shí)現(xiàn)在ASIC上,并集成到雨果平臺(tái)上。地平線的第一代人工智能處理器“盤古”已于2017年6月在臺(tái)積電流片。產(chǎn)業(yè)調(diào)研顯示,地平線也是目前唯一在四大汽車市場(chǎng)—美國(guó)、德國(guó)、日本和中國(guó),與頂級(jí)OEMs和Tier1s 建立重要客戶關(guān)系的中國(guó)初創(chuàng)企業(yè)。中國(guó)中央電視臺(tái),美國(guó)MITTechnology Review等眾多媒體報(bào)道了地平線在自動(dòng)駕駛和人工智能處理器設(shè)計(jì)方面的進(jìn)展。

2.3 未來(lái)趨勢(shì):專屬ASIC芯片是未來(lái)智能汽車市場(chǎng)主流

我們判斷,專屬ASIC芯片是智能汽車市場(chǎng)未來(lái)主流。得益于ASIC優(yōu)良的性能,定制芯片可將車載信息的數(shù)據(jù)處理速度提升更快,并將能耗維持在相對(duì)較低水平,最重要的是,ASIC可以更好的滿足車載應(yīng)用下重點(diǎn)關(guān)心的“最差情況處理”的延時(shí)問(wèn)題。但鑒于其研發(fā)周期長(zhǎng)且成本高昂,目前車載場(chǎng)景下,主流廠商仍然考慮采用GPU作為主流方案,預(yù)計(jì)隨著ADAS定制化需求的增加,未來(lái)專用芯片將成為主流。

3. 終端落地之AI+消費(fèi)電子:百花齊放的未來(lái)最大應(yīng)用場(chǎng)景

3.1 智慧產(chǎn)品空間:千億美元市場(chǎng),AI或引領(lǐng)新一輪消費(fèi)電子革命

ASIC將成為AI終端之消費(fèi)電子的必然選擇。在過(guò)去的20年,主導(dǎo)消費(fèi)電子的終端應(yīng)用從PC切換到智能手機(jī),然而蘋果發(fā)布 iPhone 已有十年,全球智能手機(jī)滲透率已近飽和。據(jù) Gartner 預(yù)測(cè), 2016~2019年P(guān)C 出貨將出現(xiàn)負(fù)增長(zhǎng),而智能手機(jī)的出貨增速僅維持在1~2%。因此從2015年以后,大家開(kāi)始尋找消費(fèi)電子行業(yè)下一個(gè)風(fēng)口,紛紛開(kāi)始關(guān)注無(wú)人機(jī)、AR/VR、智能音響等領(lǐng)域。此類智能硬件都可與AI結(jié)合,AI處理芯片的加入將加速此類消費(fèi)電子行業(yè)的發(fā)展,重點(diǎn)落地在手機(jī)、無(wú)人機(jī)、AR/VR、智能音響、機(jī)器人等子領(lǐng)域。其中,手機(jī)是目前電子行業(yè)最強(qiáng)粘性終端之一,也是驅(qū)動(dòng)行業(yè)發(fā)展的最重要下游產(chǎn)品。隨著AI芯片的加入,手機(jī)有望加速更新,繼功能手機(jī)向智能手機(jī)的變革之后,再次向智慧手機(jī)進(jìn)化,有望迎來(lái)新一波換機(jī)潮。

3.2 智慧手機(jī)=AI+AR+智能手機(jī):偉大的新一輪強(qiáng)粘性終端革命

人工智能元素使智能手機(jī)向智慧手機(jī)轉(zhuǎn)變,ASIC低成本低功耗低面積占據(jù)核心優(yōu)勢(shì)。電子行業(yè)本身利用強(qiáng)粘性需求所驅(qū)動(dòng),驅(qū)動(dòng)發(fā)展周期約為5到7年。2002年之前由個(gè)人電腦驅(qū)動(dòng),2007年之前由功能手機(jī)驅(qū)動(dòng),2015年之前由智能手機(jī)驅(qū)動(dòng)。但2015年以后,包括A客戶推出“玫瑰金”“土豪金”這樣的微創(chuàng)新,都表現(xiàn)了電子行業(yè)滲透率達(dá)到一定程度之后創(chuàng)新開(kāi)始變緩。從2015年以后,業(yè)界普遍開(kāi)始尋找電子行業(yè)下一個(gè)風(fēng)口,包括無(wú)人機(jī)、可穿戴AR/VR、智能音響等,但是目前此類智能硬件都不屬于強(qiáng)粘性終端。而只有類似手機(jī)每年出貨在15億到20億部這樣巨大量的強(qiáng)粘性終端才能夠支撐電子行業(yè)進(jìn)一步的變革與發(fā)展。手機(jī)仍將是未來(lái)幾年不可替代的強(qiáng)粘性電子終端。目前AI在手機(jī)里面主要是輔助處理圖形圖像的識(shí)別(比如拍照的快速美顏)以及語(yǔ)音語(yǔ)義的識(shí)別等應(yīng)用場(chǎng)景。但目前此類應(yīng)用對(duì)AI算法處理速度的要求并不高。隨著如AR功能的引入,并隨著光學(xué)聲學(xué)等傳感器不斷演進(jìn),對(duì)AI的計(jì)算能力需求會(huì)迅速增加,因此需要引入AI芯片來(lái)增加手機(jī)的運(yùn)算能力。AI硬件芯片的引入或集成將有益于解決手機(jī)終端創(chuàng)新不足及目前滲透率過(guò)高的問(wèn)題,未來(lái)與手機(jī)AR和3D應(yīng)用的結(jié)合,會(huì)進(jìn)一步推動(dòng)智慧手機(jī)AI硬件的發(fā)展,從而帶動(dòng)手機(jī)產(chǎn)業(yè)鏈的發(fā)展。同時(shí)手機(jī)對(duì)功耗要求極低,ASIC低成本低功耗低面積將占據(jù)核心優(yōu)勢(shì)。

蘋果:“Bionic神經(jīng)引擎”助力蘋果迎來(lái)新一輪技術(shù)革新。蘋果在當(dāng)?shù)貢r(shí)間9月12日發(fā)布了本年度最重量級(jí)的產(chǎn)品——iPhone X(iPhone 10)。iPhone X 最引人關(guān)注的是其引入了Face ID解鎖功能,手機(jī)可通過(guò)對(duì)人面部識(shí)別實(shí)現(xiàn)瞬間解鎖。iPhone X集成了眾多傳感器,面部識(shí)別采集點(diǎn)達(dá)三萬(wàn)個(gè),采集完的臉部信息由神經(jīng)網(wǎng)絡(luò)進(jìn)行建模處理。為此,蘋果專門打造了專用神經(jīng)網(wǎng)絡(luò)處理芯片A11“Bionic神經(jīng)引擎”。該神經(jīng)引擎使用雙核設(shè)計(jì),每秒運(yùn)算6000億次,面部信息數(shù)據(jù)都由A11引擎處理,不會(huì)送到云端。該芯片旨在將主處理器(CPU)和圖像處理器(GPU)巨大的計(jì)算量分開(kāi),把面部識(shí)別、語(yǔ)音識(shí)別等 AI 相關(guān)的任務(wù)卸載到 AI 專用模塊(ASIC)上處理,以提升 AI 算法效率,并延長(zhǎng)電池壽命,并且最新發(fā)布的三款手機(jī)中所帶有的Siri 語(yǔ)音助手及增強(qiáng)現(xiàn)實(shí)(AR)功能都將利用“Bionic神經(jīng)引擎”進(jìn)行實(shí)時(shí)處理。A11 Bionic芯片內(nèi)部的AI處理器和CPU、GPU等一起,讓新一代iPhone具備了更先進(jìn)的AI能力,同時(shí)進(jìn)一步降低AI處理任務(wù)對(duì)電池壽命的影響,AI元素助力蘋果迎來(lái)新一輪技術(shù)革新。

華為:引入AI芯片,差異化競(jìng)爭(zhēng)優(yōu)勢(shì)突出。2017年9月2日,在德國(guó)柏林舉行的 IFA 2017 展會(huì)上,華為正式發(fā)布了全球首款移動(dòng)端 AI 芯片麒麟970,并將運(yùn)用于即將發(fā)布的華為Mate10手機(jī)中。這是業(yè)內(nèi)第一次在手機(jī)芯片中出現(xiàn)了專門用于進(jìn)行人工智能方面計(jì)算的處理單元,它早于蘋果于9月12日發(fā)布的A11 Bionic中的 NeuralEngine。在麒麟 970 芯片的設(shè)計(jì)過(guò)程中,華為與寒武紀(jì)進(jìn)行了深度合作,集成了專門用于神經(jīng)網(wǎng)絡(luò)任務(wù)處理的 NPU,并且其面積僅有10×10毫米。相信隨著人工智能的興起,手機(jī)芯片中是否集成人工智能處理器,將會(huì)成為手機(jī)芯片,甚至是智能手機(jī)差異化競(jìng)爭(zhēng)的關(guān)鍵點(diǎn)。

高通:即將發(fā)布AI移動(dòng)芯片搶占AI手機(jī)高地。高通一直在和Yann LeCun在Facebook AI研究機(jī)構(gòu)的團(tuán)隊(duì)保持合作,共同開(kāi)發(fā)用于實(shí)時(shí)推理的新型手機(jī)芯片。近日消息稱,高通即將發(fā)布人工智能專用移動(dòng)芯片,搶占人工智能手機(jī)領(lǐng)域高地。

三星:收購(gòu)AI系列公司意欲布局手機(jī)AI。2016年10月,有消息稱三星準(zhǔn)備收購(gòu)AI助手系統(tǒng)VivLabs公司,VivLabs的創(chuàng)始人也正是蘋果Siri的創(chuàng)造者,這一舉措,也證實(shí)了三星意欲布局人工智能手機(jī)領(lǐng)域。

3.3 智能音響:GPU目前占據(jù)主流,ASIC方案是未來(lái)

隨著人工智能以及物聯(lián)網(wǎng)的不斷發(fā)展,智能家居越來(lái)越受到人們的歡迎。目前,亞馬遜、谷歌、蘋果等科技巨頭紛紛開(kāi)始布局智能家居市場(chǎng)。其中亞馬遜推出智能音箱 Echo,在支持音箱功能的同時(shí),更支持語(yǔ)音搜索、購(gòu)物、提醒等多項(xiàng)操作。其主要芯片包括德州儀器的 DSP 和集成電源管理 IC,三星的 RAM, SanDisk 的 4GB 閃存和高通的 Wi-Fi、藍(lán)牙模塊。國(guó)內(nèi)京東與國(guó)內(nèi)最大語(yǔ)音技術(shù)公司科大訊飛聯(lián)合開(kāi)發(fā)叮咚音箱,能夠在為用戶提供音箱功能的同時(shí),支持語(yǔ)音控制,并致力于在未來(lái)成為智能家居的集中控制中心,音箱主芯片采用全志四核 Cortex-A7CPU,并內(nèi)置Mali400 GPU,旨在發(fā)揮其計(jì)算及音頻處理功能。除此之外,國(guó)內(nèi)阿里、騰訊、百度、小米都紛紛推出智能音響產(chǎn)品。雖然目前市面上的智能音響解決方案或者是運(yùn)用GPU或者是通過(guò)云端進(jìn)行計(jì)算。但考慮到成本等因素,未來(lái)智能音響中ASIC將是必然方案。

3.4 無(wú)人機(jī)、VR/AR:ASIC將是必然選擇

英特爾于2016年11月完成對(duì)Movidius的收購(gòu),Movidius的Myriad 2視覺(jué)處理單元擁有相當(dāng)于第一代產(chǎn)品20倍的超強(qiáng)性能,它專注于圖像處理,是一種領(lǐng)先的視覺(jué)處理芯片。該芯片功耗很低,能夠在0.5瓦的超低功耗下提供浮點(diǎn)運(yùn)算性能,并且使用20納米工藝制造。全球著名的無(wú)人機(jī)公司大疆在其智能無(wú)人機(jī)Phantom4以及最新推出的Mavic產(chǎn)品上均采用了Movidius公司的芯片。Movidius的芯片目前廣泛用于VR/AR頭顯,室內(nèi)導(dǎo)航,360°全景視頻等場(chǎng)景。因?yàn)镚PU與FPGA的量產(chǎn)成本都相對(duì)較高,并且都具有較大的能耗,因此ASIC將成為消費(fèi)電子龐大藍(lán)海的必然選擇。

終端AI未來(lái):成本效能優(yōu)化,作為協(xié)處理器內(nèi)嵌

1.成本效益優(yōu)化,終極形態(tài)向ASIC進(jìn)化

GPU和FPGA不能滿足終端大規(guī)模、低成本應(yīng)用需求。目前GPU和FPGA在終端雖然落地較快,但實(shí)現(xiàn)成本高、功耗大,不滿足大規(guī)模終端應(yīng)用低功耗、低成本的場(chǎng)景要求。比如在安防領(lǐng)域,??低暽铐p目人臉智能攝像機(jī)目前方案采用GPU模塊,實(shí)現(xiàn)成本估算為幾百元甚至高達(dá)千元,大大增加了安防攝像頭成本,阻礙了AI攝像頭的普及速度。如果采用FPGA方案,目前單路攝像頭實(shí)現(xiàn)成本也需要百元以上,成本較GPU低但依舊昂貴。

從成本和效能兩個(gè)角度考慮,ASIC作為終端AI優(yōu)勢(shì)明顯。同樣以安防攝像頭舉例,如果未來(lái)海思等攝像頭主控芯片供應(yīng)商,未來(lái)在主芯片里內(nèi)嵌入相關(guān)AI加速硬件IP,我們預(yù)估成本增加極有可能控制在2美元以內(nèi),能極大節(jié)約智能攝像頭實(shí)現(xiàn)成本,加速其應(yīng)用普及。

未來(lái):進(jìn)化至ASIC是趨勢(shì),內(nèi)嵌入主芯片是形態(tài)。和云端幾種芯片長(zhǎng)期共存不同,我們判斷,隨著AI推斷算法逐步穩(wěn)定,無(wú)論安防、車載、消費(fèi)電子,終端AI在終端各種場(chǎng)景下,都將最終進(jìn)化至ASIC,以AI協(xié)處理器IP的方式,嵌入融合至現(xiàn)有的各種移動(dòng)終端主控芯片中。對(duì)主控芯片公司而言,集成AI的IP模塊,能夠?qū)崿F(xiàn)進(jìn)化、維持長(zhǎng)期競(jìng)爭(zhēng)優(yōu)勢(shì)。產(chǎn)業(yè)調(diào)研顯示,蘋果、高通、三星、華為、展訊等各大手機(jī)終端主芯片廠商都在各自開(kāi)發(fā)專屬自己的人工智能加速ASIC協(xié)處理器。此外,ARM作為老牌CPU IP提供商,也在積極開(kāi)發(fā)支持AI相關(guān)運(yùn)算指令集的芯片產(chǎn)品。9月華為發(fā)布首款內(nèi)嵌人工智能專屬處理器的手機(jī)主芯片(麒麟970),搭載在十月發(fā)布的Mate 10 新機(jī)中,便是典型例證,也將成為未來(lái)終端人工智能ASIC發(fā)展的里程碑式事件。我們判斷,華為隨后同樣會(huì)在其安防芯片中內(nèi)嵌AI相關(guān)處理器。終端AI化普及已初現(xiàn)端倪。

2.關(guān)注“中華崛起”與“帝國(guó)反擊”

“中華崛起”:中國(guó)公司在終端專用AI硬件架構(gòu)領(lǐng)域未落人后。目前國(guó)內(nèi)已有多家優(yōu)秀的AI芯片創(chuàng)業(yè)型公司成立,主要包括寒武紀(jì),地平線機(jī)器人,深鑒科技、比特大陸等。2017年8月寒武紀(jì)獲得國(guó)投創(chuàng)業(yè)領(lǐng)投的1億美元融資,并且華為9月發(fā)布的首款人工智能手機(jī)處理器也搭載寒武紀(jì)NPU。深鑒科技成立于2016年,2017年公司獲得包括賽靈思在內(nèi)的數(shù)千萬(wàn)美元投資,目前深鑒科技推出的專業(yè)處理芯片DPU在終端相比GPU性能快80%。2016年3月奇點(diǎn)汽車發(fā)布會(huì)上,地平線機(jī)器人首次展示了基于雨果平臺(tái)的先進(jìn)輔助駕駛系統(tǒng)(ADAS)原型系統(tǒng),地平線計(jì)劃將其專屬ASIC處理器(BPU)集成到雨果平臺(tái)之上,預(yù)計(jì)計(jì)算性能將比目前提升 2-3 個(gè)數(shù)量級(jí),并且未來(lái)地平線還將其BPU應(yīng)用于智慧家居、智慧城市等多個(gè)領(lǐng)域。2017年比特大陸最新發(fā)布的BM1680專用芯片是其定制化的ASIC AI芯片,適用于CNN/RNN等深度學(xué)習(xí)網(wǎng)絡(luò)模型的預(yù)測(cè)和訓(xùn)練計(jì)算加速,32位浮點(diǎn)運(yùn)算性能達(dá)到4TFLOPS,其競(jìng)爭(zhēng)目標(biāo)是英偉達(dá)高端GPU產(chǎn)品??梢钥闯?,國(guó)產(chǎn)終端專用AI硬件架構(gòu)目前處于世界一級(jí)梯隊(duì),未來(lái)前景廣闊。

“帝國(guó)反擊”:英偉達(dá)開(kāi)源DLA阻擊新興ASIC廠商。2017年 5月 GTC 大會(huì)英偉達(dá) CEO 黃仁勛宣布,為加速深度學(xué)習(xí)技術(shù)的普及和進(jìn)步,將開(kāi)源其 Xavier DLA(深度學(xué)習(xí)硬件加速器)供所有開(kāi)發(fā)者使用、修改,爭(zhēng)取占據(jù)終端生態(tài)平臺(tái)優(yōu)勢(shì)。我們認(rèn)為這是重要的標(biāo)志性事件。標(biāo)志著英偉達(dá)在終端對(duì)ASIC技術(shù)路徑的認(rèn)可,以及開(kāi)始重視對(duì)新興廠商的阻擊。傳統(tǒng) GPU 架構(gòu)的功耗限制了其在終端市場(chǎng)的應(yīng)用,為維持其在人工智能硬件的霸主地位,英偉達(dá)把自己的ASIC技術(shù)路徑和相關(guān)硬件代碼開(kāi)源,來(lái)應(yīng)對(duì)ASIC芯片廠商的挑戰(zhàn)。此次開(kāi)源 Xavier DLA,英偉達(dá)就是瞄準(zhǔn)嵌入式IoT 等終端市場(chǎng),而這也是包括寒武紀(jì)、地平線、深鑒科技、Novomind 等在內(nèi)的很多 AI 芯片創(chuàng)業(yè)公司重點(diǎn)耕耘的領(lǐng)域。英偉達(dá)試圖利用硬件的開(kāi)源共享和自己的良好生態(tài)優(yōu)勢(shì),在終端繼續(xù)拓展自己的帝國(guó)版圖。我們認(rèn)為這勢(shì)必對(duì)新興廠商造成一定程度的沖擊,具體影響尚不明確,但云端巨頭入局終端市場(chǎng)已成必然,新興ASIC廠商將面臨“看誰(shuí)跑得快”的競(jìng)爭(zhēng)新局面。

芯片前瞻:類腦,未來(lái)的另一種可能

類腦芯片——讓機(jī)器用人類的大腦思考

類腦芯片是通過(guò)模擬人腦結(jié)構(gòu)、讓機(jī)器具備自主感知識(shí)別能力的AI方案。目前處理器芯片基本上基于傳統(tǒng)“馮?諾依曼”架構(gòu),和人腦處理信息的方式和流程有本質(zhì)差異。人腦最大的優(yōu)點(diǎn)除善于自我學(xué)習(xí)和認(rèn)知外,消耗的功耗也比計(jì)算機(jī)低很多,同時(shí)能夠維持低功耗下的快速信息處理。類腦芯片可以看做機(jī)器對(duì)人大腦的模仿。它基于仿生學(xué)神經(jīng)形態(tài)工程,借鑒人腦信息處理方式,采用與模擬人腦的新型存儲(chǔ)器件,致力于發(fā)展適合實(shí)時(shí)處理非結(jié)構(gòu)化信息、和人腦功能類似、具備學(xué)習(xí)能力的超低功耗新型計(jì)算芯片。力圖在基本架構(gòu)上模仿人腦工作原理,使用神經(jīng)元和突觸的方式替代傳統(tǒng)“馮?諾依曼”架構(gòu)體系,使芯片能夠進(jìn)行異步、并行、低速和分布式處理信息數(shù)據(jù)的能力,同時(shí)具備自主感知、識(shí)別和學(xué)習(xí)的能力。

代表是IBM TrueNorth 類腦芯片。目前最具代表性的研究成果是IBMTrueNorth 類腦芯片。TrueNorth基于脈沖神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),并且采用了邏輯時(shí)鐘為1KHz這樣的低頻率來(lái)模擬毫秒級(jí)別生物上的脈沖,這也使得TrueNorth功耗很低(70mW)。目前IBM 已經(jīng)利用 16 顆 TrueNorth 芯片開(kāi)發(fā)出一臺(tái)神經(jīng)元計(jì)算機(jī)原型,具有一定的實(shí)時(shí)視頻處理能力。

政府、巨頭大力推動(dòng)原型研發(fā),尚不具備商用可能。包括美國(guó)、日本、德國(guó)、英國(guó)、瑞士等發(fā)達(dá)國(guó)家已經(jīng)制定相應(yīng)的類腦芯片發(fā)展戰(zhàn)略,中國(guó)的類腦科學(xué)研究項(xiàng)目目前也已經(jīng)正式啟動(dòng)。各國(guó)研究計(jì)劃梳理如下表。但由于目前對(duì)人腦機(jī)理的理解和真正意義上的模擬都仍存在諸多盲區(qū),模擬神經(jīng)元的存儲(chǔ)元器件(如憶阻器)尚不具備成熟量產(chǎn)能力,再加之目前以深度學(xué)習(xí)算法為基礎(chǔ)的AI芯片陣營(yíng)蓬勃發(fā)展,我們判斷今后三年類腦芯片尚不具備成熟商用的可能。

除IBM類腦芯片外,我們也梳理了其他幾種新型在研的AI方案供投資人參考。

海外AI重點(diǎn)芯片公司梳理

  • NVIDIA:GPU市場(chǎng)壟斷者,業(yè)務(wù)逐漸由游戲轉(zhuǎn)向數(shù)據(jù)中心

  • Intel:業(yè)務(wù)中心由PC芯片拓展至數(shù)據(jù)中心、物聯(lián)網(wǎng)等領(lǐng)域

  • Google:利用TPU打造谷歌云核心競(jìng)爭(zhēng)力

  • Xilinx:FPGA市場(chǎng)領(lǐng)導(dǎo)者,重點(diǎn)發(fā)力四大領(lǐng)域

  • Altera:緊隨Xilinx之后的市場(chǎng)巨頭,被Intel收購(gòu)或迎加速發(fā)展


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1642

    文章

    21920

    瀏覽量

    612006
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48449

    瀏覽量

    244975
  • 半導(dǎo)體芯片
    +關(guān)注

    關(guān)注

    60

    文章

    925

    瀏覽量

    71133

原文標(biāo)題:群芯逐鹿時(shí)代:AI未來(lái),星辰大?!斯ぶ悄苌疃认盗醒芯繄?bào)告

文章出處:【微信號(hào):eetop-1,微信公眾號(hào):EETOP】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI終端爆發(fā)!模擬芯片企業(yè)2024年狂攬市場(chǎng),最高凈利暴增400%

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近年來(lái),AI技術(shù)的迅猛發(fā)展催生了芯片增量市場(chǎng),為模擬芯片企業(yè)帶來(lái)了新的增長(zhǎng)曲線。電子發(fā)燒友網(wǎng)整理了模擬芯片企業(yè)
    的頭像 發(fā)表于 04-18 00:18 ?1626次閱讀
    <b class='flag-5'>AI</b>終端<b class='flag-5'>爆發(fā)</b>!模擬<b class='flag-5'>芯片</b>企業(yè)2024年狂攬<b class='flag-5'>市場(chǎng)</b>,最高凈利暴增400%

    算力租賃市場(chǎng)爆發(fā),H20遭瘋搶!小心掉坑

    的算力服務(wù)器租賃需求也在爆發(fā)式的增長(zhǎng),更出現(xiàn)了“一機(jī)難求”的盛況。 ? AI 服務(wù)器告急,H20 芯片需求大漲 ? 近期,許多上市公司紛紛發(fā)布公告,計(jì)劃布局算力租賃市場(chǎng)。隨著國(guó)產(chǎn)大模型
    的頭像 發(fā)表于 04-04 00:13 ?2402次閱讀

    蘋果入局,AI眼鏡市場(chǎng)即將爆發(fā),國(guó)內(nèi)芯片產(chǎn)業(yè)再臨機(jī)遇

    影響的則是AI眼鏡。 ? 據(jù)多家媒體報(bào)道,盡管Vision Pro的銷量不及預(yù)期,但蘋果仍然在研發(fā)下一系列新產(chǎn)品,其中便包括一款類似Ray Ban Meta的AI眼鏡。與此同時(shí),市場(chǎng)中多款AI
    的頭像 發(fā)表于 08-15 01:00 ?4904次閱讀

    市場(chǎng)爆發(fā)!芯片廠商搶灘,AI玩具激發(fā)端側(cè)AI需求

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)在AI大模型與生成式技術(shù)爆發(fā)的當(dāng)下,玩具行業(yè)正經(jīng)歷一場(chǎng)靜默的革命:傳統(tǒng)積木、玩偶被植入“大腦”,教育機(jī)器人能輔導(dǎo)數(shù)學(xué)題,智能寵物狗可感知情緒,甚至能與孩子進(jìn)行哲學(xué)對(duì)話
    的頭像 發(fā)表于 02-27 01:01 ?2659次閱讀

    當(dāng)我問(wèn)DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    AI時(shí)代,F(xiàn)PGA(現(xiàn)場(chǎng)可編程門陣列)具有極其重要的地位,主要體現(xiàn)在以下幾個(gè)方面: 1.硬件加速與高效能 ? 并行處理能力:FPGA內(nèi)部由大量可編程邏輯單元組成,能夠?qū)崿F(xiàn)高度并行的數(shù)據(jù)處理。這種
    發(fā)表于 02-19 13:55

    搶灘AI市場(chǎng)!Meta、NXP鎖定目標(biāo),2025又一重大并購(gòu)來(lái)襲

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近年來(lái),AI芯片市場(chǎng)成為科技巨頭和半導(dǎo)體企業(yè)的必爭(zhēng)之地。隨著人工智能技術(shù)的快速發(fā)展,AI芯片作為算力的核心載體
    的頭像 發(fā)表于 02-18 00:15 ?1366次閱讀
    搶灘<b class='flag-5'>AI</b><b class='flag-5'>市場(chǎng)</b>!Meta、NXP鎖定目標(biāo),2025又一重大并購(gòu)來(lái)襲

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    ,可完成電力負(fù)荷精準(zhǔn)預(yù)測(cè)、故障快速定位。據(jù)市場(chǎng)研究機(jī)構(gòu)預(yù)測(cè),到2025年,AI邊緣網(wǎng)關(guān)市場(chǎng)規(guī)模將突破千億美元,年復(fù)合增長(zhǎng)率超過(guò)60%。 產(chǎn)業(yè)新機(jī)遇已經(jīng)顯現(xiàn)。對(duì)于硬件制造商,需要開(kāi)發(fā)更高
    發(fā)表于 02-15 11:41

    RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)

    我們會(huì)迎來(lái)前所未見(jiàn)的AI軟件應(yīng)用,而RISC-V有望打造出下一代的AI引擎?!?達(dá)摩院院長(zhǎng)張建鋒此前在3月2024玄鐵RISC-V生態(tài)大會(huì)表示,隨著新型算力需求激增,RISC-V發(fā)展迎來(lái)蝶變,即將進(jìn)入應(yīng)用
    發(fā)表于 10-31 16:06

    創(chuàng)星未來(lái)訪談|時(shí)擎科技:端側(cè)智能芯片領(lǐng)域的新銳力量

    本文轉(zhuǎn)載自:長(zhǎng)三角資本市場(chǎng)服務(wù)基地在半導(dǎo)體產(chǎn)業(yè)和人工智能產(chǎn)業(yè)的融合驅(qū)動(dòng)作用下,AI芯片行業(yè)正進(jìn)入發(fā)展“快車道”。由于邊端設(shè)備大部分都有AI
    的頭像 發(fā)表于 09-24 08:03 ?836次閱讀
    創(chuàng)星未來(lái)訪談|時(shí)擎科技:端側(cè)智能<b class='flag-5'>芯片</b>領(lǐng)域的新銳力量

    AI爆發(fā),光互連將給連接器帶來(lái)什么機(jī)遇?

    AI服務(wù)器與交換機(jī)帶寬容量不斷增長(zhǎng)的趨勢(shì)下,光模塊市場(chǎng)空間逐步釋放,這將給連接器行業(yè)帶來(lái)什么發(fā)展機(jī)遇? ▲AI 圖源/包圖網(wǎng) 要說(shuō)2024年最火的賽道,一定不能不提人工智能
    的頭像 發(fā)表于 09-20 11:47 ?629次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>爆發(fā)</b><b class='flag-5'>期</b>,光互連將給連接器帶來(lái)什么機(jī)遇?

    大疆入局eBike千億市場(chǎng),芯片廠商有哪些機(jī)遇?

    。 來(lái)源:DJI官網(wǎng) ? eBike在近幾年間迅速發(fā)展成為一個(gè)千億市場(chǎng),自2020年開(kāi)始,eBike市場(chǎng)投資進(jìn)入高峰,多家新
    的頭像 發(fā)表于 08-21 09:02 ?4317次閱讀
    大疆入局eBike<b class='flag-5'>千億</b><b class='flag-5'>市場(chǎng)</b>,<b class='flag-5'>芯片</b>廠商有哪些機(jī)遇?

    千億規(guī)模市場(chǎng)待導(dǎo)入!UVC-LED或迎增長(zhǎng)小高峰

    洗碗機(jī)行業(yè)高峰論壇發(fā)布報(bào)告,顯示市場(chǎng)進(jìn)入成長(zhǎng)期并向三四線拓展。健康意識(shí)提升推動(dòng)洗碗機(jī)普及,企業(yè)加速產(chǎn)品智能化、健康化升級(jí)。UVC-LED殺菌技術(shù)成為新趨勢(shì),滿足消費(fèi)者健康需求,打開(kāi)千億市場(chǎng)
    的頭像 發(fā)表于 07-30 09:11 ?506次閱讀
    <b class='flag-5'>千億</b>規(guī)模<b class='flag-5'>市場(chǎng)</b>待導(dǎo)入!UVC-LED或迎增長(zhǎng)小高峰

    AI硬件產(chǎn)品銷售爆發(fā),CPU、存儲(chǔ)、AI芯片如何創(chuàng)新

    全線爆發(fā),成交額同比增長(zhǎng)150%,AI品類總流量同比增長(zhǎng)250%。 ? AI硬件產(chǎn)品都有哪些 ? 近年來(lái),AI技術(shù)的突破為智能終端市場(chǎng)帶來(lái)更
    的頭像 發(fā)表于 06-24 00:20 ?3164次閱讀

    AI芯片哪里買?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    全球AI芯片市場(chǎng)收入預(yù)計(jì)持續(xù)增長(zhǎng)

    根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)Gartner的最新報(bào)告,全球AI芯片市場(chǎng)展現(xiàn)出強(qiáng)勁的增長(zhǎng)勢(shì)頭。預(yù)計(jì)2024年,全球AI
    的頭像 發(fā)表于 05-31 10:26 ?734次閱讀