一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

含光劍出,AI推理芯片如何創(chuàng)新

張康康 ? 2019-09-26 18:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2019云棲大會(huì)已經(jīng)揭開(kāi)了帷幕,就在9月25日,阿里巴巴集團(tuán)首席技術(shù)官兼阿里云智能總裁、達(dá)摩院院長(zhǎng)張建鋒發(fā)表了題為《構(gòu)建數(shù)字經(jīng)濟(jì)基礎(chǔ)設(shè)施》的演講。在演講中,張建鋒重磅推出AI推理芯片含光800,引發(fā)了眾多關(guān)于它的討論。

近年來(lái)科技熱潮一波接著一波。從物聯(lián)網(wǎng)到可穿戴電子、從人工智能5G,它們推進(jìn)了國(guó)家的科技發(fā)展路徑,與其同時(shí)也催生出了一大批創(chuàng)新公司:比如專精于安防的曠視科技、專精于視頻的極鏈科技等等。其中的人工智能(AI)便曾在1950年代、1980年代先后熱議過(guò),并因多項(xiàng)技術(shù)限制與過(guò)度期許而回復(fù)平淡。而到了2016年,它又隨著云端資料的增長(zhǎng)和影音辨識(shí)的需求,再次進(jìn)入了公眾的視野。

分析AI推理芯片,自然要從人工智能說(shuō)起。人工智能的運(yùn)用一般分為兩個(gè)階段,即開(kāi)發(fā)與執(zhí)行,這也與其他大部分應(yīng)用程序相類似。在實(shí)際投入運(yùn)行前,人工智能需要進(jìn)行學(xué)習(xí)與訓(xùn)練,借助大量繁復(fù)的運(yùn)算來(lái)使模型獲得更佳的參數(shù)調(diào)整數(shù)據(jù),對(duì)運(yùn)算的精準(zhǔn)度、細(xì)膩度要求都相對(duì)較高;而在執(zhí)行階段,由于模型已經(jīng)訓(xùn)練完成,所以不再需要龐大的運(yùn)算量,再加上效率的考量,往往會(huì)采用較低的運(yùn)算精度。也就是說(shuō),在這兩個(gè)階段,所需要的芯片能力其實(shí)是有所差異的。

目前人類要實(shí)現(xiàn)人工智能,只能靠芯片,別無(wú)選擇。但是現(xiàn)有的CPU、GPU、FPGA等芯片的基本架構(gòu)早在這次人工智能突破之前就已經(jīng)存在了,并非為人工智能而專門設(shè)計(jì),因此它們并不能完美地承擔(dān)實(shí)現(xiàn)人工智能的任務(wù)。人工智能專家MichaelI.Jordan也認(rèn)為,我們今天所做的還不能算是真正的AI,而只是利用技術(shù)來(lái)增強(qiáng)一部分的智能而已,也就是所謂的IA(IntelligenceAugmentation:增強(qiáng)智能)。

所以近年來(lái),人們已經(jīng)開(kāi)始普遍使用CPU之外的芯片來(lái)加速,例如GPGPU、FPGA、ASIC等,特別是GPGPU為多,原因在于GPGPU的高階軟體生態(tài)較為完備、可支援多種人工智能框架。相對(duì)的,F(xiàn)PGA需要熟悉低階硬體電路者方能開(kāi)發(fā),而ASIC通常只針對(duì)限定的軟體或框架最佳化。雖然FPGA與ASIC較有難度與限制,但仍有科技大廠愿意投入,如Microsoft即主張用FPGA執(zhí)行人工智能運(yùn)算,Google則針對(duì)TensorFlow人工智能框架開(kāi)發(fā)ASIC,即CloudTPU芯片。

阿里此次推出的含光800,在業(yè)界標(biāo)準(zhǔn)的ResNet-50測(cè)試中推理性能達(dá)到78563IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。在杭州城市大腦的業(yè)務(wù)測(cè)試中,一顆含光800的算力相當(dāng)于十顆GPU。這固然令人驚喜,但更重要的是,平頭哥團(tuán)隊(duì)在過(guò)去一年中不斷探索芯片與場(chǎng)景的融合,如對(duì)算力需求較大的圖像視頻分析、搜索、推薦等業(yè)務(wù)場(chǎng)景。圍繞這一目標(biāo),平頭哥針對(duì)場(chǎng)景深度定制了芯片的軟硬件,例如自研了架構(gòu)、軟件編譯器、框架、工具鏈等,如先后發(fā)布的玄鐵910、無(wú)劍SoC平臺(tái),后期也針對(duì)INT數(shù)據(jù)類型做了大量?jī)?yōu)化。這說(shuō)明中國(guó)的AI推理芯片不再滿足于IA,而是試圖往真正的AI靠攏。

在推理芯片市場(chǎng)之外,人工智能的訓(xùn)練芯片市場(chǎng)也值得觀察。由于人工智能應(yīng)用的開(kāi)發(fā)、訓(xùn)練、參數(shù)調(diào)整等工作并非時(shí)時(shí)在進(jìn)行,通常在歷經(jīng)一段時(shí)間的密集開(kāi)發(fā)訓(xùn)練后回歸平淡,直到下一次修改調(diào)整才再次進(jìn)入密集運(yùn)算。因此,企業(yè)若為了人工智能應(yīng)用的開(kāi)發(fā)訓(xùn)練購(gòu)置大量的伺服器等運(yùn)算力,每次訓(xùn)練完成后,大量的伺服器將閑置無(wú)用,直到下一次參數(shù)調(diào)整、密集訓(xùn)練時(shí)才能再次顯現(xiàn)價(jià)值。鑒于此,許多企業(yè)傾向?qū)⒚芗?xùn)練的運(yùn)算工作交付給云端服務(wù)供應(yīng)商,依據(jù)使用的運(yùn)算量、運(yùn)算時(shí)間付費(fèi),而不是自行購(gòu)置與維護(hù)龐大運(yùn)算系統(tǒng)。這也應(yīng)該是阿里只售賣基于含光800的阿里云服務(wù),而非芯片本身的原因之一。

目前推理芯片市場(chǎng)的主流想法依然是在規(guī)格上做文章,而清華大學(xué)微電子研究所所長(zhǎng)魏少軍教授則認(rèn)為這是完全錯(cuò)誤的思路,“差異化并不是靠規(guī)格設(shè)計(jì)出來(lái)的,這樣設(shè)計(jì)出來(lái)的差異化只存在于產(chǎn)品產(chǎn)出的那一段時(shí)間,之后就無(wú)法更改。別人追上來(lái),差異化越來(lái)越小,你的產(chǎn)品便出局?!?/p>

所以說(shuō),如何讓推理芯片真正的具有智慧,才是我們當(dāng)前需要思考的。如果只是單純的推進(jìn)芯片的速度,收效只會(huì)越來(lái)越小。含光800已經(jīng)踏出了創(chuàng)新的第一步,可剩下的過(guò)程,依舊漫長(zhǎng)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI推理的存儲(chǔ),看好SRAM?

    看到了其前景并提前布局。AI推理也使得存儲(chǔ)HBM不再是唯一熱門,更多存儲(chǔ)芯片AI推理芯片結(jié)合,
    的頭像 發(fā)表于 03-03 08:51 ?1693次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的存儲(chǔ),看好SRAM?

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    AI根據(jù)故障推理結(jié)果,智能生成修復(fù)建議(指向檢查物理層錯(cuò)誤)。 結(jié)果:在AI推理引擎的驅(qū)動(dòng)下,系統(tǒng)僅用20分鐘即精準(zhǔn)鎖定故障根源為出口路由器
    發(fā)表于 07-16 15:29

    谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命

    、架構(gòu)設(shè)計(jì)的顛覆性創(chuàng)新 ? 首款推理專用TPU ? Ironwood是谷歌TPU系列中首款完全針對(duì)AI推理優(yōu)化的芯片,標(biāo)志著
    的頭像 發(fā)表于 04-12 11:10 ?1840次閱讀
    谷歌第七代TPU Ironwood深度解讀:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>時(shí)代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理AI 模型新引擎?

    Cloud 客戶開(kāi)放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項(xiàng)。 ? 在核心亮點(diǎn)層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設(shè)計(jì)的 TPU
    的頭像 發(fā)表于 04-12 00:57 ?2444次閱讀

    DeepSeek推動(dòng)AI算力需求:800G模塊的關(guān)鍵作用

    的100G模塊已無(wú)法滿足高效能AI訓(xùn)練和推理所需的大規(guī)模數(shù)據(jù)傳輸。為了應(yīng)對(duì)這一挑戰(zhàn),400G、800G乃至1.6T模塊的出現(xiàn)成為行業(yè)必然趨勢(shì)。特別是隨著DeepSeek等模型的規(guī)模
    發(fā)表于 03-25 12:00

    AI推理帶火的ASIC,開(kāi)發(fā)成敗在此一舉!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)去年年底,多家大廠爆出開(kāi)發(fā)數(shù)據(jù)中心ASIC芯片的消息,包括傳聞蘋果與博通合作開(kāi)發(fā)面向AI推理的ASIC,亞馬遜也在年底公布了其AI?ASIC的應(yīng)用實(shí)例,展
    的頭像 發(fā)表于 03-03 00:13 ?3326次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>帶火的ASIC,開(kāi)發(fā)成敗在此一舉!

    請(qǐng)問(wèn)DMD芯片在on狀態(tài)時(shí),以何種角度入射DMD芯片,可以垂直于芯片

    請(qǐng)問(wèn)DMD芯片在on狀態(tài)時(shí),以何種角度入射DMD芯片,可以垂直于芯片
    發(fā)表于 02-27 07:20

    AI變革正在推動(dòng)終端側(cè)推理創(chuàng)新

    尖端AI推理模型DeepSeek R1一經(jīng)問(wèn)世,便在整個(gè)科技行業(yè)引起波瀾。因其性能能夠媲美甚至超越先進(jìn)的同類模型,顛覆了關(guān)于AI發(fā)展的傳統(tǒng)認(rèn)知。
    的頭像 發(fā)表于 02-20 10:54 ?561次閱讀

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 02-08 09:59 ?723次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    生成式AI推理技術(shù)、市場(chǎng)與未來(lái)

    OpenAI o1、QwQ-32B-Preview、DeepSeek R1-Lite-Preview的相繼發(fā)布,預(yù)示著生成式AI研究正從預(yù)訓(xùn)練轉(zhuǎn)向推理(Inference),以提升AI邏輯推理
    的頭像 發(fā)表于 01-20 11:16 ?849次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術(shù)、市場(chǎng)與未來(lái)

    AI接吻”——AI技術(shù)的雙刃

    綜上所述,“AI接吻”技術(shù)作為一把雙刃,在帶來(lái)創(chuàng)新與便利的同時(shí),也伴隨著諸多風(fēng)險(xiǎn)與挑戰(zhàn)。因此,我們?cè)谑褂迷摷夹g(shù)時(shí)要保持警惕和理性,充分發(fā)揮其優(yōu)點(diǎn),同時(shí)努力規(guī)避其不利影響。
    的頭像 發(fā)表于 12-09 14:48 ?757次閱讀

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過(guò) Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速解決方案。無(wú)論是在復(fù)雜的 AI 開(kāi)發(fā)
    的頭像 發(fā)表于 10-27 10:03 ?831次閱讀
    NVIDIA助力麗蟾科技打造<b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b>加速解決方案

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    非常高興本周末收到一本新書,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 關(guān)于《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章“AI
    發(fā)表于 10-14 09:16

    AMD助力HyperAccel開(kāi)發(fā)全新AI推理服務(wù)器

    提高成本效率。HyperAccel 針對(duì)新興的生成式 AI 應(yīng)用提供超級(jí)加速的芯片 IP/解決方案。HyperAccel 已經(jīng)打造出一個(gè)快速、高效且低成本的推理系統(tǒng),加速了基于轉(zhuǎn)換器的大型語(yǔ)言模型
    的頭像 發(fā)表于 09-18 09:37 ?885次閱讀
    AMD助力HyperAccel開(kāi)發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務(wù)器

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過(guò)深入淺的語(yǔ)言和諸多實(shí)際應(yīng)用案例,介紹了
    發(fā)表于 09-09 13:54