經(jīng)歷了十?dāng)?shù)年的高速發(fā)展之后,以智能手機(jī)為代表的移動設(shè)備開始邁入下半場。大家對新設(shè)備的關(guān)注重點(diǎn)從過往的多核、RAM和ROM大小轉(zhuǎn)移到了人工智能、3D游戲和混合現(xiàn)實(shí)等新方向上來。這就吸引了包括高通、華為、蘋果和聯(lián)發(fā)科等眾多移動SoC廠商密鑼緊鼓地投入其中。作為全球移動芯片基石的Arm也正在加緊布局,擁抱新時(shí)代。
Arm資深市場營銷總監(jiān)Ian Smythe表示,現(xiàn)代人類使用設(shè)備的的方式增加了對設(shè)備性能的期望值,這就促使Arm達(dá)到一個(gè)新的愿景——所有人都能夠使用這些新技術(shù)。這就要求Arm讓這些處理器能夠勝任各種各樣的計(jì)算任務(wù),這首先體現(xiàn)在人工智能方面。其實(shí)Arm現(xiàn)在在人工方面的表示也不錯(cuò)。根據(jù)IDC的調(diào)查數(shù)據(jù)顯示,現(xiàn)在市場上有人工智能能力的設(shè)備,80%是基于Arm的處理器實(shí)現(xiàn)的。但在Ian Smythe看來,這還不夠。
Arm的人工智能策略
根據(jù)他的看法,人工智能將會無處不在,應(yīng)用也會多元化,實(shí)現(xiàn)人工智能的關(guān)鍵——機(jī)器學(xué)習(xí)往“邊緣”轉(zhuǎn)移是一個(gè)必然的趨勢,因?yàn)橹挥性凇斑吘墶辈渴穑拍芙鉀Q帶寬、功耗、成本、延遲、可靠性和安全等幾方面的問題。針對AI的這些特點(diǎn),Arm升級了他們的AI布局,首先祭出了他們的項(xiàng)目:機(jī)器學(xué)習(xí)運(yùn)算平臺Project Trillium。這是一套包括新的高度可擴(kuò)展處理器的Arm IP組合,這些產(chǎn)品可以提供增強(qiáng)的機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)功能。
Arm Project Trillium項(xiàng)目
從上圖我們可以看出,在Arm的這個(gè)項(xiàng)目里,Arm本身的CPU、GPU、ML(Machine Learning)和OD(Obeject Detect)處理器,加上合作伙伴的DSP、FPGA等加速器IP會是整個(gè)項(xiàng)目中最基本的硬件支持。
在中間的軟件產(chǎn)品層,Project Trillium提供了專門針對Arm硬件優(yōu)化的軟件庫,其中包括了Arm NN、CMSIS-NN、Compute Library和Object Detection Libraries。
在應(yīng)用方面,項(xiàng)目會對TsensorFlow、Caffe、Caffe2、Mxnet和Android NNAPI等主流框架的支持。
Ian Smythe告訴記者:“Arm Project Trillium提供了相應(yīng)的接入硬件、軟件的框架,并相應(yīng)地為CPU和GPU提供了針對機(jī)器學(xué)習(xí)的加速,這樣開發(fā)人員就能更好地基于Arm的所有硬件去進(jìn)行開發(fā),還能非常方便地獲得這些開發(fā)框架和一些工具系統(tǒng)”。那就意味著開發(fā)者如果要開發(fā)一個(gè)手機(jī)應(yīng)用,不需要去擔(dān)心這個(gè)手機(jī)硬件本身的適配性能問題,只需要關(guān)心出來的手機(jī)應(yīng)用的性能是最好的。
舉個(gè)例子,如果開發(fā)人員用的是安卓神經(jīng)網(wǎng)絡(luò)的API,那么底層的硬件無論是CPU、GPU還是OD、ML都不重要,因?yàn)镻roject Trillium都能夠?qū)崿F(xiàn)最優(yōu)的處理器的性能,同時(shí)也會提供去訪問這些Arm底層硬件處理器的軟件庫,這樣就可以節(jié)約開發(fā)人員大量的精力。
CPU和GPU是Arm AI芯片先鋒
由上可知,底層硬件是Arm人工智能策略的關(guān)鍵,而其實(shí)對于這些芯片的應(yīng)用,Arm方面也有了明確清晰的定位。如應(yīng)用廣泛的CPU和GPU將會是他們的AI芯片先鋒。
首先是Cortex-A系列處理器。Ian Smythe表示,經(jīng)過了多年的迭代,Arm的Cortex-A系列處理器的SIMD性能有了極大的提升,尤其是在引入了DynamIQ技術(shù)之后,這系列處理器對人工智能的支持有了質(zhì)的飛躍。
DynamIQ是Arm公司針對機(jī)器學(xué)習(xí)和人工智能應(yīng)用,面向新一代Cortex-A處理器推出的技術(shù),不同于之前的多核處理設(shè)計(jì),DynamIQ能夠?qū)我挥?jì)算集群上的大小核進(jìn)行配置,例如1+3或者1+7的SoC設(shè)計(jì)配置,而這在過去是不可能的。
Arm DynamIQ的作用
據(jù)Arm介紹,第一代采用DynamIQ的Cortex-A系列處理器在優(yōu)化應(yīng)用后,能夠在未來三到五年內(nèi)實(shí)現(xiàn)比基于Cortex-A73的設(shè)備高50倍的人工智能性能,最多可將CPU和SoC上特定硬件加速器的反應(yīng)速度提升10倍;
同時(shí),SoC設(shè)計(jì)者還可以在單個(gè)集群中最多部署8個(gè)核心,而且每一個(gè)核心都可以有不同的性能特性。這些先進(jìn)的能力可以為機(jī)器學(xué)習(xí)和人工智能帶去更快的響應(yīng)速度。全新設(shè)計(jì)的內(nèi)存子系統(tǒng)也將實(shí)現(xiàn)更快的數(shù)據(jù)讀取和更加高效的節(jié)能特性;
另外還能通過對每一個(gè)處理器進(jìn)行獨(dú)立的頻率控制,高效地在不同的任務(wù)間切換最合適的處理器,所以能夠在嚴(yán)苛的發(fā)熱限制實(shí)現(xiàn)更高的性能。當(dāng)然還有更安全的自動安全系統(tǒng),能夠讓合作伙伴在故障情況下也能實(shí)現(xiàn)安全運(yùn)行。
Arm同時(shí)也為Cortex-M系列其引入包括機(jī)器學(xué)習(xí)、內(nèi)核加速的計(jì)算庫,也就是CMSIS-NN,這就讓這系列的處理器能夠很好地支持機(jī)器學(xué)習(xí)的算法。
Arm Cortex-A、Cortex-M和GPU對ML的支持
至于Mali-GPU,由于GPU本身的產(chǎn)品特性,讓它成為Arm人工智能策略中不可或缺的一部分。作為智能手機(jī)領(lǐng)域出貨量最大的一系列產(chǎn)品,搭載Mali-GPU的SoC在去年出貨總計(jì)達(dá)到12億套。高度的客戶認(rèn)同感,驅(qū)使Arm更積極地將它推向了人工智能,完善AI芯片布局。
Arm的GPU架構(gòu)
日前,Arm更是推出了Bifrost架構(gòu)之下的第二代產(chǎn)品Mali-G52 。作為Arm GPU的新一代架構(gòu),全新的Bifrost 針對幾大方向做了改良:分別是藉由Claused Shaders 技術(shù),以及基于查表索引的向量著色架構(gòu)與Wire Light 管線設(shè)計(jì)所帶來的能源效率(Energy Efficiency)提升、結(jié)合CCI-550,可讓CPU和GPU存取同一快取區(qū)塊的異構(gòu)計(jì)算(Heterogeneous computing)的一致性最佳化,以及最重要的Vulkan API 支援。這讓G52能更好的滿足產(chǎn)品的設(shè)計(jì)要求。
Mali –G52 GPU
據(jù)Ian Smythe介紹,這個(gè)GPU采用了典型的四核布局,不同于上一代產(chǎn)品的四線程執(zhí)行引擎,新的GPU將這個(gè)數(shù)據(jù)提高到八線程,因此在復(fù)雜的指令方面,就能實(shí)現(xiàn)兩倍的性能提升;另外,通過添加一些具體的指令,G52能夠更好地支持機(jī)器學(xué)習(xí),在性能方面也有了更大的改善。這樣的提升勢必會給中端設(shè)備帶來非常高質(zhì)量的表現(xiàn)。
Mali G52出色的機(jī)器學(xué)習(xí)性能
從測試結(jié)果也看到,G52較上一代提高了30%的性能密度,能效提高了15%,機(jī)器學(xué)習(xí)性能更是上一代的3.6倍。
ML和OD處理器是重要組成部分
除了CPU和GPU,Arm AI芯片庫里還有ML和OD處理器這兩個(gè)重要部分。在前面介紹Project Trillium的時(shí)候,我們曾經(jīng)提到了這兩個(gè)產(chǎn)品。這一段里,我們會深入探討Arm對這兩個(gè)芯片的期望。
其實(shí)關(guān)于Arm 的AI芯片,市場上有很多說法,最多的是在大家都在爭先恐后擁有人工智能,華為甚至在Kirin 970中引入了寒武紀(jì)的NPU芯片,作為智能手機(jī)芯片的最大IP供應(yīng)商的Arm似乎無動于衷,但隨著Project Trillium的公布,Arm的專門AI芯片終于揭開了其神秘面紗。
Ian Smythe告訴記者,ML和OD處理器是Arm公司從零開始的設(shè)計(jì)。與CPU和GPU相比,他們的性能和效率有了大幅的提升;另外,Arm還很有想法地加入DSP的功能。這讓這兩系列處理器非常適合于機(jī)器學(xué)習(xí)。首先我們先來了解一下ML處理器。
據(jù)Arm方面介紹,這個(gè)全新架構(gòu)的處理器是7nm工藝下實(shí)現(xiàn)的,擁有非常高的性能性能密度,能夠?qū)崿F(xiàn)每平方毫米多達(dá)4.6萬億次的計(jì)算能力。這款處理器將會在2018年中,通過合作伙伴推向市場。
Arm ML處理器
OD處理器則是Arm AI芯片領(lǐng)域的另一個(gè)關(guān)注點(diǎn)。這是Arm公司基于2016年收購的Apical公司的技術(shù)開發(fā)的第二代產(chǎn)品。后者作為影像處理與嵌入式機(jī)器視覺技術(shù)市場的絕對專家,讓我們堅(jiān)信Arm OD處理器的實(shí)力。
Arm OD處理器
Ian Smythe指出,新一代的OD處理器能夠?qū)崿F(xiàn)非常高速的目標(biāo)檢測:在每秒鐘可以實(shí)現(xiàn)無限次數(shù)量的幀的鑒別,這樣就可以以非常搞的速度去檢測豐富的內(nèi)容。
比如說我們可以想象一個(gè)場景,在這個(gè)場景中OD處理器能以60FPS的速度,在全高清的環(huán)境下實(shí)時(shí)識別無限數(shù)量的物體,并找到這個(gè)識別目標(biāo)物體的原數(shù)據(jù),然后把原數(shù)據(jù)發(fā)給下一個(gè)要進(jìn)行處理的處理器。
如果我們把Arm機(jī)器學(xué)習(xí)處理器和目標(biāo)檢測處理器合起來用,必然能很好地提升計(jì)算機(jī)的視覺能力。
更多的多媒體套件輔助
對于Arm包括AI在內(nèi)的很多應(yīng)用,想顯示出來,就必須要有更好的多媒體條件支持,而Arm本身就是這樣一個(gè)角色。在CPU、GPU和AI芯片之外,Arm還有DPU和VPU這樣的產(chǎn)品,他們將是將Arm產(chǎn)品性能結(jié)果展示到用戶面前的一個(gè)重要橋梁,Arm在日前也對其做了更新,首先就是Mali-D51。
Arm的多媒體套件賦能下一代技術(shù)
據(jù)介紹,Mali-D51是第一款基于Komeda架構(gòu)構(gòu)建的主流顯示處理器,擁有2017年出品的高端顯示處理器Mali-D71的眾多優(yōu)勢,并將之整合至迄今為止Arm旗下最小的DPU上。,實(shí)現(xiàn)的性能包括:
與上一代的Mali-DP650相比較,D51實(shí)現(xiàn)了兩倍的面積效率,30%的系統(tǒng)功耗額,內(nèi)存延遲也降低了50%;場景復(fù)雜度也加倍,還與Mali-D71一樣支持8層圖像處理能力。Ian Smythe表示,經(jīng)過全面優(yōu)化,D51可與Mali多媒體套件中的其他IP無縫協(xié)作,結(jié)合Assertive Display 5技術(shù)使用,甚至可將HDR(高動態(tài)范圍圖像)帶入主流設(shè)備;結(jié)合CoreLink MMU-600,可提升系統(tǒng)內(nèi)存管理效率。
Arm的顯示解決方案
視頻處理器V52則是Arm的另一個(gè)高質(zhì)量產(chǎn)品。與上一代的V61相比,V52在每一個(gè)核的解碼性能是翻了一番,能夠?qū)崿F(xiàn)了4K,每秒30幀的高畫質(zhì)顯示支持;在硅面積方面,與V61相比,同樣實(shí)現(xiàn)4K60顯示的情況下,V52的硅面積與后者相比,減少了38%。
而在解碼質(zhì)量方面,V52同樣也有了20%的提升。換句話說,就是在達(dá)到同樣的圖像質(zhì)量的前提之下,在比特?cái)?shù)上面V52能夠減少20%。對于一些非常關(guān)鍵的應(yīng)用,比如說視頻會議而言,如果帶寬條件有限的話,其實(shí)這種更少的比特?cái)?shù)是非常關(guān)鍵的。
這顆芯片能支持現(xiàn)在市面上包括HEVC、VP9、VP8、H.264、AVS+、Legacy在內(nèi)的幾乎所有標(biāo)準(zhǔn)。能夠滿足越來越多4K內(nèi)容制作需求。
在GPU方面,Arm還帶來了全新的G31。這是他們Bifrost架構(gòu)家族中,G30系列的第一款GPU。主要是針對可能低端配置的智能手機(jī)和數(shù)字電視應(yīng)用。它的總硅面積降低了20%,在性能密度上有20%的提高,同時(shí)在UI的性能方面有12%的提升。
這款產(chǎn)品具備可配置性的特點(diǎn),讓開發(fā)者在執(zhí)行引擎方面,可以選擇一個(gè)或者是兩個(gè);同時(shí)在顯示時(shí)鐘也可以配置每個(gè)是一個(gè)像素還是兩個(gè)像素。據(jù)介紹,這款極小的GPU還能夠以極低的成本支持OpenGL ES3.2和Vulkan,這勢必將幫助開發(fā)者在低端產(chǎn)品里實(shí)現(xiàn)更高的性能。
在Arm這些的產(chǎn)品賦能下,一個(gè)全新的科技世界即將到來,你準(zhǔn)備好迎接了嗎?
-
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280028 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249588 -
AI處理器
+關(guān)注
關(guān)注
0文章
94瀏覽量
9747
原文標(biāo)題:AI處理器領(lǐng)銜,Arm全面賦能未來科技
文章出處:【微信號:MooreNEWS,微信公眾號:摩爾芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
開售RK3576 高性能人工智能主板
AI人工智能隱私保護(hù)怎么樣

評論