一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從Arm的TCS23參考設(shè)計(jì),看明年的手機(jī)性能提升

哈哈hfgfdf ? 來(lái)源:嵌入式學(xué)習(xí)資料 ? 作者:嵌入式學(xué)習(xí)資料 ? 2023-07-02 08:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

其實(shí)Arm前一陣已經(jīng)正式發(fā)布了TCS23(Total Compute Solutions 23)平臺(tái),以及對(duì)應(yīng)的IP產(chǎn)品,包括Cortex-X4、A720、A520這些Armv9架構(gòu)的CPU IP,最新的Immortalis-G720——也就是基于Arm第五代GPU微架構(gòu)的新IP,以及更新后的DSU。毫無(wú)疑問(wèn)的,這些IP會(huì)成為接下來(lái)1-2年手機(jī)AP SoC的焦點(diǎn)。 最近Arm特別在中國(guó)的媒體技術(shù)日上,花較多篇幅去談這些IP及TCS23平臺(tái)的組成細(xì)節(jié)。Arm從解決方案、CPU/GPU及相關(guān)IP、軟件、安全四個(gè)方面做了比較大篇幅的分享。 幾個(gè)核心IP應(yīng)該是普羅大眾最關(guān)心的,包括全面徹底遷往AArch64的CPU IP,新一代的Immortalis GPU,以及新版DSU-120(DynamIQ Shared Unit)。這幾個(gè)組成部分,我們將另外撰文詳述。 實(shí)際上Arm推的TCS23解決方案也已經(jīng)是第3代了。大部分人對(duì)于“解決方案”于Arm IP這套生態(tài)的理解,應(yīng)該就是將IP打包發(fā)售。但實(shí)際上,TCS是從設(shè)計(jì)角度,更綜合、整體的范圍去提升性能和效率的存在。 e3b6b16c-1871-11ee-9c1d-dac502259ad0.png ?具體如上圖所示,大部分人關(guān)心的是處在中間的環(huán)節(jié),即Armv9架構(gòu)及其上的存儲(chǔ)與互聯(lián)一致性、各種核心IP。實(shí)際TCS還包括圖中的軟件、開發(fā)工具,以及以先進(jìn)工藝做Arm IP實(shí)施的物理IP。 Arm終端事業(yè)部產(chǎn)品管理高級(jí)總監(jiān)Kinjal Dave說(shuō):“談到解決方案,為什么 Arm 要采取這樣一種全局的方法論來(lái)開發(fā)解決方案,不斷推高性能、提高效率,本身變得越來(lái)越難且成本高昂。其實(shí)這對(duì) Arm 來(lái)說(shuō),意味著我們每年推出的 TCS 在性能跟效率方面,都必須實(shí)現(xiàn)進(jìn)步。所以,我們要采取一種平衡?!?/span> Kinjal說(shuō)Arm這些年來(lái)始終努力在benchmark和真實(shí)使用場(chǎng)景之間做平衡:“一方面,單獨(dú)的 IP 要不斷把它做強(qiáng),另外一方面把這些單獨(dú)的 IP 集合在一起時(shí),總體的系統(tǒng)級(jí)別也要實(shí)現(xiàn)性能效率的雙提升?!?“為我們的合作伙伴提供融合了這些單獨(dú)IP的系統(tǒng)級(jí)解決方案所帶來(lái)的完整性能提升?!?/span> 隨著摩爾定律的放緩,以及設(shè)計(jì)層面各種經(jīng)典技術(shù)的全面上線,這兩年單獨(dú)IP微架構(gòu)層面帶來(lái)的性能和效率提升也遠(yuǎn)不及此前那么大了,從更系統(tǒng)的角度來(lái)做考量也是半導(dǎo)體鏈條上各個(gè)玩家的共識(shí)。 所以這篇文章我們就從TCS23整體的角度來(lái)看看這一代平臺(tái)的改進(jìn),其中會(huì)涉及到上述IP,但不會(huì)過(guò)多深入。另外很難得的是,Arm特別用一個(gè)主題演講的章節(jié)去談了軟件改進(jìn),包括編譯器、SVE2指令、Android動(dòng)態(tài)性能框架等,本文也會(huì)略有涉及。 TCS23參考設(shè)計(jì) 本文就不過(guò)多提單獨(dú)IP的性能與效率變化了,包括Cortex-X4相比X3性能提升15%,Cortex-A720相比A715能效提升20%,Cortex-A520相比A510能效提升22%,DSU提升動(dòng)態(tài)功耗表現(xiàn)、針對(duì)閑置與低負(fù)載場(chǎng)景的新功耗模式,Immortalis-G720性能提升15%、帶寬用量降低40%等等。 wKgZomSibB6ATEqaAAOdHT4VhzI046.png ?不過(guò)Arm針對(duì)TCS23就FPGA級(jí)別做了參考設(shè)計(jì),“代表真實(shí)的芯片設(shè)備”。Arm做參考設(shè)計(jì)的原因,一是IP越來(lái)越復(fù)雜,其次是系統(tǒng)中的許多特性是需要跨系統(tǒng)的,比如說(shuō)這次Arm一直在談的MTE(Memory Tagging Extention)安全特性; 另外還包括“越來(lái)越多樣化終端使用場(chǎng)景的出現(xiàn)”,以及“對(duì)這些芯片設(shè)計(jì)工作來(lái)說(shuō),在設(shè)計(jì)選擇以及平衡方面的取舍難度也提高了?!?/span> e4c9992a-1871-11ee-9c1d-dac502259ad0.png ?上面這張圖就是Arm TCS23參考設(shè)計(jì)。大框架上CPU、GPU都用了這一代最新IP。不同核心組成的CPU集群,“與DSU-120共同連接到共享系統(tǒng)的背板(backplane)”;借助system cache(SLC)所在的CoreLink CI-700,一邊連接到Immortalis-G720 GPU。 這里CoreLink CI-700作為存儲(chǔ)系統(tǒng)的核心,為所有的IO流量提供一個(gè)匯聚點(diǎn)(也用于實(shí)現(xiàn)MTE)。同時(shí),NI-700為所有其他流量提供一條通往DRAM獨(dú)立的路徑;“能進(jìn)行QoS執(zhí)行,允許不同的流量類型一起流動(dòng),而不會(huì)出現(xiàn)交叉流,或者互相阻塞的情況”。 系統(tǒng)級(jí)解決方案的奧義 參考設(shè)計(jì)的CPU部分,是1x Cortex-X4, 3x Cortex-A720, 4x Cortex-A520的配置;DSU-120配了8MB L3 cache。Arm認(rèn)為1+3+4是性能和效率可達(dá)成均衡的配置方案。不過(guò)在多線程性能對(duì)比時(shí),Arm也有基于1+5+2的搭配呈現(xiàn)。 e4f649a2-1871-11ee-9c1d-dac502259ad0.png ?Kinjal沒(méi)有細(xì)談這部分的配置。不過(guò)這里主要看的還是系統(tǒng)級(jí)別的工作。他強(qiáng)調(diào)CPU集群的關(guān)鍵首先是如何利用CPU和行為架構(gòu)實(shí)現(xiàn)跨越三個(gè)層級(jí)的性能動(dòng)態(tài)范圍;其次影響CPU性能很重要的因素是DRAM延遲。 對(duì)于后者,一方面,“我們進(jìn)行了DRAM結(jié)構(gòu)性的靜態(tài)延遲優(yōu)化”,“首先是DynamIQ共享單元內(nèi)和通往內(nèi)存的路徑中的時(shí)鐘配置的選擇,也就是在這個(gè)領(lǐng)域資源的競(jìng)爭(zhēng)”——在這個(gè)過(guò)程里,需要進(jìn)行DynamIQ時(shí)鐘配置優(yōu)化,“同時(shí)要最小化數(shù)量的選擇”; 另一方面,還需要考慮“加載系統(tǒng)內(nèi)存層面下的動(dòng)態(tài)優(yōu)先級(jí)別”,包括“GPU、攝像頭以及其他多媒體管道等”,“它們可能要同時(shí)訪問(wèn)內(nèi)存”。這些都要求在進(jìn)行CPU集群配置時(shí),做相應(yīng)的考量。 e5354936-1871-11ee-9c1d-dac502259ad0.png ?在CPU集群的優(yōu)化上,首先是基于“CPU核心微架構(gòu)”提供“最為廣泛的動(dòng)態(tài)范圍”,“跨越三層(Cortex X4,Cortex A720和Cortex A520)”。其中包括DVFS動(dòng)態(tài)調(diào)整,線程核心遷移等;適配各種負(fù)載場(chǎng)景、應(yīng)對(duì)不同的性能目標(biāo)。此間涵蓋以最優(yōu)化的效率,針對(duì)不同的運(yùn)行場(chǎng)景,包括了分配多少CPU資源,如頻率、響應(yīng)、哪些核心參與等等。 “計(jì)算IP級(jí)的系統(tǒng)級(jí)解決方案,包括不同電源選擇的模式,不同時(shí)鐘選項(xiàng)的配置”,“在TCS23中我們添加了一個(gè)邏輯增強(qiáng)型降功耗的模式”。 “在解決方案層級(jí),我們的電源控制固件的堆棧以及調(diào)度器一起工作,能實(shí)現(xiàn)基于不同的使用場(chǎng)景的選擇,這點(diǎn)很關(guān)鍵。”Kinjal說(shuō),“TCS23解決方案中還有一個(gè)系統(tǒng)控制處理器,它能夠協(xié)調(diào)傳感器控制框架,在各個(gè)CPU內(nèi)核以及DSU-120工作點(diǎn)之間移動(dòng)的時(shí)候充分考慮到散熱以及輸電的一些限制因素?!薄翱缯麄€(gè)CPU集群,我們還實(shí)施了積極的時(shí)鐘門控以及時(shí)空調(diào)節(jié)的機(jī)制,來(lái)節(jié)約動(dòng)態(tài)功耗。” e559ea7a-1871-11ee-9c1d-dac502259ad0.png ?另一個(gè)關(guān)鍵是細(xì)粒度的電源模式——這也是當(dāng)代低功耗設(shè)計(jì)的精髓所在。上面這張圖每種顏色代表“單獨(dú)的電源連接供電”。Arm在此的工作之一就是管理供電的復(fù)雜性,“我們有專門用于電壓供應(yīng)的管理、電源傳輸、網(wǎng)絡(luò)控制電源控制部件。 “這里電源控制部件是與調(diào)度器,以及操作系統(tǒng)電源管理軟件共同協(xié)調(diào)工作的?!?/span> e58cb28e-1871-11ee-9c1d-dac502259ad0.png ?圖形計(jì)算相關(guān)的部分,Arm強(qiáng)調(diào)了3個(gè)解決方案層面的關(guān)注點(diǎn),分別是帶寬、功耗,與安全性。“我們將Arm Immotalis-G720集成到TCS23解決方案中,配置了MMU-700,與GPU實(shí)現(xiàn)共同的優(yōu)化”。其中的某些部分,也會(huì)在我們后續(xù)的IP文章GPU相關(guān)部分做更詳盡的介紹——比如節(jié)約帶寬的Deferred Vertex Shading延遲頂點(diǎn)著色。 從大方向來(lái)看,節(jié)約帶寬方面的工作包括AFRC與AFBC無(wú)損壓縮——管線不同階段的數(shù)據(jù)壓縮始終是GPU不變的話題之一,它對(duì)于DRAM訪問(wèn)需求的降低,提供更大的發(fā)熱空間都有價(jià)值;IO一致性,將緩存維護(hù)開銷降到最低,并由CoreLink CI-700與Immortalis-G720合作,來(lái)達(dá)成性能的提升;以及利用大型系統(tǒng)高速緩存(system cache),而且還有個(gè)“內(nèi)存分配提示,優(yōu)先考慮哪部分要存在高速緩存中”。 能效優(yōu)化部分,一方面是利用針對(duì)每個(gè)shader核心的power gating,另外就是核心群組的節(jié)電模式等?!癟CS23解決方案提供了一套完整的參考:Immortalis-G720驅(qū)動(dòng)如何與我們的參考固件堆棧協(xié)同,實(shí)現(xiàn)電源控制、動(dòng)態(tài)電壓與頻率的調(diào)節(jié)?!绷硗?,“我們?cè)贕PU中也實(shí)施了積極的clock gating方案,用以管理動(dòng)態(tài)功耗?!?/span> 安全性方面,MMU-700的集成對(duì)于支持DRAM保護(hù)內(nèi)容的安全處理,以及支持Android虛擬化框架是至關(guān)重要的。 e5dbc0d6-1871-11ee-9c1d-dac502259ad0.png ?結(jié)合包括cache、連接至內(nèi)存的延遲、floorplan以及內(nèi)存支持方面的變化,參考設(shè)計(jì)達(dá)成綜合的帶寬吞吐,相比于前代提升了33%。 所以在總結(jié)性發(fā)言里,Kinjal再度強(qiáng)調(diào)的一點(diǎn)就是基于TCS全面計(jì)算解決方案,“Arm已經(jīng)超越單個(gè)IP產(chǎn)品,為客戶實(shí)現(xiàn)端到端系統(tǒng)級(jí)的優(yōu)化,從而釋放整個(gè)SoC系統(tǒng)全面性能”。這是TCS存在的核心價(jià)值。 軟件帶來(lái)的性能提升 除了這些比較多人關(guān)注的IP之外,如文首所述,TCS作為解決方案還涵蓋了工具、軟件、物理/POP IP等。這里我們?cè)僬勔徽劰ぞ吆蛙浖?,TCS23不僅升級(jí)了IP,也升級(jí)了軟件與工具。Arm終端事業(yè)部生態(tài)系統(tǒng)及工程高級(jí)總監(jiān)Geraint North說(shuō)Arm的工程師中,超過(guò)45%都是軟件工程師,底層部分涵蓋了驅(qū)動(dòng)、Linux內(nèi)核,往上則有軟件框架、性能分析工具、開發(fā)者教學(xué)、最佳實(shí)踐等。 wKgaomSibAGAONG5AAaJaZdfZxY824.png ?軟件自然是位于硬件之上的層級(jí),這部分Geraint主要談了64bit完全遷移、compiler編譯器性能提升,以及ADPF(Android自適應(yīng)性能框架)帶來(lái)的軟件層面的性能提升。 實(shí)際上就軟件相關(guān)的主題演講,Arm還特別花篇幅去談了安全,包括MTE、PAC/BTI技術(shù)及對(duì)應(yīng)生態(tài)——談到與谷歌、Unity在安全特性上的合作,甚至在MTE(Memory Tagging Extension)技術(shù)上,還特別找來(lái)快手、聯(lián)發(fā)科、vivo這些合作伙伴站臺(tái)。不過(guò)這次我們不會(huì)把筆墨放在安全問(wèn)題上,即便這個(gè)問(wèn)題就當(dāng)代移動(dòng)技術(shù)而言正變得格外重要。 有關(guān)64位生態(tài)遷移的話題,桎梏并不在芯片和操作系統(tǒng)廠商身上,而在最上層的App開發(fā)者身上。自11年以前,CPU層面提供64位支持(Cortex-A57/A53),以及2年后Android操作系統(tǒng)跟進(jìn),一直到今年P(guān)ixel 7作為純64位Android配置的手機(jī)問(wèn)世,這仍然是個(gè)相當(dāng)漫長(zhǎng)的過(guò)程。而TCS23是徹底構(gòu)建起純64bit支持集群的一代。 e6a888d2-1871-11ee-9c1d-dac502259ad0.png ?從安全和性能兩個(gè)角度來(lái)看,64位都顯然是個(gè)更好的選擇。安全方面,64bit提供更大的內(nèi)存地址空間,在地址空間布局隨機(jī)化(ASLR)等特性實(shí)現(xiàn)上會(huì)更為有效;也為Arm多番提及的MTE和PAC(Pointer Authentication)提供了實(shí)現(xiàn)基礎(chǔ)。 而在性能方面,Arm給出了上面這張圖。Cortex-A7x系列核心,從A76到A720的SPECint2006性能變化情況:32位與64位應(yīng)用的性能差別是在逐步擴(kuò)大的。至Cortex-A710這一代性能差距擴(kuò)大至33%,且后續(xù)的IP上32位應(yīng)用不再能獲得性能紅利。Geraint說(shuō):“這種差距的拉大,一部分是由于 IP 實(shí)施的決策,我們會(huì)把更加寶貴的時(shí)間以及硅面積集中在 64 位路徑的優(yōu)化之上?!?/span> “軟件方面也是如此,我們的編譯器和庫(kù)優(yōu)化團(tuán)隊(duì),都把工作重點(diǎn)聚焦在 64 位上。如果現(xiàn)在你還是在做 32 位的開發(fā),那么我們做的這些工作可能就不能為你提供賦能?!奔幢隳壳皻v史遺留問(wèn)題多少都還在,TCS23應(yīng)當(dāng)也意味著移動(dòng)平臺(tái)的64位攻堅(jiān)戰(zhàn)進(jìn)入了尾聲。 e6d70a68-1871-11ee-9c1d-dac502259ad0.png ?編譯器方面,Geraint說(shuō)過(guò)去3年時(shí)間里,LLVM實(shí)現(xiàn)了12%的性能提升。所以“這種工作是非常有價(jià)值的,因?yàn)樗粌H提高了最新一代的 CPU 性能,不管這個(gè)設(shè)備是基于 Armv8 還是 Armv9,當(dāng)它搭載最新的工具鏈重新編譯的時(shí)候,會(huì)普遍獲得性能的提升”。 Geraint強(qiáng)調(diào),Arm在LLVM上的投入有很大一部分是集中在了SVE2指令的性能提升的——也就是Armv9架構(gòu)引入的矢量擴(kuò)展。 e6fe740e-1871-11ee-9c1d-dac502259ad0.png ?Arm對(duì)于SVE2真正產(chǎn)生價(jià)值的目標(biāo)是,“第一我們要確保 SVE2 的代碼生成盡可能做好,這就意味著我們要保證 LLVM 能做矢量化的工作,同時(shí)又能確保 LLVM 能夠矢量化目前它不能做到的事情。”也就是在LLVM可實(shí)現(xiàn)矢量化工作的基礎(chǔ)上,做得比NEON更好,比如scatter/gather指令和predicted指令。 另一方面LLVM 16版本引入了Function Multi-Versioning,“所以開發(fā)者能夠更加容易確保其函數(shù)的利用和 SVE2版本都能夠生成,并且在運(yùn)行的時(shí)候自動(dòng)選擇正確的版本”?!白鳛橐粋€(gè)開發(fā)者你不必同時(shí)做兩個(gè)二進(jìn)位文件,或者每一次都進(jìn)行 CPU 的檢測(cè)?!边@是為兼容性所做的考量。 不過(guò)我們知道,現(xiàn)階段SVE2面臨的一個(gè)實(shí)際問(wèn)題還是在于利用率,和移動(dòng)平臺(tái)是否真正需要SVE2。所以Geraint特別提到SVE2對(duì)于圖像處理非常適用。 e7404dde-1871-11ee-9c1d-dac502259ad0.png ?他舉了iToF(indirect Time-of-Flight)的例子,即用基于相位差的ToF方法來(lái)構(gòu)建深度圖?;诘腍alide圖像處理算法,都用Cortex-A720分別在FP32和FP16精度下跑,則SVE2相比NEON,分別有10%和23%的性能領(lǐng)先。這和SVE2的scatter/gather指令有很大的關(guān)系,也就是“從內(nèi)存不連續(xù)部分檢索數(shù)據(jù)”的效率。 軟件相關(guān)的提升,還有個(gè)有趣的部分是Android Adaptability Framework動(dòng)態(tài)性能自適應(yīng)框架(ADPF)。ADPF為開發(fā)者提供了一些API,包括ADPF Hint API,Thermal API,Game State API等。比如其中的Hint API,可讓操作系統(tǒng)以更快的速度來(lái)進(jìn)行CPU頻率、資源的調(diào)節(jié),達(dá)成性能需求或者節(jié)能;而Thermal API顯然是溫控相關(guān)的。 e7919856-1871-11ee-9c1d-dac502259ad0.png ?比如具體到PerformanceHint API,這個(gè)API存在的價(jià)值在于,它能為操作系統(tǒng)提供應(yīng)用或游戲目標(biāo)負(fù)載的更多信息,那么CPU可以更精準(zhǔn)地調(diào)控資源——它比Linux內(nèi)核的scheduler行為更高效。比如governor需要200ms從空閑狀態(tài)拉升到最高頻率,而在該工作完成后,頻率還有個(gè)緩慢回落的過(guò)程。這些行為不夠高效。 從應(yīng)用或游戲直接把負(fù)載預(yù)期持續(xù)時(shí)間、目標(biāo)發(fā)給操作系統(tǒng),調(diào)度策略就會(huì)高效許多,可以減少掉幀、提升能效。Geraint說(shuō),PerformanceHint API的應(yīng)用可確保正確的工作放在正確的核心上,“而不是用以前的工具如setAffinity進(jìn)行猜測(cè)”。 Pixel手機(jī)將ADPF應(yīng)用到了SurfaceFlinger(Android負(fù)責(zé)繪制應(yīng)用UI的服務(wù)),減少了50%的掉幀、節(jié)電6%。PerformanceHint API在 Android 14成為必選項(xiàng);Unity游戲引擎中,它也作為Adaptability Plugin插件存在。 e7dcd5aa-1871-11ee-9c1d-dac502259ad0.png ?還有個(gè)ADPF Thermal API,Geraint也做了分享,包括在游戲《Candy Clash》里的測(cè)試結(jié)果。其本質(zhì)都在為達(dá)成更好的游戲體驗(yàn),基于設(shè)備的熱狀態(tài)(thermal state),動(dòng)態(tài)適配游戲畫面渲染質(zhì)量(包括幀率、分辨率、LOD、貼圖),則即便是老手機(jī)也不會(huì)發(fā)生過(guò)熱,而且可穩(wěn)幀、降低功耗,測(cè)試結(jié)果是平均幀提高25%,CPU功耗降低最多18%。 ADPF以及Unity的自適應(yīng)性能特性顯然是需要和Arm IP配合的。當(dāng)然了另一方面這也需要開發(fā)者去使用對(duì)應(yīng)的API。這類API理所應(yīng)當(dāng)?shù)?,不僅成為軟件層面性能提升的組成部分,也是Arm加強(qiáng)生態(tài)粘性的關(guān)鍵。 wKgaomSiaxmASETVAAZovwwiNzY564.png ?就軟件和工具,Kinjal聊到了當(dāng)前市場(chǎng)需求熱點(diǎn)之一的AI,機(jī)器學(xué)習(xí)。Arm在這方面的中間件和庫(kù)主要是Arm NN與Arm Compute Library。 Kinjal說(shuō):“開發(fā)者每個(gè)季度都可以從Arm發(fā)布的最新軟件庫(kù)優(yōu)化上實(shí)現(xiàn)更高的機(jī)器學(xué)習(xí)應(yīng)用開發(fā)?!苯衲?月份,Android NN和ACL已經(jīng)可以在谷歌應(yīng)用商店下載;到2024年,兩者都可以直接在GMS(Google Mobile Services)上直接訪問(wèn)——在更廣的范圍內(nèi),成為Android的NN標(biāo)準(zhǔn)。 wKgaomSia0CAAygwAAX1rsHxUmg032.png ?開發(fā)工具相關(guān)的,有個(gè)促成軟件優(yōu)化的改進(jìn),Profile Guided Optimization的性能提升。開發(fā)者借助PGO能夠“收集應(yīng)用執(zhí)行需要的各類數(shù)據(jù)、信息,基于它進(jìn)行優(yōu)化,信息的收集能幫助大家了解到執(zhí)行這個(gè)應(yīng)用的瓶頸,從而有指導(dǎo)的進(jìn)行調(diào)整,獲得最大收益”。 Armv9架構(gòu)通過(guò)名為ETE(Embedded Trace Extention)和TRBE(TRace Buffer Extention)的擴(kuò)展,來(lái)捕捉這些數(shù)據(jù),做“基于硬件的追蹤”。最終在程序的binary size、追蹤捕獲數(shù)據(jù)對(duì)性能方面都達(dá)成了影響最低。 明年手機(jī)性能提升的一些數(shù)字參考 最后來(lái)談?wù)効赡芨嗳岁P(guān)心的性能提升數(shù)字,其中的絕大部分應(yīng)該都是上述參考設(shè)計(jì)的表現(xiàn)提升,也要考慮進(jìn)軟件層面的提升。既然是系統(tǒng)層面的,那就是高層級(jí)的系統(tǒng)測(cè)試了,對(duì)于反映未來(lái)手機(jī)性能變化應(yīng)該相比IP層面的性能和能效提升數(shù)字更有價(jià)值。 e8d72302-1871-11ee-9c1d-dac502259ad0.png ?首先上述對(duì)比是不同游戲,每一幀的DRAM帶寬需求縮減。Arm測(cè)試了不少游戲。相比TCS22,最高可達(dá)成44%的帶寬縮減,平均縮減幅度30%。換句話說(shuō)就是片外主內(nèi)存的依賴更低了,這對(duì)提升游戲能效表現(xiàn)是很有價(jià)值的。 這也對(duì)應(yīng)地帶來(lái)了20%的功耗節(jié)省(測(cè)試這些游戲在60fps下持續(xù)性能發(fā)揮)?!皼Q定,這些節(jié)約下來(lái)的能耗,它們或被用于 SoC 功率的計(jì)算中,來(lái)實(shí)現(xiàn)性能進(jìn)一步提升,或者又可以把它們存起來(lái),從而實(shí)現(xiàn)更長(zhǎng)電池續(xù)航的時(shí)間,讓用戶能夠玩更長(zhǎng)時(shí)間的游戲。”Kinjal說(shuō)。 前文也部分提到了圖形計(jì)算目標(biāo)之一的帶寬縮減,主要是DVS延遲頂點(diǎn)著色技術(shù)的加入,以及system cache分配策略優(yōu)化。 wKgZomSia2SAAXUDAAZlclmeSWI031.png ?在GFXBench系統(tǒng)性能測(cè)試?yán)铮瑑蓚€(gè)比較知名的測(cè)試項(xiàng)Manhattan 3.0和Aztec Ruins High中,TCS23分別有21%和20%的性能提升。這是更高的頻率、更多的shader核心,外加系統(tǒng)級(jí)優(yōu)化帶來(lái)的。未來(lái)的游戲手機(jī)又可以期待以下了。 CPU方面,Arm主要給的是Geekbench 6多線程測(cè)試,和Speedometer 2.1網(wǎng)頁(yè)瀏覽測(cè)試。需要注意的是,GB6的這個(gè)測(cè)試,TCS23這邊的CPU搭配方法是1+5+2,多線程性能提升27%。 Kinjal解釋說(shuō)之所以這樣搭配,是因?yàn)椤霸絹?lái)越多的人們開始比較多線程指標(biāo),并且它也成為我們合作伙伴進(jìn)行優(yōu)化的一個(gè)目標(biāo)。我們看到許多 AAA 級(jí)的游戲會(huì)產(chǎn)生高性能線程,而且數(shù)量正在不斷增加,因此就對(duì)CPU集群持續(xù)的多線程性能提出了要求。我們通過(guò)這個(gè)基準(zhǔn)測(cè)試來(lái)展示全新 IP 效率的提升以及制程技術(shù)的改進(jìn),可以滿足持續(xù)多線程性能方面的要求?!?/span> Speedometer這邊是1+3+4,其中還加入了軟件優(yōu)化——即Arm與谷歌就Chromium的合作,開啟PAC/BTI安全特性。軟件優(yōu)化達(dá)成的更高性能提升。 wKgZomSia5yAJbyIAAQ67tjW3K8975.png ?還有個(gè)CPU的對(duì)比,是比較CPU的機(jī)器學(xué)習(xí)性能,具體到對(duì)象識(shí)別、分類、人體姿勢(shì)追蹤等;比的主要就是Int8推理。不同核心的性能提升幅度,相比TCS22如上圖所示。 圖中右邊是GPU的AI超分性能提升達(dá)成了4倍。這里面除了CPU、GPU算力加強(qiáng),也在于Arm NN和Arm Compute Library的進(jìn)化。 wKgZomSia8yAVqmSAAQ7dUZXA1A706.png ?以上就是從解決方案層面Arm闡釋的TCS23了。不過(guò)Kinjal提到,TCS23是個(gè)可伸縮的平臺(tái),面向廣闊的客戶端設(shè)備,不只是高端手機(jī)設(shè)備。比如說(shuō)Immortalis-G720彈性縮放有下設(shè)Mali-G720/G620可選配;而在CPU集群方面,Cortex-A720核心有著對(duì)應(yīng)的可伸縮選項(xiàng)。 “我們最新發(fā)布的產(chǎn)品也將推動(dòng)下一代的旗艦智能手機(jī)?!盇rm產(chǎn)品營(yíng)銷副總裁Ian Smythe說(shuō)。實(shí)際上他在開篇還展望了未來(lái)的TCS設(shè)計(jì),如上圖,包括Blackhawk CPU以及Krake GPU等關(guān)鍵IP,“我們還著眼于未來(lái)。我們對(duì) CPU 和 GPU 產(chǎn)品路線圖的承諾更勝以往,在接下來(lái)的幾年里,我們將在包括 Krake GPU 和 Blackhawk CPU 等關(guān)鍵 IP 上加大投入,以滿足合作伙伴對(duì)于計(jì)算和圖形性能的要求。”

e9cfe816-1871-11ee-9c1d-dac502259ad0.gif


審核編輯 黃宇


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9345

    瀏覽量

    376449
  • 手機(jī)
    +關(guān)注

    關(guān)注

    35

    文章

    6936

    瀏覽量

    159398
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11067

    瀏覽量

    216635
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4930

    瀏覽量

    131003
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    明年用5G手機(jī)? 最新數(shù)據(jù)顯示:沒(méi)那么簡(jiǎn)單

    進(jìn)程仍在最后的攻堅(jiān)階段,5G建設(shè)暫時(shí)不會(huì)占用國(guó)家過(guò)多的資源。此外,按照以往通訊升級(jí)的經(jīng)驗(yàn),4G到5G還會(huì)受到地域、資費(fèi)等限制。但目前,5G通訊的大部分標(biāo)準(zhǔn)還未擬定,明年全國(guó)覆蓋5G網(wǎng)絡(luò)的可能性不大,更別說(shuō)使用5G手機(jī)了。綜上所
    發(fā)表于 10-24 15:58

    搭載RISC-V芯片的手機(jī),或?qū)⒂?b class='flag-5'>明年正式推出

    。最終,RISC-V作為硬件,打鐵還要自身硬,RISC-V芯片必須先得證明自己的能力,比如芯片廠商推出性能更強(qiáng)的產(chǎn)品。在硬件基礎(chǔ)打好了后,或許就如同蘋果x86轉(zhuǎn)向ARM一樣,包括Android、甚至未來(lái)
    發(fā)表于 12-17 08:00

    如何使用ESP8266和TAOS TCS23的顏色識(shí)別板?

    我設(shè)法使用 ESP8266 和 TAOS TCS230 顏色識(shí)別模塊實(shí)現(xiàn)了顏色識(shí)別板。我必須采取一些技巧才能讓 GPIO 能夠處理方波輸入和頻率,但最終讓它工作并實(shí)現(xiàn)了原型板。這是項(xiàng)目的描述
    發(fā)表于 05-24 08:46

    TCS2315 GPRS手機(jī)解決方案

    TCS2315 GPRS手機(jī)解決方案 TI 公司的TCS2315 GPRS手機(jī)解決方案是第三代基于GSM的超低成本手機(jī),采用先進(jìn)的65-n
    發(fā)表于 12-26 14:53 ?1296次閱讀
    <b class='flag-5'>TCS</b>2315 GPRS<b class='flag-5'>手機(jī)</b>解決方案

    ARM預(yù)計(jì)明年全球智能手機(jī)市場(chǎng)將爆炸式增長(zhǎng)

    ARM預(yù)計(jì)明年全球智能手機(jī)市場(chǎng)將爆炸式增長(zhǎng) 據(jù)英國(guó)微芯片設(shè)計(jì)廠商ARM預(yù)測(cè),明年智能手機(jī)芯片市
    發(fā)表于 11-23 09:14 ?370次閱讀

    明年將成為雙核智能手機(jī)元年

      當(dāng)前智能手機(jī)的發(fā)展趨勢(shì),明年可能將是雙核智能手機(jī)的元年。   近日,LG電子宣布將于明年
    發(fā)表于 12-25 08:46 ?551次閱讀

    ARM體系嵌入式處理器的發(fā)展

    ARM體系嵌入式處理器的發(fā)展
    發(fā)表于 09-25 08:20 ?13次下載
    <b class='flag-5'>從</b><b class='flag-5'>ARM</b>體系<b class='flag-5'>看</b>嵌入式處理器的發(fā)展

    全新的Arm全面計(jì)算解決方案實(shí)現(xiàn)基于Arm技術(shù)的移動(dòng)未來(lái)

    Arm 高級(jí)副總裁兼終端事業(yè)部總經(jīng)理 Chris Bergey 表示:“TCS23包含了基于全新第五代 GPU 架構(gòu)、可實(shí)現(xiàn)終極視覺體驗(yàn)的全新Arm Immortalis GPU,助力 Ar
    的頭像 發(fā)表于 05-30 15:37 ?710次閱讀
    全新的<b class='flag-5'>Arm</b>全面計(jì)算解決方案實(shí)現(xiàn)基于<b class='flag-5'>Arm</b>技術(shù)的移動(dòng)未來(lái)

    全新的Arm全面計(jì)算解決方案實(shí)現(xiàn)基于Arm技術(shù)的移動(dòng)未來(lái)

    Arm? 今日宣布推出 2023 全面計(jì)算解決方案(TCS23),該解決方案將成為最重要的移動(dòng)計(jì)算平臺(tái),為智能手機(jī)帶來(lái)絕佳的解決方案。TCS23 提供一整套針對(duì)特定工作負(fù)載而設(shè)計(jì)與優(yōu)化
    的頭像 發(fā)表于 05-30 15:46 ?575次閱讀
    全新的<b class='flag-5'>Arm</b>全面計(jì)算解決方案實(shí)現(xiàn)基于<b class='flag-5'>Arm</b>技術(shù)的移動(dòng)未來(lái)

    Arm TCS23現(xiàn)迄今最快處理器IP組合,前瞻定義旗艦手機(jī)SoC性能,為生成式AI而來(lái)

    最近Arm推出2023 全面計(jì)算解決方案(TCS23),發(fā)布最新CPU和GPU IP等產(chǎn)品。沒(méi)有意外,高通和聯(lián)發(fā)科的下一代旗艦手機(jī)SoC將采用Arm最新的CPU架構(gòu)Cortex-X4,
    的頭像 發(fā)表于 06-05 16:16 ?2295次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>TCS23</b>現(xiàn)迄今最快處理器IP組合,前瞻定義旗艦<b class='flag-5'>手機(jī)</b>SoC<b class='flag-5'>性能</b>,為生成式AI而來(lái)

    Arm TCS23Arm對(duì)移動(dòng)設(shè)備未來(lái)的洞察

    5月29日Arm正式推出 Arm 2023 全面計(jì)算解決方案(TCS23), 包含基于全新第五代 GPU 架構(gòu)、可實(shí)現(xiàn)終極視覺體驗(yàn)的全新Arm Immortalis GPU,助力
    的頭像 發(fā)表于 07-03 09:46 ?909次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>Arm</b> <b class='flag-5'>TCS23</b><b class='flag-5'>看</b><b class='flag-5'>Arm</b>對(duì)移動(dòng)設(shè)備未來(lái)的洞察

    移動(dòng)設(shè)備部署機(jī)器學(xué)習(xí),Arm談如何賦能移動(dòng)AI

    計(jì)算解決方案 (TCS23)?持續(xù)引領(lǐng)這樣的應(yīng)用趨勢(shì)。在最近,Arm高級(jí)副總裁兼終端事業(yè)部總經(jīng)理Chris Bergey接受媒體采訪,分享了Arm對(duì)移動(dòng)AI發(fā)展的看法以及Arm如何賦能
    的頭像 發(fā)表于 07-07 14:47 ?853次閱讀
    移動(dòng)設(shè)備部署機(jī)器學(xué)習(xí),<b class='flag-5'>Arm</b>談如何賦能移動(dòng)AI

    Arm攜手MediaTek和vivo將TCS23運(yùn)用于新一代旗艦智能手機(jī)

    2023 年五月,Arm 宣布推出移動(dòng)計(jì)算平臺(tái)——2023 全面計(jì)算解決方案 (Arm TCS23)。
    的頭像 發(fā)表于 11-29 10:09 ?1145次閱讀

    TCS23的軟件棧和FVP加速移動(dòng)生態(tài)的產(chǎn)品開發(fā)方案一覽

    今年五月,Arm 發(fā)布了 2023 全面計(jì)算解決方案 (TCS23)。TCS23 是面向移動(dòng)計(jì)算的完整 IP 組合,也是我們有史以來(lái)最佳的面向智能手機(jī)的高端解決方案。
    的頭像 發(fā)表于 12-13 16:37 ?799次閱讀
    <b class='flag-5'>TCS23</b>的軟件棧和FVP加速移動(dòng)生態(tài)的產(chǎn)品開發(fā)方案一覽

    ARM發(fā)布旗艦手機(jī)芯片:性能提升、AI性能增強(qiáng)、節(jié)能減耗

    ARM為Cortex-X系列CPU重新命名,以強(qiáng)調(diào)其性能的顯著提升。據(jù)稱,X925的單核性能較X4提升了36%(依據(jù)Geekbench測(cè)試結(jié)
    的頭像 發(fā)表于 05-30 11:26 ?1229次閱讀