Arm Neoverse V1 性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現(xiàn)在可以下載了,它可以幫助您為基于V1的產(chǎn)品系統(tǒng)優(yōu)化應(yīng)用程序代碼。
白皮書是對(duì)上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內(nèi)核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺(tái)上應(yīng)用程序的性能。
為了充分利用您花費(fèi)的分析和優(yōu)化時(shí)間,選擇正確的PMU事件并遵循具有用戶友好軟件度量的結(jié)構(gòu)化方法是非常重要的。在白皮書中,我們介紹了Neoverse V1的Arm自頂向下分析方法。
在本博客中,我們概述了從N1到V1內(nèi)核的更新,并概述了本白皮書的內(nèi)容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺(tái)。
ArmNeoverse V1支持自上而下的1級(jí)指標(biāo)。
Arm Neoverse V1平臺(tái)是第一個(gè)Arm核心,為自上而下的方法學(xué)1級(jí)指標(biāo)支持全套事件和指標(biāo)。這些指標(biāo)對(duì)于性能分析和優(yōu)化是一個(gè)巨大的增值。
這些指標(biāo)提供了SLOT級(jí)別處理器流水線利用率的詳細(xì)細(xì)分,從而能夠評(píng)估處理器效率和識(shí)別瓶頸。該功能是Arm Neoverse V1平臺(tái)性能分析功能的一個(gè)主要增強(qiáng),此外還有其他可用于進(jìn)一步分析的微架構(gòu)探索指標(biāo)。
Arm Neoverse V1遙測(cè)規(guī)范:性能分析的事件和指標(biāo)。
Arm Neoverse V1遙測(cè)規(guī)范,包括軟件產(chǎn)品特定事件描述和衍生分析指標(biāo),可在Arm Neovere V1性能分析方法白皮書附錄B和C中找到。
Arm遙測(cè)解決方案庫(kù)
白皮書中引用的機(jī)器可讀JSON文件中提供的遙測(cè)數(shù)據(jù)和壓力工作負(fù)載套件現(xiàn)在可以在GitLab遙測(cè)解決方案庫(kù)(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。
Neoverse V1 PMU事件和指標(biāo)備忘單
在這個(gè)過(guò)程中,熟悉Arm Neoverse微體系結(jié)構(gòu),包括其復(fù)雜的管道和多級(jí)內(nèi)存層次結(jié)構(gòu),可能會(huì)有所幫助。由于Neoverse內(nèi)核提供了100多個(gè)硬件計(jì)數(shù)器可供選擇,因此確定重點(diǎn)關(guān)注的事件的優(yōu)先級(jí)非常重要。為了幫助完成這項(xiàng)任務(wù),我們創(chuàng)建了列出事件及其相應(yīng)派生度量的備忘單。
表1。Neoverse V1核心活動(dòng)備忘單
主要參考文獻(xiàn)
以下兩份文件提供了對(duì)Neoverse V1進(jìn)行性能分析所需的所有信息,是我們推薦的參考文件:
1) Arm Neoverse V1性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺(tái)上進(jìn)行工作負(fù)載表征。這是對(duì)上一篇Neoverse N1白皮書的更新,該白皮書介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺(tái)上進(jìn)行工作負(fù)載表征。如果您是Arm平臺(tái)和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書。
2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構(gòu)和架構(gòu)細(xì)節(jié)。
Arm Neoverse V1核心
Arm Neoverse V1是一個(gè)核心,旨在為苛刻的云、HPC和AI/ML輔助工作負(fù)載提供最大的單線程性能。Neoverse V1是第一個(gè)包含可擴(kuò)展向量擴(kuò)展(SVE)的Neoverse處理器,可實(shí)現(xiàn)最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機(jī)器學(xué)習(xí)框架提供高達(dá)3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實(shí)例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。
結(jié)論
我們自上而下的方法分析和遙測(cè)規(guī)范現(xiàn)在可用于Neoverse V1平臺(tái)。我們將很快開(kāi)始將這些信息上傳到Linux perf工具。V系列內(nèi)核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書和V1 PMU指南可以幫助開(kāi)發(fā)人員從V1架構(gòu)中獲得最大性能。我們鼓勵(lì)所有使用基于V1的平臺(tái)(包括AWS Graviton3和Graviton3E)的開(kāi)發(fā)人員學(xué)習(xí)和使用它。
白皮書下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19740瀏覽量
232865 -
ARM
+關(guān)注
關(guān)注
134文章
9270瀏覽量
373513 -
應(yīng)用程序
+關(guān)注
關(guān)注
38瀏覽量
58537
原文標(biāo)題:Arm Neoverse V1–性能分析和遙測(cè)規(guī)范的自頂向下方法
文章出處:【微信號(hào):Arm軟件開(kāi)發(fā)者,微信公眾號(hào):Arm軟件開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
深度解析Neoverse V1對(duì)Arm的重要意義

Arm Neoverse家族新增V1和N2兩大平臺(tái),突破高性能計(jì)算瓶頸
基于自頂向下技術(shù)的工程機(jī)械Digital Prototyping設(shè)計(jì)方法及應(yīng)用
如何實(shí)現(xiàn)擴(kuò)頻通信調(diào)制器自頂向下的設(shè)計(jì)?
Arm Neoverse V1的AWS Graviton3在深度學(xué)習(xí)推理工作負(fù)載方面的作用
ARM Neoverse N1 Core性能分析方法
Arm Neoverse V1 PMU指南
Arm Neoverse V1軟件優(yōu)化指南
Arm Neoverse? N1 PMU指南
ARM Neoverse?N1核心技術(shù)參考手冊(cè)
ARM Neoverse?V1參考設(shè)計(jì)軟件開(kāi)發(fā)人員指南
互聯(lián)網(wǎng)巨頭紛紛啟用Arm CPU架構(gòu),Arm最新Neoverse V1和N2平臺(tái)加速云服務(wù)器芯片自研
計(jì)算機(jī)網(wǎng)絡(luò):自頂向下
eda自頂向下的設(shè)計(jì)方法 eda自頂向下設(shè)計(jì)優(yōu)點(diǎn)
Arm新Arm Neoverse計(jì)算子系統(tǒng)(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

評(píng)論