一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Neoverse V1–性能分析和遙測(cè)規(guī)范的自頂向下方法

jf_9aVl32Dp ? 來(lái)源:Arm軟件開(kāi)發(fā)者 ? 2023-03-02 13:48 ? 次閱讀

Arm Neoverse V1 性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)現(xiàn)在可以下載了,它可以幫助您為基于V1的產(chǎn)品系統(tǒng)優(yōu)化應(yīng)用程序代碼。

白皮書是對(duì)上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵蓋了從N1到V1內(nèi)核的新功能和更新。此資源可用于了解和優(yōu)化V1平臺(tái)上應(yīng)用程序的性能。

為了充分利用您花費(fèi)的分析和優(yōu)化時(shí)間,選擇正確的PMU事件并遵循具有用戶友好軟件度量的結(jié)構(gòu)化方法是非常重要的。在白皮書中,我們介紹了Neoverse V1的Arm自頂向下分析方法。

在本博客中,我們概述了從N1到V1內(nèi)核的更新,并概述了本白皮書的內(nèi)容。我們還引用了其他有用的資源,以充分利用Neoverse V1平臺(tái)。

ArmNeoverse V1支持自上而下的1級(jí)指標(biāo)。

Arm Neoverse V1平臺(tái)是第一個(gè)Arm核心,為自上而下的方法學(xué)1級(jí)指標(biāo)支持全套事件和指標(biāo)。這些指標(biāo)對(duì)于性能分析和優(yōu)化是一個(gè)巨大的增值。

這些指標(biāo)提供了SLOT級(jí)別處理器流水線利用率的詳細(xì)細(xì)分,從而能夠評(píng)估處理器效率和識(shí)別瓶頸。該功能是Arm Neoverse V1平臺(tái)性能分析功能的一個(gè)主要增強(qiáng),此外還有其他可用于進(jìn)一步分析的微架構(gòu)探索指標(biāo)。

Arm Neoverse V1遙測(cè)規(guī)范:性能分析的事件和指標(biāo)。

Arm Neoverse V1遙測(cè)規(guī)范,包括軟件產(chǎn)品特定事件描述和衍生分析指標(biāo),可在Arm Neovere V1性能分析方法白皮書附錄B和C中找到。

Arm遙測(cè)解決方案庫(kù)

白皮書中引用的機(jī)器可讀JSON文件中提供的遙測(cè)數(shù)據(jù)和壓力工作負(fù)載套件現(xiàn)在可以在GitLab遙測(cè)解決方案庫(kù)(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。

Neoverse V1 PMU事件和指標(biāo)備忘單

在這個(gè)過(guò)程中,熟悉Arm Neoverse微體系結(jié)構(gòu),包括其復(fù)雜的管道和多級(jí)內(nèi)存層次結(jié)構(gòu),可能會(huì)有所幫助。由于Neoverse內(nèi)核提供了100多個(gè)硬件計(jì)數(shù)器可供選擇,因此確定重點(diǎn)關(guān)注的事件的優(yōu)先級(jí)非常重要。為了幫助完成這項(xiàng)任務(wù),我們創(chuàng)建了列出事件及其相應(yīng)派生度量的備忘單。

5d7bda8a-b06d-11ed-bfe3-dac502259ad0.jpg

表1。Neoverse V1核心活動(dòng)備忘單

主要參考文獻(xiàn)

以下兩份文件提供了對(duì)Neoverse V1進(jìn)行性能分析所需的所有信息,是我們推薦的參考文件:

1) Arm Neoverse V1性能分析方法白皮書(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮書介紹了一種性能分析方法,并介紹了如何在Arm Neovere V1平臺(tái)上進(jìn)行工作負(fù)載表征。這是對(duì)上一篇Neoverse N1白皮書的更新,該白皮書介紹了性能分析方法,并展示了如何在Arm Neoverse N1平臺(tái)上進(jìn)行工作負(fù)載表征。如果您是Arm平臺(tái)和性能分析工具(如Linuxperf)的新手,我們建議您先閱讀本白皮書。

2) Arm Neoverse V1 PMU指南(直接下載):本文檔全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架構(gòu)和架構(gòu)細(xì)節(jié)。

Arm Neoverse V1核心

Arm Neoverse V1是一個(gè)核心,旨在為苛刻的云、HPC和AI/ML輔助工作負(fù)載提供最大的單線程性能。Neoverse V1是第一個(gè)包含可擴(kuò)展向量擴(kuò)展(SVE)的Neoverse處理器,可實(shí)現(xiàn)最大向量性能、HPC代碼重用和使用壽命。Neoverse V1支持Bfloat16和Int8 MatMul指令。與Neoverse N1相比,這些指令可以為TensorFlow、PyTorch、OneDNN等機(jī)器學(xué)習(xí)框架提供高達(dá)3倍的性能。Neoverse V1 CPU目前可用于AWS EC2實(shí)例,由AWS Graviton3和AWS Graviton 3E處理器提供支持。

結(jié)論

我們自上而下的方法分析和遙測(cè)規(guī)范現(xiàn)在可用于Neoverse V1平臺(tái)。我們將很快開(kāi)始將這些信息上傳到Linux perf工具。V系列內(nèi)核,如V1,旨在在Neoverse系列CPU IP中提供最大的單線程性能。Neoverse V1性能分析方法白皮書和V1 PMU指南可以幫助開(kāi)發(fā)人員從V1架構(gòu)中獲得最大性能。我們鼓勵(lì)所有使用基于V1的平臺(tái)(包括AWS Graviton3和Graviton3E)的開(kāi)發(fā)人員學(xué)習(xí)和使用它。

白皮書下載地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19740

    瀏覽量

    232865
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9270

    瀏覽量

    373513
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3316

    瀏覽量

    58537

原文標(biāo)題:Arm Neoverse V1–性能分析和遙測(cè)規(guī)范的自頂向下方法

文章出處:【微信號(hào):Arm軟件開(kāi)發(fā)者,微信公眾號(hào):Arm軟件開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深度解析Neoverse V1對(duì)Arm的重要意義

    2018年10月,Arm首次宣布推出面向云到邊緣基礎(chǔ)設(shè)施產(chǎn)品Neoverse及其初步路線圖,并承諾平臺(tái)效能30%的年增長(zhǎng)率指標(biāo)將持續(xù)到2022年及以后。 根據(jù)Neoverse平臺(tái)PPA設(shè)計(jì)原則,N
    的頭像 發(fā)表于 05-19 17:49 ?5558次閱讀
    深度解析<b class='flag-5'>Neoverse</b> <b class='flag-5'>V1</b>對(duì)<b class='flag-5'>Arm</b>的重要意義

    Arm Neoverse家族新增V1和N2兩大平臺(tái),突破高性能計(jì)算瓶頸

    帶來(lái) 50%和 40%的性能提升。此外,Arm也同時(shí)發(fā)布了CMN-700,作為構(gòu)建基于Neoverse V1和 N2 平臺(tái)高性能SoC的關(guān)鍵
    的頭像 發(fā)表于 04-30 16:20 ?9576次閱讀

    基于向下技術(shù)的工程機(jī)械Digital Prototyping設(shè)計(jì)方法及應(yīng)用

    【作者】:劉雪冬【來(lái)源】:《華南理工大學(xué)》2009年【摘要】:向下的設(shè)計(jì)方法及裝配建模技術(shù)是在消費(fèi)品行業(yè)應(yīng)用比較成熟的一種設(shè)計(jì)方法和理論
    發(fā)表于 04-24 09:20

    如何實(shí)現(xiàn)擴(kuò)頻通信調(diào)制器向下的設(shè)計(jì)?

    如何實(shí)現(xiàn)擴(kuò)頻通信調(diào)制器向下的設(shè)計(jì)?如何實(shí)現(xiàn)擴(kuò)頻通信調(diào)制器的仿真測(cè)試?
    發(fā)表于 04-29 06:46

    Arm Neoverse V1的AWS Graviton3在深度學(xué)習(xí)推理工作負(fù)載方面的作用

    ) 與 AWS Graviton2 (c6g) 的性能特點(diǎn)AWS Graviton3 (c7g) 引入了 Arm Neoverse V1 CPU,與 AWS Graviton2 (c6
    發(fā)表于 08-31 15:03

    ARM Neoverse N1 Core性能分析方法

    使用Neoverse N1 CPU上的性能監(jiān)測(cè)單元(PMU)功能來(lái)確定和消除性能瓶頸的工作負(fù)載表征方法。目標(biāo)受眾是從事軟件優(yōu)化、調(diào)優(yōu)和開(kāi)發(fā)的
    發(fā)表于 08-09 06:01

    Arm Neoverse V1 PMU指南

    ?體系結(jié)構(gòu)參考手冊(cè)。有關(guān)Neoverse V1的更多詳細(xì)描述,請(qǐng)請(qǐng)參閱Arm?Neoverse? V1技術(shù)參考手冊(cè)。 本文檔不討論使用軟件開(kāi)
    發(fā)表于 08-09 07:30

    Arm Neoverse V1軟件優(yōu)化指南

    執(zhí)行 Armv8-A 架構(gòu)的Neovevev V1核心是一個(gè)高性能和低功率武器產(chǎn)品。 Neoveve V1核心支持 : 全面實(shí)施 Armv8.4-A A 64、A32和T32 指令組,其中不包括以下
    發(fā)表于 08-11 06:54

    Arm Neoverse? N1 PMU指南

    ARMv8-A。 有關(guān)Neoverse N1的更多詳細(xì)說(shuō)明,請(qǐng)參閱ARM?Neoverse?N1技術(shù)參考手冊(cè)。 本文檔不討論使用軟件開(kāi)發(fā)工具
    發(fā)表于 08-12 07:10

    ARM Neoverse?N1核心技術(shù)參考手冊(cè)

    Neoverse?N1內(nèi)核是一款高性能、低功耗的ARM產(chǎn)品,采用ARM?V8-A架構(gòu)。
    發(fā)表于 08-29 08:05

    ARM Neoverse?V1參考設(shè)計(jì)軟件開(kāi)發(fā)人員指南

    支持兩種RD-V1配置: ·RD-V1 FVP型號(hào)配置-M,這是一款單芯片系統(tǒng),具有16個(gè)ARM?Neoverse?V1內(nèi)核。 ·RD-
    發(fā)表于 08-29 06:59

    互聯(lián)網(wǎng)巨頭紛紛啟用Arm CPU架構(gòu),Arm最新Neoverse V1和N2平臺(tái)加速云服務(wù)器芯片

    V1平臺(tái)。 NeoverseN2 和V1,較N1性能分別提升40%和50% Neoverse V1
    發(fā)表于 09-30 14:46 ?1376次閱讀

    計(jì)算機(jī)網(wǎng)絡(luò):向下

    本文檔包含Jim Kurose和Keith Ross編寫的《計(jì)算機(jī)網(wǎng)絡(luò):向下方法(第7版)》復(fù)習(xí)題和問(wèn)題的參考答案。這些答案只對(duì)指導(dǎo)老師有效。請(qǐng)不要復(fù)制或者分發(fā)給其他人(即使是其他指導(dǎo)老師)。請(qǐng)
    發(fā)表于 03-13 14:23 ?0次下載

    eda向下的設(shè)計(jì)方法 eda自頂向下設(shè)計(jì)優(yōu)點(diǎn)

    EDA(Electronic Design Automation,電子設(shè)計(jì)自動(dòng)化)向下的設(shè)計(jì)方法是一種常見(jiàn)的電子電路設(shè)計(jì)方法。該
    發(fā)表于 04-10 16:49 ?4367次閱讀

    ArmArm Neoverse計(jì)算子系統(tǒng)(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    3和Neoverse CSS N3代表了Arm計(jì)算子系統(tǒng)產(chǎn)品組合的最新進(jìn)展。 Neoverse CSS V3是高性能
    的頭像 發(fā)表于 04-24 17:53 ?1396次閱讀
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計(jì)算子系統(tǒng)(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3