一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于ARMv8A的處理器——Graviton系列

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:Linux閱碼場 ? 2022-07-01 10:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2011年ARM公司的年度技術(shù)會議TechCon發(fā)布了全新的ARMv8架構(gòu)[1],同一年,在以色列,Nafea Bshara和Bilik Hrvoye從他們的前老板獲得2000萬美元的投資,創(chuàng)建了Annapurna Labs。四年之后的2015年,亞馬遜用35億美元收購了這家公司。Annapurna Labs從此成為亞馬遜的一個(gè)部門,這個(gè)部門相繼設(shè)計(jì)了3代基于ARMv8A的處理器——也就是Graviton系列。

話不多說,先上參數(shù):

583f029c-f8d3-11ec-ba43-dac502259ad0.png

數(shù)據(jù)整理:健哥。

原始地址:https://fvot4kwt4n.feishu.cn/sheets/shtcn69s9nbcvYxX0bAnDgxiAUb

Graviton3們,等等,這里為什么用們?因?yàn)镚raviton3這顆“芯片”(Chip)里面是由7顆芯片(die)組成的。雖然沒有召喚出神龍,Graviton3的引力吸引到了4個(gè)DDR控制器die(每個(gè)die又有兩個(gè)DDR5通道)和兩個(gè)PCIe5.0控制器die。

把多個(gè)die封裝到一個(gè)芯片中的技術(shù)稱為chiplet技術(shù),這樣的好處是,如果將來亞馬遜有了更快的CPU,而周圍的DDR和PCIe控制器不變,則不需要重新設(shè)計(jì)制造DDR和PCIe控制器芯片,可以把新的CPU和已有的控制器封裝到一起。這樣,系統(tǒng)設(shè)計(jì)可以更加靈活。前面表格的華為鯤鵬920,也采用了這項(xiàng)技術(shù)。

芯片整體性能方面,官方的說法是每個(gè)核心的性能至少快了25%。下面的SPEC CPU 2017測試也可以說明這一點(diǎn)。圖中的藍(lán)色是Graviton2,綠色是Graviton3。SPEC CPU是業(yè)內(nèi)通行的測試CPU性能的benchmark,包括整數(shù)測試,浮點(diǎn)測試等等,大多數(shù)的用例都取自最終用戶的應(yīng)用,例如perl解釋器,視頻壓縮,3D渲染等等[3]。

5880905e-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

Nginx的負(fù)載均衡測試?yán)锩?,Graviton3比前一代好了一倍。

58b09092-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

對于Nodejs,則提高了40%

58d007e2-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

視頻編碼提高了50%

58f71814-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

機(jī)器學(xué)習(xí)提高了幾乎150%

591c6ae2-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

由于亞馬遜做了軟硬件垂直優(yōu)化,不光是芯片本身的迭代,整個(gè)服務(wù)器的結(jié)構(gòu)也有改進(jìn),這次一個(gè)主板上(下圖右側(cè))支持三顆Graviton3芯片。

594117de-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

最后,讓我們“打開”芯片,看看里面的CPU。Graviton3使用了ARM Neoverse V1。V1主要是支持ARMv8.4的特性(上次說的蘋果M2支持到ARMv8.5特性),包括MPAM,SVE,嵌套虛擬化等。

595db4f2-f8d3-11ec-ba43-dac502259ad0.png

來源:https://community.arm.com/arm-community-blogs/b/architectures-and-processors-blog/posts/neoverse-v1-platform-a-new-performance-tier-for-arm

ARMv8.4的MPAM是內(nèi)存的分區(qū)和監(jiān)控功能,通過Partition ID對cache的容量和內(nèi)存帶寬進(jìn)行劃分。SVE是ARM在NEON的下一代SIMD(單指令多數(shù)據(jù))指令集,關(guān)于SVE指令,2020年的超級計(jì)算機(jī)排行榜的第一名的Fugaku,就是基于ARM架構(gòu)并使用了SVE指令集。[4]

ARMv8.4還支持了安全世界的虛擬化(Secure EL2),平時(shí)咱們用的Linux/Android都運(yùn)行在Normal World(非安全世界,和安全世界相對)。安全世界運(yùn)行需要更高安全性的能力,例如手機(jī)的指紋識別,版權(quán)視頻播放等等。安全世界的虛擬化就是允許安全世界運(yùn)行多個(gè)安全操作系統(tǒng)。

59932a7e-f8d3-11ec-ba43-dac502259ad0.png

來源:https://en.wikipedia.org/wiki/Bfloat16_floating-point_format

ARMv8.6的Bfloat16不僅支持了Bfloat16浮點(diǎn)類型,還支持了該類型的點(diǎn)積和矩陣運(yùn)算,以及從單精度浮點(diǎn)(32位)轉(zhuǎn)換到Bfloat16的命令。Bfloat16格式是由Google Brain團(tuán)隊(duì)開發(fā)的格式,如上圖,指數(shù)有8位,小數(shù)有7位。該格式很適合機(jī)器學(xué)習(xí)使用。

59b3a4c0-f8d3-11ec-ba43-dac502259ad0.png

來源:AWS re:invent 2021

Graviton3的CPU性能如何呢?有大神做了詳細(xì)的測試[5],健哥選了其中的時(shí)延測試。下圖的Amphere Altra和Graviton2一樣都采用了Neoverse N1,下圖是二者和Graviton3的memory時(shí)延對比,可以看出Graviton3的L3 cache性能(下圖虛線,第三個(gè)臺階)明顯比另外兩個(gè)處理器好。但是由于DDR5本身的延遲比DDR4大一些,再加上DDR5在另外的die上面,所以Graviton3的主內(nèi)存時(shí)延比另外兩個(gè)稍稍大一些(下圖第四個(gè)臺階,圖片的右上角)。

59d74ace-f8d3-11ec-ba43-dac502259ad0.png

Graviton3在亞馬遜云服務(wù)上已經(jīng)上線,一根豪華冰棍的錢(每小時(shí)15.5RMB)就能愉快的玩耍64個(gè)vCPU的虛擬機(jī)1小時(shí),相比之下,1vCPU2G內(nèi)存的虛擬機(jī)只需要每小時(shí)兩毛四。64個(gè)CPU意味著單個(gè)Graviton3的芯片完全被你所用,系統(tǒng)cache和內(nèi)存帶寬都是你一個(gè)人的。

59f6898e-f8d3-11ec-ba43-dac502259ad0.png

對ARM架構(gòu)和調(diào)測調(diào)優(yōu)感興趣的小伙伴可以進(jìn)群咨詢了解健哥的課程

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19890

    瀏覽量

    235118
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52494

    瀏覽量

    440660
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9351

    瀏覽量

    377420

原文標(biāo)題:從外到內(nèi)揭開亞馬遜的自研ARM芯片:Graviton3

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    高性能處理器LCP037A系列產(chǎn)品介紹

    LCP037A系列(LCP037AH31ES8/LCP037AK31EU8/LCP037AK31EV8)是集成 Cortex-M0 內(nèi)核的面
    的頭像 發(fā)表于 06-13 14:19 ?1273次閱讀
    高性能<b class='flag-5'>處理器</b>LCP037<b class='flag-5'>A</b><b class='flag-5'>系列</b>產(chǎn)品介紹

    海光雙路服務(wù)主板,支持 5000/7000系列 2/3號處理器

    處理器
    jf_10805031
    發(fā)布于 :2025年04月02日 14:17:42

    Xilica XP系列音頻處理器操作手冊

    XilicaXP系列數(shù)字音頻處理器操作手冊-XilicaXP系列音頻處理器操作手冊
    發(fā)表于 03-26 14:29 ?0次下載

    Arm發(fā)布基于Armv9架構(gòu)的Cortex-A320處理器

    邊緣 AI 需要更卓越的計(jì)算性能、更強(qiáng)大的安全性,以及更出色的軟件靈活性。隨著軟件愈發(fā)復(fù)雜化,Armv9 架構(gòu)應(yīng)運(yùn)而生,以提供先進(jìn)的機(jī)器學(xué)習(xí) (ML) 和 AI 功能,并具備增強(qiáng)的安全特性。該架構(gòu)現(xiàn)已在 Cortex-A3xx 的超高能效
    的頭像 發(fā)表于 02-27 17:10 ?790次閱讀

    在AWS Graviton4處理器上運(yùn)行大語言模型的性能評估

    亞馬遜云科技 (AWS) 新一代基于 Arm 架構(gòu)的定制 CPU —— AWS Graviton4 處理器已于 2024 年 7 月正式上線。這款先進(jìn)的處理器基于 64 位 Arm 指令集架構(gòu)的 Arm Neoverse V2
    的頭像 發(fā)表于 02-24 10:28 ?608次閱讀
    在AWS <b class='flag-5'>Graviton</b>4<b class='flag-5'>處理器</b>上運(yùn)行大語言模型的性能評估

    海光處理器有哪些型號

    海光處理器是基于X86架構(gòu)研發(fā)的國產(chǎn)處理器,擁有自主知識產(chǎn)權(quán),并針對不同市場需求推出了多個(gè)系列和型號。以下是海光處理器的主要型號及其分類: 1、產(chǎn)品
    的頭像 發(fā)表于 02-13 14:44 ?1.3w次閱讀

    DaVinci系列處理器TPS659105用戶指南

    電子發(fā)燒友網(wǎng)站提供《DaVinci系列處理器TPS659105用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 12-21 08:59 ?0次下載
    DaVinci<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>TPS659105用戶指南

    強(qiáng)悍的AWS Graviton4處理器及其背后的Arm Neoverse

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)在今年的亞馬遜re:Invent 2024大會上,該公司正式對外發(fā)布了旗下第四代自研Arm芯片——Graviton4。作為目前最強(qiáng)大的Graviton處理器
    的頭像 發(fā)表于 12-19 00:04 ?2394次閱讀

    Arm與AWS合作深化,AWS Graviton4展現(xiàn)顯著進(jìn)展

    :Invent 2024大會上,AWS進(jìn)一步展示了其基于Arm架構(gòu)的AWS Graviton4處理器的顯著進(jìn)展。AWS Graviton4作為AWS Graviton
    的頭像 發(fā)表于 12-18 14:17 ?544次閱讀

    Cortex-A55 處理器到底什么來頭?創(chuàng)龍教儀一文帶您了解

    53:基于ARMv8-A架構(gòu),是ARM公司推出的第一個(gè)支持64位指令集的ARM Cortex-A系列處理器核心。 Cortex-A55:基于
    發(fā)表于 12-03 17:00

    全志T536系列處理器特性概述 集成RISC-V E907協(xié)處理器

    全志T536系列處理器是一款工業(yè)、智能應(yīng)用領(lǐng)域的高性能處理器;全志T536系列處理器可以說是基于ARM架構(gòu)設(shè)計(jì),專為高效能、低功耗的嵌入式應(yīng)
    的頭像 發(fā)表于 11-18 15:21 ?3937次閱讀
    全志T536<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>特性概述 集成RISC-V E907協(xié)<b class='flag-5'>處理器</b>

    AM3517/AM3505高性能ARM Cortex-A8處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《AM3517/AM3505高性能ARM Cortex-A8處理器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-08 14:13 ?0次下載
    AM3517/AM3505高性能ARM Cortex-<b class='flag-5'>A8</b>微<b class='flag-5'>處理器</b>數(shù)據(jù)表

    國產(chǎn)新型AI PC處理器亮相上海

    處理器
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年08月01日 09:21:01

    AMD的銳龍9000系列處理器將延后至8月發(fā)布

    國際媒體傳來消息,AMD公司已正式向其全球合作伙伴宣布,原計(jì)劃于7月31日面世的銳龍9000系列處理器將延后至8月發(fā)布。這一調(diào)整源自于AMD在最終品質(zhì)檢驗(yàn)階段發(fā)現(xiàn)的首批生產(chǎn)批次未能全面符合其嚴(yán)苛的質(zhì)量標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 07-25 14:24 ?1080次閱讀

    GITSATR 集特國產(chǎn) 商務(wù)臺式機(jī)電腦龍芯3A6000處理器

    處理器
    GITSTAR 集特工控
    發(fā)布于 :2024年07月22日 15:52:19