Arm 近日公開了Arm? Neoverse V1 和 N2 平臺的產(chǎn)品細節(jié),兩者滿足了基礎設施應用的各種需求。這兩個平臺的設計旨在解決當前正在運行的各種工作負載和應用問題,與上一代N1相比,并分別帶來 50%和 40%的性能提升。此外,Arm也同時發(fā)布了CMN-700,作為構建基于Neoverse V1和 N2 平臺高性能SoC的關鍵部件。
Neoverse V1:最寬微架構+SVE矢量運算

Neoverse V1平臺 / Arm
與上一代N1相比,Neoverse V1帶來了50%的性能提升和1.8倍的矢量工作負載優(yōu)化、以及4倍的機器學習工作負載優(yōu)化。得益于Arm迄今為止最寬的微架構以及SVE功能,Neoverse V1可以容納更多運行中的指令,延長了代碼存活期,也為芯片設計人員提供了靈活性。Arm 現(xiàn)有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于 NEON,SVE可將處理速度提高近3.5倍。

已經(jīng)用到Neoverse V1的HPC項目 / Arm
目前法國芯片公司SiPearl、印度信息技術部(MEITY)韓國電子通信研究所(ETRI)都在各自的HPC項目中用到了Neoverse V1。
Neoverse N2:首個Armv9+SVE2平臺

Neoverse N2提高云端到邊緣性能效率 / Arm
Arm在幾周前發(fā)布了Armv9架構,以滿足全球對無所不在的專用處理能力的需求,而新公布的Neoverse N2平臺正是第一個基于Armv9架構的平臺。

SVE2 / Arm
相比于N1,Neoverse N2在保持相同水平的功率和面積效率的基礎上,單線程性能提升了40%。不僅如此,Neoverse N2也是第一個具備SVE2功能的平臺,作為SVE和Neon的超集,SVE2為云端到邊緣的性能效率帶來了巨大提升。SVE主要用于加速HPC,而SVE2可廣泛運用于機器學習、數(shù)字信號處理和5G等應用場景,同時兼具SVE的編程簡易性和可移植性等優(yōu)勢。
CMN-700:下一代總線賦能異構SoC

Neoverse CMN-700 / Arm
作為上一代CMN-600的升級,CMN-700支持的最大核心數(shù)可達512顆。通過對CCIX 2.0和CXL 2.0的支持,也為客戶提供了更多的定制和擴展選項,為緊密耦合的異構計算提供了更大的靈活性。
異構計算的趨勢
隨著異構計算的逐步發(fā)展,我們已經(jīng)看到了很多CPU和GPU搭配的趨勢,比如英偉達近期公布的基于Arm Neoverse的Grace芯片,就是一個用于AI超算的CPU。英偉達在互聯(lián)技術上采用的是自研的NVLink技術,而非PCIE。Arm基礎設施事業(yè)部高級副總裁兼總經(jīng)理 Chris Bergey提到,與多樣化的加速器功能進行互聯(lián),比如AI加速器,這對未來的市場時相當關鍵的。比如CMN-700已經(jīng)支持了CXL和CCIX這樣的互聯(lián)標準,未來Arm期待給市場帶來更多的靈活性,并支持更多像Grace這樣的系統(tǒng)。
這樣的異構趨勢也囊括了FPGA,Arm基礎設施事業(yè)部全球高級總監(jiān)鄒挺補充道,現(xiàn)在已經(jīng)有合作伙伴將Neoverse N2和FPGA加速卡放在異構計算系統(tǒng)中使用。有的Arm合作伙伴還將FPGA加速器和N2放在一個芯片上做成SoC,通過Chiplet的技術來實現(xiàn)異構計算的靈活性。
公有云的廣泛應用

騰訊云加碼Arm生態(tài) / Arm 騰訊云
Neoverse的廣泛應用在公有云廠商中尤為明顯,比如AWS、阿里云和騰訊云等。騰訊專項測試技術中心總監(jiān)黃聞欣提到騰訊去年和Arm正式簽署了一份合作協(xié)議,希望通過合作加速Arm Neoverse技術的測評和適配。通過TencentBench測試框架發(fā)現(xiàn),得益于更多可擴展的CPU核心數(shù),Arm服務器比傳統(tǒng)的服務器性能表現(xiàn)更強勁,尤其是在AI推理和圖片處理領域。
Neoverse V1:最寬微架構+SVE矢量運算

Neoverse V1平臺 / Arm
與上一代N1相比,Neoverse V1帶來了50%的性能提升和1.8倍的矢量工作負載優(yōu)化、以及4倍的機器學習工作負載優(yōu)化。得益于Arm迄今為止最寬的微架構以及SVE功能,Neoverse V1可以容納更多運行中的指令,延長了代碼存活期,也為芯片設計人員提供了靈活性。Arm 現(xiàn)有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于 NEON,SVE可將處理速度提高近3.5倍。

已經(jīng)用到Neoverse V1的HPC項目 / Arm
目前法國芯片公司SiPearl、印度信息技術部(MEITY)韓國電子通信研究所(ETRI)都在各自的HPC項目中用到了Neoverse V1。
Neoverse N2:首個Armv9+SVE2平臺

Neoverse N2提高云端到邊緣性能效率 / Arm
Arm在幾周前發(fā)布了Armv9架構,以滿足全球對無所不在的專用處理能力的需求,而新公布的Neoverse N2平臺正是第一個基于Armv9架構的平臺。

SVE2 / Arm
CMN-700:下一代總線賦能異構SoC

Neoverse CMN-700 / Arm
作為上一代CMN-600的升級,CMN-700支持的最大核心數(shù)可達512顆。通過對CCIX 2.0和CXL 2.0的支持,也為客戶提供了更多的定制和擴展選項,為緊密耦合的異構計算提供了更大的靈活性。
異構計算的趨勢
隨著異構計算的逐步發(fā)展,我們已經(jīng)看到了很多CPU和GPU搭配的趨勢,比如英偉達近期公布的基于Arm Neoverse的Grace芯片,就是一個用于AI超算的CPU。英偉達在互聯(lián)技術上采用的是自研的NVLink技術,而非PCIE。Arm基礎設施事業(yè)部高級副總裁兼總經(jīng)理 Chris Bergey提到,與多樣化的加速器功能進行互聯(lián),比如AI加速器,這對未來的市場時相當關鍵的。比如CMN-700已經(jīng)支持了CXL和CCIX這樣的互聯(lián)標準,未來Arm期待給市場帶來更多的靈活性,并支持更多像Grace這樣的系統(tǒng)。
這樣的異構趨勢也囊括了FPGA,Arm基礎設施事業(yè)部全球高級總監(jiān)鄒挺補充道,現(xiàn)在已經(jīng)有合作伙伴將Neoverse N2和FPGA加速卡放在異構計算系統(tǒng)中使用。有的Arm合作伙伴還將FPGA加速器和N2放在一個芯片上做成SoC,通過Chiplet的技術來實現(xiàn)異構計算的靈活性。
公有云的廣泛應用

騰訊云加碼Arm生態(tài) / Arm 騰訊云
Neoverse的廣泛應用在公有云廠商中尤為明顯,比如AWS、阿里云和騰訊云等。騰訊專項測試技術中心總監(jiān)黃聞欣提到騰訊去年和Arm正式簽署了一份合作協(xié)議,希望通過合作加速Arm Neoverse技術的測評和適配。通過TencentBench測試框架發(fā)現(xiàn),得益于更多可擴展的CPU核心數(shù),Arm服務器比傳統(tǒng)的服務器性能表現(xiàn)更強勁,尤其是在AI推理和圖片處理領域。
阿里巴巴首席工程師周經(jīng)森(Kingsum Chow)談道:Arm的CPU資源的話,在我們現(xiàn)有的軟件里會有兩個考慮的點,一個是我們有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要我們把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在這方面,一年之前,我們就跟Arm的員工一起合作,把JVM的性能提高。過去一年里,我們從JDK8到JDK11,通過OpenJDK, 通過阿里巴巴 Dragonwell(OpenJDK的一個發(fā)行版),就把我們現(xiàn)有一些Java應用的一些性能提高了50%。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
ARM
+關注
關注
134文章
9270瀏覽量
373641 -
HPC
+關注
關注
0文章
331瀏覽量
24131 -
高性能計算
+關注
關注
0文章
84瀏覽量
13580 -
Neoverse
+關注
關注
0文章
11瀏覽量
4726
發(fā)布評論請先 登錄
相關推薦
解讀基于Arm Neoverse V2平臺的Google Axion處理器
云計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
如何在基于Arm Neoverse平臺的CPU上構建分布式Kubernetes集群
在本文中,我們將以 X(原 Twitter)為例,演示如何在基于 Arm Neoverse 平臺的 CPU 上構建分布式 Kubernetes 集群,以根據(jù)推文實時監(jiān)控情緒變化。如此一來,你可以充分利用

Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
RZ/V2N——近期在嵌入式世界2025上新發(fā)布,為 AI 計算、嵌入式系統(tǒng)及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發(fā)者和企業(yè)用戶對高性
發(fā)表于 03-19 17:54
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發(fā)布的最新的高性能處理器RZ/V2N

采用雙核Arm Cortex-A57 CPU的超高性能微處理器RZ/G2N數(shù)據(jù)手冊
RZ/G2N憑借雙核 Arm? Cortex?-A57(1.5GHz)處理器,具備更高規(guī)格的處理性能,同時擁有 3D 圖形處理能力以及 4K 視頻編碼/ 解碼功能。作為該產(chǎn)品的軟件平臺

英特爾18A與臺積電N2工藝各有千秋
TechInsights與SemiWiki近日聯(lián)合發(fā)布了對英特爾Intel 18A(1.8nm級別)和臺積電N2(2nm級別)工藝的深度分析。結果顯示,兩者在關鍵性能指標上各有優(yōu)勢。
瑞薩電子RZ MPU家族精品RZ/N2L產(chǎn)品介紹
瑞薩生態(tài)合作伙伴RT-Thread推出了一款高性能、多功能以太網(wǎng)MPU開發(fā)板EtherKit,搭載瑞薩電子RZ/N2L,并攜手瑞薩電子舉辦了產(chǎn)品發(fā)布會和產(chǎn)品研討。瑞薩電子在本次活動中介紹了瑞薩明星

Arm Neoverse如何加速實現(xiàn)AI數(shù)據(jù)中心
在快速演進的云計算和人工智能 (AI) 時代,企業(yè)需要能助力其優(yōu)化性能、降低成本并在市場競爭中保持領先的方法。Arm Neoverse 已成為眾多前沿企業(yè)的選擇,他們希望在推動創(chuàng)新的同
基于Arm Neoverse N2實現(xiàn)自動語音識別技術
自動語音識別 (Automatic Speech Recognition) 技術已經(jīng)深入到現(xiàn)代生活的方方面面,廣泛應用于從語音助手、轉錄服務,到呼叫中心分析和語音轉文本翻譯等方面,為各行各業(yè)提供了創(chuàng)新解決方案,顯著提升了用戶體驗。

AI高性能計算平臺是什么
AI高性能計算平臺不僅是AI技術發(fā)展的基石,更是推動AI應用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI高性能計算
基于Arm Neoverse的微軟全新Azure虛擬機上線
Neoverse CSS N2 所構建。這是我們與微軟長期合作中的一個重要里程碑,通過提供強大的平臺,為各種工作負載帶來出色的性能、可擴展性和繁榮的軟件生態(tài)系統(tǒng)。
OFFSET N1和N2這兩個引腳不是都是兩個輸入性質的引腳嗎?為什么會有固定的-12V輸出呢?
N2)發(fā)現(xiàn),均存在一個-12V的電源電壓。
請問,OFFSET N1和N2這兩個引腳不是都是兩
發(fā)表于 09-10 07:58
芯品# 高性能計算芯片
(LSE:AWE)是全球技術基礎設施高速連接和計算芯片的全球領導者,與Arm合作開發(fā)基于Arm ? Neoverse?計算子系統(tǒng)(CSS)的
評論