一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面向AI基礎(chǔ)設(shè)施,Arm Neoverse CSS N3/V3性能加碼,Arm全面設(shè)計生態(tài)不斷壯大

花茶晶晶 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2024-02-26 17:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)生成式人工智能(GenAI)經(jīng)歷2023年的興起,在2024年迎來新的高度,近期文生視頻又火爆全網(wǎng)。GenAI將滲透到教育、就業(yè)、制造、醫(yī)療和交通等各個領(lǐng)域,創(chuàng)新應(yīng)用不斷涌現(xiàn)。這其中除了GPU對AI至關(guān)重要之外,不斷優(yōu)化的CPU性能同樣必不可少。在AI時代,以Arm為代表的半導體設(shè)計及軟件平臺公司為這些創(chuàng)新奠定基石。

Arm高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理Mohamed Awad分析,計算正越來越專用化,通用CPU不再能滿足需求。以基礎(chǔ)設(shè)施領(lǐng)域來看,計算轉(zhuǎn)型持續(xù)朝向更復雜的倉庫級計算。與此同時,許多頭部企業(yè)正在打造定制芯片,并希望對支持云計算關(guān)鍵工作負載的計算進行優(yōu)化。

近日,Arm 宣布推出兩款全新 Arm Neoverse 計算子系統(tǒng) (CSS) —— Neoverse CSS N3 和 Neoverse CSS V3,專注于釋放芯粒等新技術(shù)的潛力,并更大限度地優(yōu)化實際工作負載的 TCO,這對于包括AI、數(shù)據(jù)庫、網(wǎng)絡(luò)等在內(nèi)的整個生態(tài)系統(tǒng)至關(guān)重要。

CSS N3 和 CSS V3均基于全新的第三代 Neoverse IP 構(gòu)建,N 系列聚焦能效,而V系列平臺針對性能優(yōu)先,這也是V系列首次引入CSS。

wKgZomXcVZaAYetuAAa330dyfHk504.png

Neoverse CSS N3和CSS V3性能顯著提升

據(jù)Arm 基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁 Dermot O’Driscoll介紹,CSS N3在進行了調(diào)優(yōu)后,提供滿足基礎(chǔ)設(shè)施性能要求的高效計算。CSS N3與CSS N2 相比,其每核心的每瓦性能提升20%。CSS N3 的首個實例可提供 32 核,熱設(shè)計功耗 (TDP) 低至 40W。其可擴展性非常強,可覆蓋電信、網(wǎng)絡(luò)和 DPU 等一系列應(yīng)用。同時還考慮到橫向擴展云配置。CSS N3 基于新的 Neoverse N3 IP 平臺打造,為 N 系列產(chǎn)品引入了 Armv9.2 功能,能為每個核心提供 2MB 的專用 L2 緩存,并支持最新的 PCIe 和 CXL I/O 標準以及 UCIe 芯粒標準。

CSS V3 基于新的Neoverse V3 核心打造,是 Arm 目前單線程性能最高的 Neoverse 核心。與CSS N2 產(chǎn)品相比,CSS V3的單芯片性能提高了50%。CSS V3 在單芯片上最多可擴展至 128 核,并支持最新的高速內(nèi)存和 I/O 標準。V3 為 Arm 機密計算架構(gòu) (CCA) 提供硬件支持。V3也可提供業(yè)界領(lǐng)先的專用 L2 緩存大小,顯著改善性能表現(xiàn)。

以下(見下圖)是基于 Neoverse N 系列和 V 系列打造的芯片在一些關(guān)鍵工作負載下的性能數(shù)據(jù)。Dermot O’Driscoll表示,這種代際產(chǎn)品之間的性能提升只有通過 Arm 才能實現(xiàn),因為 Arm 能讓客戶掌握創(chuàng)新的步伐,而不受制于技術(shù)供應(yīng)商。

wKgaomXcVaCAcffKAAMVKv7KOjw168.png

與AI耦合,面向AI基礎(chǔ)設(shè)施

新的CPU核心帶來全方位的良好提升,包括從視頻處理到 SQL 數(shù)據(jù)庫的性能均有所躍進。N 系列在壓縮方面取得性能優(yōu)勢,可降低云服務(wù)運營商的成本,并最終降低云服務(wù)客戶的成本。V 系列顯著提高了協(xié)議緩沖區(qū)的性能,這是在數(shù)據(jù)中心內(nèi)傳輸數(shù)據(jù)的一項關(guān)鍵功能。在這里,Dermot O’Driscoll重點解析了通過分析關(guān)鍵工作負載核心的任務(wù)算法,對微架構(gòu)進行調(diào)整從而獲得的性能效果。

AI數(shù)據(jù)分析工作負載就是最好的例證。XGBoost 是一種強大且廣泛使用的機器學習 (ML) 算法,可以幫助人們理解數(shù)據(jù)并做出更明智的決策。例如為人們推薦下一個媒體內(nèi)容,預測高峰時段的打車費用,以及等提供相關(guān)的機票優(yōu)惠等等。

在這個用例中(見下圖),通過改進分支預測,更好地管理最后一級緩存和相關(guān)內(nèi)存帶寬,以及大幅增加 L2 緩存。其結(jié)果令人驚嘆,N3 的性能提升高達 196%。

wKgaomXcVaqARnpkAAZQ4nv08ug945.png

目前行業(yè)重點放在訓練大語言模型(LLM)上,但更多業(yè)務(wù)落地在AI推理。分析師認為,已部署的 AI 服務(wù)器中有高達 80% 專用于推理。也就是說找到合適的模型和模型配置,并加以訓練,然后將其部署到更具成本效益的計算基礎(chǔ)設(shè)施上。

Dermot O’Driscoll表示,這一轉(zhuǎn)變意味著吞吐量是考量因素之一,而在基于 Arm 架構(gòu)的芯片上,Token 生成吞吐量表現(xiàn)相當優(yōu)異。其他考量因素還包括靈活性、易于部署,可支持各種軟件框架,具備低成本和高能效等優(yōu)勢。CPU 推理將是生成式AI計算應(yīng)用的關(guān)鍵組成。下圖為Arm在CPU推理的 LLM 優(yōu)化方面的初步數(shù)據(jù)??梢钥吹?,這些工作負載已從 ML 專用的 Neoverse 功能(如 Bfloat16、MatMul、SVE 和 SVE2),以及微架構(gòu)優(yōu)化中受益。

wKgZomXcVbSAXNLbAAEIt0jGBZw897.png

當然,除了CPU的AI推理,AI加速器也備受關(guān)注。據(jù)最新統(tǒng)計,打造 AI 加速器的公司已接近 80 家。以NVIDIA來看,NVIDIA不僅利用其領(lǐng)先的 Hopper GPU,同時也使用了基于 Neoverse V2 平臺的緊耦合計算芯粒Grace。Dermot O’Driscoll談到,NVIDIA Grace Hopper 的一大關(guān)鍵創(chuàng)新在于內(nèi)存容量和共享內(nèi)存模式。這種緊耦合的 CPU 加上加速器配置,對大參數(shù) LLM 非常有益,對檢索-增強-生成 (RAG) 等新興方法也很有幫助。Neoverse CSS 是專為幫助客戶在基于Arm領(lǐng)先的 CPU 平臺上,快速打造通用計算芯粒而推出的產(chǎn)品。它能提供客戶所需的所有接口,以便選擇耦合自身的加速器。

通用芯?;ミB技術(shù) (UCIe) 是一項行業(yè)標準,旨在解決芯粒物理層兼容性的問題。Arm和生態(tài)系統(tǒng)合作伙伴正積極參與這個項目。協(xié)議層存在多種標準,包括 PCIe、CXL 和 AMBA。Arm 深入?yún)⑴c到 AMBA CHI,引入芯片到芯片 (C2C) 的擴展功能,但系統(tǒng)架構(gòu)層面仍面臨難題。例如,怎樣在設(shè)計時對芯粒進行邏輯分區(qū),如何設(shè)置直接內(nèi)存訪問 (DMA) 和中斷、電源和安全等管理功能,要建立可互操作的生態(tài)系統(tǒng),就需要在生態(tài)系統(tǒng)層面一致地解決這些問題。

Arm近期發(fā)布了芯粒系統(tǒng)架構(gòu) (Chiplet System Architecture, CSA) ,正與 20 多家合作伙伴一同對此進行審核,齊心協(xié)力推動整個 Arm 生態(tài)系統(tǒng)釋放芯粒技術(shù)的潛力。

Arm全面設(shè)計生態(tài)項目不斷壯大

去年十月,Arm將廣泛的半導體產(chǎn)業(yè)匯聚一起,借由 Arm 全面設(shè)計,圍繞 Arm 計算子系統(tǒng)開展創(chuàng)新設(shè)計。僅僅推出短短四個月內(nèi),Arm 全面設(shè)計已經(jīng)有 20 多家成員加入。其中包括新的 EDA 和配套 IP 提供商,以及來自包括韓國、中國臺灣、中國大陸和印度等戰(zhàn)略市場的芯片設(shè)計合作伙伴。Arm基礎(chǔ)設(shè)施事業(yè)部營銷副總裁 Eddie Ramirez表示,Arm正在與三家主要代工廠合作,以確保 CSS 產(chǎn)品能在其先進工藝節(jié)點上進行優(yōu)化。定制芯片離不開可靠供應(yīng)鏈的支持,唯有 Arm 可提供多樣的技術(shù)和選擇。

去年,Socionext 成為首家宣布計劃在臺積公司領(lǐng)先的2納米工藝上開發(fā)基于CSS芯粒的合作伙伴。這款配置 32 核的芯??膳c其他芯粒結(jié)合使用,提供可擴展且經(jīng)濟高效的計算解決方案。該設(shè)計將基于新推出的Neoverse CSS V3 來打造。

智原科技也在構(gòu)建基于芯粒的服務(wù)器芯片,該芯片將搭載 64 顆 N 系列核心,并基于英特爾代工服務(wù)的 18A 工藝節(jié)點進行生產(chǎn)制造。

此外,ADTechnology 將提供高性價比的16 核 CSS N 系列邊緣服務(wù)器平臺,他們將與三星代工廠合作,為邊緣計算釋放更強大的算力。

wKgaomXcVb2AFqY9AAFBOrzGhNo262.png

Arm 全面設(shè)計合作伙伴正在打造多款基于 CSS 的 SoC,以賦能新一代 AI 服務(wù)器,并借助各大代工廠的前沿工藝完成這項任務(wù)。

Arm軟件生態(tài)系統(tǒng)優(yōu)勢凸顯

Arm軟件生態(tài)系統(tǒng)也在迅速擴展,幫助開發(fā)者簡化部署流程,提高采用 Arm技術(shù)的硬件的生產(chǎn)效率。Eddie Ramirez介紹說,去年,80%的云原生計算基金會 (CNCF) 畢業(yè)項目原生支持 Arm 架構(gòu)。CNCF是開源云原生軟件領(lǐng)域的中堅力量,也是當今許多現(xiàn)代軟件和云服務(wù)的基礎(chǔ)。Arm 與云服務(wù)提供商一同提供可免費訪問的基于 Neoverse 平臺的云實例,以簡化軟件開發(fā)者的資源訪問路徑。例如,OCI 最近宣布計劃向 CNFC 捐贈 300 萬美元的計算積分,旨在助力實現(xiàn)所有項目支持 Arm 架構(gòu)。

再來看Arm Neoverse 軟件生態(tài)系統(tǒng),它正在不斷擴展以滿足基礎(chǔ)設(shè)施軟件應(yīng)用領(lǐng)域的所有開發(fā)者的需求。從主流編程語言、軟件工具、所有主要 Linux 發(fā)行版,到支持網(wǎng)絡(luò)、存儲和大數(shù)據(jù)以及 AI 應(yīng)用的項目,這包括軟件棧各個級別的知名開源企業(yè)。此外還包括大量獨立軟件供應(yīng)商 (ISV),他們可提供各類應(yīng)用和 SaaS 產(chǎn)品。這一生態(tài)系統(tǒng)正成為云服務(wù)提供商部署其云服務(wù)的上佳之選,以便能夠充分利用 Arm 提供的 TCO 優(yōu)勢。

此外,主要的企業(yè)軟件 ISV 承諾將 Arm 平臺用于其核心產(chǎn)品組合。Oracle 發(fā)布的 Oracle Database 19c 支持基于 Arm 架構(gòu)的服務(wù)器,可用于云端和本地部署。這種向傳統(tǒng)企業(yè)軟件的轉(zhuǎn)變,以及部分大型 ISV 的投資,是 Arm 生態(tài)系統(tǒng)不斷擴展的又一例證。

Eddie Ramirez表示,超過 15 年在 Neoverse 軟件生態(tài)系統(tǒng)的投資,讓Arm實現(xiàn)了強大的軟件支持水平,助力超過五萬家公司在支持 Arm 的基礎(chǔ)設(shè)施上部署關(guān)鍵工作負載。這也是 Arm 及其合作伙伴生態(tài)系統(tǒng)降低部署成本,并提高正在部署的各類定制芯片可用性的另一種方式。

wKgZomXcVciAWIC9AAMbdt3V0k0503.png

小結(jié):

過去幾年,Arm 能夠在基礎(chǔ)設(shè)施領(lǐng)域取得不小的進展,Mohamed Awad認為主要是卓越性能、靈活性以及生態(tài)系統(tǒng)三方面助力。

如今,AI 正成為包括網(wǎng)絡(luò)、安全和存儲等諸多領(lǐng)域不可或缺的一部分,它可應(yīng)用到包括小型終端到交換機、路由器和基站等各種設(shè)備在內(nèi)的整個基礎(chǔ)設(shè)施中。Arm 在軟件、 IP 和芯片生態(tài)系統(tǒng)中提供出色性能和靈活性,從而降低配置的總成本并加速產(chǎn)品上市。Arm 將持續(xù)發(fā)揮關(guān)鍵作用,協(xié)助科技先行者解決由AI轉(zhuǎn)型帶來的不斷增長的數(shù)據(jù)和計算需求。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274203
收藏 人收藏

    評論

    相關(guān)推薦

    解讀基于Arm Neoverse V2平臺的Google Axion處理器

    云計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
    的頭像 發(fā)表于 04-21 13:47 ?278次閱讀

    Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創(chuàng)新

    性能、可擴展且高效的解決方案。Arm Neoverse CMN S3 能夠無縫管理一致性通信和內(nèi)存共享,是適合現(xiàn)代存儲架構(gòu)的變革性解決方案,其專為支持 Compute Express
    發(fā)表于 04-09 18:19 ?262次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S<b class='flag-5'>3</b> 推動Compute Express Link (CXL) 存儲創(chuàng)新

    基于MediaTek MT9679芯片的堅果投影N3 Pro介紹

    堅果投影 N3 Pro 搭載 MediaTek MT9679 旗艦投影芯片,該芯片配備 4 核 Arm Cortex-A73 CPU 及 Arm Mail-G52 MC1 GPU,強悍性能
    的頭像 發(fā)表于 03-24 09:10 ?471次閱讀

    虹軟AI視覺賦能雷鳥V3 AI拍攝眼鏡發(fā)布

    近日,雷鳥創(chuàng)新正式發(fā)布全新一代AI拍攝眼鏡——雷鳥V3。該產(chǎn)品搭載多項創(chuàng)新技術(shù),包括融合虹軟AI視覺算法的獵鷹影像系統(tǒng)、通義獨家定制大模型、高通驍龍AR1 Gen 1芯片平臺以及定制揚聲器等諸多創(chuàng)新
    的頭像 發(fā)表于 01-08 10:58 ?785次閱讀

    Arm Neoverse如何加速實現(xiàn)AI數(shù)據(jù)中心

    在快速演進的云計算和人工智能 (AI) 時代,企業(yè)需要能助力其優(yōu)化性能、降低成本并在市場競爭中保持領(lǐng)先的方法。Arm Neoverse 已成為眾多前沿企業(yè)的選擇,他們希望在推動創(chuàng)新的同
    的頭像 發(fā)表于 11-26 09:30 ?562次閱讀

    基于Arm Neoverse的微軟全新Azure虛擬機上線

    Neoverse CSS N2 所構(gòu)建。這是我們與微軟長期合作中的一個重要里程碑,通過提供強大的平臺,為各種工作負載帶來出色的性能、可擴展性和繁榮的軟件
    的頭像 發(fā)表于 10-27 11:00 ?675次閱讀

    Arm全面設(shè)計助力Arm架構(gòu)生態(tài)發(fā)展

    ,通過該生態(tài)項目,Arm、三星晶圓代工廠 (Samsung Foundry)、ADTechnology 和 Rebellions 正在聯(lián)手向市場推出人工智能 (AI) CPU 芯粒 (chiplet) 平臺,
    的頭像 發(fā)表于 10-21 09:58 ?638次閱讀

    Arm全面設(shè)計生態(tài)迅速擴張,推出AI CPU小芯片平臺

    近期,Arm全面設(shè)計(Arm Total Design)在推出一周年之際宣布,其生態(tài)體系中的合作伙伴數(shù)量已迅速增長至超過30家。這些合作伙伴涵蓋了從IC設(shè)計到晶圓代工服務(wù)等多個專業(yè)領(lǐng)域
    的頭像 發(fā)表于 10-18 17:00 ?523次閱讀

    基于高通主板的ARM架構(gòu)服務(wù)器

    架構(gòu)主導服務(wù)器市場,現(xiàn)面臨挑戰(zhàn)。Arm 2008 年入服務(wù)器領(lǐng)域,雖因性能生態(tài)問題未大突破,但近幾年重新沖刺。 (二)技術(shù)創(chuàng)新引領(lǐng) Arm
    的頭像 發(fā)表于 09-11 10:53 ?896次閱讀

    基于Arm架構(gòu)的Azure虛擬機助力云原生應(yīng)用開發(fā)

    定制芯片有助于解決現(xiàn)代基礎(chǔ)設(shè)施所面臨的計算挑戰(zhàn),例如人工智能 (AI) 時代與日俱增的計算復雜性。Microsoft Azure Cobalt 100 等采用 Arm Neoverse
    的頭像 發(fā)表于 09-05 15:54 ?2040次閱讀

    芯品# 高性能計算芯片

    Arm Neoverse基于CSS的CPU芯片組具有超高速接口和高級封裝,可為AI,HPC和網(wǎng)絡(luò)基礎(chǔ)設(shè)施提供可擴展的
    的頭像 發(fā)表于 06-27 10:28 ?7249次閱讀

    MediaTek加入Arm全面設(shè)計生態(tài),加速AI應(yīng)用領(lǐng)域創(chuàng)新

    近日,在COMPUTEX 2024展會上,全球知名的芯片設(shè)計廠商MediaTek宣布正式加入Arm全面設(shè)計(Arm Total Design)生態(tài)項目。這一決定標志著MediaTek
    的頭像 發(fā)表于 06-07 16:38 ?1060次閱讀

    聯(lián)發(fā)科加入Arm全面設(shè)計生態(tài)項目

    在近日舉行的COMPUTEX 2024大會上,知名芯片廠商聯(lián)發(fā)科正式宣布加入Arm全面設(shè)計(Arm Total Design)生態(tài)項目。這一舉措旨在進一步推動數(shù)據(jù)中心、
    的頭像 發(fā)表于 06-06 10:07 ?739次閱讀

    聯(lián)發(fā)科加入Arm,加速AI應(yīng)用性能與效率

    全面設(shè)計(Arm Total Design)生態(tài)項目,這一里程碑式的舉措標志著聯(lián)發(fā)科與Arm在數(shù)據(jù)中心、基礎(chǔ)設(shè)施系統(tǒng)以及電信領(lǐng)域的
    的頭像 發(fā)表于 06-05 16:26 ?770次閱讀

    MediaTek加入Arm全面設(shè)計生態(tài)項目 塑造AI計算的未來

    MediaTek 今日于 COMPUTEX 2024 宣布加入 Arm 全面設(shè)計(Arm Total Design)生態(tài)項目。Arm
    的頭像 發(fā)表于 06-04 20:09 ?1510次閱讀
    MediaTek加入<b class='flag-5'>Arm</b><b class='flag-5'>全面</b>設(shè)<b class='flag-5'>計生態(tài)</b>項目 塑造<b class='flag-5'>AI</b>計算的未來