一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

面向AI基礎設施,Arm Neoverse CSS N3/V3性能加碼,Arm全面設計生態(tài)不斷壯大

花茶晶晶 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2024-02-26 17:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/黃晶晶)生成式人工智能(GenAI)經(jīng)歷2023年的興起,在2024年迎來新的高度,近期文生視頻又火爆全網(wǎng)。GenAI將滲透到教育、就業(yè)、制造、醫(yī)療和交通等各個領域,創(chuàng)新應用不斷涌現(xiàn)。這其中除了GPU對AI至關重要之外,不斷優(yōu)化的CPU性能同樣必不可少。在AI時代,以Arm為代表的半導體設計及軟件平臺公司為這些創(chuàng)新奠定基石。

Arm高級副總裁兼基礎設施事業(yè)部總經(jīng)理Mohamed Awad分析,計算正越來越專用化,通用CPU不再能滿足需求。以基礎設施領域來看,計算轉型持續(xù)朝向更復雜的倉庫級計算。與此同時,許多頭部企業(yè)正在打造定制芯片,并希望對支持云計算關鍵工作負載的計算進行優(yōu)化。

近日,Arm 宣布推出兩款全新 Arm Neoverse 計算子系統(tǒng) (CSS) —— Neoverse CSS N3 和 Neoverse CSS V3,專注于釋放芯粒等新技術的潛力,并更大限度地優(yōu)化實際工作負載的 TCO,這對于包括AI、數(shù)據(jù)庫、網(wǎng)絡等在內的整個生態(tài)系統(tǒng)至關重要。

CSS N3 和 CSS V3均基于全新的第三代 Neoverse IP 構建,N 系列聚焦能效,而V系列平臺針對性能優(yōu)先,這也是V系列首次引入CSS。

wKgZomXcVZaAYetuAAa330dyfHk504.png

Neoverse CSS N3和CSS V3性能顯著提升

據(jù)Arm 基礎設施事業(yè)部產(chǎn)品解決方案副總裁 Dermot O’Driscoll介紹,CSS N3在進行了調優(yōu)后,提供滿足基礎設施性能要求的高效計算。CSS N3與CSS N2 相比,其每核心的每瓦性能提升20%。CSS N3 的首個實例可提供 32 核,熱設計功耗 (TDP) 低至 40W。其可擴展性非常強,可覆蓋電信、網(wǎng)絡和 DPU 等一系列應用。同時還考慮到橫向擴展云配置。CSS N3 基于新的 Neoverse N3 IP 平臺打造,為 N 系列產(chǎn)品引入了 Armv9.2 功能,能為每個核心提供 2MB 的專用 L2 緩存,并支持最新的 PCIe 和 CXL I/O 標準以及 UCIe 芯粒標準。

CSS V3 基于新的Neoverse V3 核心打造,是 Arm 目前單線程性能最高的 Neoverse 核心。與CSS N2 產(chǎn)品相比,CSS V3的單芯片性能提高了50%。CSS V3 在單芯片上最多可擴展至 128 核,并支持最新的高速內存和 I/O 標準。V3 為 Arm 機密計算架構 (CCA) 提供硬件支持。V3也可提供業(yè)界領先的專用 L2 緩存大小,顯著改善性能表現(xiàn)。

以下(見下圖)是基于 Neoverse N 系列和 V 系列打造的芯片在一些關鍵工作負載下的性能數(shù)據(jù)。Dermot O’Driscoll表示,這種代際產(chǎn)品之間的性能提升只有通過 Arm 才能實現(xiàn),因為 Arm 能讓客戶掌握創(chuàng)新的步伐,而不受制于技術供應商。

wKgaomXcVaCAcffKAAMVKv7KOjw168.png

與AI耦合,面向AI基礎設施

新的CPU核心帶來全方位的良好提升,包括從視頻處理到 SQL 數(shù)據(jù)庫的性能均有所躍進。N 系列在壓縮方面取得性能優(yōu)勢,可降低云服務運營商的成本,并最終降低云服務客戶的成本。V 系列顯著提高了協(xié)議緩沖區(qū)的性能,這是在數(shù)據(jù)中心內傳輸數(shù)據(jù)的一項關鍵功能。在這里,Dermot O’Driscoll重點解析了通過分析關鍵工作負載核心的任務算法,對微架構進行調整從而獲得的性能效果。

AI數(shù)據(jù)分析工作負載就是最好的例證。XGBoost 是一種強大且廣泛使用的機器學習 (ML) 算法,可以幫助人們理解數(shù)據(jù)并做出更明智的決策。例如為人們推薦下一個媒體內容,預測高峰時段的打車費用,以及等提供相關的機票優(yōu)惠等等。

在這個用例中(見下圖),通過改進分支預測,更好地管理最后一級緩存和相關內存帶寬,以及大幅增加 L2 緩存。其結果令人驚嘆,N3 的性能提升高達 196%。

wKgaomXcVaqARnpkAAZQ4nv08ug945.png

目前行業(yè)重點放在訓練大語言模型(LLM)上,但更多業(yè)務落地在AI推理。分析師認為,已部署的 AI 服務器中有高達 80% 專用于推理。也就是說找到合適的模型和模型配置,并加以訓練,然后將其部署到更具成本效益的計算基礎設施上。

Dermot O’Driscoll表示,這一轉變意味著吞吐量是考量因素之一,而在基于 Arm 架構的芯片上,Token 生成吞吐量表現(xiàn)相當優(yōu)異。其他考量因素還包括靈活性、易于部署,可支持各種軟件框架,具備低成本和高能效等優(yōu)勢。CPU 推理將是生成式AI計算應用的關鍵組成。下圖為Arm在CPU推理的 LLM 優(yōu)化方面的初步數(shù)據(jù)??梢钥吹?,這些工作負載已從 ML 專用的 Neoverse 功能(如 Bfloat16、MatMul、SVE 和 SVE2),以及微架構優(yōu)化中受益。

wKgZomXcVbSAXNLbAAEIt0jGBZw897.png

當然,除了CPU的AI推理,AI加速器也備受關注。據(jù)最新統(tǒng)計,打造 AI 加速器的公司已接近 80 家。以NVIDIA來看,NVIDIA不僅利用其領先的 Hopper GPU,同時也使用了基于 Neoverse V2 平臺的緊耦合計算芯粒Grace。Dermot O’Driscoll談到,NVIDIA Grace Hopper 的一大關鍵創(chuàng)新在于內存容量和共享內存模式。這種緊耦合的 CPU 加上加速器配置,對大參數(shù) LLM 非常有益,對檢索-增強-生成 (RAG) 等新興方法也很有幫助。Neoverse CSS 是專為幫助客戶在基于Arm領先的 CPU 平臺上,快速打造通用計算芯粒而推出的產(chǎn)品。它能提供客戶所需的所有接口,以便選擇耦合自身的加速器。

通用芯?;ミB技術 (UCIe) 是一項行業(yè)標準,旨在解決芯粒物理層兼容性的問題。Arm和生態(tài)系統(tǒng)合作伙伴正積極參與這個項目。協(xié)議層存在多種標準,包括 PCIe、CXL 和 AMBA。Arm 深入?yún)⑴c到 AMBA CHI,引入芯片到芯片 (C2C) 的擴展功能,但系統(tǒng)架構層面仍面臨難題。例如,怎樣在設計時對芯粒進行邏輯分區(qū),如何設置直接內存訪問 (DMA) 和中斷、電源和安全等管理功能,要建立可互操作的生態(tài)系統(tǒng),就需要在生態(tài)系統(tǒng)層面一致地解決這些問題。

Arm近期發(fā)布了芯粒系統(tǒng)架構 (Chiplet System Architecture, CSA) ,正與 20 多家合作伙伴一同對此進行審核,齊心協(xié)力推動整個 Arm 生態(tài)系統(tǒng)釋放芯粒技術的潛力。

Arm全面設計生態(tài)項目不斷壯大

去年十月,Arm將廣泛的半導體產(chǎn)業(yè)匯聚一起,借由 Arm 全面設計,圍繞 Arm 計算子系統(tǒng)開展創(chuàng)新設計。僅僅推出短短四個月內,Arm 全面設計已經(jīng)有 20 多家成員加入。其中包括新的 EDA 和配套 IP 提供商,以及來自包括韓國、中國臺灣、中國大陸和印度等戰(zhàn)略市場的芯片設計合作伙伴。Arm基礎設施事業(yè)部營銷副總裁 Eddie Ramirez表示,Arm正在與三家主要代工廠合作,以確保 CSS 產(chǎn)品能在其先進工藝節(jié)點上進行優(yōu)化。定制芯片離不開可靠供應鏈的支持,唯有 Arm 可提供多樣的技術和選擇。

去年,Socionext 成為首家宣布計劃在臺積公司領先的2納米工藝上開發(fā)基于CSS芯粒的合作伙伴。這款配置 32 核的芯??膳c其他芯粒結合使用,提供可擴展且經(jīng)濟高效的計算解決方案。該設計將基于新推出的Neoverse CSS V3 來打造。

智原科技也在構建基于芯粒的服務器芯片,該芯片將搭載 64 顆 N 系列核心,并基于英特爾代工服務的 18A 工藝節(jié)點進行生產(chǎn)制造。

此外,ADTechnology 將提供高性價比的16 核 CSS N 系列邊緣服務器平臺,他們將與三星代工廠合作,為邊緣計算釋放更強大的算力。

wKgaomXcVb2AFqY9AAFBOrzGhNo262.png

Arm 全面設計合作伙伴正在打造多款基于 CSS 的 SoC,以賦能新一代 AI 服務器,并借助各大代工廠的前沿工藝完成這項任務。

Arm軟件生態(tài)系統(tǒng)優(yōu)勢凸顯

Arm軟件生態(tài)系統(tǒng)也在迅速擴展,幫助開發(fā)者簡化部署流程,提高采用 Arm技術的硬件的生產(chǎn)效率。Eddie Ramirez介紹說,去年,80%的云原生計算基金會 (CNCF) 畢業(yè)項目原生支持 Arm 架構。CNCF是開源云原生軟件領域的中堅力量,也是當今許多現(xiàn)代軟件和云服務的基礎。Arm 與云服務提供商一同提供可免費訪問的基于 Neoverse 平臺的云實例,以簡化軟件開發(fā)者的資源訪問路徑。例如,OCI 最近宣布計劃向 CNFC 捐贈 300 萬美元的計算積分,旨在助力實現(xiàn)所有項目支持 Arm 架構。

再來看Arm Neoverse 軟件生態(tài)系統(tǒng),它正在不斷擴展以滿足基礎設施軟件應用領域的所有開發(fā)者的需求。從主流編程語言、軟件工具、所有主要 Linux 發(fā)行版,到支持網(wǎng)絡、存儲和大數(shù)據(jù)以及 AI 應用的項目,這包括軟件棧各個級別的知名開源企業(yè)。此外還包括大量獨立軟件供應商 (ISV),他們可提供各類應用和 SaaS 產(chǎn)品。這一生態(tài)系統(tǒng)正成為云服務提供商部署其云服務的上佳之選,以便能夠充分利用 Arm 提供的 TCO 優(yōu)勢。

此外,主要的企業(yè)軟件 ISV 承諾將 Arm 平臺用于其核心產(chǎn)品組合。Oracle 發(fā)布的 Oracle Database 19c 支持基于 Arm 架構的服務器,可用于云端和本地部署。這種向傳統(tǒng)企業(yè)軟件的轉變,以及部分大型 ISV 的投資,是 Arm 生態(tài)系統(tǒng)不斷擴展的又一例證。

Eddie Ramirez表示,超過 15 年在 Neoverse 軟件生態(tài)系統(tǒng)的投資,讓Arm實現(xiàn)了強大的軟件支持水平,助力超過五萬家公司在支持 Arm 的基礎設施上部署關鍵工作負載。這也是 Arm 及其合作伙伴生態(tài)系統(tǒng)降低部署成本,并提高正在部署的各類定制芯片可用性的另一種方式。

wKgZomXcVciAWIC9AAMbdt3V0k0503.png

小結:

過去幾年,Arm 能夠在基礎設施領域取得不小的進展,Mohamed Awad認為主要是卓越性能、靈活性以及生態(tài)系統(tǒng)三方面助力。

如今,AI 正成為包括網(wǎng)絡、安全和存儲等諸多領域不可或缺的一部分,它可應用到包括小型終端到交換機、路由器和基站等各種設備在內的整個基礎設施中。Arm 在軟件、 IP 和芯片生態(tài)系統(tǒng)中提供出色性能和靈活性,從而降低配置的總成本并加速產(chǎn)品上市。Arm 將持續(xù)發(fā)揮關鍵作用,協(xié)助科技先行者解決由AI轉型帶來的不斷增長的數(shù)據(jù)和計算需求。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35168

    瀏覽量

    280168
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務。
    的頭像 發(fā)表于 07-03 14:37 ?366次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> <b class='flag-5'>N</b>2平臺實現(xiàn)DeepSeek-R1滿血版部署

    Arm如何助力AI基礎設施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個基本事實:支撐傳統(tǒng)計算的基礎設施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?349次閱讀

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    子系統(tǒng)(CSS)? ? 的垂直領域延伸,Niva 旨在通過軟硬件深度整合,解決傳統(tǒng) x86 架構在能效比、AI 加速與生態(tài)兼容性上的痛點。以下結合技術架構、性能突破、競爭格局與戰(zhàn)略意義
    的頭像 發(fā)表于 05-29 09:56 ?695次閱讀

    Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動端的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動設備在 AI 性能、能效比與開發(fā)效率上的挑戰(zhàn)。以下從技術架構、性能突破、應用場景、
    的頭像 發(fā)表于 05-29 09:54 ?1251次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領域推出的核心計算平臺,屬于其“平臺優(yōu)先”
    的頭像 發(fā)表于 05-29 09:51 ?1377次閱讀

    解讀基于Arm Neoverse V2平臺的Google Axion處理器

    云計算需求在人工智能 (AI) 時代的爆發(fā)式增長,推動了開發(fā)者尋求性能優(yōu)化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
    的頭像 發(fā)表于 04-21 13:47 ?539次閱讀

    Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創(chuàng)新

    性能、可擴展且高效的解決方案。Arm Neoverse CMN S3 能夠無縫管理一致性通信和內存共享,是適合現(xiàn)代存儲架構的變革性解決方案,其專為支持 Compute Express
    發(fā)表于 04-09 18:19 ?561次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S<b class='flag-5'>3</b> 推動Compute Express Link (CXL) 存儲創(chuàng)新

    基于MediaTek MT9679芯片的堅果投影N3 Pro介紹

    堅果投影 N3 Pro 搭載 MediaTek MT9679 旗艦投影芯片,該芯片配備 4 核 Arm Cortex-A73 CPU 及 Arm Mail-G52 MC1 GPU,強悍性能
    的頭像 發(fā)表于 03-24 09:10 ?881次閱讀

    虹軟AI視覺賦能雷鳥V3 AI拍攝眼鏡發(fā)布

    近日,雷鳥創(chuàng)新正式發(fā)布全新一代AI拍攝眼鏡——雷鳥V3。該產(chǎn)品搭載多項創(chuàng)新技術,包括融合虹軟AI視覺算法的獵鷹影像系統(tǒng)、通義獨家定制大模型、高通驍龍AR1 Gen 1芯片平臺以及定制揚聲器等諸多創(chuàng)新
    的頭像 發(fā)表于 01-08 10:58 ?1170次閱讀

    Arm Neoverse如何加速實現(xiàn)AI數(shù)據(jù)中心

    在快速演進的云計算和人工智能 (AI) 時代,企業(yè)需要能助力其優(yōu)化性能、降低成本并在市場競爭中保持領先的方法。Arm Neoverse 已成為眾多前沿企業(yè)的選擇,他們希望在推動創(chuàng)新的同
    的頭像 發(fā)表于 11-26 09:30 ?687次閱讀

    基于Arm Neoverse的微軟全新Azure虛擬機上線

    Neoverse CSS N2 所構建。這是我們與微軟長期合作中的一個重要里程碑,通過提供強大的平臺,為各種工作負載帶來出色的性能、可擴展性和繁榮的軟件
    的頭像 發(fā)表于 10-27 11:00 ?817次閱讀

    Arm全面設計助力Arm架構生態(tài)發(fā)展

    ,通過該生態(tài)項目,Arm、三星晶圓代工廠 (Samsung Foundry)、ADTechnology 和 Rebellions 正在聯(lián)手向市場推出人工智能 (AI) CPU 芯粒 (chiplet) 平臺,
    的頭像 發(fā)表于 10-21 09:58 ?834次閱讀

    Arm全面計生態(tài)迅速擴張,推出AI CPU小芯片平臺

    近期,Arm全面設計(Arm Total Design)在推出一周年之際宣布,其生態(tài)體系中的合作伙伴數(shù)量已迅速增長至超過30家。這些合作伙伴涵蓋了從IC設計到晶圓代工服務等多個專業(yè)領域
    的頭像 發(fā)表于 10-18 17:00 ?675次閱讀

    基于高通主板的ARM架構服務器

    架構主導服務器市場,現(xiàn)面臨挑戰(zhàn)。Arm 2008 年入服務器領域,雖因性能生態(tài)問題未大突破,但近幾年重新沖刺。 (二)技術創(chuàng)新引領 Arm
    的頭像 發(fā)表于 09-11 10:53 ?1159次閱讀

    基于Arm架構的Azure虛擬機助力云原生應用開發(fā)

    定制芯片有助于解決現(xiàn)代基礎設施所面臨的計算挑戰(zhàn),例如人工智能 (AI) 時代與日俱增的計算復雜性。Microsoft Azure Cobalt 100 等采用 Arm Neoverse
    的頭像 發(fā)表于 09-05 15:54 ?2202次閱讀