一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

再發(fā)三大服務(wù)器芯片,自研實(shí)力愈發(fā)強(qiáng)悍的亞馬遜

lPCU_elecfans ? 來源:未知 ? 2022-12-06 07:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在近期舉辦的Re:Invent大會(huì)上,亞馬遜為其AWS云服務(wù)公布了上線全新的EC2實(shí)例,分別是C7gn、HPC7g和R7iz。R7iz用到了英特爾最新的第四代Xeon Scalable處理器Sapphire Rapids,而HPC7g則是由新處理器Graviton3E來驅(qū)動(dòng)的。與此同時(shí),AWS還在本次會(huì)議上公布了第五代Nitro芯片Nitro v5和第二代推理芯片AWS Inferentia 2,其中Graviton3E和Nitro v5都是基于Arm架構(gòu)打造的。

性能更上一層樓的Graviton3E

在HPC領(lǐng)域,Arm的出鏡率還是比較低的,除了像富岳超算這樣的頂級(jí)存在外,我們很少看到云服務(wù)廠商基于Arm芯片來打造HPC計(jì)算集群,Graviton的出現(xiàn)可謂改變了這一點(diǎn)。AWS在2020年推出的C6gn實(shí)例,就是基于其Graviton2處理器打造的,相較基于第二代AMD EPYC處理器的C5實(shí)例,C6gn做到了成本低上20%,性能卻高上40%的表現(xiàn)。

Graviton3E在不同負(fù)載下的性能提升 / 亞馬遜
根據(jù)亞馬遜給出的數(shù)據(jù),Graviton3E在Graviton3的基礎(chǔ)上再加改良,以測(cè)試浮點(diǎn)性能的基準(zhǔn)HPL為例,Graviton3E將矢量指令處理性能再度提高了35%。而HPC7g實(shí)例相比基于Graviton2的C6gn實(shí)例,更是將浮點(diǎn)性能拔高至兩倍,比基于第3代AMD EPYC 7003系列48核處理器的HPC6a實(shí)例,性能上也能高出20%,可以說是AWS上性價(jià)比最高的HPC實(shí)例了。
如今的亞馬遜已經(jīng)有了100多個(gè)不同的Graviton實(shí)例,供使用者靈活選擇。而且讓Graviton充分發(fā)揮作用的不僅是AWS EC2這樣的彈性計(jì)算云服務(wù),還有Fargate這樣無需管理實(shí)例的服務(wù),也獲得了不小的性能提升。
然而對(duì)于大部分云服務(wù)廠商來說,他們首推的實(shí)例很多依然是基于x86的,這不禁讓人深思,真的會(huì)有大型公司選擇了Arm服務(wù)器芯片嗎?亞馬遜給出了肯定的答案,也介紹了Graviton極快的普及速度。
從亞馬遜給出的合作伙伴中,我們可以看到大宇無限、Epic、Lyft、Zoom等公司,都選了圍繞Graviton芯片來構(gòu)造他們的產(chǎn)品服務(wù)。比如美國(guó)電視串流服務(wù)DirectTV在使用Graviton 3的實(shí)例后,成本減少了20%的同時(shí),延遲也有了最高50%的降低,使得他們能在訪問流量變化巨大的同時(shí)靈活擴(kuò)展容量,還能保證性能不受影響。

加劇DPU和AI芯片內(nèi)卷的Nitro和Inferentia

對(duì)于多數(shù)超大規(guī)模數(shù)據(jù)中心和云服務(wù)廠商來說,他們的DPU往往來自第三方,比如英偉達(dá)的BlueField、AMD的Pensando等,而亞馬遜旗下的Annapurna Labs,則成了AWS DPU產(chǎn)品的Nitro的幕后功臣。

Nitro v5芯片 / 亞馬遜
而這次Annapurna Labs設(shè)計(jì)的Nitro v5在性能上再度實(shí)現(xiàn)了飛躍,亞馬遜展示的數(shù)據(jù)上提到,Nitro v5相較上一代集成了兩倍的晶體管數(shù)目,在算力上提升近兩倍,擁有快上50%的DRAM速度,PCIe帶寬也提升至兩倍。由此可以看出,Nitro v5應(yīng)該選擇了更先進(jìn)的工藝,DRAM和PCIe也換成了最新一代。
在實(shí)際測(cè)試中,Nitro v5可以提高最多60%的吞吐量,降低30%的延遲,在能效比上也有了40%的提升。正是因?yàn)橛兄@樣強(qiáng)大的性能,AWS選擇了將其集成到C7gn、HPC7g實(shí)例中去,與Graviton3和Graviton3E一起實(shí)現(xiàn)200Gbps的超高網(wǎng)絡(luò)性能。
大型語言模型的出現(xiàn)推動(dòng)深度學(xué)習(xí)進(jìn)入了下一個(gè)階段,但龐大的參數(shù)量加大了推理所需的算力和成本。2019年,AWS的Inferentia芯片第一代出現(xiàn)在Inf1實(shí)例上,為用戶提供了性價(jià)比優(yōu)于GPU實(shí)例的選項(xiàng),但彼時(shí)的深度學(xué)習(xí)模型還大多數(shù)停留在數(shù)百萬個(gè),如今某些深度學(xué)習(xí)模型的參數(shù)已經(jīng)超過了數(shù)百億,比如百度的PLATO-XL對(duì)話生成模型、亞馬遜的AlexaTM等。
為此,Annapurna Labs拿出了全新的Inferentia2芯片,最高可支持到1750億參數(shù)的大型深度學(xué)習(xí)模型?;贗nferentia2芯片的Inf2實(shí)例也首次支持到分布式推理,將大型模型分布到多個(gè)芯片上進(jìn)行推理。與上一代Inf1實(shí)例相比,Inf2可以提供高達(dá)4倍的吞吐量和10分之一的延遲,與GPU實(shí)例相比更是將能效提高了50%之多。

小結(jié)

這樣頻繁的芯片發(fā)布節(jié)奏,足以看出亞馬遜在自研服務(wù)器芯片上已經(jīng)到了一個(gè)新的高度。不得不承認(rèn),亞馬遜早在2016年就收購(gòu)Annapurna Labs是一個(gè)多么具有前瞻性的戰(zhàn)略決策,在云服務(wù)廠商競(jìng)爭(zhēng)愈演愈烈的當(dāng)下,擁有自研可控的服務(wù)器芯片無疑是殺手锏。雖然谷歌、阿里巴巴等廠商也都加入到了自研服務(wù)器芯片的行列中來,但與亞馬遜的AWS相比,在產(chǎn)品陣容和布局時(shí)間上還是有所差距。

聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。


更多熱點(diǎn)文章閱讀

  • 馬斯克:預(yù)計(jì)6個(gè)月后進(jìn)行大腦芯片的人體試驗(yàn),愿意給自己孩子植入
  • 硅料降價(jià)拐點(diǎn)來臨,光伏市場(chǎng)有望重啟裝機(jī)潮
  • 造車新勢(shì)力11月銷量:哪吒第一,蔚理進(jìn)前三,小鵬依舊墊底
  • 行業(yè)機(jī)構(gòu)頻發(fā)警報(bào) 2023年全球半導(dǎo)體市場(chǎng)面臨下滑風(fēng)險(xiǎn)
  • 富士康失去iPhone 14 Pro獨(dú)家代工資格!立訊和碩上位,果鏈格局大變?


原文標(biāo)題:再發(fā)三大服務(wù)器芯片,自研實(shí)力愈發(fā)強(qiáng)悍的亞馬遜

文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:再發(fā)三大服務(wù)器芯片,自研實(shí)力愈發(fā)強(qiáng)悍的亞馬遜

文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高端芯片,服務(wù)器芯片傳來好消息!

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)當(dāng)前,處理已經(jīng)跨過了能用的階段,逐漸走向好用,但無論是消費(fèi)級(jí)還是服務(wù)器級(jí)都面臨著如何在性能上接近國(guó)外高端產(chǎn)品,以及生態(tài)上如何更加完善的問題。國(guó)內(nèi)廠商
    的頭像 發(fā)表于 05-18 09:25 ?6636次閱讀
    高端<b class='flag-5'>芯片</b><b class='flag-5'>自</b><b class='flag-5'>研</b>,<b class='flag-5'>服務(wù)器</b><b class='flag-5'>芯片</b>傳來好消息!

    國(guó)外bgp服務(wù)器多少錢?# 服務(wù)器

    服務(wù)器
    jf_57681485
    發(fā)布于 :2025年04月24日 14:19:00

    新加坡服務(wù)器延遲大嗎?真相在這里#新加坡服務(wù)器 #服務(wù)器

    服務(wù)器
    jf_57681485
    發(fā)布于 :2025年04月18日 13:48:50

    NTP校時(shí)服務(wù)器 時(shí)鐘同步服務(wù)器

    服務(wù)器
    jf_75250307
    發(fā)布于 :2025年03月19日 20:56:34

    華為 Flexus 云服務(wù)器打造 Laverna 在線筆記應(yīng)用

    在信息快速流轉(zhuǎn)的時(shí)代,高效的筆記工具愈發(fā)重要。Laverna 是一款出色的在線筆記應(yīng)用,能滿足用戶隨時(shí)隨地記錄和整理思緒的需求。在這篇博客中,我們將探討如何借助華為 Flexus 云服務(wù)器的強(qiáng)大性能
    的頭像 發(fā)表于 01-13 15:52 ?640次閱讀
    華為 Flexus 云<b class='flag-5'>服務(wù)器</b>打造 Laverna 在線筆記應(yīng)用

    進(jìn)迭時(shí)空服務(wù)器芯片發(fā)布:64 位RISC-V架構(gòu)、12nm

    。據(jù)介紹,V100服務(wù)器芯片采用了公司的RISC-VCPU核心X100、支持中斷虛擬化的AIA和APLIC、支持內(nèi)存虛擬化的IOMMU、支持安全功能的IOPMP、支
    的頭像 發(fā)表于 01-09 18:04 ?1313次閱讀
    進(jìn)迭時(shí)空<b class='flag-5'>服務(wù)器</b><b class='flag-5'>芯片</b>發(fā)布:64 位RISC-V架構(gòu)、12nm

    蘋果AI芯片,或終結(jié)與英偉達(dá)多年合作

    的實(shí)現(xiàn)提供支持,但雙方的合作并不涉及直接的芯片購(gòu)買。蘋果選擇從亞馬遜和微軟等云服務(wù)提供商處租用訪問權(quán)限,以獲取所需的技術(shù)支持。然而,這一合作模式可能即將迎來重大變革。 據(jù)最新報(bào)道,蘋果正與博通攜手設(shè)計(jì)自家的AI
    的頭像 發(fā)表于 12-27 10:18 ?579次閱讀

    亞馬遜啟動(dòng)“登月”計(jì)劃,目標(biāo)部署10萬顆AI芯片

    :Trainium2,目標(biāo)是在亞馬遜自己的數(shù)據(jù)中心里部署10萬顆Trainium2,以提高數(shù)據(jù)處理效率并降低AI芯片采購(gòu)成本。 ? 近幾年,亞馬遜一直都在致力于
    的頭像 發(fā)表于 12-02 00:26 ?2888次閱讀

    蘋果5G芯片或于明年亮相

    蘋果公司正加速推進(jìn)其5G芯片的研發(fā)進(jìn)程,有望最快在明年推出首款5G調(diào)制解調(diào)。這一舉措對(duì)
    的頭像 發(fā)表于 11-12 15:24 ?1013次閱讀

    比亞迪最快于11月實(shí)現(xiàn)算法量產(chǎn),推進(jìn)智駕芯片進(jìn)程

    10月21日市場(chǎng)傳出消息,比亞迪正計(jì)劃整合其新技術(shù)院下的智能駕駛團(tuán)隊(duì),目標(biāo)是在今年11月實(shí)現(xiàn)智能駕駛算法的量產(chǎn),并持續(xù)推進(jìn)智能駕駛芯片
    的頭像 發(fā)表于 10-22 15:57 ?1455次閱讀

    獨(dú)立服務(wù)器與云服務(wù)器的區(qū)別

    隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,企業(yè)對(duì)于服務(wù)器的需求日益增加,而服務(wù)器市場(chǎng)也隨之出現(xiàn)了多種類型的產(chǎn)品,其中最常見的是獨(dú)立服務(wù)器和云服務(wù)器。這兩種服務(wù)器
    的頭像 發(fā)表于 10-12 14:34 ?712次閱讀

    服務(wù)器CPU架構(gòu)之爭(zhēng):x86穩(wěn)坐江山,力量蓄勢(shì)待發(fā)

    在數(shù)字化轉(zhuǎn)型的浪潮中,服務(wù)器市場(chǎng)持續(xù)繁榮,各大廠商競(jìng)相投入,力求在激烈的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)一席之地。作為服務(wù)器的核心部件,CPU的性能與功耗直接決定了服務(wù)器的整體表現(xiàn),因此,CPU架構(gòu)的選擇成為了業(yè)界關(guān)注的焦點(diǎn)。
    的頭像 發(fā)表于 09-20 14:54 ?1418次閱讀

    亞馬遜AWSAI芯片崛起,挑戰(zhàn)英偉達(dá)

    近期,據(jù)路透社獨(dú)家報(bào)道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實(shí)驗(yàn)室中,六位來亞馬遜AWS的工程師正在對(duì)一種尚未公開透露名稱及詳細(xì)參數(shù)的新型服務(wù)器展開深入測(cè)試。這一關(guān)鍵事件引人注
    的頭像 發(fā)表于 07-27 14:33 ?1515次閱讀

    亞馬遜正測(cè)試一款融入AI芯片的新型服務(wù)器設(shè)計(jì)

    在得克薩斯州奧斯汀的秘密芯片實(shí)驗(yàn)室中,亞馬遜正緊鑼密鼓地測(cè)試一款高度保密的新型服務(wù)器設(shè)計(jì),該設(shè)計(jì)融入了亞馬遜自主研發(fā)的AI芯片,旨在與業(yè)界巨
    的頭像 發(fā)表于 07-26 14:21 ?923次閱讀