一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力由性能、規(guī)模和利用率三部分組成

Dbwd_Imgtec ? 來源:Imagination Tech ? 作者:Imagination Tech ? 2022-07-05 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1、算力由性能、規(guī)模和利用率三部分組成

算力 = (單芯片)性能 x 規(guī)模(即數(shù)量) x 利用率。

8388782c-fbfb-11ec-ba43-dac502259ad0.png

算力是由性能、規(guī)模、利用率三部分共同組成的,相輔相成,缺一不可:

有的算力芯片,可能可以做到性能狂飆,但較少考慮芯片的通用性易用性,然后芯片銷量不高落地規(guī)模小,那就無法做到宏觀算力的真正提升。

有的算力提升方案,重在規(guī)模投入,攤大餅有一定作用,但不是解決未來算力需求數(shù)量級(jí)提升的根本。

有的解決方案,通過各種資源池化和跨不同的邊界算力共享,來提升算力利用率,但改變不了目前算力芯片性能瓶頸的本質(zhì)。

性能、規(guī)模、利用率,宏觀微觀,牽一發(fā)而動(dòng)全身。管中窺豹終有偏,既要考慮多種因素協(xié)同設(shè)計(jì),更要宏觀的統(tǒng)籌算力問題。

2、最核心的,通過超異構(gòu)實(shí)現(xiàn)芯片性能的數(shù)量級(jí)提升

83980a62-fbfb-11ec-ba43-dac502259ad0.png

一方面,超異構(gòu)可以通過集成更多的加速引擎來實(shí)現(xiàn)相比CPU、GPU的性能的數(shù)量級(jí)提升,但更多的計(jì)算是在DSA架構(gòu)引擎完成的,從單位晶體管資源的性能效率視角看,是和DSA在一個(gè)量級(jí)的。

工藝進(jìn)步、3D封裝、Chiplet封裝等各種創(chuàng)新,支持?jǐn)?shù)量級(jí)提升的設(shè)計(jì)規(guī)模。但要想充分利用這些價(jià)值,就需要?jiǎng)?chuàng)新的系統(tǒng)架構(gòu)。超異構(gòu)計(jì)算,通過分布式系統(tǒng)設(shè)計(jì),可以駕馭數(shù)量級(jí)提升的更大的設(shè)計(jì)規(guī)模。因此,可以做到相比傳統(tǒng)DSA再繼續(xù)10倍甚至100倍的性能提升。

3、在超異構(gòu)的約束下,實(shí)現(xiàn)規(guī)?;涞?/p>

3.1 芯片要更好地支持規(guī)模化

從微服務(wù)的視角,云計(jì)算是由不同的服務(wù)組成的分層服務(wù)體系:每一層就是一個(gè)服務(wù)族,然后不同層次的服務(wù)族組成整個(gè)云計(jì)算服務(wù)體系,這就是我們所熟悉的云計(jì)算三層服務(wù)IaaS、PaaS和SaaS。

83a22a6a-fbfb-11ec-ba43-dac502259ad0.png

更詳細(xì)的軟件堆棧如上圖所示,從非云系統(tǒng)所有的“服務(wù)”堆棧都需要用戶自己擁有并維護(hù),經(jīng)過IaaS、CaaS、PaaS、FaaS,再到最后的SaaS,一切都由供應(yīng)商運(yùn)營(yíng)維護(hù)。從左到右的過程,就是“服務(wù)”堆棧的下層layer不斷地由云運(yùn)營(yíng)商接管的過程。

這是一個(gè)鮮明的“二八定律”案例:80%的任務(wù)由云運(yùn)營(yíng)商負(fù)責(zé),20%的任務(wù)由用戶負(fù)責(zé);站在用戶的角度,20%自己負(fù)責(zé)的任務(wù)價(jià)值占到80%,而運(yùn)營(yíng)商負(fù)責(zé)的部分只占到到20%的價(jià)值。

83b329d2-fbfb-11ec-ba43-dac502259ad0.png

因此,基于二八定律,我們可以把整個(gè)系統(tǒng)分為三部分:

基礎(chǔ)設(shè)施層?;A(chǔ)設(shè)施層的任務(wù)都相對(duì)確定,適合DSA和ASIC處理引擎處理。

應(yīng)用層可加速部分任務(wù)。基礎(chǔ)設(shè)施層是CSP使用,而應(yīng)用層則是給到用戶應(yīng)用。用戶的應(yīng)用多種多樣,因此應(yīng)用層的加速也需要一定程度的彈性。這樣,GPU和FPGA就相對(duì)比較合適。

應(yīng)用層的不可加速部分。主要是一些通用的處理,如控制以及一些細(xì)粒度的計(jì)算。協(xié)處理器是CPU的一部分。因此,CPU適合各類通用任務(wù)處理,CPU負(fù)責(zé)兜底。

83be9db2-fbfb-11ec-ba43-dac502259ad0.png

如上圖所示,整個(gè)系統(tǒng)的處理有點(diǎn)像塔防游戲:DSA負(fù)責(zé)干粗活累活,大量的計(jì)算任務(wù)在DSA中完成;GPU是性能和靈活性折中一些,負(fù)責(zé)一些彈性加速的計(jì)算任務(wù);CPU啥都能干,但性能較差,因此負(fù)責(zé)兜底,也就是其他處理引擎都干不了的,都放在CPU。

這樣,CPU+GPU+DSA+etc.的超異構(gòu)計(jì)算架構(gòu)就可以實(shí)現(xiàn)“包治百病”的、相對(duì)通用的計(jì)算架構(gòu)和平臺(tái),就可以實(shí)現(xiàn)在云、網(wǎng)、邊、端等大算力場(chǎng)景以及用戶的絕大部分覆蓋。

更多場(chǎng)景和更多用戶的覆蓋,這樣才能真正實(shí)現(xiàn)芯片的規(guī)模化落地。芯片的大規(guī)模落地之后,又進(jìn)一步攤薄一次性研發(fā)成本,進(jìn)一步降低成本,形成良性循環(huán)。

3.2 宏觀算力建設(shè)實(shí)現(xiàn)芯片規(guī)?;?/p>

83c9e73a-fbfb-11ec-ba43-dac502259ad0.png

要想持續(xù)不斷地增加算力,不可避免的就是建設(shè)更多的數(shù)據(jù)中心。2022年2月,國(guó)家發(fā)改委、中央網(wǎng)信辦、工業(yè)和信息化部、國(guó)家能源局聯(lián)合印發(fā)通知,同意在京津冀、長(zhǎng)三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動(dòng)建設(shè)國(guó)家算力樞紐節(jié)點(diǎn),并規(guī)劃了10個(gè)國(guó)家數(shù)據(jù)中心集群。至此,全國(guó)一體化大數(shù)據(jù)中心體系完成總體布局設(shè)計(jì),“東數(shù)西算”工程正式全面啟動(dòng)。

“東數(shù)西算”通過構(gòu)建數(shù)據(jù)中心、云計(jì)算、大數(shù)據(jù)一體化的新型算力網(wǎng)絡(luò)體系,將東部算力需求有序引導(dǎo)到西部,優(yōu)化數(shù)據(jù)中心建設(shè)布局,促進(jìn)東西部協(xié)同聯(lián)動(dòng)。“東數(shù)西算”工程有三個(gè)總體思路:一是推動(dòng)全國(guó)數(shù)據(jù)中心適度集聚、集約發(fā)展。通過在全國(guó)布局8個(gè)算力樞紐,引導(dǎo)大型、超大型數(shù)據(jù)中心向樞紐內(nèi)集聚,形成數(shù)據(jù)中心集群。二是促進(jìn)數(shù)據(jù)中心由東向西梯次布局、統(tǒng)籌發(fā)展。三是實(shí)現(xiàn)“東數(shù)西算”循序漸進(jìn)、快速迭代。

除了大型云數(shù)據(jù)中心建設(shè)之外,也需要更多的邊緣數(shù)據(jù)中心和服務(wù)器、更多的超高算力的智慧終端,以及更智慧的網(wǎng)絡(luò)核心設(shè)備,來共同提升宏觀總算力。

4、在超異構(gòu)的約束下,提升算力利用率

4.1 提升算力利用率的手段

云計(jì)算出現(xiàn)之前,部署一套互聯(lián)網(wǎng)系統(tǒng),一般有兩種方式:小規(guī)模的時(shí)候,自己購(gòu)買物理的服務(wù)器,然后租用運(yùn)營(yíng)商的機(jī)房;超過一定規(guī)模的時(shí)候,就需要自己建機(jī)房,租用運(yùn)營(yíng)商的網(wǎng)絡(luò),自己運(yùn)維數(shù)據(jù)中心的軟件和硬件。這個(gè)時(shí)候的算力資源是一個(gè)個(gè)孤島,整個(gè)業(yè)務(wù)的模式也非常之重,成本很高而且彈性不足。如果算力資源配置比較多,就意味著資源浪費(fèi)和利用率低;如果算力資源配置比較少,就意味著無法支撐業(yè)務(wù)的發(fā)展,丟失關(guān)鍵的商業(yè)機(jī)會(huì)。

云計(jì)算通過互聯(lián)網(wǎng)按需提供IT資源,并且采用按使用量付費(fèi)的方式。用戶可以根據(jù)需要從云服務(wù)商那里獲得技術(shù)服務(wù),例如計(jì)算能力、存儲(chǔ)和數(shù)據(jù)庫(kù),而無需購(gòu)買、擁有和維護(hù)物理數(shù)據(jù)中心及服務(wù)器。云服務(wù)使用多少支付多少,可以幫助用戶降低運(yùn)維成本,用戶可以根據(jù)業(yè)務(wù)需求的變化快速調(diào)整服務(wù)的使用。

其他如基于分布式云的邊緣計(jì)算、跨不同云廠家的MSP、算力網(wǎng)絡(luò)以及云網(wǎng)邊端融合等,都是盡可能的把算力資源整合成一個(gè)巨大的資源池,然后可以靈活的根據(jù)各種完全動(dòng)態(tài)變化的需求來提供合適的算力。

我們分析一下,要想提升算力利用率,肯定不能是算力的孤島:

第一個(gè)階段,所有的設(shè)備是孤島,各自要實(shí)現(xiàn)各自的所有功能。軟件應(yīng)用也是單機(jī)版,算力利用率很低,應(yīng)用的規(guī)模受單個(gè)硬件規(guī)格的限制;

第二階段,有了互聯(lián)網(wǎng),不同的設(shè)備可以進(jìn)行協(xié)作??梢酝ㄟ^C/S架構(gòu)實(shí)現(xiàn)跨設(shè)備的軟件應(yīng)用協(xié)作。這樣,應(yīng)用的規(guī)模就突破了單個(gè)設(shè)備的約束。

第三階段,所有的算力資源形成一個(gè)整體??梢宰詣?dòng)的、任意的切分算力資源。軟件也升級(jí)成了MicroService架構(gòu)。這樣可以根據(jù)設(shè)備的規(guī)格大小,運(yùn)行合適大小合適數(shù)量的微服務(wù)。只有資源形成巨大的資源池,然后通過各種運(yùn)營(yíng)管理,才能真正提高算力的利用率。

4.2 芯片視角看算力利用率

資源池化是提升算力利用率的根本途徑,但資源要想池化,對(duì)硬件有很高的要求:

不同設(shè)備架構(gòu)/接口一致。比如CPU等引擎架構(gòu)一致(比如都是x86架構(gòu)平臺(tái)),那么軟件可以運(yùn)行在任何一個(gè)設(shè)備上,硬件也可以支持各種不同的軟件運(yùn)行。比如NVMe SSD,可以被不同的用戶訪問,也可以同時(shí)或分時(shí)地支持多種用戶的工作。

支持虛擬化。一方面是資源粒度的問題,另一方面是資源自由和動(dòng)態(tài)分配的問題,都可以通過虛擬化技術(shù)解決。虛擬化還可以實(shí)現(xiàn)不同架構(gòu)/接口的抽象,屏蔽硬件差異。

83e87588-fbfb-11ec-ba43-dac502259ad0.png

通常,算力的平臺(tái)都是CPU,而且目前x86架構(gòu)CPU占據(jù)了絕大部分市場(chǎng)份額,并且x86 CPU對(duì)虛擬化的支持也非常的好。CPU對(duì)資源池化的支持,或者說對(duì)算力更高利用率的支持,是相當(dāng)?shù)挠押谩?/p>

但是,隨著性能需求越來越高,不得不通過超異構(gòu)計(jì)算來數(shù)量級(jí)提升算力的時(shí)候,問題出現(xiàn)了。在超異構(gòu)的架構(gòu)下,如何實(shí)現(xiàn)更高的靈活性,如何實(shí)現(xiàn)更高的擴(kuò)展性,如何實(shí)現(xiàn)各類資源的輕松便捷地池化和共享,則是一個(gè)全新的挑戰(zhàn):

處理引擎要支持虛擬化和高可擴(kuò)展性;

軟件可以跨不同廠家的、不同架構(gòu)處理引擎;

軟件可以跨跨CPU、GPU、DSA等不同類型處理引擎;

軟件可以跨云網(wǎng)邊端。

5、展望,云網(wǎng)邊端大融合

83fdf908-fbfb-11ec-ba43-dac502259ad0.png

在虛擬化的加持下,軟件可以實(shí)現(xiàn)完全高可用:軟件可以脫離硬件實(shí)體,隨意的尋找合適的平臺(tái)運(yùn)行,自適應(yīng)的在云、網(wǎng)、邊、端運(yùn)行。

隨著CPU的性能瓶頸,I/O虛擬化技術(shù)完全硬件化的情況下,硬件接口直接暴露給軟件,這就需要云數(shù)據(jù)中心內(nèi)部,以及跨云邊端的硬件平臺(tái)一致性。

要想實(shí)現(xiàn)跨云網(wǎng)邊端、跨不同廠家的芯片平臺(tái)、跨不同類型不同架構(gòu)的處理引擎,就需要芯片、系統(tǒng)、框架和庫(kù)、以及上層應(yīng)用的多方協(xié)同,就需要開源開放的超異構(gòu)計(jì)算生態(tài)。

萬(wàn)物互聯(lián),當(dāng)所有的設(shè)備算力資源匯集成一個(gè)大的共享資源池,算力資源將取之不盡用之不竭。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52481

    瀏覽量

    440621
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4943

    瀏覽量

    131209
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1193

    瀏覽量

    15643
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    億鑄科技入圍工信強(qiáng)基揭榜行動(dòng)

    近日,工業(yè)和信息化辦公廳(以下簡(jiǎn)稱“工信”)發(fā)布了《關(guān)于公布強(qiáng)基揭榜行動(dòng)入圍名單的通知》,億鑄科技作為核心參與單位聯(lián)合申報(bào)的“大規(guī)模
    的頭像 發(fā)表于 06-30 14:57 ?364次閱讀

    拼版怎么拼好,板廠經(jīng)常說利用率太低,多收費(fèi)用?

    做板的時(shí)候,板廠經(jīng)常說我拼版利用率太低,要多收取費(fèi)用,哪位大神知道怎么利用率
    發(fā)表于 05-14 13:42

    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)利用率的關(guān)鍵策略

    、All-to-All等),網(wǎng)絡(luò)面臨高并發(fā)、低延遲、無損傳輸?shù)膰?yán)苛需求。然而,傳統(tǒng)以太網(wǎng)的網(wǎng)絡(luò)利用率長(zhǎng)期徘徊在35%~40%,成為制約AI釋放的關(guān)鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?377次閱讀
    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)<b class='flag-5'>利用率</b>的關(guān)鍵策略

    梯度科技助力客戶破解調(diào)度難題

    在數(shù)字經(jīng)濟(jì)與人工智能深度融合的新階段,已成為支撐人工智能發(fā)展的核心生產(chǎn)。梯度科技基于云原生技術(shù)架構(gòu)研發(fā)的調(diào)度平臺(tái),以“
    的頭像 發(fā)表于 04-27 16:32 ?512次閱讀

    DeepSeek驅(qū)動(dòng)AI市場(chǎng)升溫,智中心利用率望提升

    據(jù)多位業(yè)內(nèi)人士透露,DeepSeek在業(yè)界的迅速部署與應(yīng)用,為AI市場(chǎng)帶來了新的熱潮。自年后開工兩周以來,設(shè)備租賃及采購(gòu)的咨詢量顯著增長(zhǎng),市場(chǎng)需求主要聚焦于英偉達(dá)產(chǎn)品,尤其是其
    的頭像 發(fā)表于 02-19 14:00 ?460次閱讀

    交換機(jī)內(nèi)存利用率過高會(huì)是什么問題

    在現(xiàn)代網(wǎng)絡(luò)架構(gòu)中,交換機(jī)扮演著至關(guān)重要的角色,負(fù)責(zé)在網(wǎng)絡(luò)設(shè)備之間高效地轉(zhuǎn)發(fā)數(shù)據(jù)包。然而,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和數(shù)據(jù)流量的增加,交換機(jī)的內(nèi)存資源可能會(huì)變得緊張,導(dǎo)致內(nèi)存利用率過高。這種情況如果不加
    的頭像 發(fā)表于 10-18 09:53 ?2154次閱讀

    TLV320AIC3254 AGC的增益值是哪些部分組成的 ?

    是有差的,手冊(cè)中給出的dB值不準(zhǔn)確。是否有更加詳細(xì)或者更加準(zhǔn)確的AGC增益表? 2、AGC 的增益值 是哪些部分組成的 ? 該怎樣理解AGC Gain的組成?
    發(fā)表于 10-18 06:24

    弧焊變壓器哪些部分組成

    是一種特殊設(shè)計(jì)的變壓器,用于提供穩(wěn)定的焊接電流。它通常以下幾個(gè)主要部分組成: 初級(jí)繞組 :連接到電網(wǎng)的繞組。 次級(jí)繞組 :提供焊接電流的繞組。 鐵芯 :用于增強(qiáng)磁場(chǎng)的磁性材料。 外殼 :保護(hù)內(nèi)部組件并提供散熱。 冷卻系統(tǒng) :
    的頭像 發(fā)表于 10-10 10:38 ?681次閱讀

    實(shí)際的正弦波震蕩電路主要由哪三部分組成

    實(shí)際的正弦波振蕩電路主要由以下三部分組成,盡管有時(shí)在更詳細(xì)的描述中可能會(huì)提及四部分(包括穩(wěn)幅環(huán)節(jié)),但以下三部分是構(gòu)成正弦波振蕩電路的核心: 放大電路 : 放大電路是振蕩電路的核心部分
    的頭像 發(fā)表于 10-09 16:59 ?1279次閱讀

    焊接專機(jī)是部分組成

    焊接專機(jī)在現(xiàn)代制造業(yè)中扮演著至關(guān)重要的角色,特別是在汽車、建筑和重工業(yè)等領(lǐng)域。了解焊接專機(jī)的組成部分,有助于更好地掌握其工作原理與應(yīng)用。那么,焊接專機(jī)是部分組成的?本文將為您詳細(xì)介紹焊接專機(jī)
    的頭像 發(fā)表于 09-29 17:33 ?571次閱讀
    焊接專機(jī)是<b class='flag-5'>由</b>幾<b class='flag-5'>部分組成</b>的

    負(fù)載均衡服務(wù)部分組成?分別是什么

    均衡服務(wù)通常部分組成,分別是客戶端、負(fù)載均衡器、后端服務(wù)器、負(fù)載均衡算法、監(jiān)控和健康檢查及會(huì)話保持。這六者互相協(xié)同工作,實(shí)現(xiàn)了流量的有效分發(fā)和系統(tǒng)的高可用性。這種結(jié)構(gòu)不僅提高了系統(tǒng)的容錯(cuò)能力,還能夠根據(jù)實(shí)際需求靈活調(diào)整資源配置,以應(yīng)對(duì)不同的業(yè)務(wù)場(chǎng)景。
    的頭像 發(fā)表于 09-18 11:16 ?554次閱讀

    什么是labview?labview編寫的程序哪幾部分組成?

    通常以下幾個(gè)部分組成: 前面板(Front Panel) :這是用戶界面部分,用于顯示和控制程序。用戶可以通過前面板輸入數(shù)據(jù)、啟動(dòng)程序、查看結(jié)果等
    的頭像 發(fā)表于 09-04 16:04 ?2195次閱讀

    集成運(yùn)算放大器哪些部分組成?

    、集成運(yùn)算放大器的組成 集成運(yùn)算放大器主要由以下幾個(gè)部分組成: 輸入級(jí):輸入級(jí)是運(yùn)算放大器的前端部分,通常采用差分放大器結(jié)構(gòu)。差分放大器兩個(gè)晶體管或MOSFET
    的頭像 發(fā)表于 08-01 11:28 ?2117次閱讀

    異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源,提高利用率

    的解決方案。通過混合使用多種異構(gòu)芯片,可以充分利用不同芯片的優(yōu)勢(shì),提高利用率,降低成本,
    的頭像 發(fā)表于 07-18 00:11 ?4239次閱讀