一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

融合計算是如何提出來的

中科院半導(dǎo)體所 ? 來源:軟硬件融合 ? 2024-12-10 09:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

融合計算是微觀和宏觀視角算力提升策略的總結(jié),是三個維度融合(異構(gòu)融合x軟硬件融合x云邊端融合)的統(tǒng)稱,那么融合計算是如何提出來的?為什么融合計算有且僅有三個維度的融合?

性能和算力

1.1 性能的計算公式

5079478e-b483-11ef-93f3-92fbcf53809c.png

定性的分析,一個芯片的性能由三個維度組成:

維度一,指令復(fù)雜度。理論上,指令復(fù)雜度越高,性能越好。但實際上,需要考慮系統(tǒng)的通用性,以及目標(biāo)工作任務(wù)的靈活性特征,來選擇合適的處理器引擎。

維度二,運行頻率。運行頻率提升,主要是先進工藝,以及更復(fù)雜的流水線設(shè)計。

維度三,并行度。提高并行度比較好理解,并行也主要有同構(gòu)并行、(兩個處理器的)異構(gòu)并行和(三個以上)更多異構(gòu)融合的并行。

1.2 算力的計算公式

508dd352-b483-11ef-93f3-92fbcf53809c.png

算力和性能的區(qū)別在哪里?性能是微觀的算力,算力是宏觀的性能。那么算力和性能之間的聯(lián)系是什么? 如上圖所示,我們定性分析,可以在性能和算力之間構(gòu)建一個關(guān)聯(lián)的公式。從上述公式可以看到,宏觀的總算力,由三個維度的參數(shù)組成:

維度一,單芯片性能。通過提升單芯片性能的方式,也就是Scale Up的方式提升整體算力。

維度二,芯片的數(shù)量。通過增加計算芯片(計算節(jié)點)的數(shù)量,也就是Scale Out的方式,通過提升規(guī)模來提升整體算力。

維度三,算力利用率。如果僅有標(biāo)稱算力,而無法達到很好的利用率,那也是徒勞。隨著AI的發(fā)展,集群規(guī)模越來越擴大,算力利用率越來越成為評價一個算力系統(tǒng)能力的關(guān)鍵指標(biāo)。

從微觀到宏觀

2.1 微觀視角的算力提升

2.1.1 如何提升單芯片性能 融合提升單芯片的性能:

一方面是底層采用更先進的工藝,以及通過Chiplet封裝支撐,從而實現(xiàn)更大的計算規(guī)模;

另一方面,則是系統(tǒng)架構(gòu)和微架構(gòu)方面的創(chuàng)新,來實現(xiàn)單芯片層次更高的性能,這也是算力提升最本質(zhì)的做法。

計算架構(gòu)的創(chuàng)新則最主要的就是:

從第一代基于CPU的同構(gòu)通用計算;

以及第二代基于CPU+GPU的異構(gòu)通用計算;

逐步的走向第三代基于CPUxGPUxDSAs的異構(gòu)融合通用計算。

2.1.2 如何提升芯片的數(shù)量和落地規(guī)模 芯片的落地,不是簡單的復(fù)制。國產(chǎn)算力芯片已經(jīng)有好多家了,甚至一些公司的芯片都已經(jīng)有三到四代了,但仍然銷售不是很順利。底層的原因在于:

生態(tài)的問題。國產(chǎn)芯片(相比NVIDIA CUDA)生態(tài)不夠好。但生態(tài)問題如何解決,不在于微觀的一家公司的一個架構(gòu)和相應(yīng)的私有生態(tài)如何構(gòu)建和繁榮,而在于宏觀的很多公司很多架構(gòu)如何整合(將在加下來的宏觀視角部分介紹)。

芯片需要足夠多的通用性,需要能夠覆蓋更多的業(yè)務(wù)場景和更多的業(yè)務(wù)迭代。

此外,芯片需要有非常高的I/O能力,確保在更大的規(guī)模下仍能有非常高的東西向通信效率(不耽誤計算,不影響計算效率),能夠支持更大規(guī)模的集群計算。

2.1.3 如何提升芯片的算力利用率 要想提升算力芯片的利用率,那么:

一方面,芯片需要有很好的擴展性能力,支持資源切分、池化、和重組;

另一方面,開放架構(gòu),減少多元異構(gòu)算力的架構(gòu)數(shù)量,從而使得更多的算力能夠匯集到統(tǒng)一的算力資源池,從而實現(xiàn)更大范圍的算力共享,進而提升整體的算力利用率。

2.2 宏觀視角的算力提升

2.2.1 如何提升單個節(jié)點的性能 從宏觀角度,單節(jié)點的性能提升,則主要是如何把更多異構(gòu)融合架構(gòu)的計算能力充分的用起來:

首先,是需要一個更加綜合的異構(gòu)融合計算框架,既包括CPU的工具鏈,也有GPU、AI,以及其他如網(wǎng)絡(luò)、存儲、視頻、安全等領(lǐng)域的加速計算框架,還需要這個異構(gòu)融合計算框架,支持異構(gòu)協(xié)同和跨異構(gòu)應(yīng)用遷移。

第二,則是更復(fù)雜的計算架構(gòu)和算力調(diào)度。在通算時代,一個物理的計算機,通常具有四類資源:CPU、內(nèi)存、網(wǎng)絡(luò)和存儲;在異構(gòu)計算時代,則是CPU、內(nèi)存、網(wǎng)絡(luò)、存儲和加速器。而在異構(gòu)融合時代,則是CPU、內(nèi)存、網(wǎng)絡(luò)、存儲,以及更多種不同領(lǐng)域的加速器。那么,如此復(fù)雜的計算架構(gòu)模型,如何資源切分、池化和重組,以及如何同架構(gòu)調(diào)度,以及實現(xiàn)跨架構(gòu)調(diào)度,都是需要深入考慮的事情。

2.2.2 如何提升芯片的數(shù)量和落地的規(guī)模 宏觀視角下,芯片的數(shù)量提升,主要是如下幾個層次:

最基礎(chǔ)的就是集群規(guī)模的擴大,這需要高性能網(wǎng)絡(luò),更高的帶寬,更低的延遲。

接下來,就是跨集群管理和跨集群調(diào)度,這就需要更復(fù)雜的網(wǎng)絡(luò)和更高層次的算力調(diào)度。

再接下來,就是要實現(xiàn)跨數(shù)據(jù)中心的算力整合,這也就是目前火熱的算力網(wǎng)絡(luò)關(guān)注的范疇,有非常大的技術(shù)挑戰(zhàn)和商業(yè)上的挑戰(zhàn)。

再接下倆,那就是要跨云邊端,實現(xiàn)云邊端融合計算,挑戰(zhàn)會更大。

2.2.3 如何提升算力利用率 宏觀視角看算力利用率提升,主要是兩塊,承上啟下:

啟下。承載計算的芯片類型越來越多,多元異構(gòu)問題凸顯,這是目前算力整合不得不面對的現(xiàn)實困難。芯片(或引擎)的類型有很多,每一張類型還有很多不同的架構(gòu),這些不同類型不同架構(gòu)的芯片是一個個孤島,如何把這些孤島連成一體,是一個非常重要的事情。未來,開放計算架構(gòu)會是一個不得不走的選項,逐漸的從目前各家芯片公司各自為政私有架構(gòu)的模式,過渡到開放架構(gòu)的模式,讓芯片的架構(gòu)逐漸收斂。

承上。相比芯片側(cè)的問題,計算芯片所支撐的上層業(yè)務(wù)軟件側(cè)的問題相對較少。行業(yè)存在開源軟件生態(tài),這是目前絕大部分業(yè)務(wù)客戶的共識,這也減少了很多底層硬件的適配難度。但這幾年,這個問題有所惡化:隨著AI發(fā)展,NVIDIA GPU和CUDA一家獨大,大家不得不在NVIDIA的封閉體系下工作。這不利于行業(yè)的競爭,也不利于算力成本的下降。理想的情況是:行業(yè)形成開源開放的計算軟硬件生態(tài),開源軟件定義開放硬件;算力中心,不對任何硬件平臺有依賴,不需要為生態(tài)溢價付費,僅需要為功能和性能付費即可。

需要注意的是,宏觀和微觀,以及算力提升的三個維度,是彼此交叉關(guān)聯(lián)的。這里的很多策略,可能會同時影響兩個甚至三個維度,甚至“按下葫蘆浮起瓢”也是有可能的。實際的算力優(yōu)化工作,需要仔細分析應(yīng)對。

融合計算

隨著AI大模型以及AI+場景對算力的需求猛增,算力中心建設(shè)成本也水漲船高,算力網(wǎng)絡(luò)(實現(xiàn)算力共享)逐漸流行。同時許多AI+終端的場景,算力需求猛增,從云端和邊緣端“借”算力的云邊端融合計算模式,成為了終端算力提升的一個重要方式。 算力系統(tǒng)相當(dāng)復(fù)雜,算力提升成為了一個龐大的系統(tǒng)工程。立足于最核心的芯片硬件和相關(guān)軟件,從微觀到宏觀,基于上面分析的算力提升的背景知識,提出了“融合計算”的概念。希望通過“融合計算”的全方位的整合優(yōu)化,來實現(xiàn)算力最優(yōu)的性能和成本。

50a3d9ae-b483-11ef-93f3-92fbcf53809c.png

融合計算,其實就是微觀和宏觀視角算力提升策略的總結(jié),是三個維度融合(異構(gòu)融合x軟硬件融合x云邊端融合)的統(tǒng)稱:

X軸,芯片維度,異構(gòu)融合,Scale Up,提升單芯片性能。通過異構(gòu)融合計算,把各類異構(gòu)算力的價值發(fā)揮到極致。

Y軸,計算堆棧維度,軟硬件融合,提升算力利用率。通過核心的算力調(diào)度系統(tǒng)中間件,實現(xiàn)承上啟下,向上對接開源軟件,向下對接多元異構(gòu)算力,實現(xiàn)多元異構(gòu)算力的協(xié)同和融合,從而最大化算力資源的利用率。

Z軸,集群擴展維度,云邊端融合,Scale Out,提升芯片數(shù)量。通過增加集群規(guī)模,同時實現(xiàn)跨算力中心、跨不同云運營商、跨云邊端融合的計算。

融合計算和多算融合的關(guān)系

融合計算,是從宏觀和微觀的角度,實現(xiàn)更底層更本質(zhì)的提升性能和降低成本。而通算、智算和超算,則要更上層一些,是計算面向不同業(yè)務(wù)要求所做的定向性能和成本的調(diào)整。

隨著智算中心的發(fā)展,目前行業(yè)中出現(xiàn)了通算,智算和超算的融合的發(fā)展趨勢。但實際的做法,有待商榷。把CPU通算集群、GPU智算集群,以及存儲集群,以及超算集群,放置到一個算力中心里,就是多算融合嗎?顯然不是。

50c3c656-b483-11ef-93f3-92fbcf53809c.png

多算融合,必然是需要一套體系,能夠統(tǒng)一通算、智算和超算,有統(tǒng)一的資源切分重組,有統(tǒng)一的資源池,有統(tǒng)一的算力調(diào)度,有統(tǒng)一的上層算力服務(wù),才能稱之為多算融合:

首先,是要構(gòu)建統(tǒng)一的計算機模型。通算一般是CPU+標(biāo)準(zhǔn)網(wǎng)卡,而智算是CPU+GPU+高性能網(wǎng)卡,而超算則是CPU+GPU+高性能網(wǎng)卡+內(nèi)存一致性加速,存儲則是CPU+更多的存儲I/O。不管咋樣,可以通過我們前面講到的計算模型來統(tǒng)一,不管是哪種計算,都是CPU+加速卡+內(nèi)存+網(wǎng)絡(luò)+存儲的統(tǒng)一的計算模型。

然后是資源的池化。通過云計算的虛擬化和容器的機制,實現(xiàn)資源的切分、池化和重組,可以組合出符合要求的不同類型的計算實例。

目前,計算集群已經(jīng)成為主流的計算方式。通過VPC,可以在公共算力服務(wù)的多租戶場景為用戶構(gòu)建專屬的通算的、智算的或超算的計算集群。

融合計算,是更底層更本地算力優(yōu)化問題,它存在于軟硬件協(xié)同層次,通過全方位的各種融合,實現(xiàn)算力的最佳效果:同算力條件下,成本更優(yōu);同成本下,算力更高。

融合計算,是云計算未來發(fā)展最大的創(chuàng)新方向,通過融合計算,夯實算力底座,支撐云計算繼續(xù)往前發(fā)展。再以云計算為基,構(gòu)建出面向通算、智算和超算等不同場景的算力服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52509

    瀏覽量

    440841
  • 計算
    +關(guān)注

    關(guān)注

    2

    文章

    453

    瀏覽量

    39344
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1200

    瀏覽量

    15653

原文標(biāo)題:融合計算的概念是如何提出來的?

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    空間計算是如何運作的?它有哪些優(yōu)勢?

    空間計算將數(shù)字數(shù)據(jù)與物理世界實時融合,通過增強現(xiàn)實和虛擬現(xiàn)實頭顯或智能眼鏡等設(shè)備、增強混合現(xiàn)實交互。
    的頭像 發(fā)表于 07-02 09:14 ?305次閱讀

    突破智能駕艙邊界,Imagination如何構(gòu)建高安全GPU+AI融合計算架構(gòu)

    與發(fā)展趨勢。在5月15日的專題論壇上,Imagination中國區(qū)產(chǎn)品總監(jiān)鄭魁著重分享了公司GPU與AI融合計算架構(gòu)創(chuàng)新,及其在智能座艙領(lǐng)域的應(yīng)用探索。同時,憑借
    的頭像 發(fā)表于 05-16 09:38 ?427次閱讀
    突破智能駕艙邊界,Imagination如何構(gòu)建高安全GPU+AI<b class='flag-5'>融合計算</b>架構(gòu)

    融合計算突破界限,英特爾大小腦融合架構(gòu)加速具身智能進化

    ,例如數(shù)據(jù)匱乏、硬件設(shè)計的挑戰(zhàn),落地確定性、安全性以及成本等問題。 ? 為此,英特爾基于公司在AI領(lǐng)域的技術(shù)基礎(chǔ),正式發(fā)布了基于酷睿Ultra系列處理器的具身智能大小腦融合方案,通過大小腦融合的單系統(tǒng)架構(gòu)解決當(dāng)前雙系統(tǒng)方案
    的頭像 發(fā)表于 04-24 00:08 ?1490次閱讀
    <b class='flag-5'>融合計算</b>突破界限,英特爾大小腦<b class='flag-5'>融合</b>架構(gòu)加速具身智能進化

    曦智科技時隔八年再登《Nature》,光電混合計算架構(gòu)首次公開

    英國倫敦時間4月9日,全球頂級學(xué)術(shù)期刊《自然》(Nature)刊載了曦智科技的光電混合計算成果:《超低延遲大規(guī)模集成光子加速器》(An integrated large-scale photonic
    發(fā)表于 04-10 09:50 ?359次閱讀
     曦智科技時隔八年再登《Nature》,光電混<b class='flag-5'>合計算</b>架構(gòu)首次公開

    光電混合新范式:全球首款128x128矩陣規(guī)模光電混合計算卡正式發(fā)布

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)光電混合計算卡,作為融合光學(xué)與電子學(xué)技術(shù)的高性能計算設(shè)備,借助光信號與電信號的協(xié)同處理,打破了傳統(tǒng)電子芯片的物理限制,為人工智能、科學(xué)計算等領(lǐng)域開創(chuàng)了全新
    的頭像 發(fā)表于 04-01 00:17 ?2326次閱讀
    光電混合新范式:全球首款128x128矩陣規(guī)模光電混<b class='flag-5'>合計算</b>卡正式發(fā)布

    曦智科技全球首發(fā)新一代光電混合計算

    算力技術(shù)在產(chǎn)品化和商業(yè)化進程中的重要突破。我們堅信,光電混合將會為人工智能、大語言模型、智能制造等領(lǐng)域帶來算力革新。” 天樞是一款深度融合光芯片與電芯片各自優(yōu)勢特點,并采用了3D先進封裝技術(shù)的可編程光電混合計算卡。該產(chǎn)
    發(fā)表于 03-25 15:43 ?323次閱讀
    曦智科技全球首發(fā)新一代光電混<b class='flag-5'>合計算</b>卡

    大數(shù)據(jù)與云計算是干嘛的?

    大數(shù)據(jù)與云計算是支撐現(xiàn)代數(shù)字化技術(shù)的兩大核心。大數(shù)據(jù)專注于海量數(shù)據(jù)的采集、存儲、分析與價值挖掘;云計算通過虛擬化資源池提供彈性計算、存儲及服務(wù)能力。兩者結(jié)合,共同賦能企業(yè)決策、業(yè)務(wù)創(chuàng)新和效率提升。下面UU云小編將詳細剖析大數(shù)據(jù)與
    的頭像 發(fā)表于 02-20 14:48 ?630次閱讀

    AD9826采集出來的數(shù)據(jù)有漂移和震蕩,是什么原因?qū)е碌模?/a>

    分析一下,是什么原因?qū)е抡鹗幒推?,請TI專家們給予指導(dǎo)和解答,有說明不清楚的,也請及時提出來,以便我補充。謝謝!
    發(fā)表于 12-24 07:57

    ads1256有效位數(shù)怎么計算?

    您好,對于ADS1256有效位數(shù)的計算,數(shù)據(jù)手冊給出的測試公式是怎么推到出來的呢?能夠幫我推到出來嗎?對于第一張圖中rms的計算是怎么出來
    發(fā)表于 11-22 07:07

    基于FPGA實現(xiàn)OTSU算法

    OSTU大津法是一種確定圖像二值化閾值的方法,由日本學(xué)者大津提出來的。
    的頭像 發(fā)表于 10-25 15:23 ?1025次閱讀
    基于FPGA實現(xiàn)OTSU算法

    人工智能云計算是什么

    人工智能云計算,簡而言之,是指將人工智能技術(shù)與云計算平臺相結(jié)合,利用云計算的強大計算力、存儲能力和靈活可擴展性,來加速AI模型的訓(xùn)練、推理和優(yōu)化過程,同時實現(xiàn)AI服務(wù)的廣泛部署和按需使
    的頭像 發(fā)表于 10-12 09:46 ?768次閱讀

    請問ISO124的共模抑制能力是多少?

    ISO124的共模抑制能力是多少?手冊里面怎么沒提出來?
    發(fā)表于 09-20 06:05

    合計算完成數(shù)億元A1輪融資

    合計算技術(shù)(深圳)有限公司近日宣布成功完成數(shù)億元規(guī)模的A1輪融資,標(biāo)志著公司在人工智能智算芯片領(lǐng)域的快速發(fā)展獲得資本市場的高度認可。
    的頭像 發(fā)表于 09-12 18:09 ?941次閱讀

    計算機視覺中的圖像融合

    在許多計算機視覺應(yīng)用中(例如機器人運動和醫(yī)學(xué)成像),需要將多個圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場景的三維表示
    的頭像 發(fā)表于 08-01 08:28 ?1141次閱讀
    <b class='flag-5'>計算</b>機視覺中的圖像<b class='flag-5'>融合</b>

    LMV7219電特性表里面的失調(diào)電壓和內(nèi)部滯環(huán)的計算是帶符號計算嗎?

    您好,LMV7219電特性表里面的失調(diào)電壓和內(nèi)部滯環(huán)的計算是帶符號計算嗎?按照下圖電特性表(4)的定義:內(nèi)部滯環(huán)的典型值為3.5mV-(-4mV)=7.5mV,而失調(diào)電壓等于(3.5mV+(-4mV))/ 2=0.25mV ?
    發(fā)表于 07-31 06:41