今天這篇文章,我們來聊聊算力。 ? 這兩年,算力可以說是ICT行業(yè)的一個熱門概念。在新聞報道和大咖演講中,總會出現(xiàn)它的身影。 ? 那么,究竟到底什么是算力?算力包括哪些類別,分別有什么用途?目前,全球算力正處于怎樣的發(fā)展?fàn)顟B(tài)?? ?
?什么是算力
算力的字面意思,大家都懂,就是計算能力(Computing Power)。 ? 更具體來說,算力是通過對信息數(shù)據(jù)進(jìn)行處理,實現(xiàn)目標(biāo)結(jié)果輸出的計算能力。 ?
? ? 我們?nèi)祟悾鋵嵕途邆溥@樣的能力。在我們的生命過程中,每時每刻都在進(jìn)行著計算。我們的大腦,就是一個強(qiáng)大的算力引擎。 ? 大部分時間里,我們會通過口算、心算進(jìn)行無工具計算。但是,這樣的算力有點(diǎn)低。所以,在遇到復(fù)雜情況時,我們會利用算力工具進(jìn)行深度計算。 ? 遠(yuǎn)古時期,我們的原始工具是草繩、石頭。后來,隨著文明的進(jìn)步,我們有了算籌(一種用于計算的小棍子)、算盤等更為實用的算力工具,算力水平不斷提升。 ? 到了20世紀(jì)40年代,我們迎來了算力革命。 ? 1946年2月,世界上第一臺數(shù)字式電子計算機(jī)ENIAC誕生,標(biāo)志著人類算力正式進(jìn)入了數(shù)字電子時代。 ? ? ? 再后來,隨著半導(dǎo)體技術(shù)的出現(xiàn)和發(fā)展,我們又進(jìn)入了芯片時代。芯片成為了算力的主要載體。
時間繼續(xù)推移。 ? 到了20世紀(jì)70-80年代,芯片技術(shù)在摩爾定律的支配下,已經(jīng)取得了長足進(jìn)步。芯片的性能不斷提升,體積不斷減小。終于,計算機(jī)實現(xiàn)了小型化,PC(個人電腦)誕生了。 ? ?
? PC的誕生,意義極為深遠(yuǎn)。它標(biāo)志著IT算力不再僅為少數(shù)大型企業(yè)服務(wù)(大型機(jī)),而是昂首走向了普通家庭和中小企業(yè)。它成功打開了全民信息時代的大門,推動了整個社會的信息化普及。 ? 在PC的幫助下,人們充分感受到IT算力帶來的生活品質(zhì)改善,以及生產(chǎn)效率提升。PC的出現(xiàn),也為后來互聯(lián)網(wǎng)的蓬勃發(fā)展奠定了基礎(chǔ)。 ? 進(jìn)入21世紀(jì)后,算力再次迎來了巨變。 ? 這次巨變的標(biāo)志,是云計算技術(shù)的出現(xiàn)。 ? ?
? 在云計算之前,人類苦于單點(diǎn)式計算(一臺大型機(jī)或一臺PC,獨(dú)立完成全部的計算任務(wù))的算力不足,已經(jīng)嘗試過網(wǎng)格計算(把一個巨大的計算任務(wù),分解為很多的小型計算任務(wù),交給不同的計算機(jī)完成)等分布式計算架構(gòu)。 ? 云計算,是分布式計算的新嘗試。它的本質(zhì),是將大量的零散算力資源進(jìn)行打包、匯聚,實現(xiàn)更高可靠性、更高性能、更低成本的算力。 ? 具體來說,在云計算中,中央處理器(CPU)、內(nèi)存、硬盤、顯卡(GPU)等計算資源被集合起來,通過軟件的方式,組成一個虛擬的可無限擴(kuò)展的“算力資源池”。 ? 用戶如果有算力需求,“算力資源池”就會動態(tài)地進(jìn)行算力資源的分配,用戶按需付費(fèi)。 ? 相比于用戶自購設(shè)備、自建機(jī)房、自己運(yùn)維,云計算有明顯的性價比優(yōu)勢。 ?
算力云化之后,數(shù)據(jù)中心成為了算力的主要載體。人類的算力規(guī)模,開始新的飛躍。 ?
?算力的分類
云計算和數(shù)據(jù)中心之所以會出現(xiàn),是因為信息化和數(shù)字化的不斷深入,引發(fā)了整個社會強(qiáng)烈的算力需求。 ? 這些需求,既有來自消費(fèi)領(lǐng)域的(移動互聯(lián)網(wǎng)、追劇、網(wǎng)購、打車、O2O等),也有來自行業(yè)領(lǐng)域的(工業(yè)制造、交通物流、金融證券、教育醫(yī)療等),還有來自城市治理領(lǐng)域的(智慧城市、一證通、城市大腦等)。 ? 不同的算力應(yīng)用和需求,有著不同的算法。不同的算法,對算力的特性也有不同要求。 ? 通常,我們將算力分為兩大類,分別是通用算力和專用算力。 ?
大家應(yīng)該都聽說過,負(fù)責(zé)輸出算力的芯片,就有分為通用芯片和專用芯片。 ? 像x86這樣的CPU處理器芯片,就是通用芯片。它們能完成的算力任務(wù)是多樣化的,靈活的,但是功耗更高。
FPGA,是可編程集成電路。它可以通過硬件編程來改變內(nèi)部芯片的邏輯結(jié)構(gòu),但軟件是深度定制的,執(zhí)行專門任務(wù)。 ? ASIC,是專用集成電路。顧名思義,它是為專業(yè)用途而定制的芯片,其絕大部分軟件算法都固化于硅片。 ? ASIC能完成特定的運(yùn)算功能,作用比較單一,不過能耗很低。FPGA,介于通用芯片和ASIC之間。 ?
我們以比特幣挖礦為例。 ? 以前,人們都是用PC(x86通用芯片)挖礦,后來越挖難度越大,算力不夠。于是,開始使用顯卡(GPU)去挖礦。再后來,顯卡的能耗太高,挖出來的幣值還抵不上電費(fèi),就開始采用FPGA和ASIC集群陣列挖礦。 ? 在數(shù)據(jù)中心里,也對算力任務(wù)進(jìn)行了對應(yīng)劃分,分為基礎(chǔ)通用計算,以及HPC高性能計算(High-performance computing)。 ? HPC計算,又繼續(xù)細(xì)分為三類: ? 科學(xué)計算類:物理化學(xué)、氣象環(huán)保、生命科學(xué)、石油勘探、天文探測等。 工程計算類:計算機(jī)輔助工程、計算機(jī)輔助制造、電子設(shè)計自動化、電磁仿真等。 智能計算類:即人工智能(AI,Artificial Intelligence)計算,包括:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等。 ? 科學(xué)計算和工程計算大家應(yīng)該都聽說過,這些專業(yè)科研領(lǐng)域的數(shù)據(jù)產(chǎn)生量很大,對算力的要求極高。 ? 以油氣勘探為例。油氣勘探,簡單來說,就是給地表做CT。一個項目下來,原始數(shù)據(jù)往往超過100TB,甚至可能超過1個PB。如此巨大的數(shù)據(jù)量,需要海量的算力進(jìn)行支撐。 ? 智能計算這個,我們需要重點(diǎn)說一下。 ? AI人工智能是目前全社會重點(diǎn)關(guān)注的發(fā)展方向。不管是哪個領(lǐng)域,都在研究人工智能的應(yīng)用和落地。 ? 人工智能的三大核心要素,就是算力、算法和數(shù)據(jù)。 ?
大家都知道,AI人工智能是一個算力大戶,特別“吃”算力。在人工智能計算中,涉及較多的矩陣或向量的乘法和加法,專用性較高,所以不適合利用CPU進(jìn)行計算。 ? 在現(xiàn)實應(yīng)用中,人們主要用GPU和前面說的專用芯片進(jìn)行計算。尤其是GPU,是目前AI算力的主力。 ? GPU雖然是圖形處理器,但它的GPU核(邏輯運(yùn)算單元)數(shù)量遠(yuǎn)超CPU, 適合把同樣的指令流并行發(fā)送到眾核上,采用不同的輸入數(shù)據(jù)執(zhí)行,從而完成圖形處理或大數(shù)據(jù)處理中的海量簡單操作。 ? 因此,GPU更合適處理計算密集型、高度并行化的計算任務(wù)(例如AI計算)。 ? 這幾年,因為人工智能計算的需求旺盛,國家還專門建設(shè)了很多智算中心,也就是專門進(jìn)行智能計算的數(shù)據(jù)中心。 ?
除了智算中心之外,現(xiàn)在還有很多超算中心。超算中心里面,放的都是“天河一號”這樣的超級計算機(jī),專門承擔(dān)各種大規(guī)??茖W(xué)計算和工程計算任務(wù)。 ? ? 我們平時看到的數(shù)據(jù)中心,基本上都屬于云計算數(shù)據(jù)中心。 ?
? 任務(wù)比較雜,基礎(chǔ)通用計算和高性能計算都有,也有大量的異構(gòu)計算(同時使用不同類型指令集的計算方式)。因為高性能計算的需求越來越多,所以專用計算芯片的比例正在逐步增加。 ? 前幾年逐漸開始流行起來的TPU、NPU和DPU等,其實都是專用芯片。 ?
? 大家現(xiàn)在經(jīng)常聽說的“算力卸載”,其實不是刪除算力,而是把很多計算任務(wù)(例如虛擬化、數(shù)據(jù)轉(zhuǎn)發(fā)、壓縮存儲、加密解密等),從CPU轉(zhuǎn)移到NPU、DPU等芯片上,減輕CPU的算力負(fù)擔(dān)。 ? 近年來,除了基礎(chǔ)通用算力、智能算力、超算算力之外,科學(xué)界還出現(xiàn)了前沿算力的概念,主要包括量子計算、光子計算等,值得關(guān)注。 ?
算力的衡量
算力既然是一個“能力”,當(dāng)然就會有對它進(jìn)行強(qiáng)弱衡量的指標(biāo)和基準(zhǔn)單位。大家比較熟悉的單位,應(yīng)該是FLOPS、TFLOPS等。 ? 其實,衡量算力大小的指標(biāo)還有很多,例如MIPS、DMIPS、OPS等。 ?
? MFLOPS、GFLOPS、TFLOPS、PFLOPS等,都是FLOPS的不同量級。具體關(guān)系如下: ?
浮點(diǎn)數(shù)有FP16、FP32、FP64不同的規(guī)格 ? 不同的算力載體之間,算力差異是非常巨大的。為了便于大家更好地理解這個差異,小棗君又做了一張算力對比表格: ?
? 前面我們提到了通用計算、智算和超算。從趨勢上來看,智算和超算的算力增長速度遠(yuǎn)遠(yuǎn)超過了通用算力。 ? 根據(jù)GIV的數(shù)據(jù)統(tǒng)計,到2030年,通用計算算力(FP32)將增長10倍,達(dá)到3.3 ZFLOPS。而AI智算算力(FP16),將增長500倍,達(dá)到105 ZFLOPS。 ?
算力的現(xiàn)狀與未來
早在1961年,“人工智能之父”約翰·麥卡錫就提出Utility Computing(效用計算)的目標(biāo)。他認(rèn)為:“有一天,計算可能會被組織成一個公共事業(yè),就像電話系統(tǒng)是一個公共事業(yè)一樣”。 ? 如今,他的設(shè)想已經(jīng)成為現(xiàn)實。在數(shù)字浪潮下,算力已經(jīng)成為像水、電一樣的公共基礎(chǔ)資源,而數(shù)據(jù)中心和通信網(wǎng)絡(luò),也變成了重要的公共基礎(chǔ)設(shè)施。 ? 這是IT行業(yè)和通信行業(yè)辛苦奮斗大半個世紀(jì)的成果。???? ? 對于整個人類社會來說,算力早已不是一個技術(shù)維度的概念。它已經(jīng)上升到經(jīng)濟(jì)學(xué)和哲學(xué)維度,成為了數(shù)字經(jīng)濟(jì)時代的核心生產(chǎn)力,以及全社會數(shù)智化轉(zhuǎn)型的基石。
? 我們每個人的生活,還有工廠企業(yè)的運(yùn)轉(zhuǎn),政府部門的運(yùn)作,都離不開算力。在國家安全、國防建設(shè)、基礎(chǔ)學(xué)科研究等關(guān)鍵領(lǐng)域,我們也需要海量的算力。 ? 算力決定了數(shù)字經(jīng)濟(jì)發(fā)展速度,以及社會智能發(fā)展高度。 ? 根據(jù)IDC、浪潮信息、清華大學(xué)全球產(chǎn)業(yè)研究院聯(lián)合發(fā)布的數(shù)據(jù)顯示,計算力指數(shù)平均每提高1點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長3.5‰和1.8‰。 ?
? 全球各國的算力規(guī)模與經(jīng)濟(jì)發(fā)展水平,已經(jīng)呈現(xiàn)出顯著的正相關(guān)關(guān)系。一個國家的算力規(guī)模越大,經(jīng)濟(jì)發(fā)展水平就越高。 ?
世界各國算力和GDP排名 (來源:遲九虹,華為算力時代峰會演講) ? 在算力領(lǐng)域,國家之間的競爭博弈日益激烈。 ? 2020年,我國算力總規(guī)模達(dá)到135 EFLOPS,同比增長55%,超過全球增速約16個百分點(diǎn)。目前,我們的絕對算力,排名世界第二。 ? 但是,從人均角度來看,我們并不占優(yōu)勢,僅處于中等算力國家水平。 ?
世界各國人均算力對比 (來源:唐雄燕,華為算力時代峰會演講) ? 尤其是在芯片等算力核心技術(shù)上,我們與發(fā)達(dá)國家還有很大的差距。很多掐脖子技術(shù)未能解決,嚴(yán)重影響了我們的算力安全,進(jìn)而影響了國家安全。
所以,腳下的路還有很長,我們還需要繼續(xù)努力。 ?
未來社會,信息化、數(shù)字化和智能化將會進(jìn)一步加快。萬物智聯(lián)時代的到來,大量智能物聯(lián)網(wǎng)終端的引入,AI智能場景的落地,將產(chǎn)生難以想象的海量數(shù)據(jù)。 ? 這些數(shù)據(jù),將進(jìn)一步刺激對算力的需求。 ? 根據(jù)羅蘭貝格的預(yù)測,從2018年到2030年,自動駕駛對算力的需求將增加390倍,智慧工廠需求將增長110倍,主要國家人均算力需求將從今天的不足500 GFLOPS,增加20倍,變成2035年的10000 GFLOPS。 ? 根據(jù)浪潮人工智能研究院的預(yù)測,到2025年,全球算力規(guī)模將達(dá)6.8 ZFLOPS,與2020年相比提升30倍。 ? 新一輪的算力革命,正在加速啟動。 ? ?
結(jié)語
? 算力是如此重要的資源,但事實上,我們對算力的利用仍然存在很多問題。 ? 比如算力利用率問題,以及算力分布均衡性問題。根據(jù)IDC的數(shù)據(jù)顯示,企業(yè)分散的小算力利用率,目前僅為10%-15%,存在很大的浪費(fèi)。 ? 摩爾定律從2015年開始放緩,單位能耗下的算力增速已經(jīng)逐漸被數(shù)據(jù)量增速拉開差距。我們在不斷挖掘芯片算力潛力的同時,必須考慮算力的資源調(diào)度問題。 ? 那么,我們該如何對算力進(jìn)行調(diào)度呢?現(xiàn)有的通信網(wǎng)絡(luò)技術(shù),能夠滿足算力的調(diào)度需求嗎? ? ?
編輯:黃飛
評論