一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

中國為何同時面臨算力過剩與短缺 ?

穎脈Imgtec ? 2025-04-24 15:02 ? 次閱讀

原文標(biāo)題:《China’s Weird Chip Surplus, Explained——How China has both compute overcapacity and shortage》

原文作者:Nicholas Welch, Lily Ottinger, and Jordan Schneider

原文鏈接:https://www.chinatalk.media/p/chinas-weird-chip-surplus-explained

編譯:超算百科


隨著DeepSeek近期的突破性進(jìn)展占據(jù)新聞頭條,一個更深層次的問題依然存在:中國政府是否真的在推動實現(xiàn)通用人工智能(AGI)?如果是的話,它在計算資源分配中可能扮演了何種角色?

盡管DeepSeek的成就表明,獲取超越對沖基金所能拼湊的計算能力或許并不是開發(fā)算法進(jìn)步的直接瓶頸,但情況要復(fù)雜得多。西方實驗室仍在競相構(gòu)建大規(guī)模的10萬GPU級別的集群(更不用提“星際之門項目”),希望以規(guī)?;绞介_發(fā)和部署AGI。而DeepSeek的首席執(zhí)行官也多次表示,他面臨計算資源的限制。

在本文中,我們探討一個關(guān)鍵的悖論:中國為何能夠同時存在計算資源過剩和短缺的現(xiàn)象?這又說明了中國是否準(zhǔn)備好邁向開發(fā)和部署AGI的下一步?

自2024年初以來,有關(guān)中國閑置計算中心的報道不斷涌現(xiàn)。9月,租賃Nvidia AI芯片在中國的價格比美國更低。

乍一看,這似乎不合邏輯。由于美國限制了中國獲取先進(jìn)AI芯片的渠道,人們本應(yīng)看到芯片短缺、所有可用芯片被充分利用以及云服務(wù)價格高企的局面。

那么,到底發(fā)生了什么?

這一謎團也引起了中國記者的關(guān)注。在本文中,我們綜合了兩篇去年11月發(fā)表的長篇中文文章的觀點:

吳俊宇為《財經(jīng)雜志》撰寫的《中國算力,過剩了嗎?》

張帥為《鈦媒體》撰寫的《智算中心太“多”,大模型不夠用了》



本文關(guān)鍵要點

2024年,中國在其計算能力中新增了至少100萬塊AI芯片(其中70%為Nvidia,30%為華為)——從理論上講,這足以構(gòu)建多個10萬GPU規(guī)模的集群(這可能是與GPT-5或其他下一代西方模型競爭所需的規(guī)模)。

但為什么即使在當(dāng)前的1萬GPU規(guī)模集群時代,中國已經(jīng)出現(xiàn)了過?,F(xiàn)象?

解釋一:芯片部署不當(dāng),導(dǎo)致“高質(zhì)量算力”短缺,而“低質(zhì)量算力”過剩。

人工智能熱潮中,許多公司和地方政府急于購買GPU,認(rèn)為僅僅擁有這些硬件就能確保利潤。然而,由于其中許多人缺乏技術(shù)和市場專業(yè)知識,芯片最終被分散部署在地理位置偏遠(yuǎn)、質(zhì)量較低的數(shù)據(jù)中心,要么難以使用,要么處于沒有需求的地方。這種投機行為和資源管理不善導(dǎo)致了盡管整體算力短缺,卻仍出現(xiàn)閑置計算中心的現(xiàn)象。

政府對此作出回應(yīng),不再批準(zhǔn)新建數(shù)據(jù)中心的許可,除非它們位于八個指定樞紐之一。行業(yè)的整合和專業(yè)化使得類似混亂在2025年阻礙中國數(shù)據(jù)中心建設(shè)的可能性降低。

解釋二:短期過剩,長期短缺。

到2024年,對基礎(chǔ)模型訓(xùn)練的需求顯著放緩。許多在2023年匆忙開發(fā)基礎(chǔ)模型的參與者已停止訓(xùn)練新一代模型。

盡管推理需求正在快速增長,但仍不足以完全吸收先前用于訓(xùn)練的過剩算力。

未來,推理需求的增長以及更大基礎(chǔ)模型的開發(fā)預(yù)計將引發(fā)新的短缺。當(dāng)前這種暫時性過剩的“過渡期”預(yù)計將在2025年中期結(jié)束。

接下來,我們將更詳細(xì)地探討中國媒體對以下問題的看法:

中國擁有多少AI芯片,又是誰在部署它們;

“虛假”和“偽”1萬GPU集群的出現(xiàn),以及政府如何應(yīng)對;

使用國產(chǎn)芯片的算力集群所面臨的獨特挑戰(zhàn);

從訓(xùn)練需求向推理需求的轉(zhuǎn)變;

中國是否需要更多公共云計算,而非私有GPU集群;

在10萬GPU規(guī)模時代,中國如何避免1萬GPU規(guī)模時代的陷阱。



誰參與投資了智算中心?

首先,《財經(jīng)》雜志概述了在中國實際構(gòu)建算力集群的主體。主要分為三大類:

1.大型科技公司(阿里巴巴、騰訊、百度):預(yù)計2024年資本支出總額超過1300億元人民幣;

2.國有電信運營商(中國移動、中國電信):計劃在2024年投資845億元人民幣;

3.地方政府和國有企業(yè):統(tǒng)計數(shù)據(jù)不完整,但僅2024年1月至10月的投資就至少達(dá)到275億元人民幣。

《財經(jīng)》深入分析了這些數(shù)據(jù),以估算這三類主體在2024年投入使用的芯片總數(shù)。

大型科技公司

《財經(jīng)》認(rèn)為,資本支出(Capex)是衡量算力中心投資的良好指標(biāo),因為資本支出通常用于購買芯片和租賃土地。


2024年上半年,阿里巴巴、騰訊和百度的總資本支出達(dá)到504.4億元人民幣,同比增長121.6%,這是自2018年以來的最高增長率。如果這一增長趨勢延續(xù)到下半年,那么2024年阿里巴巴、騰訊和百度的總資本支出將超過1300億元人民幣。


需要注意的是,華為和字節(jié)跳動也運營著重要的算力中心。但由于它們并非上市公司,未披露相關(guān)數(shù)據(jù)——這意味著“大型科技公司”這一類別中的總投資實際上高于這里呈現(xiàn)的數(shù)據(jù)。


預(yù)計在未來幾個月內(nèi),DeepSeek將像OpenAI與微軟合作那樣,與其中一家公司達(dá)成合作。據(jù)鈦媒體周一報道,字節(jié)跳動正“考慮與DeepSeek開展研究合作”。與字節(jié)跳動的合作可能為DeepSeek的研究人員帶來巨大的突破,使其能夠獲得數(shù)量級更高的計算資源支持。


圖1:阿里巴巴、騰訊和百度的資本支出(2021年第一季度至2024年第二季度)單位:億元人民幣


0dfaab0a-20da-11f0-9434-92fbcf53809c.jpg


注:1. 阿里巴巴的自然年與其財年不一致,數(shù)據(jù)已根據(jù)自然年進(jìn)行調(diào)整。2. 科技公司的資本支出通常用于購買芯片和服務(wù)器,以及租賃土地建設(shè)數(shù)據(jù)中心;因此,科技公司的資本支出與算力投資直接相關(guān)。| 來源:財經(jīng)

2024年上半年,英偉達(dá)報告稱其在中國市場的收入達(dá)到61.6億美元(約合437億元人民幣),同比增長42.3%。由于國內(nèi)科技公司仍然主要依賴英偉達(dá)芯片,這些數(shù)據(jù)為估算中國主要科技公司購買芯片的數(shù)量提供了另一個有用的參考。


圖5:英偉達(dá)在全球各地區(qū)的營收規(guī)模(2022年第一季度至2024年第二季度) 單位:美元


0e178cf2-20da-11f0-9434-92fbcf53809c.jpg


注:1. 英偉達(dá)的自然年與財年不一致,數(shù)據(jù)已根據(jù)自然年進(jìn)行調(diào)整。2. 為便于統(tǒng)計,英偉達(dá)來自中國大陸、臺灣及其他非美國地區(qū)的收入在圖表中被合并為“其他”。3. 英偉達(dá)財務(wù)報告統(tǒng)計中的中國大陸收入包含香港。

國有電信運營商

《財經(jīng)》解釋稱,自2023年以來,國有電信運營商已將投資重點從5G轉(zhuǎn)向算力中心投資。事實上,其投資規(guī)模與上述私營科技公司的差距并不大。

中國移動和中國電信均披露了2024年的算力投資計劃,其中中國移動計劃投資475億元人民幣,中國電信計劃投資370億元人民幣。兩者合計845億元人民幣,同比增長13%。中國聯(lián)通未披露相關(guān)數(shù)據(jù),因此本部分的數(shù)據(jù)也存在不完整性。

圖3:電信運營商與算力相關(guān)的資本支出(2022-2024) 單位:億元人民幣

0e2c8396-20da-11f0-9434-92fbcf53809c.jpg

注:2024年的數(shù)據(jù)為2023年財務(wù)報告中披露的計劃數(shù)據(jù)。

中國移動已公開發(fā)布了兩份公開招標(biāo)的采購公告。這兩份采購文件顯示,計劃采購超過9200臺華為昇騰AI服務(wù)器(一臺昇騰AI服務(wù)器通常配備4到8個GPU,因此這大約相當(dāng)于3.6萬到7.4萬個GPU)。中標(biāo)者是國內(nèi)知名的昇騰經(jīng)銷商,例如昆侖、華鯤振宇、寶德、百信、長江、鯤泰、湘江鯤鵬和四川虹信軟件。一些文章指出,中國移動在2024年建設(shè)的計算基礎(chǔ)設(shè)施中,約85%依賴國產(chǎn)芯片。

《財經(jīng)》提醒,即使是這些國產(chǎn)芯片也依賴全球供應(yīng)鏈:

華為的一位代表在今年9月向我們表示,盡管Nvidia的H20芯片目前仍在向中國銷售,但必須為最壞的情況做好準(zhǔn)備,因為供應(yīng)鏈隨時可能中斷。華為的昇騰910系列芯片依賴韓國SK海力士提供的高帶寬存儲器(HBM)。目前,國內(nèi)缺乏既有效又可靠的HBM替代品。在極端情況下,如果SK海力士的HBM供應(yīng)鏈被切斷,昇騰910芯片的生產(chǎn)能力也會受到影響。


地方政府和國有企業(yè)

這里的數(shù)據(jù)顯示最為雜亂且不完整?!敦斀?jīng)》的統(tǒng)計表明,截至2024年10月16日,各地城市已至少啟動了30個與人工智能計算中心相關(guān)的招標(biāo)項目,總投資額不少于275億元人民幣。

0e3f8554-20da-11f0-9434-92fbcf53809c.jpg

注:1. 統(tǒng)計時段為2024年1月至2024年10月16日,以上統(tǒng)計并不完整。2. 投資金額包括軟件、硬件及土建工程投資,例如服務(wù)器采購和智能計算中心建設(shè)。



中國到底擁有多少算力?

基于上述投資數(shù)據(jù),《財經(jīng)》謹(jǐn)慎估計,2024年中國新增了:

70萬塊Nvidia H20芯片;

30萬塊國產(chǎn)華為芯片。


文章還提到了Semianalysis更為樂觀的估算:

超過100萬塊Nvidia H20芯片;

55萬塊國產(chǎn)(如華為)芯片。


然而,據(jù)《財經(jīng)》報道,大多數(shù)中國業(yè)內(nèi)人士認(rèn)為后者的估算并不可信。

無論如何,這使得中國擁有了足夠的GPU來構(gòu)建多個10萬GPU規(guī)模的集群。作為對比,Epoch AI估計僅谷歌一家就運營著超過100萬塊芯片。(需要注意的是,Epoch AI的數(shù)據(jù)反映的是其總?cè)萘浚鲜鲋袊臄?shù)據(jù)特指2024年新增的容量,因此兩者并不直接可比。)

0e93ebbc-20da-11f0-9434-92fbcf53809c.jpg

鈦媒體估算,2024年上半年:

國內(nèi)智算中心交付了17億卡時(card-hours),其中5.6億卡時被使用,利用率約為32%。其他數(shù)據(jù)顯示,當(dāng)前算力基礎(chǔ)設(shè)施行業(yè)的平均機架利用率不足60%。


不同運營商的利用率存在差異:

通過云服務(wù)提供更多的算力資源可以有效提升智能算力的使用效率。阿里云和華為云已經(jīng)向多個政府部門提交了這一建議。

公共云服務(wù)的合理利用率在40%-60%之間,政務(wù)云服務(wù)的利用率在25%-40%之間,但私有化計算資源的利用率通常不超過5%。



“假的”1萬GPU集群?

僅僅擁有GPU是不夠的。在2023年和2024年中國建設(shè)1萬GPU規(guī)模集群的過程中,出現(xiàn)了許多關(guān)于高效和合理分配的問題。

阿里云智能科技研究中心主任安琳指出,當(dāng)前中國存在三種類型的“1萬GPU集群”:

1. 假的1萬GPU集群(假萬卡集群):這類集群的技術(shù)定義是公司確實擁有1萬個AI加速器,但這些GPU分散在多個不同地點的數(shù)據(jù)中心。每個數(shù)據(jù)中心可能只有幾百或幾千塊GPU,盡管總數(shù)可能超過1萬塊,但它們無法作為一個統(tǒng)一的集群運行。

2. 偽1萬GPU集群(偽萬卡集群):這種集群將1萬塊AI加速卡部署在一個數(shù)據(jù)中心內(nèi)。然而,雖然硬件設(shè)施集中在一個地方,但這些GPU并未被用作統(tǒng)一資源來訓(xùn)練單一的大模型。例如,一部分GPU可能用于訓(xùn)練模型A,另一部分則用于模型B。

3. 真正的1萬GPU集群(真萬卡集群):在一個數(shù)據(jù)中心內(nèi)集中部署超過1萬塊GPU,并通過先進(jìn)的大規(guī)模資源調(diào)度技術(shù)實現(xiàn)互聯(lián),使其能夠作為一個整體協(xié)同工作。這使得單一大模型可以同時利用全部1萬塊GPU進(jìn)行訓(xùn)練。


創(chuàng)建一個真正的1萬GPU集群需要克服諸多技術(shù)挑戰(zhàn),例如:

高性能網(wǎng)絡(luò)以處理巨大的數(shù)據(jù)流量;

高效的調(diào)度系統(tǒng)以最大化GPU利用率;

穩(wěn)定的運行能力,能夠應(yīng)對頻繁的硬件故障。


在人工智能熱潮中,許多公司和地方政府急于購買GPU,認(rèn)為僅憑擁有這些硬件就能在AI競賽中占據(jù)優(yōu)勢。然而,其中許多人缺乏實際部署這些資源所需的技術(shù)專長,導(dǎo)致了“假的1萬GPU集群”和“偽1萬GPU集群”的出現(xiàn)。據(jù)鈦媒體報道:


“目前,囤積NVIDIA顯卡確實造成了一些算力浪費。許多買家缺乏構(gòu)建智能計算中心所需的網(wǎng)絡(luò)、調(diào)度和運營能力。一位業(yè)內(nèi)技術(shù)專家直言不諱地表示:‘投機行為太多了。很多人其實并不在這個行業(yè)——他們以為囤積硬件就能賺錢。他們把這些GPU隨便塞進(jìn)某個數(shù)據(jù)中心,卻沒有解決穩(wěn)定性、容錯性等技術(shù)問題,結(jié)果造成了大量資源浪費?!?


此外,一些中國的中小型云服務(wù)提供商可能提供價格低廉的服務(wù),但其質(zhì)量同樣較低。



政府的應(yīng)對措施

中國政府清楚地意識到2023年及2024年初因數(shù)據(jù)中心建設(shè)混亂所造成的資源浪費,并已采取措施,試圖主動減緩新建數(shù)據(jù)中心的步伐。

據(jù)鈦媒體報道,國家發(fā)展和改革委員會(NDRC)已停止批準(zhǔn)新建數(shù)據(jù)中心的能源配額。不過,如果在去年我們文章中探討過的中國“東數(shù)西算”項目的八大節(jié)點之一中使用華為芯片,則可能會獲得例外批準(zhǔn)。

《科技日報》(黨媒《科技日報》頭版文章)發(fā)表了一篇題為“智算中心建設(shè)不應(yīng)盲目跟風(fēng)”的文章,提出了以下觀點:


智算中心的運營和管理高度依賴專業(yè)技術(shù)人才和高效的管理團隊。如果沒有這些,算力中心可能無法按預(yù)期發(fā)揮作用,導(dǎo)致設(shè)備閑置和資源浪費。

因此,是否建設(shè)、何時建設(shè)以及在何處建設(shè)智算中心需要科學(xué)審慎的決策?!皬谋娦睦怼被蚣庇凇案L(fēng)”的行為必須避免。總體原則應(yīng)是基于明確且可持續(xù)的市場需求,因地制宜地建設(shè)智算中心,并適度超前規(guī)劃。


地方政府正在提高對承包商的要求:


一些地方政府加強了對智算中心運營的要求。例如,山東德州一個價值約2億元人民幣的項目,在招標(biāo)文件中明確表示將采用“設(shè)計、施工、采購與運營一體化模式”。該項目要求運營期不少于五年,并明確規(guī)定了項目驗收和交付使用后每年的算力收入下限。

據(jù)云軸科技(ZStack)CTO王偉介紹,政府如今對智算中心提出了更高要求。過去,簡單建成算力中心即可,但現(xiàn)在政府希望尋找有能力的運營商,或?qū)⒔ㄔO(shè)與運營整合起來,以確保算力的高效利用。


其他地方政府則嘗試將其閑置的計算資源交給云服務(wù)提供商:


一些地方政府已開始協(xié)調(diào),鼓勵云服務(wù)提供商租賃其智算中心的閑置算力?!拔覀兩踔敛恢绹鴥?nèi)有這么多GPU。某種意義上,算力短缺與資源錯配并存,”一位業(yè)內(nèi)人士表示。


此外,還有幾項政府政策試圖解決小型分散計算中心的資源浪費問題:


《數(shù)據(jù)中心綠色低碳發(fā)展專項行動計劃》對數(shù)據(jù)中心行業(yè)的區(qū)域布局、能源和水資源效率以及綠色電力的使用提出了嚴(yán)格而全面的要求。該計劃還提出“全面取消對高耗能行業(yè)的地方優(yōu)惠電價政策”。人們普遍認(rèn)為,這一政策將加速淘汰落后產(chǎn)能,優(yōu)化行業(yè)供給結(jié)構(gòu),推動健康發(fā)展。

工業(yè)和信息化部(MIIT)近期批準(zhǔn)了六個城市的云邊端一體化智能算力應(yīng)用試點。這些試點旨在解決各地早期建設(shè)智算中心過程中出現(xiàn)的問題,尤其是由國有資金支持的小型分散算力中心的資源浪費問題。


除了這些政府措施外,文章還指出,隨著市場逐漸成熟,投資策略逐步調(diào)整,低質(zhì)量或低效的參與者(如部署次優(yōu)或閑置系統(tǒng)的機構(gòu))可能會自然被淘汰。隨著時間推移,更高效的參與者將占據(jù)主導(dǎo)地位,從而緩解閑置計算資源的問題。



國產(chǎn)芯片是否更容易閑置?

文章對國產(chǎn)芯片在閑置算力悖論中的作用傳遞了復(fù)雜的信息。

據(jù)《財經(jīng)》報道,受閑置悖論影響最嚴(yán)重的集群是由國有移動運營商和地方政府運營的那些。部分原因在于它們使用的是國產(chǎn)芯片:


國產(chǎn)AI芯片的情況更為特殊。目前,國產(chǎn)AI芯片僅達(dá)到了“能用”的水平,但距離“好用”仍有差距。盲目使用這些芯片只會導(dǎo)致算力浪費。企業(yè)需要通過各種技術(shù)手段進(jìn)行適配,以最大化國產(chǎn)AI芯片的效率。


鈦媒體也描述了華為芯片面臨的生態(tài)挑戰(zhàn),但引用業(yè)內(nèi)人士的觀點稱,這些問題只是小問題,是不可避免的,并且最終將有助于華為生態(tài)的成熟:


一方面,有觀點認(rèn)為,國內(nèi)智算中心仍然依賴海外生態(tài)系統(tǒng),需要三到五年的過渡期。在此期間,大規(guī)??焖俳ㄔO(shè)此類中心很可能導(dǎo)致顯著的浪費。專家指出,國內(nèi)AI計算存在效率低下問題,他表示:“華為的運營能力非常強大。然而,在用戶準(zhǔn)備好采用國產(chǎn)GPU或華為解決方案之前,華為已經(jīng)投入大量資源開發(fā)計算集群和智算中心。電信運營商雖然建起了數(shù)萬GPU的集群,但硬件從可用到高效使用之間仍存在差距。隨著更多國產(chǎn)芯片進(jìn)入市場,這些低效問題可能會更加突出?!?

另一方面,也有觀點認(rèn)為,海外限制只會愈加嚴(yán)格,國內(nèi)AI計算生態(tài)必須更快成熟。與國家戰(zhàn)略競爭相比,因建設(shè)過快引發(fā)的一些小問題是可接受的。“不過,總體而言,我對國產(chǎn)GPU持樂觀態(tài)度,特別是在大模型時代的算力趨勢變化下。過去,AI模型非常分散,Nvidia的CUDA生態(tài)系統(tǒng)之所以占據(jù)主導(dǎo)地位,是因為它需要支持如此多的不同模型。如今,隨著大模型逐漸整合,主流框架變得更加統(tǒng)一。同時,Nvidia GPU價格昂貴,且獲取其算力面臨諸多挑戰(zhàn),因此會有更多人愿意嘗試國產(chǎn)GPU,”專家補充道。


從訓(xùn)練需求向推理需求的轉(zhuǎn)變

2023年,無數(shù)公司爭相開發(fā)基礎(chǔ)模型,推動了全國范圍內(nèi)眾多算力中心的建設(shè)。


2023年出現(xiàn)了算力短缺,因為“百模大戰(zhàn)”導(dǎo)致對訓(xùn)練算力的需求激增。美國出口管制進(jìn)一步限制了供應(yīng),而企業(yè)的恐慌性采購加劇了供需失衡。一家領(lǐng)先科技公司的戰(zhàn)略規(guī)劃師在2023年8月提到,他們的公司在2023年以比Nvidia官方定價高出1.5至2倍的價格購買了市場上的A100/A800和H100/H800芯片,甚至從小型和中型分銷商手中收購了散貨囤積的芯片。


然而,到2024年,許多公司已放棄開發(fā)基礎(chǔ)模型的雄心,導(dǎo)致訓(xùn)練需求急劇下降。這表明資源正逐漸集中到行業(yè)中的少數(shù)主導(dǎo)者手中。根據(jù)鈦媒體的報道,截至2024年10月,在中國正式獲批的188個模型中(《ChinaTalk》編輯注:原文未提供數(shù)據(jù)來源,因此僅供參考):


超過30%的模型在獲批后沒有進(jìn)一步進(jìn)展;

僅有約10%的模型仍在積極進(jìn)行訓(xùn)練;

近50%的模型將重點轉(zhuǎn)向AI應(yīng)用開發(fā)。


《財經(jīng)》也認(rèn)同這一觀點,并指出:


需求結(jié)構(gòu)正在發(fā)生變化。到2024年,隨著企業(yè)囤積了越來越多的芯片,算力逐漸變得充足。模型訓(xùn)練的需求開始放緩,而應(yīng)用推理的需求尚未爆發(fā)。此時,一個過渡性的“空檔期”出現(xiàn)了。

目前,國內(nèi)科技公司如阿里巴巴、字節(jié)跳動和百度的旗艦?zāi)P托阅芤呀咏麿penAI的GPT-4。由于GPT-4之后的下一代模型尚未真正出現(xiàn),追趕GPT-4的任務(wù)已基本結(jié)束。因此,國內(nèi)主要科技公司暫時放緩了模型訓(xùn)練的努力。

在2022年至2027年之間,訓(xùn)練算力的比例將下降至27.4%,而推理算力的比例將上升至72.6%。

0eb09ae6-20da-11f0-9434-92fbcf53809c.jpg

2024年至2027年的數(shù)據(jù)來自國際市場研究公司IDC的估算。| 來源:《財經(jīng)》

然而,推理需求正在增長。百度的Token消耗量從2024年5月的2500億增長到8月的1萬億,增加了四倍。字節(jié)跳動同期的模型Token消耗甚至增長了十倍。


圖7:百度與字節(jié)跳動大型模型的日均Token消耗量 單位:億/日均

0ec97872-20da-11f0-9434-92fbcf53809c.jpg

注:1. 百度數(shù)據(jù)來源于百度財報披露。2. 字節(jié)跳動數(shù)據(jù)來源于字節(jié)跳動新聞發(fā)布會披露。


所有這些都表明,最終可能會再次出現(xiàn)算力短缺。《財經(jīng)》指出:


我們從多家技術(shù)云服務(wù)提供商和部分電信運營商處獲悉,他們的共同判斷是“短期充足,但長期不足”。短期內(nèi),現(xiàn)有的算力能夠滿足基本業(yè)務(wù)需求,并在局部出現(xiàn)過?,F(xiàn)象。然而,從長遠(yuǎn)來看,AI應(yīng)用的落地將需要更多的算力支持。

這一“過渡期”的長短取決于兩個因素:第一,下一代模型訓(xùn)練競賽何時開始;第二,推理算力需求增長的速度,這取決于AI應(yīng)用的采納與普及速度。


一些科技公司的技術(shù)專家預(yù)測,這一過渡期可能會持續(xù)到2025年中期,但總體而言不會持續(xù)太久。

本文轉(zhuǎn)自:超算百科

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274193
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1103

    瀏覽量

    15353
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    755

    瀏覽量

    1045
收藏 人收藏

    評論

    相關(guān)推薦

    華為助力中國移動全面升級“九州”互聯(lián)網(wǎng)

    中國移動云智大會期間,以“智啟新,安全筑基“為主題的智基礎(chǔ)設(shè)施及安全峰會成功舉辦。會上,中國移動聯(lián)合華為等重磅發(fā)布了《“九州”
    的頭像 發(fā)表于 04-14 16:46 ?365次閱讀

    AI 報告來了!2025中國AI市場將達(dá) 259 億美元

    報告來源:IDC、浪潮信息2月13日,國際數(shù)據(jù)公司(IDC)攜手浪潮信息,重磅發(fā)布《2025年中國人工智能計算發(fā)展評估報告》。當(dāng)下,大模型與生成式人工智能熱度飆升,需求水漲船高,
    的頭像 發(fā)表于 03-07 13:27 ?470次閱讀
    AI <b class='flag-5'>算</b><b class='flag-5'>力</b>報告來了!2025<b class='flag-5'>中國</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b>市場將達(dá) 259 億美元

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運行。以下是對智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?1502次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?308次閱讀

    澎峰科技助力中國移動發(fā)布智“芯合”原生基礎(chǔ)軟件棧2.0

    近日 ,由中國通信學(xué)會主辦、中國移動研究院承辦的2024中國信息通信大會“網(wǎng)絡(luò)網(wǎng)一體創(chuàng)新發(fā)
    的頭像 發(fā)表于 12-03 13:29 ?494次閱讀

    聯(lián)想亮相2024中國大會

    日前,2024中國大會在河南鄭州拉開帷幕。作為全球領(lǐng)先的基礎(chǔ)設(shè)施和服務(wù)提供商,聯(lián)想集團參會參展并攜手異構(gòu)智
    的頭像 發(fā)表于 10-14 11:43 ?783次閱讀

    中國大會召開,業(yè)界首個高質(zhì)量評估體系發(fā)布

    首次完整地構(gòu)建了人工智能時代高質(zhì)量的理論體系,并探索性提出業(yè)界首個 "五位一體"的高質(zhì)量評估體系。 發(fā)布現(xiàn)場 在當(dāng)前由大模型和AIGC驅(qū)動的AI時代,
    的頭像 發(fā)表于 09-28 16:50 ?378次閱讀
    <b class='flag-5'>中國</b><b class='flag-5'>算</b><b class='flag-5'>力</b>大會召開,業(yè)界首個<b class='flag-5'>算</b><b class='flag-5'>力</b>高質(zhì)量評估體系發(fā)布

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國信通院公布首個《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智
    的頭像 發(fā)表于 08-06 14:23 ?1110次閱讀

    中國中心市場持續(xù)增長,智能規(guī)??焖籴绕?/a>

    7月24日,中國信息通信研究院(簡稱“中國信通院”)權(quán)威發(fā)布了《中國中心服務(wù)商分析報告(2024年)》,該報告深入剖析了
    的頭像 發(fā)表于 07-24 15:25 ?847次閱讀

    曙光攜手“互聯(lián)公共服務(wù)平臺”提高全國匹配效率

    近日,由中國信息通信研究院開發(fā)的“互聯(lián)公共服務(wù)平臺”在重慶上線。作為該平臺合作方之一,曙光智參與了平臺發(fā)布儀式。 ? ? 曙光將依托在
    的頭像 發(fā)表于 07-16 15:45 ?906次閱讀

    壁仞科技為中國移動呼和浩特智中心提供強大

    ? 隨著人工智能技術(shù)的飛速發(fā)展,高性能計算中心成為推動AI創(chuàng)新和應(yīng)用的關(guān)鍵基礎(chǔ)設(shè)施。近日,中國移動智中心(呼和浩特)成功上線運營。國內(nèi)領(lǐng)先的GPU企業(yè)壁仞科技的壁礪系列通用GPU
    的頭像 發(fā)表于 07-05 17:16 ?1510次閱讀

    中國移動網(wǎng)絡(luò)大會的現(xiàn)場精華,都在這里!

    大家好,我是小棗君。4月28-29日,2024中國移動網(wǎng)絡(luò)大會在蘇州召開。我有幸前往現(xiàn)場參加了本次大會。按照慣例,來給大家匯報一下現(xiàn)場的情況。中國移動
    的頭像 發(fā)表于 05-13 08:05 ?592次閱讀
    <b class='flag-5'>中國</b>移動<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)大會的現(xiàn)場精華,都在這里!

    揭秘芯片為何它如此關(guān)鍵?

    在數(shù)字化時代,芯片作為電子設(shè)備的核心組件,其性能直接關(guān)系到設(shè)備的運行速度和處理能力。而芯片的,即其計算能力,更是衡量芯片性能的重要指標(biāo)。那么,芯片的到底有什么用?
    的頭像 發(fā)表于 05-09 08:27 ?1683次閱讀
    揭秘芯片<b class='flag-5'>算</b><b class='flag-5'>力</b>:<b class='flag-5'>為何</b>它如此關(guān)鍵?

    軟通動力亮相2024中國移動網(wǎng)絡(luò)大會,共繪網(wǎng)絡(luò)新藍(lán)圖

    4月28日至29日,以“網(wǎng)絡(luò)點亮AI新時代”為主題的2024中國移動網(wǎng)絡(luò)大會在蘇州隆重舉行。
    的頭像 發(fā)表于 05-06 10:20 ?715次閱讀
    軟通動力亮相2024<b class='flag-5'>中國</b>移動<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)大會,共繪<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)新藍(lán)圖