電子發(fā)燒友網(wǎng)報道(文/黃山明)從2022年起,美國開始持續(xù)收緊對華芯片的出口政策,而H20便是英偉達(dá)專為中國市場量身定制的AI芯片。今年以來,市場中的英偉達(dá)H20需求突然開始上漲。與此同時,市場中的算力服務(wù)器租賃需求也在爆發(fā)式的增長,更出現(xiàn)了“一機難求”的盛況。
AI服務(wù)器告急,H20芯片需求大漲
近期,許多上市公司紛紛發(fā)布公告,計劃布局算力租賃市場。隨著國產(chǎn)大模型的升級,算力租賃市場開始迎來高速增長,據(jù)某些算力中心人士預(yù)測,其今年的營收將比2024年增長三倍以上。
與此同時,不少公司正在加緊采購算力服務(wù)器,尤其是高性能的算力服務(wù)器更是需求旺盛。例如蓮花控股孫公司蓮花紫星智算科技向中建投租賃200臺高性能服務(wù)器,為期三年。
有算力租賃分析師表示,從產(chǎn)業(yè)調(diào)研的情況來看,僅目前浮現(xiàn)的潛在大廠采購方可能接近300億市場規(guī)模,預(yù)計中國2025年算力租賃市場規(guī)模有望超千億。整體來看,2024年我國AI服務(wù)器整體市場規(guī)模190億美元,2025年預(yù)期將達(dá)到255億美元。
不僅是國內(nèi),海外市場中,算力租賃同樣火熱。前不久英偉達(dá)被爆出將收購Lepton AI,這是一家專門做搭載英偉達(dá)AI芯片服務(wù)器的公司,而此舉被視為英偉達(dá)進(jìn)軍云計算和企業(yè)軟件市場的一部分。巧合的是,就在這則消息被曝出不久后,近期市場中又傳來谷歌公司正在洽談租賃英偉達(dá)的AI服務(wù)器。
算力租賃市場的火爆,也帶動了市場中AI芯片的旺盛需求。以英偉達(dá)的H20為例,盡管該芯片作為英偉達(dá)專為中國量身定制的產(chǎn)品,并且其性能僅為H100的十分之一,但好在可以直接在中國售賣。
有接近新華三的產(chǎn)業(yè)鏈人士透露,目前141GB H20基本被銷售一空,而96GB版本也接近售罄,同時不知道未來合適能否再有供應(yīng),這需要取決于美國方面是否會放出相關(guān)禁令。
據(jù)財聯(lián)社報道,H20的短缺情況從今年2月份便已有端倪,其中算力資源信息共享平臺稱H20咨詢量為年前3倍,8卡H20機器價格較年前漲價10萬,單價已經(jīng)達(dá)到了110萬左右。市場中算力需求主要集中在英偉達(dá)的H20,同時具有一定性價比的4090也受到了市場的青睞。
而采購方主要來自于互聯(lián)網(wǎng)大廠,例如阿里巴巴、騰訊、字節(jié)跳動等,共向英偉達(dá)訂購了價值高達(dá)160億美元的H20服務(wù)器芯片。其中阿里在2月中旬確認(rèn)了與蘋果AI進(jìn)行合作,蘋果官網(wǎng)顯示,中文版Apple Intelligence將于4月上線,其采用的服務(wù)器支持便來自阿里。
而騰訊方面也有相關(guān)人士透露,騰訊云已推出適配H20的四款面向不同場景的DeepSeek專屬資源部署方案,并表示H20為性價比最優(yōu)的選擇。
AI算力市場,一時之間,好似又進(jìn)入到了繁花似錦的階段,尤其是目前H20的需求大增。其背后的原因在于DeepSeek的出現(xiàn),以算法創(chuàng)新重構(gòu)AI算力邏輯,讓AI計算從訓(xùn)練為主轉(zhuǎn)換到推理為主。雖然H20性能上有所下降,但做推理還是綽綽有余,顯存足夠,適合跑大規(guī)模的參數(shù)模型,價格也更低。
租賃市場仍在,但不一定是H20
在過去,大模型的私有化部署成本昂貴,僅采購商業(yè)閉源模型這一項,就需要數(shù)百萬乃至上千萬。如果企業(yè)規(guī)模大,使用人數(shù)多,還需要采購多套模型,成本呈指數(shù)級上升。但隨著開源的DeepSeek出現(xiàn)后,企業(yè)可以直接免費下載,模型成本直接歸零,直接點燃了市場中做AI應(yīng)用的熱潮。
同時,Deepseek主要的一個優(yōu)勢就是計算成本大大降低,其語義識別能力和推理能力非常強大。有企業(yè)透露其匹配率提升了20%左右,成本降低超過50%。
當(dāng)然,對于許多想要參與的中小型企業(yè)而言,自己建立數(shù)據(jù)中心可能需要數(shù)十億的投入,還不如直接采用租賃的方式,這也是為何近期算力租賃市場愈發(fā)火爆的原因。
但H20卻不一定能一直伴隨國內(nèi)算力租賃市場的春風(fēng),自2022年起,美國先后將英偉達(dá)的A100、H100、A800、H800 等高性能 AI 芯片列入對華出口禁令,這才讓弱化版的H20被推出。而隨著前段時間,美國商務(wù)部再次將多個中國企業(yè)納入所謂的“實體清單”,并進(jìn)一步收緊H20的出口許可,未來甚至面臨全面禁售。
與此同時,中國發(fā)改委正在推行數(shù)據(jù)中心的能源效率新規(guī),要求新建或擴(kuò)建的數(shù)據(jù)中心采用PUE(能源利用效率)低于1.5和符合“能效/算力比”的芯片。H20的能效表現(xiàn)顯著低于華為昇騰、壁仞科技等國產(chǎn)芯片,例如壁仞科技的產(chǎn)品能效可以達(dá)到H20的2倍以上。
加上目前國內(nèi)AI企業(yè)已經(jīng)開始認(rèn)可華為昇騰、寒武紀(jì)、壁仞等本土芯片產(chǎn)品,同時優(yōu)化算法以降低算力消耗。此前,DeepSeek曾因算力不足暫停了API服務(wù),也在倒逼行業(yè)加速構(gòu)建自主算力生態(tài)。
據(jù)DeepSeek研究人員的測試結(jié)果,推理任務(wù)中,昇騰910C性能可以達(dá)到H100的60%。同時推理時代對于云計算、AI Infra架構(gòu)也有著全新的需求。
此外,目前已經(jīng)明確2030年前持續(xù)提升能效,H20的高能耗特性使其在算力采購中被邊緣化,面臨被技術(shù)性淘汰的風(fēng)險。
盡管目前有消息顯示,英偉達(dá)正在積極應(yīng)對可能的禁令,同時計劃修改H20芯片以符合中國能效標(biāo)準(zhǔn),但這樣一來性能可能會進(jìn)一步下降,進(jìn)一步推動企業(yè)采購國產(chǎn)AI芯片。雖然英偉達(dá)也可能通過租賃境外云算力,來間接服務(wù)中國客戶,但這樣成本較高。
因此,大摩預(yù)計,2025年中國本土AI芯片的市場份額將從2024年的15%提升至25%。而這種影響是深刻的,以騰訊為例,盡管仍然在采購H20,但騰訊也在加強芯片、模型、應(yīng)用層的本土化協(xié)同,例如在其微信中集成DeepSeek模型時,還同步推進(jìn)與本土芯片廠商的適配,減少對英偉達(dá)的長期依賴。
一方面是懸而未決的禁令風(fēng)險導(dǎo)致供應(yīng)鏈的不穩(wěn)定,另一方面是中國能效政策下的驅(qū)動。顯然,DeepSeek的出現(xiàn)固然推動了算力需求的增加,但H20未來的日子未必好過。
總結(jié)
在DeepSeek出現(xiàn)后,小微企業(yè)開始乘著AI應(yīng)用的東風(fēng),算力租賃訂單也呈爆發(fā)式增長。甚至一些企業(yè)還將大模型嵌入服務(wù)器中,降低企業(yè)的調(diào)試成本。H20作為目前唯一可以買到的英偉達(dá)AI芯片,也被市場拉抬炒作。但隨著中美雙方博弈持續(xù),如今H20的爆火,更多像是一場絢麗的煙花表演。
發(fā)布評論請先 登錄
相關(guān)推薦
美國限制英偉達(dá)向華出售H20芯片
特朗普要叫停英偉達(dá)對華特供版 英偉達(dá)H20出口限制 或損失55億美元
大算力芯片的生態(tài)突圍與算力革命

DeepSeek驅(qū)動AI算力市場升溫,智算中心利用率望提升

評論