隨著生成式AI的火熱以及英偉達(dá)市值沖破萬億美元,如何取替英偉達(dá),成為AI芯片市場新貴,又成為了一個(gè)熱門話題。
以下為文章原文摘錄:
看到英偉達(dá)這個(gè)萬億美元的市值,我想沒有任何人敢說他不想要。。。。。。想要,就得琢磨琢磨怎么才能造他娘的反。
王侯將相寧有種乎!
你得盤個(gè)邏輯,提個(gè)口號(hào)才能舉旗,得想辦法證明舊社會(huì)的不足和新社會(huì)的先進(jìn)性才有機(jī)會(huì)。
不知道多少人分析過Nvidia的GPU的成本,我們以最新的Hopper H100為例。大致上,為了跑AI大模型,你從Nvidia手上購買到的是如下這樣的一張卡,他叫做SXM5模組,單手就能拿捏的樣子。
這個(gè)模組附帶了大量的供電VRM,也通常會(huì)使用相對(duì)高階的PCB保證供電的銅損最小。最中間的差不多就是一顆Hopper GPU芯片,看得出由7顆Die用chiplet方式封裝,分別是1顆logic Die和6顆HBM。
把他的成本打開,SXM的成本不會(huì)高于300$,封裝的Substrate及CoWoS大約也需要$300,中間的Logic Die最大顆,這是一顆看起來非常高貴的die,使用4nm工藝打,尺寸為814mm2,TSMC一張12英寸Wafer大致上可以制造大約60顆這個(gè)尺寸的Die,Nvidia在Partial Good上一向做得很好(他幾乎不賣Full Good),所以這60顆大致能有50顆可用,Nvidia是大客戶,從TSMC手上拿到的價(jià)格大約是$15000,所以這個(gè)高貴的Die大約只需要$300。哦,只剩下HBM了,當(dāng)前DRAM市場疲軟得都快要死掉一家的鬼樣了,即使是HBM3大抵都是虧本在賣,差不多只需要$15/GB,嗯,80GB的容量成本是$1200。
你掐指一算……
凸(艸皿艸 ),你花錢到底買到的是什么?這居然是一個(gè)投機(jī)倒把倒賣DRAM的貨,整顆GPU物料成本中DRAM占了~60%,而且這DRAM的容量,80GB,它是個(gè)啥?夠個(gè)屁啊,老黃還騙我買8張卡來存放一個(gè)GPT3大模型。
高貴的黃教主啊,想不到你是個(gè)高價(jià)倒賣DRAM的二手販子啊........Grace把LPDDR也集成進(jìn)去了,是不是這集成的LPDDR不得也比標(biāo)準(zhǔn)DDR DIMM貴個(gè)幾倍?
所以,要革Nvidia命的第一步,就應(yīng)該從DRAM出手,如果我做把DRAM成本做到更合理的結(jié)構(gòu),并且再把容量做大到更少的芯片數(shù)量就能存放大模型。
這天,我能翻。
就前幾天,聰明絕頂?shù)腉raphCore聯(lián)合創(chuàng)始人兼CTO為眾多競爭者指出了一條路,如下:
看到?jīng)],LPDDR定制一下是可以做到50% HBM的帶寬,但是容量遠(yuǎn)大于HBM的,剩下你只要在AI大模型的存/算帶寬容量比上做到最好就行。
不過。。。。。。。他自己為啥不做?
因?yàn)橐活wH100 GPGPU雖然成本只有 ~$2000,但它在市場上的售價(jià)是 ~$30000,在15倍的暴利面前,你想用降成本的方式來獲取競爭力。嗯,假設(shè)你做一顆成本$1000,比H100性價(jià)比更高的DSA,能打贏嗎?
客戶他又不是傻子,他愿意用$30000的價(jià)格買一個(gè)$2000成本的東西,他真的會(huì)圖你的成本能再降低$1000 ?
這個(gè)巨大的溢價(jià)空間,并非源自GPGPU本身,而來自于其背后的巨大黑手,一個(gè)復(fù)雜的系統(tǒng),這個(gè)系統(tǒng)本身,甚至潛移默化影響了用戶的算法。
Nvidia是一個(gè)偽裝成賣Device,但真實(shí)是在賣一個(gè)system的公司。Apple也是。
只有打掉這個(gè)系統(tǒng)才有可能破解其成本,想一想,iOS有Android,Windows有Linux,cuda卻沒有開源路徑……
一計(jì)不成,再生一計(jì)。我再治他一個(gè)system的閹人之罪。
回到中國本土市場,你注意到老黃最近在呼吁,美國政府對(duì)中國的技術(shù)管制要三思而后行。嗯,網(wǎng)傳老黃差點(diǎn)就來大陸炒光模塊的A股了。
邏輯是沒問題的,美國的技術(shù)管制大概率Nvidia是參與了,所以他才那么在美國發(fā)布管制時(shí),第一時(shí)間推出了A800、H800這樣的數(shù)字對(duì)中國人是好意頭的芯片型號(hào),這種體貼AMD蘇媽媽就慢了一拍(蘇媽媽推出了mi388……)。
美國技術(shù)管制的約束大致是芯片總帶寬要小于600GB/s(雙向)。
GPU A100的Nvlink帶寬是600GB/s,考慮到PCIe不能裁,A800的Nvlink被限制到400GB/s(12Lane降低到8Lane)。
這還好,灑灑水啦。
H100相比A100算力FP16從300T增加到接近1P,Nvlink帶寬從600GB/s提升到900GB/s,咔嚓一刀,H800的Nvlink帶寬還是得降低到400GB/s。
有點(diǎn)憋屈,但是我作為驕傲的中國客戶,為了圖8這個(gè)吉利,連4這個(gè)數(shù)字都能忍了。
我記得我列過幾次大模型訓(xùn)練的結(jié)構(gòu),以GPT3為例,大致上用1024張A100訓(xùn)練GPT,8P一個(gè)Node,在Node內(nèi)模型并行, 然后按8個(gè)8P(64P)做8級(jí)流水并行,然后16組8x8做Batch 16的數(shù)據(jù)并行。。。。。。
H100的下一代是B100,它的FP16算力大致上從900T提升到了~2P Flops附近。
哦豁,在這個(gè)算力下如果B800只有400GB/s的Nvlink帶寬,基本上Tensor并行這個(gè)訓(xùn)練行為就沒法正常執(zhí)行了,各大廠商走過路過想一下啊,B800你還要再下10億美元的單嗎?
大概Nvidia和US政府定規(guī)則的時(shí)候,只考慮了Ampere和Hopper,沒把摩爾定律算進(jìn)去。
所以這個(gè)破綻很簡單,壞人不讓我們做的,我們就越要發(fā)展。單芯片的IO能力懟上去啊,600GB不夠就上1TB,把互聯(lián)做得大大的,8P的模型并行不夠,直接來16P、32P的大互聯(lián)。
有人會(huì)說:這樣是不是有點(diǎn)不公平?嗯,美國卡中國是公平的,反過來利用一下反而不公平了?如果能給老黃一個(gè)猴子偷桃就一定要偷。
黃教主近期在臺(tái)北發(fā)布了GH200,就有很多黃粉大吹特吹不是?然后呢?這塊芯片的帶寬是超標(biāo)美國對(duì)中國技術(shù)管制的……嗯,老黃在中國發(fā)布了不能賣給中國的產(chǎn)品。很公平?
還有人會(huì)說:如果真這么做了,美國就會(huì)放松技術(shù)管制了。我只能說,如果你不做,技術(shù)管制不會(huì)憑空的放開,你只有做了,才有放開的一天。
當(dāng)然,你說,革命之事,你求的本就是天下,不是一城一池。那是。
Nvidia看長遠(yuǎn),最大的破腚,其實(shí)是基尼系數(shù)太高,不患貧而患不均。
TSMC曾經(jīng)講過一個(gè)故事。臺(tái)灣同胞辛辛苦苦攢錢建廠,一張4nm那么先進(jìn)的工藝哦,才能賣到$15000,但是那某個(gè)客戶拿去噢,能賣出$1500000($30000*50)的貨啦,機(jī)車,那樣很討厭耶。你懂我意思嗎?
就如最開始說的,在這個(gè)世界的商業(yè)規(guī)則下,$2000成本的東西賣$30000,只有一家,銷售量還很大,這是不符合邏輯的,這種金母雞得有航母才守得住。
天下財(cái)共一石,老黃獨(dú)占八斗。
這是對(duì)全天下IT產(chǎn)業(yè)的傷害,包括TSMC,一個(gè)健康的產(chǎn)業(yè),其整個(gè)環(huán)節(jié)是需要一個(gè)合理的分配比例的,你要說Logic制造的技術(shù)含量最高,但是分成的收益卻不到1%,這種分配關(guān)系不足以長期維系,tsmc的工藝演進(jìn)是需要錢的(靠的就是大家共籌,利益均分),如果全世界IT就這么多錢,英偉達(dá)你是可以通過系統(tǒng)優(yōu)勢拿走更多,但產(chǎn)業(yè)鏈中tsmc及其他各個(gè)環(huán)節(jié)就會(huì)更加艱難。三星的HBM其實(shí)同理,操了白粉的心,賣個(gè)白菜的價(jià),不值得。
嗯,不過tsmc沒錢發(fā)展工藝對(duì)我們也不是壞事。或者說把芯片制造行業(yè)打到毛利接近零,那全世界只有中國人能做,也挺好。
摩爾定律之下,長期穩(wěn)定地?cái)D牙膏才是發(fā)展的王道(當(dāng)然Intel最終也沒擠好,但如果Intel如果過早把牙膏都擠了,死得更早)。
一個(gè)人過早獲得了超額的財(cái)富,剩下就看他能不能守得住了 :) 從歷史來看,很難的。
AI這個(gè)行業(yè),也終將,昔日王榭堂前燕 飛入尋常百姓家。這是大勢。
審核編輯:劉清
-
pcb
+關(guān)注
關(guān)注
4362文章
23458瀏覽量
408208 -
VRM
+關(guān)注
關(guān)注
0文章
31瀏覽量
13031 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3933瀏覽量
93353 -
AI芯片
+關(guān)注
關(guān)注
17文章
1978瀏覽量
35780 -
chiplet
+關(guān)注
關(guān)注
6文章
453瀏覽量
12931
原文標(biāo)題:如何顛覆英偉達(dá)?
文章出處:【微信號(hào):ZYNQ,微信公眾號(hào):ZYNQ】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價(jià)下跌超8%
剛剛!英偉達(dá)最新回應(yīng)!
英偉達(dá)被立案調(diào)查 英偉達(dá)回應(yīng)反壟斷調(diào)查

加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
英偉達(dá)第三季度營收幾乎翻倍 但英偉達(dá)美股盤后一度跌近5%

英偉達(dá)超越蘋果成為市值最高 英偉達(dá)取代英特爾加入道指
英偉達(dá)市值飆升,逼近蘋果
英偉達(dá)股價(jià)分析:英偉達(dá)股價(jià)能否上漲到150美元,接下來該如何操作?

英偉達(dá)投資日本AI公司Sakana AI
英偉達(dá)高管解讀Q2財(cái)報(bào) 但是英偉達(dá)市值暴跌1.4萬億元

英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell
AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500億
英偉達(dá)發(fā)布新版NVIDIAApp
英偉達(dá)或面臨重大技術(shù)性拋售 英偉達(dá)市值一夜蒸發(fā)1.4萬億

評(píng)論