摘要: 日前,華為發(fā)布了 ARM 服務(wù)器 芯片 鯤鵬920 ,以及搭載鯤鵬920的ARM服務(wù)器??偟膩碚f,這款芯片的設(shè)計思路和高通/華芯通、飛騰等ARM陣營IC設(shè)計公司是類似的,那就是“單核性能不夠,核心數(shù)來湊”,依靠比Intel CPU更 ...
日前,華為發(fā)布了 ARM 服務(wù)器 芯片 鯤鵬920 ,以及搭載鯤鵬920的ARM服務(wù)器。總的來說,這款芯片的設(shè)計思路和高通/華芯通、飛騰等ARM陣營IC設(shè)計公司是類似的,那就是“單核性能不夠,核心數(shù)來湊”,依靠比Intel CPU更多的核心數(shù)量獲得強(qiáng)悍的多核性能。從華為公布的數(shù)據(jù)來看,多核性能強(qiáng)悍,但由于單核性能和Intel有一定差距,以及ARM在生態(tài)上的差距和芯片成本問題,單靠純粹商業(yè)化運(yùn)作,不依賴政府和國企的幫助,前途是比較一般的。另外,一些媒體鼓吹的說辭也存在值得商榷的地方。
鯤鵬920 Base on A76?
根據(jù)華為官方消息:
鯤鵬920是目前業(yè)界最高性能ARM-based處理器。該處理器采用7nm制造工藝,基于ARM架構(gòu)授權(quán),由華為公司自主設(shè)計完成。鯤鵬920主頻可達(dá)2.6GHz,單芯片可支持64核。該芯片集成8通道DDR4,內(nèi)存帶寬超出業(yè)界主流46%。芯片集成100G RoCE以太網(wǎng)卡功能,大幅提高系統(tǒng)集成度。鯤鵬920支持PCIe4.0及CCIX接口,可提供640Gbps總帶寬,單槽位接口速率為業(yè)界主流速率的兩倍,有效提升存儲及各類加速器的性能。典型主頻下,SPECint Benchmark評分超過930,超出業(yè)界標(biāo)桿25%。同時,能效比優(yōu)于業(yè)界標(biāo)桿30%。鯤鵬920以更低功耗為數(shù)據(jù)中心提供更強(qiáng)性能。
由于飛騰的FT2000和鯤鵬920同屬ARM陣營,且都是64核芯片,那么,就對比一下兩者的SPEC06測試成績。
先要說明的是,F(xiàn)T2000是飛騰在2016年的芯片,工藝為28nm,相對于2018-2019問世,采用7nm工藝的鯤鵬920在制造工藝和時間上先天處于劣勢。這里僅拿飛騰做一個參照。
根據(jù)業(yè)內(nèi)人士告知,F(xiàn)T2000在2G主頻,編譯器為GCC4.8的情況下,SPEC2006測試單核成績?yōu)槎c(diǎn)12.4,浮點(diǎn)11.3,多核成績?yōu)槎c(diǎn)570,浮點(diǎn)482,這個成績與Intel Xeon E5-2695v3相當(dāng)。
由于不清楚鯤鵬920的具體測試條件,就假定于FT2000相當(dāng)好了。
鯤鵬920的定點(diǎn)成績?yōu)?30,相對于FT2000的570提升了約60%,這既展示出華為的實力,也是兩年時間技術(shù)進(jìn)步的體現(xiàn)。
由于鯤鵬920與FT2000都是64核,假定華為的多核擴(kuò)展做的和飛騰差不多,那么鯤鵬920的單核成績應(yīng)當(dāng)在20分左右。由于鯤鵬920的主頻為2.6G,換算一下就是接近8/G,內(nèi)核性能大致與ARM Cortex A76相當(dāng),或略強(qiáng)于ARM Cortex A76,與AMD的Zen,Intel的skylake還是有不小的差距。
這與此前一位海思大佬宣稱的這個10.8/G有不小差距。除非華為在多核擴(kuò)展方面做的比較差,與飛騰存在較大差距,導(dǎo)致性能損耗太大,否則就很難自圓其說了。就這個角度看,雖然華為自稱是自主完成設(shè)計,但以目前公開的游戲信息,恐怕很難打消外界鯤鵬920是Base on A76的猜測。
另外,業(yè)內(nèi)人士表示:
技術(shù)只能迭代演進(jìn),如果不是耗費(fèi)十多年時間從零開始技術(shù)積累,每一代CPU的進(jìn)步,代碼替換量不會超過25%,因而,像Intel、ARM這么牛逼,CPU也是迭代演進(jìn)的,不存在一步登天的情況。
如果一款號稱“自主研發(fā)”的CPU一問世就一步登天,性能牛逼、可靠性、穩(wěn)定性、兼容性好,軟件生態(tài)完善,那這款CPU的自主性就要打一個問號了。
還有業(yè)內(nèi)人士表示:
即便是技術(shù)引進(jìn)消化吸收,也是需要站在巨人肩膀上的,必然保留大量“巨人”的源代碼。
從實踐上看以蘋果來說,在收購了PA這樣的IC設(shè)計公司后,又高薪挖了很多大牛,也是拿Cortex A8、A9、A15改了三代,也就是A4、A5、A6處理器,至于在“幽靈”和“熔斷”爆發(fā)的時候,ARM宣布,因為Cortex A8、A9、A15存在漏洞,所以蘋果的數(shù)款CPU也存在漏洞……之后設(shè)計CPU也存在“高度借鑒”前人設(shè)計的情況,美國法院就判決,蘋果的處理器侵權(quán),并命令蘋果公司支付5.06億美元賠償。
此外,華為雖然開發(fā)過Hi1610、Hi1612、HI1616,看起來是演進(jìn)了四代CPU,但實際上,Hi1610、Hi1612是買A57做集成,HI1616是A72做集成,華為做的只是SoC的設(shè)計,內(nèi)核迭代完全依賴從ARM買新一代內(nèi)核。
因此,在此前并沒有獨(dú)立開發(fā)過CPU核的情況下,突然冒出一個Zen級別的內(nèi)核(海思大佬的說法),或A76級別的內(nèi)核(根據(jù)華為公開數(shù)據(jù)對照FT2000推算),而且全部源碼100%自己寫,就有違技術(shù)發(fā)展規(guī)律了。
有鑒于如今凡是做CPU的,無論是買IP做集成也好,還是拿洋芯片穿馬甲也罷,都自我標(biāo)榜自主研發(fā),自主知識產(chǎn)權(quán),以及華為曾經(jīng)把買A57做集成宣傳為“完整自主知識產(chǎn)權(quán)”,并將A57、A72作為自主可控產(chǎn)品打入中央機(jī)關(guān)政府采購名錄,對于華為官方的宣傳自主研發(fā),大家別急著給華為背書,還是留給時間來檢驗。
媒體報道應(yīng)實事求是
在鯤鵬920亮相后,媒體贊美之詞不絕于耳,不過,一些報道是值得商榷的。
有文章聲稱,鯤鵬920把計算帶入多核異構(gòu)的多樣性時代。但是異構(gòu)計算早就不是什么新鮮事物,在超算上,特別是TOP500排名靠前的超算上,大多都是異構(gòu)計算,即便是服務(wù)器CPU,Intel在收購阿爾特拉之后,也拿出了CPU+FPGA的異構(gòu)計算產(chǎn)品。相比之下,華為鯤鵬920只是一款A(yù)RM服務(wù)器CPU,沒有實現(xiàn)片上異構(gòu)。
鐵流猜測,文宣聲稱鯤鵬920把計算帶入多核異構(gòu)的多樣性時代,估計想表示鯤鵬920的一些接口能夠支持CPU+GPU,CPU+NPU,只不過文宣想表達(dá)的雞血一點(diǎn),然后宣傳過頭了。
還有鼓吹鯤鵬920性能的,但是標(biāo)桿的選擇有些問題,原文是:
典型主頻下,SPECint Benchmark評分超過930,超出業(yè)界標(biāo)桿25%。同時,能效比優(yōu)于業(yè)界標(biāo)桿30%,此前的紀(jì)錄保持者是富士通的7納米A64X,每個芯片最高可達(dá)每秒2.7萬億次浮點(diǎn)運(yùn)算(2.7 teraflops)。
首先,SPEC測試和浮點(diǎn)運(yùn)算次數(shù)根本不是一回事??茖W(xué)運(yùn)算看重雙精浮點(diǎn)性能,而對PC和服務(wù)器而言,SPEC測試更具借鑒意義。像一些專門針對科學(xué)運(yùn)算的CPU,會出現(xiàn)浮點(diǎn)運(yùn)算性能牛逼,但SPEC測試成績很一般的情況,最典型的例子就是龍芯3B1500。
其次,是對比的參數(shù)有問題,文章在把富士通的ARM芯片(應(yīng)當(dāng)是A64FX,不是文宣寫的A64X)做對比時,舉的例子是富士通ARM芯片的浮點(diǎn)性能,而拿鯤鵬920的數(shù)據(jù)用的是定點(diǎn)性能,然后把富士通ARM芯片的浮點(diǎn)性能作為鯤鵬920定點(diǎn)性能的標(biāo)桿......
最后,富士通的那款A(yù)RM芯片和鯤鵬920應(yīng)用場景完全不同。富士通那款A(yù)RM芯片是超算芯片,計劃應(yīng)用于日本的E級超算,設(shè)計思路是類似SW26010的片上異構(gòu)的眾核方案。而華為的鯤鵬920就是服務(wù)器CPU,兩款芯片根本不是一路貨,根本談不上誰是誰的標(biāo)桿。
另外,還有把鯤鵬920與5G,以及萬物感知、萬物互聯(lián)、萬物智能等概念進(jìn)行關(guān)聯(lián)的修辭方式也值得商榷。誠然,5G正當(dāng)風(fēng)口,萬物感知、萬物互聯(lián)、萬物智能看起來高大上,綁在一起可以大幅增加“逼格”。
只不過,5G其實是商業(yè)概念,根本不是技術(shù)迭代,全球通信廠商把一大堆零增益、負(fù)增益的技術(shù)塞進(jìn)5G標(biāo)準(zhǔn),整個系統(tǒng)效率基本沒有提升,完全靠建設(shè)5倍的基站和消耗20倍的帶寬提升網(wǎng)速,而且藍(lán)圖里的URLLC場景現(xiàn)在的5G技術(shù)根本實現(xiàn)不了,mMTC場景2G、4G都能做,現(xiàn)在最大的物聯(lián)網(wǎng)應(yīng)用就是刪減版的4G,恰恰是華為和電信搞出來的。前不久運(yùn)營商采購物聯(lián)網(wǎng)芯片,用的也是2G。因此,5G和萬物互聯(lián)進(jìn)行捆綁完全是謊言。
另外,萬物感知相關(guān)聯(lián)的是傳感器,萬物智能相關(guān)的是AI芯片,萬物互聯(lián)關(guān)聯(lián)的是各類通信芯片,鐵流實在看不出來,介紹一款服務(wù)器CPU為何一定要把萬物感知、萬物互聯(lián)、萬物智能綁在一起的。
ARM服務(wù)器商業(yè)前景不佳
前些年,ARM宣布進(jìn)軍服務(wù)器CPU,高通、AMD、博通、凱為、華為、飛騰等一大批國內(nèi)外廠商跟隨,炒作的熱度比起現(xiàn)在被熱炒的RISC-V有過之無不及。
然而,ARM服務(wù)器CPU沒有像當(dāng)年預(yù)估的那樣大紅大紫,反而在商業(yè)市場折戟沉沙。AMD、Marvell已經(jīng)相繼退出,高通QDT大裁員,甚至連QDT技術(shù)副總裁、高通Falkor ARM服務(wù)器架構(gòu)設(shè)計的靈魂人物Bhandarkar都離職了。高通ARM服務(wù)器項目的最大支持者,高通創(chuàng)始人之子保羅·雅各布也被趕出公司。
在這種情況下,有業(yè)內(nèi)人士依舊看好ARM服務(wù)器,理由如下:
業(yè)界有一種說法,即只要擁有20%的成本優(yōu)勢,就有動力更換處理器架構(gòu)。各大牛企都在看ARM服務(wù)器,因為Intel壟斷太厲害,大家都希望找一個取代Intel的CPU。
然而,很多企業(yè)想把Intel換掉,是因為Intel壟斷價格太貴,結(jié)果服務(wù)器廠商、互聯(lián)網(wǎng)廠商的很多利潤變相被Intel拿走了。因此,把Intel CPU換掉的前提是,新的CPU必須物美價廉,這樣才能省錢,各大牛企才有動力去換。
現(xiàn)在的情況是,ARM服務(wù)器CPU性能不如X86,特別是單核性能明顯不如X86,在生態(tài)上被X86秒殺,在價格上更貴——由于目前的ARM服務(wù)器CPU走的都是“單核性能不夠,堆核心數(shù)來湊”的路線,往往用48核、64核去戰(zhàn)Intel 24核、28核,存在芯片面積偏大的問題,加上比較有限的產(chǎn)量,成本會非常高。
因此,由于在性能、生態(tài)和價格上ARM服務(wù)器CPU對比X86 CPU都處于劣勢,因而互聯(lián)網(wǎng)巨頭只會買一些測一測、試一試,不會現(xiàn)在就海量采購大規(guī)模部署替換X86的情況。這也是高通、AMD等巨頭先后拋棄ARM服務(wù)器CPU業(yè)務(wù)的原因所在。
至于BAT這些公司“自帶干糧”去做移植軟件,這也未免一廂情愿。國內(nèi)ARM陣營廠商不是BAT的股東,BAT也不是國內(nèi)ARM陣營廠商的股東。BAT是非常商業(yè)化的公司,BAT只是對投資人和股價負(fù)責(zé),而不是對國內(nèi)ARM陣營廠商負(fù)責(zé)。
BAT幾萬名軟件工程師放下手頭的工作,去給國內(nèi)ARM陣營廠商移植軟件,工資誰出?國內(nèi)ARM陣營廠商給錢?還是BAT給自己的員工發(fā)工資?
幾萬名軟件工程師放下手頭的工作去移植軟件,耽誤掉的工作怎么辦?帶來的經(jīng)濟(jì)損失,國內(nèi)ARM陣營廠商會補(bǔ)貼么?
BAT犧牲自己的利益去成全國內(nèi)ARM陣營廠商,BAT腦子進(jìn)水了么?
何況個別國內(nèi)ARM陣營廠商已經(jīng)是國內(nèi)ICT行業(yè)很多企業(yè)的競爭對手,敵人多于朋友,和BAT已經(jīng)在一些領(lǐng)域中存在競爭了。比如在云計算上,就華為和阿里搶政府訂單打的頭破血流,阿里還為此還向相關(guān)部門投訴華為不正當(dāng)競爭。
在發(fā)布會上,阿里高管直接給華為云、騰訊云安上“拿來主義的云”標(biāo)簽,以顯示阿里飛天云“自主可控”,高華為云一等,彼此間的暗戰(zhàn)和矛盾顯而易見。
在這種情況下,要讓阿里做出巨大犧牲去扶持自己競爭對手的ARM服務(wù)器的可能性并不高,特別是阿里麾下的中天微已經(jīng)押寶RISC-V,扶持中天微完善RISC-V的生態(tài)顯然比扶持競爭對手更符合阿里的商業(yè)利益。
5年后會怎樣,鐵流不敢說,至少在當(dāng)下,一些媒體無限吹捧ARM服務(wù)器CPU的商業(yè)前景是非常不客觀的。
從市場反應(yīng)來看,真正沖擊Intel的并非是各路ARM,還是同屬X86陣營的AMD,原因就在于之前提到的三個因素:性能、價格、生態(tài),AMD達(dá)到了門檻,而華為等ARM陣營廠商還遠(yuǎn)未能及格。
華為ARM服務(wù)器可能會走 IBM 大機(jī)器的商業(yè)模式
關(guān)于高通ARM服務(wù)器業(yè)務(wù)大裁員,有網(wǎng)友表示,高通直接賣芯片,華為既做整機(jī),又賣芯片,可以像麒麟芯片和手機(jī)業(yè)務(wù)那樣起到相輔相成的作用,所以高通會失敗,華為能成功。
不知道是不是高通手機(jī)芯片業(yè)務(wù)直接賣芯片讓人先入為主了,其實,高通的ARM服務(wù)器業(yè)務(wù)并非像Intel、AMD那樣直接賣散片,也是定做主板后整機(jī)出售這種模式。
另外,麒麟芯片能夠起來的關(guān)鍵是安卓有完善的生態(tài),而且可以從ARM那里買到非常具有市場競爭力的CPU和GPU。但在ARM服務(wù)器方面,ARM自己的IP相對于Intel不具備競爭力,在生態(tài)上也被X86秒殺,ARM的生態(tài)只局限于嵌入式、智能手機(jī),華為要推ARM服務(wù)器,就要自建生態(tài),難度遠(yuǎn)非在做手機(jī)芯片可比。
而且即便做成了,也存在一個悖論,那就是既然自建生態(tài),那么為何不做中國版Wintel,反而給ARM打工,為ARM做嫁衣?
何況,現(xiàn)階段的ARM服務(wù)器CPU本身就是缺乏市場競爭力的,正是因此,在政府采購名錄中,可以看到各種ARM服務(wù)器的身影,華為在將買A57做集成和買A72做集成的芯片打入政府采購名錄后,鯤鵬920有可能也將進(jìn)入政府采購名錄。
從實踐上看,RISC服務(wù)器中的Alpha、SPARC、PA-RISC等基本消亡了,如今還有聲響的就是IBM的服務(wù)器,而IBM的大機(jī)器是高度依賴美國政府等對價格極度不敏感的客戶訂單來維系的。在商業(yè)市場上,面對廉價的X86服務(wù)器,IBM的機(jī)器缺乏競爭力。面對困境當(dāng)年郭士納的改革就是“砍砍砍、賣賣賣”,裁員、砍研發(fā)、砍機(jī)構(gòu),賣業(yè)務(wù)、賣技術(shù)、賣大樓,如果不是價格太貴,沒有客戶愿意買,差點(diǎn)就搶在索尼和AMD之前實現(xiàn)了超級企業(yè)賣大樓。在砍掉很多業(yè)務(wù)后,郭士納選擇了購買X86芯片做服務(wù)器,也是就是后來聯(lián)想從IBM買來的業(yè)務(wù)。
可以說,歷史已經(jīng)證明了X86的橫向整合模式在成本上相對于IBM、SUN、惠普、SGI、DEC的垂直整合模式具有天然的成本優(yōu)勢,華為如今的做法無非是重走一次IBM、SUN、惠普、SGI、DEC走過的大坑,順帶把自己的資金和國家資源拉過來填坑。
時至今日,IBM的Power越來越被邊緣化。正是因此,IBM搞了OpenPower,但還是無法逆襲??梢哉f,華為的ARM服務(wù)器CPU未來幾年的商業(yè)模式會和IBM的大機(jī)器類似,高度依賴政府、國企等受政策指令因素影響極大,且對價格不敏感的客戶的訂單。
ARM會扼殺中國版Wintel的成長
鐵流以前的文章中說過,黨政國企市場是中國版WIntel 的孵化池,最好是SW+自主內(nèi)核的操作系統(tǒng)。由于現(xiàn)實中不存在自主內(nèi)核的操作系統(tǒng),那么只能退而求其次,以SW+BSD/Linux構(gòu)間中國版Wintel。
而一旦ARM大肆入侵,獲得國家資源傾斜,那么就會擠壓中國版Wintel的生產(chǎn)空間。何況,ARM的安全風(fēng)險不容小覷。
在2015年,集成電路大基金注資中興微電子24億人民幣,中興也喊出了“中興訊龍芯+中興OS”的口號,CPU上選擇加入ARM陣營,中興OS則選擇和谷歌合作開發(fā)。之后開發(fā)了好幾款集成了A53和A72的機(jī)頂盒芯片。
結(jié)果在2016年和2018年兩次制裁中,由于ARM加入制裁,臺積電拒絕給中興的ARM芯片代工,然后中興把訂單給境內(nèi)晶圓廠,但境內(nèi)晶圓廠也不敢接單,據(jù)中興員工披露:當(dāng)被中芯國際拒單時,才意識的問題的嚴(yán)重性。中興微電子的ARM芯片隨即休克。
前不久,日本軟銀封殺了華為的通信設(shè)備,由于日資企業(yè)唯美國政府馬首是瞻,當(dāng)華為的ARM服務(wù)器業(yè)務(wù)做到通信設(shè)備的市場地位之際,沒準(zhǔn)軟銀又來一個封殺。
何況現(xiàn)在直接就上服務(wù)器芯片,本身就存在問題。
業(yè)內(nèi)人士表示:
國內(nèi)芯片的商用發(fā)展應(yīng)該是先做各種嵌入式芯、類手機(jī)等量大面廣的芯片,然后是類樹莓派等開發(fā)板芯片,然后是桌面,最后是服務(wù)器芯片?,F(xiàn)在一大堆公司,仗著國家政策和核高基補(bǔ)貼,直接就上服務(wù)器CPU,力圖在這個領(lǐng)域和Intel在商業(yè)市場競爭,錯的太離譜了,實屬不智。
鐵流認(rèn)為,當(dāng)下發(fā)展國產(chǎn)CPU,就兩條路,一條是純自主路線,就是自主指令集,自主CPU,自建生態(tài)之路,典型的代表是SW。另一條是純粹技術(shù)引進(jìn)路線,引進(jìn)國外最頂尖技術(shù),有完善生態(tài),產(chǎn)品可以直接造血的路線,這條路線就像合資車廠,雖然對自主可控毫無意義,但至少能造血,是現(xiàn)金奶牛。
而像ARM這種折中路線,在實踐中會非常尷尬,就自主性而言,不能和SW比,而且始終存在安全風(fēng)險,當(dāng)年的“一芯一系統(tǒng)”變成“三芯多系統(tǒng)”就折射出相關(guān)部門對ARM的深切憂慮和不安。就商業(yè)市場而言,ARM路線又不具備造血能力,如果沒有國家兜底,純商業(yè)市場必然悲劇,高通就是前車之鑒。因此必須要政策、要扶持,要國家資源傾斜,而這時候又會有一個悖論,那就是與其用國家資源扶持ARM,為何不去扶持SW?
這里再說明一下鐵流為何對ARM服務(wù)器不看好:
1、ARM服務(wù)器不像ARM手機(jī)芯片有完善生態(tài),需要自己耗費(fèi)巨資開荒,前期鐵定賠錢,即便做成了也是為ARM做嫁衣。就自建生態(tài)而言,為何不給SW建生態(tài)?
2、由于國內(nèi)ARM服務(wù)器CPU公司由很強(qiáng)的政商關(guān)系,可以拿核高基01專項,各種國家政策扶持和國企采購,這樣一來,等于是動用國家資源補(bǔ)貼ARM和軟銀建生態(tài)。
3、ARM具有很強(qiáng)的欺騙性。相對于X86這種明眼人一看就知道不可能自主可控的芯片,ARM被廣泛包裝和鼓吹為實現(xiàn)自主可控的有效途徑,而且已經(jīng)打入政府采購,獲得越來也多的國家資源扶持,加上一些企業(yè)輿論引導(dǎo)很強(qiáng),曝光率很高,ARM已經(jīng)被包裝為自主可控的希望之光。一位業(yè)內(nèi)人士就表示:華為造勢,XX立項,咱們跟上,分肉吃。相比之下,X86幾乎是過街老鼠,不具備欺騙性。鐵流不希望國家資源被一些廠商動用政商關(guān)系綁架,在ARM的歧路上一路狂奔。
4、按照現(xiàn)在的態(tài)勢,加上軟銀成立合資公司試圖在股市割韭菜并包裝為技術(shù)轉(zhuǎn)讓,ARM有可能成為事實上的國家指令集,中國版Wintel可能會被ARM這個特洛伊木馬扼殺于萌芽狀態(tài)。而且ARM既不安全,也不可控,中興前車之鑒歷歷在目,勿使后人復(fù)哀后人也。
評論