芯片已經(jīng)成為生產(chǎn)力提升過程中的絕對(duì)主角。 ? 上周三,美國(guó)收緊對(duì)于我國(guó)的芯片政策,相比上次,這次更加嚴(yán)苛,不僅用于AI計(jì)算的高算力芯片被禁,還可能要波及4090這樣的消費(fèi)級(jí)產(chǎn)品。 消息發(fā)出后,4090顯卡瞬間成為微博熱搜,雖然現(xiàn)在還無法確定4090顯卡是否會(huì)正式出現(xiàn)在這一波的名單中,但從美國(guó)修改政策頻率來看,芯片已經(jīng)成為生產(chǎn)力提升過程中的絕對(duì)主角。 ? 盡管近些年,我們?cè)?a href="http://www.www27dydycom.cn/tags/gpu/" target="_blank">GPU或者說加速計(jì)算芯片上出現(xiàn)了壁仞100這樣不錯(cuò)的產(chǎn)品,但去年剛流片成功的它,今年就被寫上了實(shí)體清單,所以壁仞100大規(guī)模量產(chǎn)很有可能將被推遲。因此,目前在市場(chǎng)上我們還看不到類似英偉達(dá)或者AMD的國(guó)產(chǎn)GPU。 但在起步更早的國(guó)產(chǎn)CPU領(lǐng)域,已經(jīng)可以看到一些可以達(dá)到國(guó)際主流水平的產(chǎn)品了,比如在這個(gè)月GMIF2023大會(huì)上,龍芯宣布最新CPU——3A6000將會(huì)在這個(gè)季度正式發(fā)布。 ? 作為一直關(guān)注***領(lǐng)域的我們,也是早早申請(qǐng)了媒體測(cè)試機(jī),終于在兩周前拿到了搭載3A6000的主機(jī)。
***啥樣?
打開主機(jī),不僅主板和CPU出自龍芯,其余配件也都出自國(guó)產(chǎn)廠商,內(nèi)存和硬盤也分別來自紫光和大華,機(jī)箱電源也是來自愛國(guó)者。只有顯卡采用了AMD的RX580芯片,但戰(zhàn)狼的型號(hào)命名,讓它在一眾國(guó)產(chǎn)配件前也不是很違和。 龍芯3A6000實(shí)拍圖,右上角的ES代表測(cè)試版 這塊最新主板上還集成了龍芯自主研發(fā)的最新7A2000橋片,除了用來控制像USB,音頻,網(wǎng)絡(luò)這樣的接口外,里面還集成了龍芯自研的GPU芯片,也就是說,即使不裝上顯卡,這臺(tái)電腦依然可用,并且實(shí)現(xiàn)了全部配件100%國(guó)產(chǎn)化。 龍芯自主研發(fā)的7A2000橋片,帶有GPU功能 在系統(tǒng)方面,除了主流的國(guó)產(chǎn)統(tǒng)信操作系統(tǒng)還有龍芯自研的Loongnix。兩者都是基于Linux的系統(tǒng),但為了照顧大家的習(xí)慣,在界面設(shè)計(jì)上都非常貼近Windows,所以用起來的學(xué)習(xí)成本很低。
真的追上10代酷睿了嗎?
在流片成功時(shí),龍芯官方公眾號(hào)曾發(fā)文稱,3A6000的總體性能已經(jīng)追上2020年上市的Intel第10代酷睿4核心處理器,雖然Intel最新的產(chǎn)品是第十三代,但這些年CPU性能過剩,第10代的性能已經(jīng)足以覆蓋日常辦公,娛樂和游戲等需求。 并且在頻率方面,10代i3也領(lǐng)先不少,它的基礎(chǔ)頻率就達(dá)到3.6Ghz,睿頻加速后,單核最高可以達(dá)到4.3Ghz。而龍芯3A6000的頻率和前一代一樣,只是固定的2.5Ghz,不過這次它增加了超線程技術(shù),從4核心4線程升級(jí)到了現(xiàn)在的4核心8線程。 這次測(cè)試,我們采用了兩款軟件——SPEC 2006用來測(cè)試CPU和Stream用來測(cè)試內(nèi)存速度。 SPEC作為市面上專業(yè)的測(cè)試軟件,SPEC是先編譯然后再運(yùn)行各類測(cè)試項(xiàng)目,所以這個(gè)軟件理論上可以運(yùn)行在各種架構(gòu)CPU和各類的系統(tǒng)中,無論是X86還是LongArch,無論是Windows還是Linux上,SPEC都可以用來測(cè)試當(dāng)前平臺(tái)處理器的性能。因此SPEC也成了目前主流的CPU測(cè)試軟件。
SPEC編譯過程截圖 Stream用來測(cè)試CPU和內(nèi)存之間的速度,在CPU設(shè)計(jì)中,內(nèi)存控制器是非常關(guān)鍵的一環(huán)。因?yàn)橐幚淼臄?shù)據(jù)一般都儲(chǔ)存在內(nèi)存中,所以如果CPU計(jì)算速度上去了,但是和內(nèi)存之間的數(shù)據(jù)交換速度過慢,就會(huì)大大限制CPU的發(fā)揮。所以Stream也是必要測(cè)試的一個(gè)項(xiàng)目。
Stream測(cè)試過程截圖 在SPEC2006的測(cè)試中,龍芯3A6000的整數(shù)部分單核得分40.4,多核得分146,浮點(diǎn)部分單核得分51.6,多核得分136。
SPEC得分截圖 而10代i3的只有整數(shù)單核和浮點(diǎn)多核的得分略高于3A6000,其他兩個(gè)項(xiàng)目龍芯得分均超過對(duì)手。(10代i得分:整數(shù):?jiǎn)魏?2.5 多核147 浮點(diǎn):?jiǎn)魏?1.3 多核 150) 在這個(gè)純CPU計(jì)算性能比拼中,龍芯可以說是和10代i3打了一個(gè)五五開??磥碓谟?jì)算性能方面,現(xiàn)在的龍芯可以讓大家放心了,接下來看看新一代龍芯在內(nèi)存交互上有著怎么樣的表現(xiàn)。 在Stream測(cè)試中,龍芯和內(nèi)存的最高交互速度出現(xiàn)在四線程的測(cè)試中,四個(gè)項(xiàng)目的速度都超過了40GB/S,在同樣的項(xiàng)目中,i310100F只有30GB/S,同樣的情況也出現(xiàn)在單線程和8線程的測(cè)試中。因此,在內(nèi)存控制器方面,龍芯的表現(xiàn)已經(jīng)超過10代酷睿i3了,并且還超出不少。
Stream最終成績(jī),均超過40G/S 綜合上面的這兩項(xiàng)測(cè)試來看,在理論性能方面,龍芯3A6000確實(shí)已經(jīng)有10代酷睿四核處理器的水平。那么在實(shí)際體驗(yàn)中,用起來是怎么樣的呢? 不過在此之前,要說一個(gè)非常有意思的事情,在拿到龍芯主機(jī)時(shí),為了測(cè)試兼容性,我把同事的兩條頻率為3200的16G金士頓內(nèi)存插上去,測(cè)試沒有問題后,就一直用了下去。在SPEC跑分的時(shí)候,成績(jī)總是低不少,后來把兩條國(guó)產(chǎn)內(nèi)存換上去,分?jǐn)?shù)就正常了,看來這國(guó)產(chǎn)硬件之間似乎可以產(chǎn)生某種神秘的BUFF。
***能干啥?
作為自主的研發(fā)的代表,龍芯的3A6000在底層上采用了自主研發(fā)的LoongArch(以下稱龍架構(gòu)),和Intel的X86架構(gòu)有著非常大的區(qū)別。 所以龍芯的CPU無法裝載Windows系統(tǒng),目前只能使用開源的Linux系統(tǒng),而不同的架構(gòu)和系統(tǒng)讓很多Windows上的軟件無法在龍芯的系統(tǒng)上運(yùn)行。 所以,我們?cè)跍y(cè)試完性能后,還要看看龍芯的生態(tài)軟件發(fā)展成什么樣子了,不然買回龍芯電腦只能用它來跑分,而不能用來實(shí)際使用一些日常軟件,就有些說不過去了。 龍芯目前最主要的任務(wù)肯定就是辦公生產(chǎn)力了。Linux版本的WPS已經(jīng)可以很好的適配龍架構(gòu)了,使用起來和Windows上的不能說大差不差吧,只能說一模一樣。大家看到的這篇稿子就是我在龍芯電腦上敲出來的。 ? 輕度辦公沒問題了,那么重度呢?讓我們一起測(cè)測(cè)看吧。 首先打開50M的百萬字的Word文件,基本上可以實(shí)現(xiàn)秒開,在經(jīng)過幾秒加載后,就可以順暢地編輯全文了。在打開200M的Word文件時(shí),會(huì)有3秒左右的延遲。這種情況和我日常使用的11代i3移動(dòng)處理器差不多。 接下來的50M的Excel和PPT以及500頁(yè)的PDF,都是可以實(shí)現(xiàn)秒開,并且直接編輯。但旁邊的筆記本這次就要慢上很多了。 ? 在娛樂方面,主板橋片上集成GPU就有點(diǎn)撐不住了,在播放4K本地視頻的時(shí)候,基本上處于播放PPT的狀態(tài)。 裝上RX580戰(zhàn)狼顯卡后,視頻播放就沒有什么壓力了,本地4K和B站在線4K都非常流暢,不過要說明一點(diǎn),在B站觀看4K視頻中,如果遇到彈幕較多時(shí),會(huì)出現(xiàn)掉幀的情況,并且彈幕越多,掉幀越嚴(yán)重。 ? 在游戲上,可以說是有意外收獲了,本來以為L(zhǎng)inux上并沒有什么游戲可玩。但現(xiàn)在的龍芯可以通過轉(zhuǎn)譯(可以理解為把外文翻譯成中文),可以運(yùn)行不少X86架構(gòu)上的游戲,并且流暢度都非常不錯(cuò)。 像勞拉,火炬之光2,甚至魔獸世界都可以流暢運(yùn)行。經(jīng)典的CS1.6,魔獸爭(zhēng)霸3,通過轉(zhuǎn)譯也都可以運(yùn)行起來,并且還非常流暢。 ? 在做轉(zhuǎn)譯測(cè)試的時(shí)候,發(fā)現(xiàn)3A6000居然可以運(yùn)行Photoshop,雖然會(huì)遇到字體的BUG,但日常P圖完全夠用了。 ? 像瀏覽網(wǎng)頁(yè)等日常體驗(yàn),3A6000可以說是毫無壓力,無論是一次開幾十個(gè)網(wǎng)頁(yè)還是說各大網(wǎng)站的高清視頻播放,體驗(yàn)完整性上絲毫不遜于Intel等X86平臺(tái)。
***目前的最大敵人:生態(tài)系統(tǒng)
通過理論性能測(cè)試和日常使用體驗(yàn)來看,龍芯最新的3A6000確實(shí)已經(jīng)追上2020年發(fā)布的10代酷睿四核處理器,并且這還是在頻率比競(jìng)品低了1個(gè)多Ghz的前提下。 按照龍芯董事長(zhǎng)胡偉武的介紹,龍芯目前也在踐行Intel的Tick-Tock戰(zhàn)略,目前處于打磨架構(gòu)的階段。下一代龍芯如果能用上比12nm更加先進(jìn)的制程,那么性能會(huì)變得更加強(qiáng)悍。 在2002年龍芯1號(hào)剛剛發(fā)布的時(shí)候,性能只有當(dāng)時(shí)主流型號(hào)的5%,2021年的3A5000基本能達(dá)到當(dāng)時(shí)主流性能的50%(差不多是第四代酷睿的水平),而今年的3A6000已經(jīng)基本上追上主流水平了。不得不說,龍芯這幾年的性能提升是肉眼可見的快。
圖片來源:龍芯在上證路演截圖
但這個(gè)時(shí)候不禁讓人想到一個(gè)問題,在性能達(dá)到主流后,軟件生態(tài)怎么樣?如果空有一身本領(lǐng),沒地方用,那就悲劇了。 如果想要啟動(dòng)個(gè)原神,還需要先轉(zhuǎn)譯,再繁瑣的設(shè)置一番,并且玩起來還有些字體上的BUG,那就不好了。 根據(jù)目前市面上的主流軟件生態(tài),龍芯現(xiàn)在面臨三個(gè)問題: 第一,需要有一套龍芯自己的系統(tǒng),并且這套系統(tǒng)的兼容性最好要做到像X86架構(gòu)下的Windows那樣,從Intel處理器換到AMD處理器,系統(tǒng)都可以兼容,在最新的Windows11系統(tǒng)下也可以玩20多年前Windows98上運(yùn)行的紅警2。
第二,能不能搞一套轉(zhuǎn)譯性能更好的東西,把X86上成熟的應(yīng)用做到可用,不要求以多高的性能運(yùn)行,只要兼容性最好就行。 就像蘋果搞的Rosetta1一樣,當(dāng)初Mac從IBM處理器遷移到Intel處理器時(shí),它就保證了不少關(guān)鍵程序的可用性,一直到五年后,基本上所有的程序都完成了Intel的X86架構(gòu)原生支持,Rosetta1才下線。而2020年,在蘋果宣布Mac產(chǎn)品線全部從Intel轉(zhuǎn)移到自研的M芯片后,Rosetta2正式上線,至今幫助不少像AfterEffects等專業(yè)軟件保證兼容可用。 蘋果轉(zhuǎn)向Intel芯片時(shí),專門推出Rosseta1 第三,就是如何吸引更多的開發(fā)者來開發(fā)基于龍架構(gòu)的應(yīng)用?只有開發(fā)者多了起來,龍芯應(yīng)用才會(huì)出現(xiàn)百花齊放的效果。 好在3A6000成功流片后,龍芯內(nèi)部也意識(shí)到這個(gè)問題。在今年的業(yè)績(jī)說明會(huì)中,胡偉武把龍芯自己的生態(tài)解決方案拿了出來。
首先,龍芯要基于Linux打造自己的操作系統(tǒng)——Loongnix(以下稱龍系統(tǒng))。傳統(tǒng)的Linux在大的版本更新后,軟件兼容性上常常會(huì)出問題,打個(gè)比方,就像大家從Windows10升級(jí)到Windows11,突然發(fā)現(xiàn),在Win10上運(yùn)行好好的軟件,在Win11要么無法運(yùn)行,要么運(yùn)行起來一大堆的Bug。 龍系統(tǒng)目前著重解決的就是應(yīng)用在不同版本Linux之間不兼容的問題,現(xiàn)在在龍系統(tǒng)上運(yùn)行的軟件,在大更新以后,也依然可用。在硬件兼容性上,龍系統(tǒng)的目標(biāo)也是達(dá)到任何一代龍架構(gòu)的CPU,都可以運(yùn)行最新的龍系統(tǒng)。 龍系統(tǒng)另外一個(gè)目標(biāo)就是要打造成為Linux里面的安卓,其他使用龍芯CPU的廠家可以根據(jù)自己的需求在龍系統(tǒng)上進(jìn)行魔改,就像小米在安卓上開發(fā)出自己的Miui一樣。
另外在開發(fā)應(yīng)用上,龍芯目前也在學(xué)習(xí)iOS和安卓,打算搞出一套自己的龍芯自主編程框架。幫助開發(fā)者們更好地開發(fā)基于龍架構(gòu)的各種生態(tài)應(yīng)用。相信過幾年應(yīng)該就可以在微信安卓版旁邊看到微信龍芯版了。 其次,在轉(zhuǎn)譯方面,龍芯也在努力地搞出一套高效的轉(zhuǎn)譯,因?yàn)榫哂型耆淖灾餍?,所以添?strong>一些優(yōu)化進(jìn)去,會(huì)更加方便。不過這個(gè)轉(zhuǎn)譯效果來看,目前還不夠理想,比如前面測(cè)試Photoshop,還有一些游戲等,多少會(huì)有影響使用的BUG出現(xiàn)。 希望在未來優(yōu)化過后,能做到蘋果一樣的效果就好,效率也不用特別高,能達(dá)到轉(zhuǎn)譯前的80%左右就行,主要是兼容性要好。這樣才能吸引更多的Windows用戶過來。 另外,根據(jù)介紹,接下來龍芯這套轉(zhuǎn)譯系統(tǒng)還會(huì)支持ARM上的應(yīng)用,所以不久后應(yīng)該就能看到一些安卓應(yīng)用在龍芯上跑起來了。
最后就是如何吸引開發(fā)者過來,說實(shí)話,這是一個(gè)很難破解的難題。想要有更多的開發(fā)者,就需要有很大的用戶基礎(chǔ),想要更多的用戶,就需要有開發(fā)者開發(fā)出好用的程序。 因此,想要打破這個(gè)循環(huán),就需要有一方做出部分犧牲,是用戶犧牲體驗(yàn),還是開發(fā)者犧牲收益。目前來看,龍芯的做法只能是后者。畢竟,在開放性的市場(chǎng),不能讓按著用戶的頭來用自己的產(chǎn)品。所以龍芯現(xiàn)在大力加強(qiáng)瀏覽器,影音軟件等基礎(chǔ)軟件體驗(yàn),然后再聯(lián)合微信,QQ,騰訊會(huì)議,飛書等這樣的大企業(yè)把必要的應(yīng)用生態(tài)做好,吸引更多的用戶進(jìn)來,從而進(jìn)入到一個(gè)良性循環(huán)。
芯片追趕,一切才剛開始
兩年前,我們還在為中國(guó)自主的CPU的性能突破慶祝,現(xiàn)在,3A6000的出現(xiàn),讓性能不再成為國(guó)產(chǎn)CPU的短板。我們反而開始擔(dān)心起來沒有軟件在這顆處理器上運(yùn)行起來。 起初我想用甜蜜的負(fù)擔(dān)來形容這一切,后來我發(fā)現(xiàn),想要打造自己的芯片,其實(shí)遠(yuǎn)比我們想的要難。 當(dāng)你的芯片性能足夠好的時(shí)候,你還需要建立起一整套自己的生態(tài)體系,用戶才能買單。 在這一點(diǎn)上,龍芯才剛開始。 雖然競(jìng)爭(zhēng)對(duì)手已經(jīng)霸占市場(chǎng)多年,但龍芯的機(jī)會(huì)還是有很多的。從上到下的自導(dǎo)自主,意味著很多方面優(yōu)化起來會(huì)更加方便。比如傳統(tǒng)X86平臺(tái)的電腦,在運(yùn)行一些機(jī)密軟件的時(shí)候,需要配一臺(tái)密碼機(jī)才可以,而龍芯因?yàn)閮?nèi)部添加了這些加密的指令集,所以使用龍芯電腦的時(shí)候,不需要添任何外部設(shè)備,就可以運(yùn)行這些加密的軟件。
在生態(tài)上的追擊,龍芯表現(xiàn)出的決心更大,在今年的多場(chǎng)演講中,胡偉武多次提到,在性能追平后,將全力轉(zhuǎn)到生態(tài)建設(shè)上來,目前龍芯自己就有幾百名軟件開發(fā)人員,下游的開發(fā)人員更是達(dá)到了幾十萬。相信幾年后,我們就能看到一套生態(tài)基礎(chǔ)完善,邁入良性循環(huán)的龍芯體系。 在GPU方面也是如此,現(xiàn)在我們已經(jīng)有了超過英偉達(dá)A100的壁仞100,但英偉達(dá)靠著CUDA已經(jīng)培養(yǎng)出一大批在GPU上編程的開發(fā)者。這就像蘋果的iOS一樣,背靠如此多的開發(fā)者,就會(huì)有非常多的應(yīng)用給用戶使用。對(duì)于英偉達(dá)來講,CUDA就是它的iOS。 目前剛剛起步的國(guó)產(chǎn)GPU公司也意識(shí)到這個(gè)問題,像壁仞和摩爾線程,它們?cè)谧汾s性能的同時(shí),也在大力發(fā)展自己的社區(qū),兼容目前主流的開發(fā)框架。 ***的未來,讓人無比期待,龍芯用了20年就追上了別人60年的水平,所以現(xiàn)在,請(qǐng)大家給予國(guó)產(chǎn)GPU芯片的一些寬容和支持,生態(tài)環(huán)境還需大家一同建設(shè)。
審核編輯:黃飛
?
評(píng)論