一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何定義AMD第二代線程撕裂者2990WX

454398 ? 作者:工程師吳畏 ? 2018-10-24 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

就在昨天AMD第二代線程撕裂者旗艦Threadripper 2990WX外觀正式解禁,AMD官網(wǎng)也揭露了其部分性能,得益于其擁有高達32個核心64個線程,Threadripper 2990WX輕松拿下了消費級市場CPU之王的頭銜,此前坐在王座上的i9-7980XE被輕松秒殺,可謂一時之間風光無限。但俗話說的好,現(xiàn)在有多風光,以前就有多折墮(落魄的意思),AMD也不例外。就在2年以前,AMD還是一個被Intel無視的對手,產(chǎn)品性能與Intel有巨大的鴻溝,股價最低時僅為2美元出頭,瀕臨破產(chǎn)。AMD會這么落魄,其中一個很主要的原因是因為當年推出的Bulldozer,推土機處理器微架構(gòu)。

就在前兩天,國外媒體ExtremeTech就總結(jié)了至今為止最糟糕的10款CPU,其中推土機(Bulldozer)進入了前三甲的位置,由此可見推土機的失敗,是一個比較公認的事實。今天,在Threadripper 2990WX意氣風發(fā)的日子,PConline曉邊就帶領(lǐng)大家回顧一下當初AMD這個失敗的架構(gòu),看看它從誕生到落幕,作為一個失敗者的故事。

推土機的誕生:背負復仇的使命AMD是一家富有冒險精神的公司,雖然他的營收規(guī)模僅為Intel的1/10,但其敢于在在HT總線、DDR內(nèi)存、多核處理器等技術(shù)做創(chuàng)新,本世紀初憑借K8架構(gòu),其處理器在ipc和效能上大幅領(lǐng)先奔騰4,在這段時間里Intel被AMD“教做人”。但Intel畢竟還是CPU界的大哥,豐厚的財力規(guī)模、海量的人才儲備、巨大的業(yè)界影響力和與OEM核心伙伴堅固的關(guān)系都成為Intel翻盤的資本。

當年P(guān)Conline對Core i系列做的評測

終于,在2006年,Core系列處理器一鳴驚人,首批推出的Core 2 Extreme 6800和Core 2 Duo E6300都顯示出了無與倫比的效能。不僅超越上代chanpin40%之多,在功耗發(fā)熱上的表現(xiàn)也讓人瞠目結(jié)舌,Intel的產(chǎn)品完成看一次華麗的逆襲。如果說Core首批推出的處理器型號是為Intel吹響了反擊的號角,那么以Nehalem為架構(gòu)的Core i系列處理器,則徹底奠定的Intel后來13年稱霸CPU市場的基礎(chǔ)。

強大的Intel

2008年11月,Intel發(fā)布了Core i7 965E/920處理器,原生四核心,內(nèi)部整合內(nèi)存控制器、使用了打破內(nèi)存帶寬傳輸瓶頸的QPI總線架構(gòu)和HT超線程技術(shù),憑借異想天開的Turbo睿頻加速技術(shù)將處理器的能耗比提高到了極致,酷睿處理器的發(fā)布是一個劃時代的改變,它令人信服的KO了AMD當時的K10架構(gòu)處理器,逼迫對方只能依靠性價比或者“開核”等騷操作才能在市場占據(jù)為數(shù)不多的份額。

嘗到成功的甜頭,AMD自然不會這么輕易接受失敗,為了改變市場局面,AMD傾盡全力的投入到下一代革命性架構(gòu)的研發(fā)當中,并在2011年推出了第一代推土機處理器,但當時誰也沒料到,推土機架構(gòu)處理器的推出,是AMD在CPU市場徹底潰敗的開始。

2推土機的架構(gòu):模塊化回頂部

推土機架構(gòu):尷尬的“革新者“CPU的微架構(gòu)與制作工藝直接決定了CPU的效能,優(yōu)化微架構(gòu)與更新制作工藝成為CPU廠商提升CPU效能的最重要途徑,推土機架構(gòu)便是當年AMD嘔心瀝血做出的CPU微架構(gòu)。

早期AMD在宣傳推土機架構(gòu)時提出了不少的創(chuàng)新點,概括起來有1、全新模塊化設(shè)計,更高效、核心擴展更容易。2、32nm SOI制作工藝,功耗控制更為出色。3、全新多線程架構(gòu),多線程運算性能更強。4、指令4發(fā)射(K10只有3發(fā)射)與AVX指令,整數(shù)/浮點運算更強,單核心性能提升。5、第二代Turbo Core技術(shù),更好適應(yīng)各種應(yīng)用環(huán)境。

其中推土機架構(gòu)的核心基礎(chǔ)和靈魂,就是模塊化設(shè)計。大家都知道傳統(tǒng)意義下CPU擁有更多的物理核心,性能會更強,但是成本也會更高,也因此Intel在酷睿處理器上應(yīng)用了SMT技術(shù),也就是超線程。SMT可以讓一個CPU核心的多個線程共享資源并同步執(zhí)行,硬件上幾乎不需要增加成本,不過效能肯定沒有更多的物理核心來的強。

AMD“推土機”微架構(gòu)

AMD為了平衡成本和多線程效能的問題,獨特的推出CMT技術(shù)。AMD在“推土機”上把兩個核心及相關(guān)單元封裝成一個模塊,兩個核心共用一個浮點運算單元,但每一個核心都有完整的整數(shù)運算單元,F(xiàn)X-8150由四模塊組成八核心,浮點單元實際上只有四個,以往CPU是每個核心一個浮點單元的。這樣四核心由雙模塊組成,六核心由三模塊組成,如此類推。采用模塊化設(shè)計的好處是可以減少冗余電路,堆砌CPU核心更容易,這在當時真的是一個天馬行空的創(chuàng)意。AMD把這個稱為CMT物理多核,也因此,與其說推土機的8核CPU叫8核處理器,筆者曉邊更愿意稱它做4模塊8線程處理器,因為它每一個”核心“其實都是不完整的殘疾核心,并沒有單獨的浮點運算模塊,但這樣做的好處就是,CPU以相對較小的成本,獲得了8個完整的整數(shù)運算單元,高端處理器才擁有的8個線程。

AMD在推土機這樣設(shè)計,其實原因有三個:其一是是他認為目前CPU中超過80%的運算都是整數(shù)運算,增加一個整數(shù)單元的好處是顯而易見的,用增加5%的核心面積的微小代價即可換來80%的整數(shù)性能提升,而浮點運算在未來則可以交給GPU負責,這樣更加高效。其二是在未來,通用運算會持續(xù)向多線程發(fā)展,對線程的要求是無限的。其三是未來大幅提升CPU頻率是可以實現(xiàn)的,這可以彌補處理器單線程羸弱的問題。

AMD的賭徒企業(yè)風格在推土機的研發(fā)設(shè)計中體現(xiàn)的淋漓盡致,他在未來處理器發(fā)展方向上打了三個賭,可惜的是在當時沒有一個賭對了。

8核推土機架構(gòu)

搭載四個模塊八個線程的高級桌面處理器有大量的整數(shù)線程富余,但大多數(shù)用戶的工作量仍然沒法被平均分配到八個線程上去(簡單的說就是大多數(shù)程序多線程優(yōu)化不好)。單線程的運行依舊占據(jù)了用戶絕大多數(shù)使用的使用場景。另一方面,浮點單元的共享意味著充滿浮點算術(shù)的應(yīng)用程序就沒有足夠的運行資源。雖然基于GPU的計算在一些特定工作中非常重要——比如科學超級計算——但主流應(yīng)用程序還是更依賴CPU來做浮點運算。

推土機的架構(gòu)帶來了處理器單核性能的倒退,甚至比不上自家上代六核旗艦Phenom II X6 1090T,更不要說去和Intel當時的SNB處理器比劃了。而在AMD的設(shè)想中單核性能的倒退能通過大幅提升處理器頻率改善,但是使用更落后的32nm制程的推土機處理器一味提升頻率,結(jié)果就是在功耗發(fā)熱方面成為大火爐(這種情況在打樁機時顯現(xiàn)的極致)。

推土機旗艦FX-8150

這樣的設(shè)計造成的另一個結(jié)果就是,最吃浮點運算性能和單核性能的大多數(shù)游戲表現(xiàn)中,推土機甚至不如”肥龍2“,只能在SNB處理器后面吃塵,這在DIY市場是致命的,畢竟大多數(shù)DIY玩家都是為了游戲才去玩DIY硬件。消費市場不買賬,口碑逐漸崩壞,推土機架構(gòu)的結(jié)局似乎已經(jīng)可以預見。

3推土機的發(fā)展:農(nóng)用機器系列處理器回頂部

打樁機:不屈的挑戰(zhàn)者但終成笑柄

AMD當時CPU的發(fā)展 路線圖

AMD在推出推土機架構(gòu)處理器后,市場反饋并不太好,但這畢竟只是第一代,也可能是市場和軟件環(huán)境還沒適應(yīng)這個處理器中的新物種。于是AMD在第二年便推出推土機小修小改的版本,Piledriver打樁機架構(gòu)處理器。與推土機相比,同為是模塊化設(shè)計的“打樁機”核心改動主要體現(xiàn)在:1、新增FMA3、AVX1.1和F16C等新指令集;2、強化電源管理,降低產(chǎn)品功耗;3、一級、二級緩存優(yōu)化;4、核心頻率提高,TDP保持不變。

其中最主要便是這功耗的優(yōu)化,這讓處理器在相同電壓下對比上一代有了10%左右的超頻空間。雖然當時以FX8350為代表的打樁機處理器使用的僅是格羅方德落后的32nm工藝打造,但得益于其設(shè)計較長的流水線,打樁機可以輕松超頻到4.5GHz以上,以至于當時坊間的A飯都戲謔的稱”性能不夠,超頻來湊“,”超一下,又不是不能用“。為了把打樁機的性能發(fā)揮到極致,AMD當時甚至還推出了TDP高達220W,動態(tài)頻率可達5.0GHz的核彈FX9590,但其可怕的功耗和散熱供電要求,以及5.0GHz的單核性能僅相當于3.8GHz左右時的i7-4770K單核性能,都成為這款處理器走向主流市場,和讓消費者選擇它的掣肘。

FX9590僅僅是AMD發(fā)出不屈的怒吼,高頻的打樁機只能給AMD帶來大火爐的稱號,但仍然改變不了推土機家族失敗的命運,最后落得個”i3默秒全“的恥辱性頭銜。

打樁機的失敗讓AMD清醒的認識了自己,至此AMD放棄了CPU高端市場,轉(zhuǎn)而投身到另一個大坑異構(gòu)運算的研發(fā)中(詳情可以點擊這里跳轉(zhuǎn)相關(guān)文章)。此后AMD推出的Steamroller壓路機、Excavator挖掘機都僅應(yīng)用在APU和低端處理器型號身上,重點都是降低CPU的功耗,提高處理器的能耗比。雖然這些低端APU產(chǎn)品在市場獲得不少消費者青睞,但消費者選擇它的原因大都是因為其高性能的核顯,甚至民間不少網(wǎng)友笑稱買APU是買GPU送CPU,買Intel的CPU則是買CPU送GPU。

AMD的CPU也在市場徹底失去了口碑,不管從市場還是性能表現(xiàn)等各個角度來講,推土機架構(gòu)都是十分失敗的,甚至可以說被釘在了CPU歷史的恥辱柱上,以至于直到今天AMD也不敢啟用曾經(jīng)象征AMD最高性能處理器的FX后綴,畢竟FX很容易讓人聯(lián)想到推土機系列處理器。

4推土機的影響:失敗是成功之母回頂部

模塊化設(shè)計:前人栽樹后人乘涼流傳比較廣的話語總是比較有道理,比如說失敗乃是成功之母,又比如說看數(shù)碼硬件資訊就來PConline。自推土機失敗以來AMD臥薪嘗膽,終于在2017年迸發(fā)出了令人驚訝的力量,在所有人事先不看好的情況下實現(xiàn)了逆襲,發(fā)布了媲美酷睿i系列處理器的銳龍系列處理器,彼時,AMD自上一個巔峰已經(jīng)過去了13年之久。

ZEN架構(gòu)

銳龍系列處理器,能一鳴驚人的原因,很大部分得益于的架構(gòu)設(shè)計上還巧妙地采用了名為CCX(CPU Complex)的模塊化設(shè)計方案。模塊化這個字眼是不是很熟悉?你沒有看錯,模塊化的設(shè)計理念雖然是推土機失敗的根本原因,但模塊化這個詞并不是洪水猛獸,ZEN架構(gòu)則是模塊化設(shè)計理念下更成熟的產(chǎn)物。

雖然同樣采用模塊化的設(shè)計理念,但是ZEN架構(gòu)吸取了推土機的教訓,每一個核心都是完整的核心,并且大幅加強了浮點運算性能,在整數(shù)管線上,Zen有4個算術(shù)邏輯單元(ALU)和兩個地址產(chǎn)生單元(AGU)。浮點管線上,共享浮點單元的概念被廢棄了:現(xiàn)在每個核都有一對獨立的128位乘法疊加運算單元(FMA)。浮點單元內(nèi)有分開的加法和乘法管線,用于在不進行乘法累積運算時應(yīng)對更多樣的混合指令。但256位AVX指令集還是得分開在兩個FMA單元上執(zhí)行,并動用所有的浮點單元。最終結(jié)果就是Ryzen系列處理器對比推土機系列處理器在ipc方面有著超過40%的巨幅提升。

ZEN架構(gòu)

ZEN架構(gòu)中一個CCX模塊中有4個核心,每個核心擁有自己獨立的L1和L2緩存,一個CCX模塊共享8MB L3緩存。每個核心都可以選擇性地開啟或者關(guān)閉SMT功能,也可以選擇性地關(guān)閉部分核心。相比于Intel的環(huán)形布線,ZEN架構(gòu)的帶來的好處是顯而易見的。在AMD最新的處理器布局上,每一代從最高的服務(wù)器EPYC到最低端的入門級Ryzen 3系列處理器,他們都只需要設(shè)計一個Die(內(nèi)核),然后不斷堆棧即可,這對比Intel方面會省下不少的設(shè)計和流片成本,所以我們也能看到市場上同核心的Ryzen處理器售價會相比酷睿要低不少。除此以外,模塊化的設(shè)計也讓CPU核心的增加像堆棧積木那么簡單,線程撕裂者Threadripper 2990WX的誕生也是水到渠成的事情。

改善了推土機單線程羸弱,依賴高頻的缺點,并秉承著模塊化的設(shè)計理念,相信未來通用運算依然對多線程的有著極大的需求,時隔6年后,AMD再一次依靠ZEN架構(gòu)奏響進軍高端CPU市場的號角。

而在AMD依靠Threadripper 2990WX奪得消費級CPU市場王座的背后,是史上最失敗的處理器甘當墊腳石的結(jié)果。

總結(jié)

英雄總會遲暮,更何況推土機更像是一個傳統(tǒng)意義上的“狗熊”,但不管怎么說,當推土機這些老前輩看到Threadripper 2990WX如此強大時,相信也會不留遺憾的離去,消失在歷史的洪流當中。而曉邊我,也只能以此文,紀念這款被I粉嘲笑,被A飯仇恨的處理器,為大家?guī)硭墓适隆?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5586

    瀏覽量

    136340
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11077

    瀏覽量

    217032
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AMD Power Design Manager 2025.1現(xiàn)已推出

    AMD Power Design Manager 2025.1 版(PDM)現(xiàn)已推出——增加了對第二代 AMD Versal AI Edge 和 第二代 Versal Prime 系列
    的頭像 發(fā)表于 07-09 14:33 ?267次閱讀

    AMD第二代Versal AI Edge和Versal Prime系列加速量產(chǎn) 為嵌入式系統(tǒng)實現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產(chǎn)品是對 Versal 產(chǎn)品組合的擴展,可為嵌入式系統(tǒng)實現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?879次閱讀

    恩智浦推出第二代OrangeBox車規(guī)級開發(fā)平臺

    第二代OrangeBox開發(fā)平臺集成AI功能、后量子加密技術(shù)及內(nèi)置軟件定義網(wǎng)絡(luò)的能力,應(yīng)對快速演變的信息安全威脅。
    的頭像 發(fā)表于 05-27 14:25 ?652次閱讀

    第二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    第二代 AMD Versal Premium 系列自適應(yīng) SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應(yīng) SoC 旨在滿足從簡單到復雜的各種 CXL 應(yīng)用需求
    的頭像 發(fā)表于 04-24 14:52 ?495次閱讀
    <b class='flag-5'>第二代</b><b class='flag-5'>AMD</b> Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    Framework召開第二代產(chǎn)品發(fā)布會,新品搶先看!

    2025年2月25日,F(xiàn)ramework在美國舊金山召開了盛大的第二代產(chǎn)品發(fā)布會。Framework發(fā)布了有史以來最大規(guī)模的一系列新品,包括Framework臺式機
    的頭像 發(fā)表于 03-19 17:55 ?721次閱讀
    Framework召開<b class='flag-5'>第二代</b>產(chǎn)品發(fā)布會,新品搶先看!

    簡單認識第二代高通3D Sonic傳感器

    目前,已有多款搭載驍龍8至尊版移動平臺的新機陸續(xù)發(fā)布,其中不少機型采用第二代高通3D Sonic超聲波指紋解鎖,為用戶帶來了更為便捷、高效的解鎖體驗。作為高通新一超聲波指紋解鎖解決方案,第二代
    的頭像 發(fā)表于 01-21 10:05 ?852次閱讀

    第二代AMD Versal Premium系列器件的主要應(yīng)用

    隨著數(shù)據(jù)中心工作負載持續(xù)呈指數(shù)級增長,存儲層也需要同等的性能提升才能跟上步伐。第二代 AMD Versal Premium 系列器件為各種存儲應(yīng)用提供了巨大優(yōu)勢,包括企業(yè)級 SSD、加密/壓縮加速器
    的頭像 發(fā)表于 01-15 14:03 ?572次閱讀

    第二代AMD Versal Premium系列產(chǎn)品亮點

    第二代 AMD Versal Premium 系列提供了全新水平的存儲器和數(shù)據(jù)帶寬,具備 CXL 3.1、PCIe Gen6 和 DDR5/LPDDR5X 接口功能,可滿足當今和未來數(shù)據(jù)中心、通信
    的頭像 發(fā)表于 01-08 11:50 ?724次閱讀

    新品 | 第二代 CoolSiC? 34mΩ 1200V SiC MOSFET D2PAK-7L封裝

    新品第二代CoolSiC34mΩ1200VSiCMOSFETD2PAK-7L封裝采用D2PAK-7L(TO-263-7)封裝的第二代CoolSiCG21200VMOSFET系列以第一技術(shù)的優(yōu)勢為
    的頭像 發(fā)表于 11-29 01:03 ?482次閱讀
    新品 | <b class='flag-5'>第二代</b> CoolSiC? 34mΩ 1200V SiC MOSFET D2PAK-7L封裝

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,納斯達克股票代碼:AMD )今日宣布推出第二代 AMD Versal Premium 系列,這款自適應(yīng) SoC 平臺旨在面向各種工作負載提供最高水平系統(tǒng)加速。
    的頭像 發(fā)表于 11-13 09:27 ?913次閱讀

    一加正式發(fā)布第二代東方屏,獲全球首個DisplayMate A++認證

    近日,一加攜手京東方正式發(fā)布第二代東方屏,并宣布將在年度旗艦產(chǎn)品一加 13 中首發(fā)搭載。去年,一加聯(lián)合京東方打造出世界上最好的屏幕——東方屏,這是一次中國屏幕歷史級的突破。本次發(fā)布的第二代東方屏,在
    的頭像 發(fā)表于 10-21 17:32 ?725次閱讀

    AMD第二代Versal自適應(yīng)SoC的主要特色

    AMD 第二代 AMD Versal AI Edge 和 Versal Prime 系列助力 AI 驅(qū)動型和經(jīng)典的嵌入式系統(tǒng)實現(xiàn)單芯片智能性??稍谛阅堋⒐?、占板面積、功能安全和信息安全性之間達到出色的平衡。
    的頭像 發(fā)表于 09-18 10:14 ?1029次閱讀

    第二代AMD Versal Prime系列自適應(yīng)SoC的亮點

    第二代 Versal Prime 系列自適應(yīng) SoC 是備受期待的 Zynq UltraScale+ MPSoC 產(chǎn)品線的繼任產(chǎn)品,該產(chǎn)品線已廣泛應(yīng)用于廣播與專業(yè)音視頻行業(yè)的設(shè)備中。第二代
    的頭像 發(fā)表于 09-14 15:32 ?959次閱讀
    <b class='flag-5'>第二代</b><b class='flag-5'>AMD</b> Versal Prime系列自適應(yīng)SoC的亮點

    新品 | 采用第二代1200V CoolSiC? MOSFET的集成伺服電機的驅(qū)動器

    新品采用第二代1200VCoolSiCMOSFET的集成伺服電機的驅(qū)動器REF-DR3KIMBGSIC2MA是為集成伺服電機的驅(qū)動器應(yīng)用而開發(fā)的升級版逆變器和柵極驅(qū)動器板。設(shè)計用于評估采用
    的頭像 發(fā)表于 09-05 08:03 ?660次閱讀
    新品 | 采用<b class='flag-5'>第二代</b>1200V CoolSiC? MOSFET的集成伺服電機的驅(qū)動器

    TMS320第二代數(shù)字信號處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320第二代數(shù)字信號處理器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-02 09:55 ?0次下載
    TMS320<b class='flag-5'>第二代</b>數(shù)字信號處理器數(shù)據(jù)表