一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

預言未來今后的多核CPU是什么?

電子工程師 ? 來源:網(wǎng)絡整理 ? 作者:佚名 ? 2021-03-24 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著莫爾定律的發(fā)展,IC設計者發(fā)現(xiàn)他們有許多硅,這些真實的資產(chǎn)來繼續(xù)發(fā)展。David Chisnall有些他們要去嘗試的冒險想法。

預言未來

明確的預言未來的技術(shù)是非常容易的,這東西將會變得更小,更快,更便宜。這將會在幾個世紀里實現(xiàn)并且不大可能發(fā)生改變——至少到我們開車跑起來不加油的時候。這會變得更有趣,并且我們預計未來一些東西會變得更復雜。

一些受雇于未來主義者的人僅僅是盡量預測一些東西,和提起語言正在發(fā)生的人們,不久他們就忽略了一些正確的受爭議的預測。這些接近工作有個限度,但是它不是非常有趣。

在計算機世界里一項好的技術(shù)看的是在大型計算機和超級計算機工作組上會發(fā)生什么和預測同樣的排序運算在個人電腦領(lǐng)域會產(chǎn)生怎樣的效果。當我在參加一個IBM 工程師關(guān)于他公司的新虛擬化技術(shù)的討論時,這條規(guī)則對于像我開車回家。他談論到他的公司有項優(yōu)勢是其他人的工作領(lǐng)域所沒有的:不論什么時候他們被難住,他 們會獨自去大廳的超級計算機設備那里去詢問如何解決同樣的問題在幾十年前。

這種方法在未來是很好的指導:這些東西通常降下來,從低到高的消費階層。

另一種趨勢是昂貴高端的變得越來越小。SGI的錯誤是沒有預料到這是正確的。大概10年前,SGI是一個生產(chǎn)高端昂貴圖形硬件的公司。他們一直保持這種定 位;他們最后的硬件允許一些GPU共享同一個存儲器因此緊緊的結(jié)合在一起工作。不同的是現(xiàn)在NVIDIA生產(chǎn)GPU。很多來自NVIDIA的人從前是在 SGI工作的,但是他們的管理部門不想讓他們生產(chǎn)消費級別的圖形加速設備,直到它能夠和高端昂貴的硬件相媲美時。這些人們繼續(xù)在自己的公司中,和現(xiàn)在他們 擁有20%的重要市場份額大于與SGI競爭的整個市場份額。更糟的是SGI的前途,一些十年前想要生產(chǎn)高端昂貴硬件的人們現(xiàn)在到了僅僅能夠擔負起消費稅的 地步。新使用高端昂貴設備的經(jīng)常會改變,但是最終消費部門追上。

這個階段的成就

雙核CPU第一次被商用領(lǐng)域的IBM制造出來的POWER4在幾年之前。這個主意簡單是:一些大型機器有許多CPU,如果把他們放在一個CPU中可以減少他們實際上的體積。

那些天,IntelAMD跳躍到雙核潮流上,它們的競爭朝向多核甚至更高。這是一個必然的開發(fā)環(huán)境,相應的到摩爾定律——其中一個重大的觀察錯誤會在計算 中。莫爾定律的成立是在CPU中晶體管的數(shù)量每增加一倍需要12-24個月。(這個精確的周期有時變化,取決于你什么時候問戈登?摩爾,但是它通常報出是 18個月。)如果你想花費更多錢,你可以增加更多的晶體管;舉個例子,Extreme Edition的Pentium系列把這些放在了更多緩存上。這個問題變成了他們增加了多于的晶體管。Pentium 2,1997發(fā)售,用了7.5億晶體管。Itanium 2,2004年發(fā)售,用了592億晶體管。它們大部分是緩存。CPU中加入緩存是好的,是一個增加晶體管的簡單方法,緩存很簡單,增加一些只是比芯片設計 的復制粘貼單元快了一些時間。不幸的是它開始減小,并且直接快速返回。一次全部工作進程轉(zhuǎn)載入緩存,加入一些規(guī)則沒用好處。

另一種手法是加入更多 核心,看最后的兩個CPU的晶體管個數(shù),我們看到2004年有必要生產(chǎn)80核心的Pentium 2。在十年前,它是節(jié)約的,可執(zhí)行的方案來生產(chǎn)5000個P6核心。不幸的是,電源設備僅僅可以提供一個芯片的,這意味著需要它單獨的供電設備。沒用提到 靠液氮來冷卻它提供一個穩(wěn)定的支持。這看起來盡管像存儲器技術(shù)只會在這個它們可以保存部分提供的數(shù)據(jù)的時期,每個都有自己的總線,但是你不能最低限度的使 用1000根針腳——64000跟為64位內(nèi)存總線。甚至設計他們封裝在一個芯片上分布象征一個工程挑戰(zhàn);設計主板將要鏈接存儲器通道和內(nèi)存bank是個 問題,這會給大部分PCB設計者重復的惡夢。

從芯片上拋棄一些緩存工作變慢了點。從芯片上跑多一些核心變得更慢。終于,不管怎么樣,聰明的解決方法將會出現(xiàn)的。

RISC相對于CISC

其中一次大辯論在上世紀80年代和90年代中是否RISC或者CISC指令接近的部分設計是否正確。這個主意在RISC之后提供了個簡單的指令用在平臺的復雜計算上,很快人們需要復雜指令的CISC為了他們自己的需要。

具體化的CISC設計是VAX,寫VAX匯編和寫高級代碼沒用太大不同。在稍后的VAX系統(tǒng)中,一些指令是微代碼,這些意味著分解在簡單些的真是指令后就是 在實際硬件上運行的。在VAX后,Digital發(fā)明了Alpha,這芯片相對的出色。Alpha有一個微指令集,但是運行的異常快。在幾年里,它是可以 買到的最快的微處理器。甚至到現(xiàn)在,500強計算機中還有一些基于Alpha的,一個不好的事實是這種芯片不會在現(xiàn)今的開發(fā)環(huán)境中超過五年。

在早些年,RISC做到很好。編譯器編寫者喜歡這種芯片;它可以簡單明白指令集,和它在構(gòu)建RISC指令集上比在CISC上更簡單的了解復雜語言。

第一個問題在RISC上的原理變得明顯改善在操作部分。早期RISC芯片沒有除法指令;一些甚至不能有乘法指令。相反的,他們創(chuàng)建了一連串的超過早期的指 令,像變換操作。這不是一個軟件開發(fā)問題;他們會僅復制一連串的指令以在機器結(jié)構(gòu)內(nèi)部完成除法,放一個宏指令在某些地方,用它像我們有一個除法指令時。這 樣一些人找到一個高效的方法使用除法。下一代CPU的除法指令執(zhí)行操作在幾個循環(huán)中,直到那些循環(huán)外部的數(shù)據(jù)執(zhí)行一系列的數(shù)據(jù)用起來像個代替品。這帶到更 遠的一步是Intel最后一代核心的微代碼結(jié)構(gòu)。一些連續(xù)的簡單的x86操作現(xiàn)在是一個簡單的指令集合。

RISC原理的一些部分繼續(xù)存在。它一直 廣泛的被關(guān)注像是一個好主意在指令集的正交上,舉個例子,因為提供乘法運算的方法做一件事是在浪費硅晶體。不管怎樣,簡單指令集的方法被列出。甚至現(xiàn)在的 PowerPC和SPARC芯片是占有了占有市場像RISC處理器一樣沒能意識到那些RISC創(chuàng)造的周期。

SIMD和更多

后來一個相對普通的特點在高性能計算機領(lǐng) 域,Pentium MMX是第一個x86芯片加入單指令多數(shù)據(jù)流(SIMD)指令集。這些指令精確列舉他們的建議,提供一種方法執(zhí)行同樣的數(shù)據(jù)乘法操作。稍后傳統(tǒng)(數(shù)量)指 令回去掉從另一處來的數(shù)據(jù),SIMD對應的能去掉四個數(shù)據(jù)從四個數(shù)據(jù)中,執(zhí)行同樣的操作在四次輸入上。這種運算用在許多圖片和視頻程序上。

SIMD 指令加入CPU是相對便宜的,提供一個好的回報在投入上。如果你的進程消耗你10%的CPU你要升級,你不太可能注意到這現(xiàn)在僅僅花費5%。有過你有個進 程占用了100%的CPU,你會很幸運的注意到,如果原來需要10分鐘運行的程序現(xiàn)在需要2分鐘。許多應用SIMD的好處是從SIMD到后面的類型——運 行用了大量CPU能源——因此允許它們運行的更快提供一個可察覺的改善。

超過SIMD,一些進程有合適的指令進行特定運算。VIA的C3,舉個例 子,有些指令專門用于為AES加密運算加速。C7加入了一些為SHA-1和SHA-256哈希運算的加速。像圖形,關(guān)于密碼的計算典型的基于CPU。他們 像是更加重要在將來,像這樣的數(shù)據(jù)發(fā)送到網(wǎng)絡,更多的機器和移動設備上。這不是罕見的在偷竊時查看為一個便攜電腦硬件所進行的AES加密運算;加快AES 運算在機器上用磁盤做更快。硬件加速密碼破譯不是新的。一些公司生產(chǎn)PCI卡形式的密碼加速器。

圖形處理單元(GPU)

后來只有一些電腦有一個專用的密碼加速卡,大部分有個圖形處理器。每代GPU越來越相同。這些天,GPU用在很多高性能計算機應用中,因為GPU有龐大的計算能力。在效果上,GPU時個超標量流頂點處理器,它并行處理一些SIMD指令流在很快。

在設計上,GPU和Pentium 4有許多相同的地方。他們都用了超長管線允許他們一次使用許多指令。他們執(zhí)行起來很糟糕如果其中一個管線預報了錯誤。這是Pentium 4的一個問題直到這個支流被發(fā)現(xiàn),平均大約每7個指令。它對于GPU不是大問題,這樣的設計時為了執(zhí)行特殊運算,不會陷入更多的錯誤分歧中。

現(xiàn)在 的環(huán)境在PC世界中很像20年前?;氐侥菚r,電腦有幾個處理器時不尋常的,一個時我們?yōu)槭裁匆凶龅闹醒胩幚砥鳎–PU)。CPU的一般目的時計算和協(xié)調(diào) 與其他CPU的活動。通常,工作站和高端昂貴PC有一個浮點處理器(FPU)進行浮點運算。始于80486,F(xiàn)PU同CPU在相同的領(lǐng)域消失了。另外的普 通加法運算時內(nèi)存管理單元。這個單元控制物理和虛擬內(nèi)存之間的轉(zhuǎn)換;那些日子里,你很難找到CPU里沒用MMU單元的。一個現(xiàn)代電腦有一個CPU和并行的 浮點運算器。它不需要很大的飛躍來想象Intel最終要把一個或兩個GPU核心加入CPU中。

在這點上,你或許想這是可能升級的范圍,因此它值得 向后退一步看CPU的發(fā)展。2005年,蘋果的便攜式電腦首次銷量上超過了臺式電腦。這依然在工業(yè)上跟隨。這個增長范圍在移動GPU的銷量上大大超過了在 桌面GPU上的銷量,Intel在CPU和GPU市場時最大的玩家。很少的人升級他們的GPU在便攜式電腦上。

浮點處理器,內(nèi)存控制單元和 頂點處理器已經(jīng)準備加入現(xiàn)代的處理器中。數(shù)字信號處理單元(DSP)已經(jīng)加入了一部分數(shù)量的處理器中,它們像是他們將要發(fā)現(xiàn)他們的方法不久在消費者的 CPU中。第一次用到附加的晶體管時加入了許多執(zhí)行單元,制造深流水線和更寬的超標量結(jié)構(gòu),和更多的緩存?,F(xiàn)在我們加入整個同種的處理單元。盡管只有一些 級別透過范圍。這一步從單核到雙核是巨大的改善;在我的電腦的一個CPU上分配75%的CPU資源是少有的,更多普通的將要分配50%,將要在停止共享和 其他程序或核心之間。

從雙核到四核將會是一個非常小的改善,單仍有意義。當年升級到32核或64核,事情就變得有趣了。它經(jīng)常是必須的寫線程代碼 在某些程度上并且使用起來不能有很多漏洞。這些應用一個異步信息很容易,接近于穿過,但是流行的桌面開發(fā)環(huán)境API沒有設計圍繞這個模式。在實際上,很少 的桌面軟件用到這些。一些例如,視頻編輯。舉例子,能吃掉不少拋出的像你將來預料到的CPU資源。已經(jīng)收縮的高端性能將會繼續(xù)。那些日子里,一些人主意到 1GHz Athlon和3GHz Core 2 Duo的區(qū)別在絕大多數(shù)時候。一些人需要最快的電腦可買到的已經(jīng)相當小。需要中檔速度機器的人的數(shù)量將要收縮。

移動計算和精確數(shù)據(jù)中心的繼續(xù)增長,電的消耗變得更加重要。猜想一個32核CPU允許你關(guān)閉核心當你不使用它的時候。在移動領(lǐng)域,你大概最好需要2到3個核心。

不同類型核心的CPU

如果你只有一少部分核心在你的進程上,你就開始驚嘆為什么它們存在。少數(shù)應用程序需要所有核心為了加快運行速度在專門的硬件上,因此我們用什么代替它?

我們開始看這個將要形成的趨勢。例子包含了蘋果的Core視頻;它將會運行在你的CPU上如果你需要,它有在CPU的頂點單元如果有,或者GPU需要更快。 OpenSSL將會運行在密碼加速卡上如果它存在,或者運行在CPU上如果它沒有。存在于普通運算的抽象接口是一種功能使它更加容易在硬件上執(zhí)行;只有一 些小的變化是必須使用一些功能的優(yōu)勢。我們看到OpenGL上的一些相同的東西;頂點變換和光線運算在圖形硬件上必須有個新驅(qū)動要寫,但是不能修改現(xiàn)行的 應用代碼。最重要的,專用的硅制造的硬件的效率比一般用途的硬件效率高在未來的工作上,電能的消耗像是更少。

如果讓硅進入太空,為什么沒有讓一個 CPU進入死亡?一個密碼加速器呢?專用硬件在其它昂貴的邏輯計算上如何?當他們不用時,你可以關(guān)閉他們。當年需要時,他們將會占用一點能源允許同樣的計 算在普通硬件上,第一步這里整合了FPU和SIMD單元。下一步將要像整合GPU那樣在一起。超越這些,它好像關(guān)系到大多數(shù)專用硬件的優(yōu)勢。在一些實例 上,我們將會簡單的看到擴展的基本指令集(像發(fā)生在浮點和SIMD指令的)提供運算一些在邏輯上的傳統(tǒng)運算。終于,我們看起來像是那些引申的超過單指令。

我看起來有個主意是封裝到FPGA中像是十分動人的。這將允許許多靈活的運算,但是像一個有意義的能源消耗。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52465

    瀏覽量

    440332
  • 雙核cpu
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    7858
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    10015

    瀏覽量

    141540
  • 浮點處理器
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    7741
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    睿擎多核 SMP 開發(fā):極簡開發(fā),超強性能——睿擎派開發(fā)板0元試用

    :計算任務占用總線帶寬,導致PWM輸出抖動超百納秒。算力浪費:實時任務因資源競爭(如鎖爭用)出現(xiàn)CPU空轉(zhuǎn)。調(diào)試復雜化:故障定位需追蹤多核交互與資源爭用,耗時耗力。R
    的頭像 發(fā)表于 05-29 17:04 ?427次閱讀
    睿擎<b class='flag-5'>多核</b> SMP 開發(fā):極簡開發(fā),超強性能——睿擎派開發(fā)板0元試用

    國產(chǎn)電腦CPU性能排行榜TOP7:CPU緩存/主頻/多核實測數(shù)據(jù)分析

    在科技飛速發(fā)展的今天,電腦CPU(中央處理器)無疑是計算機性能的核心部件。而長久以來,國際品牌在這一領(lǐng)域占據(jù)著主導地位,給人一種國產(chǎn)CPU性能不行的刻板印象。然而,隨著技術(shù)的不斷進步和研發(fā)投入的加大,國產(chǎn)電腦CPU性能已經(jīng)取得了
    的頭像 發(fā)表于 04-29 10:38 ?612次閱讀
    國產(chǎn)電腦<b class='flag-5'>CPU</b>性能排行榜TOP7:<b class='flag-5'>CPU</b>緩存/主頻/<b class='flag-5'>多核</b>實測數(shù)據(jù)分析

    熱成像儀為何都在瘋狂卷多核處理器?“多核大戰(zhàn)”背后的真相你知道嗎?

    熱成像儀進入“多核”時代,這不是噱頭,而是需求在變。 從黑夜中識別生命體,到復雜地形中實現(xiàn)熱源追蹤,過去主要用于軍事和工業(yè)的熱成像儀,如今正越來越多地進入民用市場。而隨著使用場景的復雜化,“看得見
    的頭像 發(fā)表于 04-27 15:41 ?247次閱讀

    信創(chuàng)國產(chǎn)CPU推薦

    cpu
    jf_10805031
    發(fā)布于 :2025年04月23日 17:20:43

    SEGGER SystemView支持多核行為的觀察和驗證

    2025年2月,SEGGER宣布其實時軟件驗證和可視化工具SystemView增加了多核支持,將其功能擴展到單個芯片上具有多個CPU內(nèi)核的系統(tǒng)。
    的頭像 發(fā)表于 02-07 11:24 ?645次閱讀
    SEGGER SystemView支持<b class='flag-5'>多核</b>行為的觀察和驗證

    GPU渲染才是大勢所趨?CPU渲染與GPU渲染的現(xiàn)狀與未來

    技術(shù)的不斷進步,尤其是GPU性能的顯著提升,越來越多的行業(yè)專家和從業(yè)者開始預測未來的渲染工作將逐步轉(zhuǎn)向GPU渲染。然而,CPU渲染真的會被GPU渲染逐漸取代乃至消失
    的頭像 發(fā)表于 02-06 11:04 ?673次閱讀
    GPU渲染才是大勢所趨?<b class='flag-5'>CPU</b>渲染與GPU渲染的現(xiàn)狀與<b class='flag-5'>未來</b>

    QorIQ?T1042多核處理器

    QorIQ?T1042多核處理器T1042 QorIQ高級多核處理器綜合了數(shù)據(jù)網(wǎng)絡、電信/數(shù)據(jù)通訊、無線網(wǎng)絡基礎設施和國防軍事/航天工程應用所需要的性能卓越數(shù)據(jù)線路加速及網(wǎng)絡和外圍總線接口
    發(fā)表于 01-10 08:48

    FPGA+GPU+CPU國產(chǎn)化人工智能平臺

    平臺采用國產(chǎn)化FPGA+GPU+CPU構(gòu)建嵌入式多核異構(gòu)智算終端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等組合模式,形成低功耗、高可擴展性的硬件系統(tǒng),結(jié)合使用場景靈
    的頭像 發(fā)表于 01-07 16:42 ?1075次閱讀
    FPGA+GPU+<b class='flag-5'>CPU</b>國產(chǎn)化人工智能平臺

    DOT800 多核混合信號測試儀

    DOT800將兩臺測試儀的能力融合到一個只有測試頭的系統(tǒng)中,采用創(chuàng)新的面向器件的儀器,所有模擬、數(shù)字和信號處理資源都集中在一個功能強大的可配置主板上。測試性能優(yōu)越,多站點效率>99.5%。多核
    的頭像 發(fā)表于 01-03 11:40 ?441次閱讀
    DOT800 <b class='flag-5'>多核</b>混合信號測試儀

    Keystone多核器件系列原理圖核查表

    電子發(fā)燒友網(wǎng)站提供《Keystone多核器件系列原理圖核查表.pdf》資料免費下載
    發(fā)表于 09-19 11:26 ?0次下載
    Keystone<b class='flag-5'>多核</b>器件系列原理圖核查表

    嵌入式系統(tǒng)的未來趨勢有哪些?

    智能家居領(lǐng)域,嵌入式系統(tǒng)可以集成語音識別和自然語言處理技術(shù),去實現(xiàn)智能家電的語音控制。 2. 更強大的處理能力 在未來的嵌入式系統(tǒng)將具備更加強大的處理能力,以滿足日益變得復雜的計算需求。這包括采用多核
    發(fā)表于 09-12 15:42

    CPU單核性能與多核性能的區(qū)別

    CPU的單核性能與多核性能在多個方面存在顯著的差異,這些差異主要體現(xiàn)在處理能力、應用場景、性能瓶頸以及技術(shù)發(fā)展等方面。以下是對兩者區(qū)別的詳細探討。
    的頭像 發(fā)表于 09-02 14:42 ?1.3w次閱讀

    什么是CPU緩存?它有哪些作用?

    CPU緩存(Cache Memory)是計算機系統(tǒng)中一個至關(guān)重要的組成部分,它位于CPU與內(nèi)存之間,作為兩者之間的臨時存儲器。CPU緩存的主要作用是減少CPU訪問內(nèi)存所需的時間,從而提
    的頭像 發(fā)表于 08-22 14:54 ?6072次閱讀

    多核CPU的優(yōu)勢是什么

    多核CPU(Central Processing Unit,中央處理器)作為現(xiàn)代計算機技術(shù)的重要里程碑,其優(yōu)勢在于顯著提升了計算性能、多任務處理能力、系統(tǒng)穩(wěn)定性以及能效比等多個方面。以下將詳細闡述多核
    的頭像 發(fā)表于 08-22 14:30 ?5300次閱讀

    AMD將推出Zen5架構(gòu)CPU,效能比Zen4快40%

    AMD的Zen 5 CPU架構(gòu)采用了臺積電的3納米制程。雖然目前關(guān)于Zen 5 CPU的細節(jié)尚不清楚,但預計將提高性能效率,內(nèi)建人工智能和機器學習優(yōu)化,并重新管道化前端。據(jù)報道,單核心效能將提升15%,多核心效能將提升30%,準
    的頭像 發(fā)表于 08-08 14:25 ?975次閱讀