一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力呢

Dbwd_Imgtec ? 來源:未知 ? 作者:李建兵 ? 2018-03-16 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

問:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?


「速度區(qū)別主要是來自于架構(gòu)上的區(qū)別」是一個表面化的解釋。對,架構(gòu)是不同。但是這種不同是目前各個廠家選擇的現(xiàn)狀,還是由于本質(zhì)的原因決定的?CPU 能不能增加核?GPU 那張圖為什么不需要 cache?

首先,CPU 能不能像 GPU 那樣去掉 cache?不行。GPU 能去掉 cache 關(guān)鍵在于兩個因素:數(shù)據(jù)的特殊性(高度對齊,pipeline 處理,不符合局部化假設(shè),很少回寫數(shù)據(jù))、高速度的總線。對于后一個問題,CPU 受制于落后的數(shù)據(jù)總線標(biāo)準(zhǔn),理論上這是可以改觀的。對于前一個問題,從理論上就很難解決。因為 CPU 要提供通用性,就不能限制處理數(shù)據(jù)的種類。這也是 GPGPU 永遠(yuǎn)無法取代 CPU 的原因。

其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面積。其次,CPU 為了維護(hù) cache 的一致性,要增加每個核的復(fù)雜度。還有,為了更好的利用 cache 和處理非對齊以及需要大量回寫的數(shù)據(jù),CPU 需要復(fù)雜的優(yōu)化(分支預(yù)測、out-of-order 執(zhí)行、以及部分模擬 GPU 的 vectorization 指令和長流水線)。所以一個 CPU 核的復(fù)雜度要比 GPU 高的多,進(jìn)而成本就更高(并不是說蝕刻的成本高,而是復(fù)雜度降低了成片率,所以最終成本會高)。所以 CPU 不能像 GPU 那樣增加核。

至于控制能力,GPU 的現(xiàn)狀是差于 CPU,但是并不是本質(zhì)問題。而像遞歸這樣的控制,并不適合高度對齊和 pipeline 處理的數(shù)據(jù),本質(zhì)上還是數(shù)據(jù)問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217116
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131256

原文標(biāo)題:為什么 CPU 的浮點運算能力比 GPU 差,為什么不提高 CPU 的浮點運算能力?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【中科昊芯Core_DSC280025C開發(fā)板試用體驗】+1.開箱之浮點計算對比

    模式下,確實要比FLASH下運行快速,大概要快30%左右。另外一個是就算在FLASH模式下,好像也支持將代碼先加載到RAM下,然后運行,可以提高程序運行速度。 2.帶DFU的單片機浮點運算性能,與
    發(fā)表于 06-29 10:01

    MemryX 推出浮點運算 AI 芯片,引領(lǐng)精準(zhǔn)運算新時代

    點擊藍(lán)字關(guān)注我們一、概述近年來,隨著半導(dǎo)體制程的進(jìn)步,硬件計算能力和數(shù)據(jù)量都有了飛躍性的提升,使得計算機視覺(ComputerVision)領(lǐng)域迎來了全新的發(fā)展階段。過去,圖像處理大多依賴像素級別
    的頭像 發(fā)表于 04-21 16:33 ?593次閱讀
    MemryX 推出<b class='flag-5'>浮點</b><b class='flag-5'>運算</b> AI 芯片,引領(lǐng)精準(zhǔn)<b class='flag-5'>運算</b>新時代

    搭載32位RXv2 CPU內(nèi)核以及增強型DSP和FPU的RX230系列低功耗、高性能微控制器數(shù)據(jù)手冊

    RX230 系列器件充分利用了 32 位 RXv2 CPU 內(nèi)核、經(jīng)過改進(jìn)的數(shù)字信號處理器(DSP)/浮點單元(FPU)以及低功耗技術(shù)的最佳組合,從而實現(xiàn)了極高的電源效率。即使在低電流供電能力的環(huán)境
    的頭像 發(fā)表于 03-20 17:26 ?585次閱讀
    搭載32位RXv2 <b class='flag-5'>CPU</b>內(nèi)核以及增強型DSP和FPU的RX230系列低功耗、高性能微控制器數(shù)據(jù)手冊

    ?為什么GPU性能效率峰值性能更關(guān)鍵

    在評估GPU性能時,通常首先考察三個指標(biāo):圖形工作負(fù)載的紋理率(GPixel/s)、浮點運算次數(shù)(FLOPS)以及它們能處理計算和AI工作負(fù)載的每秒8-bittera運算次數(shù)(TOPS
    的頭像 發(fā)表于 03-13 08:34 ?397次閱讀
    ?為什么<b class='flag-5'>GPU</b>性能效率<b class='flag-5'>比</b>峰值性能更關(guān)鍵

    設(shè)計了一個基于浮點數(shù)運算的協(xié)處理器,使用C語言編程時沒法輸入float型數(shù)據(jù),請問有哪些部分需要修改?

    我設(shè)計了一個基于浮點數(shù)運算的協(xié)處理器,使用C語言編程時沒法輸入float型數(shù)據(jù),請問有哪些部分需要修改?SDK,EXU_decoder浮點寄存器都需要修改嗎,謝謝
    發(fā)表于 03-07 16:03

    2024年GPU出貨量增長顯著,超越CPU

    6%的同比增長,總量超過2.51億顆,這一數(shù)據(jù)不僅彰顯了GPU市場的繁榮,也反映了當(dāng)前市場對于圖形處理能力的巨大需求。 尤為值得一提的是,與同樣作為計算機核心部件的CPU相比,GPU
    的頭像 發(fā)表于 01-17 14:12 ?526次閱讀

    西門子TIA Portal如何比較兩個浮點數(shù)相等

    概述: 由于浮點數(shù)的定義規(guī)則,導(dǎo)致浮點數(shù)不能通過二進(jìn)制精確表示,所以在浮點數(shù)計算過程中,會出現(xiàn)兩個值一樣的浮點數(shù)進(jìn)行比較相等計算時結(jié)果并不相等的情況。下面先設(shè)計一個實例說明該問題,并給
    的頭像 發(fā)表于 01-06 10:07 ?758次閱讀
    西門子TIA Portal如何比較兩個<b class='flag-5'>浮點</b>數(shù)相等

    【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比

    , atan,等等基本操作。 當(dāng)然為了測試出硬件浮點運算性能,這里很有必要在測試一下軟件浮點運算能力,方便做個測試對比,怎么做軟件
    發(fā)表于 12-30 17:55

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則運算的實現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 12:51 ?939次閱讀
    FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA中浮點四則運算的實現(xiàn)過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則運算的實現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 11:19 ?1435次閱讀
    FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現(xiàn)過程

    【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】在M23內(nèi)核上使用qfplib浮點運算庫進(jìn)行浮點運算

    運算。難道由于硬件不支持FPU, 常用的M0/M0+/M23/M3內(nèi)核就無緣浮點運算?答案是顯然不是的。 我們可以移植使用開源的qfplib庫來實現(xiàn)
    發(fā)表于 11-05 22:07

    【AG32開發(fā)板免費試用】+數(shù)據(jù)采集存儲系統(tǒng)(2)-串口輸出+浮點運算驗證

    本次學(xué)習(xí)下串口配置和輸出。 并驗證芯片的浮點運算能力。 下面直接上干貨哦。 VE 配置 SYSCLK 100 HSECLK 8 GPIO4_1 PIN_31 # LED4 GPIO4_2
    發(fā)表于 10-31 21:22

    《算力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔:從基準(zhǔn)測試到CPU微架構(gòu)的深度探索

    叫好。SIMD就像是一位指揮家,用一個指令指揮整個樂團(tuán)同時演奏,大大提高了計算效率。計算單元設(shè)計是CPU性能提升的另一重要方向。ALU(算術(shù)邏輯單元)作為CPU的核心,負(fù)責(zé)執(zhí)行整數(shù)運算
    發(fā)表于 10-19 01:21

    雙核cpu和單核cpu的區(qū)別

    雙核CPU與單核CPU在多個方面存在顯著差異,這些差異主要體現(xiàn)在處理能力、性能、運行效率、功耗以及適用場景等方面。 一、概念與結(jié)構(gòu) 雙核CPU :指在一個處理器上集成兩個
    的頭像 發(fā)表于 09-24 16:17 ?7157次閱讀

    請問AURIX TC3xx tricore架構(gòu)下浮點運算和將浮點數(shù)小數(shù)點去掉變成整數(shù)來計算哪種方式更加節(jié)省算力?

    ? tricore架構(gòu)下CPU有專門的FPU來處理浮點數(shù)運算,是否意味著用12.89參與運算,在調(diào)用FPU來計算的情況下,計算時間不會比12890參與計算的時間長,甚至可能
    發(fā)表于 08-26 06:54