一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

兩種GPU之間的延遲對比 AMD RDNA2完勝NVIDIA安培

ss ? 來源:快科技 ? 作者:快科技 ? 2021-04-21 13:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CPU緩存與內(nèi)存延遲測試,相信大家都有所耳聞,但是GPU同樣的測試卻幾乎沒人做過。

ChipsAndCheese就做了一次特別的測試,對比考察了AMD、NVIDIAGPU架構(gòu)的緩存、顯存遲問題。

首先是AMDRDNA2、NVIDIAAmpere兩家最新架構(gòu)的比拼,代表是RX6900XT、RTX3090,前者在幾乎所有階段都完勝。

RNDA2架構(gòu)創(chuàng)新性地加入了InfinityCache無限緩存,提升帶寬的同時,延遲也可圈可點,二級緩存命中率上只增加了大約20ns的延遲,明顯低于Ampere。

更驚人的是,RDNA2顯存延遲和Ampere幾乎一模一樣,但是別忘了,Ampere只有兩個層級的緩存,RDNA2卻有四個。

Ampere的緩存架構(gòu)更加傳統(tǒng),SM陣列私有一級緩存到二級緩存要增加超過100ns的延遲,RDNA2從零級緩存到二級緩存則只增加了約66ns。看起來,GA102核心面積過大,也直接增加了延遲。

這正好可以解釋AMDRDNA2架構(gòu)在低分辨率下性能、能效更優(yōu)秀,因為二級緩存、三級緩存延遲很低,更適合執(zhí)行較小的負載。Ampere則相反,高負載下優(yōu)勢明顯,比如說4K分辨率。

說完了GPU之間的對比,那么GPU、CPU放在一起怎么樣呢?這里以RX6900XT、Intel四代酷睿i7-4770為例來看看。

CPU的緩存自然不是一個級別的,所以這里Y軸用了線性數(shù)據(jù),可以看到全程大大低于RDNA2,搭配DDR3-1600CL9內(nèi)存延遲只有63ns,RX6900XT、GDDR6的組合則有226ns,另外末級緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIAGPU,包括Maxwell架構(gòu)的GTX980Ti、Pascal架構(gòu)的GTX1080、Turing架構(gòu)的RTX2060Mobile。

Maxwell、Pascal其實差不多,前者整體略高一些,可能是受制于芯片面積較大、核心頻率較低。

Turing則已經(jīng)有了Ampere的樣子,一級緩存延遲低得多,二級差不多,奇怪的是顯存延遲在32MB之后偏高,原因未知。

AMD考察了TeraScale架構(gòu)的HD5850/6950、GCN架構(gòu)的HD7970,再加上RX6900XT,很明顯在逐代降低,而且是各級緩存都在同時進步。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5589

    瀏覽量

    136370
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217098
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91881
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131248
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?1845次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小<b class='flag-5'>延遲</b>場景中的性能紀錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    兩種結(jié)構(gòu): ①GPU-GPU ②CPU-GPU 這是書中介紹的一個包括了個完全通過NVlink連接的8 GPU混合立方網(wǎng)狀拓撲結(jié)構(gòu): N
    發(fā)表于 06-18 19:31

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會后,AMD GPU技術(shù)與工程研發(fā)副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細分享了RDNA 4架構(gòu)的設(shè)計理
    的頭像 發(fā)表于 03-06 11:19 ?406次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對比

    基于大眾所熟知的 NVIDIA Ada Lovelace 架構(gòu),NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA RTX 4000 Ada 和 NVIDIA
    的頭像 發(fā)表于 03-05 10:30 ?1541次閱讀

    納米銅燒結(jié)為何納米銀燒結(jié)?

    在半導(dǎo)體功率模塊封裝領(lǐng)域,互連技術(shù)一直是影響模塊性能、可靠性和成本的關(guān)鍵因素。近年來,隨著納米技術(shù)的快速發(fā)展,納米銀燒結(jié)和納米銅燒結(jié)技術(shù)作為兩種新興的互連技術(shù),備受業(yè)界關(guān)注。然而,在眾多應(yīng)用場景中
    的頭像 發(fā)表于 02-24 11:17 ?950次閱讀
    納米銅燒結(jié)為何<b class='flag-5'>完</b><b class='flag-5'>勝</b>納米銀燒結(jié)?

    ADC12D1600和ADC12D1600RF這兩種型號之間有什么區(qū)別?

    您好,板子之前采用的是ADC12D1600,現(xiàn)在想換ADC12D1600RF; 請問: 1.這兩種型號之間有什么區(qū)別?(一個高速采樣,一個射頻采樣) 2.ADC12D1600RF是pin compatible的,能否在不改變已
    發(fā)表于 01-10 06:10

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?664次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIAAMD GPU的詳細信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 -
    發(fā)表于 12-16 14:25

    兩種轉(zhuǎn)換控制模式Zone 1 Transfer和Zone 2 Transfer怎么區(qū)分使用?

    兩種轉(zhuǎn)換控制模式Zone 1 Transfer和Zone 2 Transfer怎么區(qū)分使用?現(xiàn)在想用Zone 1 Transfer模式,硬件或軟件上應(yīng)該怎么設(shè)置?
    發(fā)表于 11-19 06:20

    AMD確認2025年推出RDNA 4顯卡,光追與AI性能大幅提升

    10月30日,AMD在2024年第三季度財報電話會議上宣布了一個關(guān)于GPU的重要信息:其下一代RDNA 4顯卡計劃于2025年初發(fā)布。AMD首席執(zhí)行官蘇姿豐明確表示:“我們計劃在202
    的頭像 發(fā)表于 10-30 16:50 ?1645次閱讀

    AMDNVIDIA GPU優(yōu)缺點

    在圖形處理單元(GPU)市場,AMDNVIDIA大主要的競爭者,它們各自推出的產(chǎn)品在性能、功耗、價格等方面都有著不同的特點和優(yōu)勢。 一、性能
    的頭像 發(fā)表于 10-27 11:15 ?2531次閱讀

    噪聲傳導(dǎo)的兩種模式

    噪聲傳導(dǎo)有兩種模式,一為差模傳導(dǎo),一為共模傳導(dǎo)。
    的頭像 發(fā)表于 10-15 11:33 ?776次閱讀
    噪聲傳導(dǎo)的<b class='flag-5'>兩種</b>模式

    嵌入式MXM模塊(NVIDIA安培架構(gòu))

    電子發(fā)燒友網(wǎng)站提供《嵌入式MXM模塊(NVIDIA安培架構(gòu)).pdf》資料免費下載
    發(fā)表于 10-09 11:09 ?0次下載

    晶閘管的阻斷狀態(tài)有兩種是什么

    晶閘管(Thyristor)是一半導(dǎo)體器件,具有單向?qū)щ娦?,廣泛應(yīng)用于電力電子領(lǐng)域。晶閘管的阻斷狀態(tài)有兩種:正向阻斷狀態(tài)和反向阻斷狀態(tài)。以下是對這兩種阻斷狀態(tài)的分析。 正向阻斷狀態(tài) 正向阻斷狀態(tài)
    的頭像 發(fā)表于 08-14 16:49 ?1417次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42