一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

M1 GPU性能:集成王者,獨立CPU的競爭對手

我快閉嘴 ? 來源:半導體行業(yè)觀察 ? 作者:半導體行業(yè)觀察 ? 2020-11-18 14:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周,蘋果公司發(fā)布了基于他們新Apple Silicon M1 SoC芯片打造新Mac產品,這個新聞在行業(yè)內引起了轟動,因為這標志著蘋果正式開啟了從Intel的x86 CPU過渡到該公司自己基于Arm架構設計的內部產品的兩年計劃第一步。

在發(fā)布會期間,我們根據該公司已經發(fā)布的Apple A14芯片(在新一代iPhone 12手機中使用)撰寫了一篇詳盡的文章,當中包括對Apple的新Firestorm內核的微體系結構的深入研究,這些內核同時為A14和新的Apple Silicon M1提供動力,如果您還沒有機會看的話,我建議您閱讀 《深度解讀蘋果M1芯片》 。

幾天以來,我們已經能夠接觸到首批Apple Silicon M1設備之一:全新的Mac mini 2020版本。在上周的分析文章中,我們基于A14得出了數字,而這次,我們根據實際的新高功率設計測量了實際性能。我們沒有很多時間,但是我們將為您帶來與新的Apple Silicon M1相關的關鍵數據點。

Apple Silicon M1:Firestorm內核的3.2GHz和約20-24W TDP?

在Apple的演示文稿中,缺少芯片時鐘頻率的實際細節(jié)以及可以保持最高性能的TDP是他們的一貫風格。

但我們可以確認,在單線程工作負載中,Apple的Firestorm內核現(xiàn)在的時鐘頻率為3.2GHz,比Apple A14的3GHz頻率提高了6.66%。只要有散熱空間,此時鐘也適用于所有內核負載,除了4個3.2GHz性能內核以外,我們在2064MHz處還可以看到4個Thunde效率內核,這也比A14上的1823MHz高出很多。

除了四個高性能的Firestorm核心之外,M1還包括四個Icestorm核心,旨在降低閑置功率并提高電池供電情境下的電源效率。4個性能內核和4個效率內核都可以同時激活,這意味著這是8內核SoC,盡管所有內核的性能吞吐量并不相同。

發(fā)布會期間最大的問題是這些設計的功耗。蘋果已經提供了包括性能和功率軸在內的幾張圖表,但是我們缺乏比較數據來得出正確的結論。

由于我們可以使用Mac mini而不是Macbook,因此這意味著設備上的功率測量非常簡單,因為我們只需將儀表連接到設備的AC輸入即可。值得一提的是,由于我們在這里測量的是交流電源,因此功率數字不能直接與電池供電的設備相提并論,因為Mac mini的電源會帶來比其他設備更大的效率損失。

尤其重要的是要記住,我們通常談到的處理器中的TDP數實際上只是此處提供的數字的一個子集,因為除了SoC,我們還在測量DRAM和電壓調節(jié)開銷,而這并不是包含在TDP數據中,也不包括筆記本電腦上的典型封裝電源讀數。

從空閑的Mac mini處于默認狀態(tài)開始,我們把打開電源后的設備看作空閑狀態(tài),在通過HDMI連接到2560p144顯示器,Wi-Fi 6和鼠標和鍵盤,我們看到的設備總功率為4.2W。鑒于我們正在測量設備的交流電源,這在低負載下可能效率很低,這在很大程度上是有意義的,并且代表了一個很好的數字。

該閑置數據還用作后續(xù)測量的基準,在這些測量中我們計算“有功功率”(active power),這意味著我們通常采用的方法是測量總功率并減去閑置功率。

在3.2GHz Firestorm內核上的平均單線程工作負載(例如GCC代碼編譯)期間,我們看到設備功率高達10.5W,有功功率約為6.3W。有功功率與我們對更高頻率的Firestorm內核的期望非常一致,并且對于Apple和M1來說是極有希望的。

在工作量更大的DRAM上,從而在Mac mini上的LPDDR4X級128位16GB DRAM上造成更大的功率損失,我們看到有功功率高達10.5W。有了這些數據,新的M1可能會給人留下深刻的印象,并且其展示能力還不到高端英特爾移動CPU的三分之一。

在多線程方案中,電源高度依賴于工作負載。在CPU利用率不高的內存密集型工作負載中,我們看到有功功率為18W,平均工作負載約為22W,在計算繁重的工作負載中峰值約為27W。這些數字通常是您希望與其他平臺的“ TDP”進行比較的數字,盡管要再次進行比較,您需要進一步減去一些在Mac mini上測算的開銷。最好的猜測是20至24W的范圍。

最后,在GPU方面,我們看到GFXBench Aztec High的功耗降低了17.3W。這將包含大量的DRAM功耗,因此Apple GPU的功耗絕對是極低的功耗,并且遠遠小于CPU可以消耗的峰值功率。

存儲差異

除了CPU和GPU上的其他內核外,M1與A14的主要區(qū)別還在于它運行在128位內存總線上,而不是在移動64位總線上。在8個16位內存通道和LPDDR4X-4266級內存中,這意味著M1達到了68.25GB / s的內存帶寬峰值。

在內存延遲方面,我們發(fā)現(xiàn)M1較之A14(預期的)減少了,在128MB完全隨機測試深度(full random test depth)下測量為96ns,而在A14上為102ns。

還需要注意的是性能核心的12MB L2緩存,盡管在這里蘋果似乎仍在對單個核心可使用的數量進行分區(qū),因為我們仍然看到8MB之后的延遲有所增加。

M1還包含一個較大的SLC緩存,芯片上的所有IP塊都應可以訪問該緩存,但我們不確定。不給過測試結果的確與A14相似,因此我們假設這是SoC上類似的16MB緩存塊,因為某些訪問模式超出了A14的訪問范圍,這在一定程度上是合理的較大的L2。

我們從未真正有機會進行測試的一個方面就是,蘋果的核心在內存帶寬方面到底有多出色。在M1內部,結果是突破性的:一次Firestorm可以實現(xiàn)高達58GB / s的內存讀取速度,而內存寫入速度則為33-36GB / s。最重要的是,根據您使用的是標量指令還是矢量指令,內存副本(memory copies)的傳輸速度可以高達60至62GB / s。單個Firestorm內核幾乎可以使內存控制器飽和的事實令人震驚,因為這是我們以前在設計中從未見過的。

因為一個內核幾乎可以利用整個內存帶寬,所以讓多個內核同時訪問事物實際上并不會增加系統(tǒng)帶寬,但是實際上由于擁塞會降低有效實現(xiàn)的總帶寬。當在內存副本(memory copies)中同時使用性能核心和效率核心時,我特別指出了這一點——4個大核心以59GB / s的內存副本(memory copies)達到峰值,但是一旦添加了效率核心,它就會降至49GB / s,當所有內核都處于活動狀態(tài)時,速度可降至46GB / s,這表明系統(tǒng)中某處中存在瓶頸。

除了增加時鐘速度,增加L2之外,這種內存提升還很有可能是M1區(qū)別于A14之外的另一個關鍵點,并讓其有能力與現(xiàn)有的x86廠商的競爭。

基準測試

由于我們使用Mac mini的時間很少,而且這不僅是一個macOS系統(tǒng),而且是一個新的基于Arm64的macOS系統(tǒng),因此我們無法使用我們通常使用的基準測試。在發(fā)布時,我們已經進行了各種可用的測試,以使我們對性能有一個大致的了解:

Cinebench是在macOS和Apple Silicon上初露頭角的一個特定基準。在基于Cinema4D的首次基準測試中,我們看到蘋果M1與市場上大部分的x86 CPU相比,擁有相當大的優(yōu)勢,但輸給了Zen3和Tiger Lake CPU,后者似乎仍然具有優(yōu)勢。

值得注意的是,在x86模式下,Rosetta2基準測試的性能不僅能夠跟上過去的Mac,而且還能勝過它們。

在多線程R23運行中,M1版本Mac具有絕對的領先優(yōu)勢。值得一提的是,我們正在嘗試訪問其他系統(tǒng)以收集更多數據,并希望進一步更新圖表。

在瀏覽器基準測試中,Apple的CPU占據了主導地位,但是人們懷疑這是由于iPhone的CPU本身,還是僅歸因于瀏覽器和瀏覽器引擎?,F(xiàn)在可以在macOS和桌面Safari上運行,并且能夠將數據與其他Intel Mac系統(tǒng)進行比較,我們可以得出這樣的結論:性能優(yōu)勢歸功于Apple的CPU設計。

Web瀏覽性能似乎是Apple CPU的頭等大事,這是有道理的,因為它是移動SoC的殺手級工作量,也是日常生活中使用最多的工作量。

在Geekbench 5中,M1再次表現(xiàn)出色,因為它實際上領先于我們的性能數據。即使在以x86兼容模式運行時,M1與上一代高端CPU的頂級單線程性能相比不相伯仲,并且大大超過了Mac mini和Macbook的先前版本。

多線程性能取決于設計的內核數和功耗效率。M1在這里輸給了2017年的15英寸Macbook Pro,它使用的Intel i7-7820HQ具有4核和8線程,得分翻倍。在收集數據點時,我們將添加更多的數據點。

M1 GPU性能:集成王者,獨立CPU的競爭對手

從Intel切換到Apple芯片上,重點主要應該放在CPU內核上,對此,我們有充分的理由,但M1在GPU方面的表示不容忽視。像他們的CPU內核一樣,蘋果已經開發(fā)了自己的GPU技術已有多年了,隨著向Apple Silicon的轉變,這些GPU設計也首次出現(xiàn)在Mac上。從性能的角度來看,這帶來的蓋板邊比蘋果的CPU還要大。

蘋果公司長期以來一直以要求GPU性能優(yōu)于一般PC OEM廠商而聞名。盡管許多英特爾合作伙伴都很樂意甚至在部分15英寸筆記本電腦中都配備了具有Intel UHD圖形和其他基準解決方案的系統(tǒng),但蘋果公司選擇在其15英寸MacBook Pro中交付獨立的GPU。而且,當他們無法在13英寸型號中安裝獨立GPU時,他們將Intel的高級Iris GPU配置與更大的GPU和片上eDRAM緩存結合使用,從而成為這些功能更強大的芯片的唯一常規(guī)客戶。

因此,一段時間以來,蘋果一直希望獲得比英特爾默認提供的更好的GPU性能。通過切換到自己的芯片,Apple最終可以通過建立具有他們想要的所有GPU性能的筆記本電腦SoC來賺錢。

同時,與向Apple Silicon過渡的CPU方面不同,圖形編程的高級性質意味著Apple幾乎不依賴于開發(fā)人員,就可以立即準備通用應用程序以利用Apple的GPU??梢钥隙ǖ氖牵腃PU代碼仍將產生更好的結果,因為幾乎沒有人聽說過純粹受GPU限制的工作負載,但是現(xiàn)有的Metal(甚至OpenGL)代碼現(xiàn)在可以在Apple的GPU上運行,這意味著它立即使所有游戲和其他受GPU約束的工作負載受益。

至于M1 SoC的GPU,毫不奇怪,它看起來很像A14的GPU。但蘋果對設計進行了一些調整,以適應Mac的敏感性(例如,各種GPU紋理和表面格式),但總的來說,差異是在API級別上抽象出來的。

總體而言,隨著M1達到A14但更大,Apple已將其4核GPU設計從該SoC擴展到了M1的8核。但與CPU時鐘速度相比,我們對GPU時鐘速度的了解甚至更少。

因此,目前尚不清楚蘋果是否真的提高了這些速度;但是如果GPU時鐘沒有提高,我會感到有些驚訝??傮w而言,按照智能手機標準,A14的4核GPU設計已經非常強大,因此8核設計就更是如此。M1的集成GPU不僅旨在超越AMD和Intel的集成GPU,他們甚至還瞄準了獨立GPU。

最后,應該指出的是,Apple為M1提供了兩種不同的GPU配置。Mac Mini和MacBook Pro的芯片均啟用了所有8個GPU內核。同時,對于Macbook Air,它取決于SKU:入門級型號具有7核配置,而更高級別的型號具有8核。這意味著入門級Air可獲得最弱的GPU(比完整的M1落后約12%)。

讓我們開始了解GPU性能,讓我們從GFXBench 5.0開始。這也是我們筆記本電腦評測的常規(guī)基準之一,因此它為我們提供了一個很好的機會,將基于M1的Mac Mini與Mac生態(tài)系統(tǒng)內外的各種其他CPU / GPU組合進行比較。

總體而言,這并不是一個完全公平的測試,因為Mac Mini是小型臺式機,而不是筆記本電腦,但是由于M1是筆記本電腦專用芯片,因此至少可以使我們了解M1在達到最佳狀態(tài)時的性能。

總體而言,M1的GPU在這里非常強大。在正常和高設置下,它都遠遠領先于其他集成GPU,甚至是獨立的Radeon RX 560X。只有到了NVIDIA的GTX 1650更強的GPU時,M1才漸落下風。

順便說一句,我還通過Rosetta自由運行了基準測試的x86版本,以了解性能損失。至少在GFXBenchAztec Ruins中沒有。GPU的性能與本機二進制文件和二進制轉換幾乎完全相同。

最后,我們以完全愚蠢的合成基準快速瀏覽了更廣闊的領域,我們有了3DMark Ice Storm Unlimited。由于Apple Silicon Macs能夠運行iPhone / iPad應用程序,因此我們能夠通過運行iOS版本首次在Mac上運行此基準測試。這是為OpenGL ES 2.0時代建立的非常古老的基準,但有趣的是它的性能甚至比GFXBench好。Mac Mini的性能恰好足以滑過配備GTX 1650的筆記本電腦,盡管這不會經常發(fā)生,但它顯示了M1的強大功能。

為蘋果新Mac的發(fā)布而更新的另一個GPU基準是BaseMark GPU。這不是我們的常規(guī)基準測試,因此我們手頭上沒有其他非Mac筆記本電腦的分數,但是它使我們可以更進一步地了解M1與其他Mac GPU產品的比較。

2020年的Mac Mini仍然領先宇2018年基于Intel的Mac Mini,就此而言,它也比配備Radeon Pro 560的2017年MacBook Pro至少快50%。當然,較新的MacBook Pro會做得更好,但是請記住,這是一個集成的GPU,整個芯片比MacBook Pro的CPU消耗的功率更少,因此不必擔心獨立的GPU。

最后,將理論付諸實踐,我們有了《Rise of the Tomb Raider》。該游戲于2016年發(fā)布,具有適當的Mac端口和內置基準,使我們能夠在游戲場景中查看M1并將其與其他Windows筆記本電腦進行比較。誠然,這款游戲的年齡稍大一些,但其性能要求與M1旨在提供的性能非常匹配。最后,應該指出的是,這是x86游戲,尚未移植到Arm上,因此游戲的CPU端通過Rosetta運行。

在我們的768p Value設置下,Mac Mini在這里提供了超過60fps的速度。它再次大大領先于2018年基于Intel的Mac Mini以及該堆棧中的所有其他集成GPU。即使是15英寸的MBP及其Radeon Pro 560仍然落后于Mac Mini 25%以上,Ryzen筆記本電腦和Radeon 560X最終要與Mac Mini保持一致。

同時,通過“發(fā)燒友”設置將事情提高到1080p時,發(fā)現(xiàn)基于M1的Mac Mini仍提供不到40fps的速度,并且比上述Ryzen + 560X系統(tǒng)高出20%以上。這確實使Mini遠遠落后于GTX 1650-Rosetta和常規(guī)API效率低下可能起了一定作用-但它表明了擊敗Apple集成GPU所需要的能力。Mac Mini以39.6fps的速度可以在1080p上以良好的圖像質量設置進行播放,并且相當容易地降低分辨率或圖像質量以使其恢復到60fps以上。全部在集成GPU上。

最終,這些基準測試非常有力地證明了M1的集成GPU將不辜負蘋果公司在高性能GPU方面的聲譽。蘋果公司為Mac推出的首個Apple內置GPU的速度明顯快于我們能夠使用的任何集成GPU,并且無疑將為筆記本電腦的GPU性能樹立新的高標準。

根據蘋果自己的die照片,很明顯,他們將M1模具的相當一部分用于GPU和相關的硬件上,其收益是可以與低端獨立GPU媲美的GPU。鑒于M1只是未來的基線,蘋果將需要更強大的GPU用于高端筆記本電腦和其余臺式機,看到基線的GPU時蘋果及其開發(fā)者生態(tài)系統(tǒng)可以做什么將非常有趣即使是最便宜的Mac,其性能也很高。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    459

    文章

    52493

    瀏覽量

    440651
  • iPhone
    +關注

    關注

    28

    文章

    13500

    瀏覽量

    206112
  • 蘋果
    +關注

    關注

    61

    文章

    24545

    瀏覽量

    203926
  • Mac
    Mac
    +關注

    關注

    0

    文章

    1117

    瀏覽量

    53085
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構的基礎知識,但該部分知識比較晦澀難懂,或許是由于我一直從事的事芯片
    發(fā)表于 06-18 19:31

    CPUGPU:渲染技術的演進和趨勢

    渲染技術是計算機圖形學的核心內容之一,它是將三維場景轉換為二維圖像的過程。渲染技術一直在不斷演進,從最初的CPU渲染到后來的GPU渲染,性能和質量都有了顯著提升。一、從CPU
    的頭像 發(fā)表于 02-21 11:11 ?740次閱讀
    從<b class='flag-5'>CPU</b>到<b class='flag-5'>GPU</b>:渲染技術的演進和趨勢

    RK3588性能設置 CPU GPU DDR NPU 頻率設置

    RK3588 CPU GPU DDR定頻策略
    的頭像 發(fā)表于 02-15 16:09 ?1992次閱讀

    THS8135進行YUV輸出,如何配置M1,M2,還有SYNC_T這些信號?

    您好!我現(xiàn)在在使用THS8135的過程中遇到了點小麻煩,我想進行YUV輸出,但是不知道如何配置M1M2,還有SYNC_T這些信號,出來的結果和想要的結果不一樣
    發(fā)表于 02-14 06:26

    GPU渲染才是大勢所趨?CPU渲染與GPU渲染的現(xiàn)狀與未來

    技術的不斷進步,尤其是GPU性能的顯著提升,越來越多的行業(yè)專家和從業(yè)者開始預測未來的渲染工作將逐步轉向GPU渲染。然而,CPU渲染真的會被GPU
    的頭像 發(fā)表于 02-06 11:04 ?680次閱讀
    <b class='flag-5'>GPU</b>渲染才是大勢所趨?<b class='flag-5'>CPU</b>渲染與<b class='flag-5'>GPU</b>渲染的現(xiàn)狀與未來

    2024年GPU出貨量增長顯著,超越CPU

    近日,根據知名市場研究機構Jon Peddie Research(JPR)最新發(fā)布的報告,2024年全球GPU(包括集成顯卡和獨立顯卡)市場呈現(xiàn)出強勁的增長態(tài)勢。報告顯示,該年度GPU
    的頭像 發(fā)表于 01-17 14:12 ?522次閱讀

    M1攜手6D Technologies云原生BSS平臺實現(xiàn)轉型

    M1攜手6D Technologies云原生BSS平臺,成功實現(xiàn)數字化轉型 印度班加羅爾2025年1月15日?/美通社/ -- 數字化轉型解決方案的全球領導者6D Technologies欣然宣布
    的頭像 發(fā)表于 01-15 15:42 ?445次閱讀

    中軟高科身份證讀取及M1卡讀寫二合一機具開發(fā)文檔

    中軟高科這款機具除了二代身份證閱讀功能,還可以對M1卡進行讀寫操作,從而實現(xiàn)身份證識讀與M1制卡二合一。 機具照片 開發(fā)文檔
    發(fā)表于 01-04 11:25

    如何提高GPU性能

    學習和機器學習等領域發(fā)揮著重要作用。 1. 硬件升級 a. 更換高性能GPU 最直接的提高GPU性能的方法是升級到更高
    的頭像 發(fā)表于 10-27 11:21 ?2499次閱讀

    TAS5611有M1,M2,M3模式設置腳,TAS5611的AD模式 BD模式有什么區(qū)別?

    TAS5611有M1,M2,M3模式設置腳,請教一下芯片的AD模式BD模式有何區(qū)別?
    發(fā)表于 10-16 07:55

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    芯片UMA與NUMA 第6章 經典算力 CPU 芯片解讀 6.1 申威處理器 6.2 富士通A64FX處理器 6.3 蘋果M1處理器 6.4 Ampere處理器 6.5 IBMPOWER理器 6.6
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    ;社區(qū)活動專版標題名稱必須包含【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+自擬標題 注意事項 1、活動期間如有作弊、灌水等違反電子發(fā)燒友論壇規(guī)則的行為
    發(fā)表于 09-02 10:09

    飛凌微車規(guī)級視覺處理芯片M1系列:高性能、低功耗、小封裝尺寸

    電子發(fā)燒友網報道(文/李彎彎)近日,思特威(SmartSens)正式宣布全資子公司品牌——飛凌微電子(Flyingchip,簡稱“飛凌微”)。同時,飛凌微M1車載視覺處理芯片系列正式亮相,包括M1
    的頭像 發(fā)表于 08-14 09:11 ?5619次閱讀

    微軟將OpenAI列為競爭對手名單

    微軟在其最新提交給美國證券交易委員會(SEC)的10-K文件中,正式將OpenAI列入其競爭對手名單,這一名單中還包括了亞馬遜、谷歌和Meta等科技巨頭。此舉標志著微軟對OpenAI在人工智能領域,特別是其ChatGPT聊天機器人及新推出的SearchGPT搜索引擎原型的快速崛起給予了高度關注。
    的頭像 發(fā)表于 08-05 11:38 ?978次閱讀

    gpu服務器與cpu服務器的區(qū)別對比,終于知道怎么選了!

    gpu服務器與cpu服務器的區(qū)別主要體現(xiàn)在架構設計、性能特點、能耗效率、應用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務器更適合數據庫管理和企業(yè)應用,而
    的頭像 發(fā)表于 08-01 11:41 ?1022次閱讀