默認(rèn)情況下是Intel I9,10核,每個(gè)核2個(gè)threads,共20個(gè)CPUs:
下面編譯內(nèi)核:
需要2分鐘30秒左右。
再來一遍:
這說明make clean, drop_caches后時(shí)間也差不多。
現(xiàn)在我們關(guān)閉smt,只保留10個(gè)CPU:
具體的關(guān)閉方法就是:
sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’
這樣只剩下10個(gè)CPU,下面來編譯:
時(shí)間2分51秒,相對(duì)于2分30秒,速度下降僅僅14%。
這說明超線程SMT對(duì)性能的提升絕對(duì)沒有達(dá)到100%,甚至都沒有達(dá)到20%。
我們現(xiàn)在重新開啟超線程:
sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control’
看一下哪個(gè)CPU和哪個(gè)CPU是thread sibling:
看起來CPU0和CPU10是一對(duì),CPU1和CPU11是一對(duì),依次類推。
剛才我們關(guān)閉SMT是把CPU10-CPU19全關(guān)了,只留下每對(duì)里面的1個(gè)CPU,也就是留下了CPU0-CPU9。
在開啟SMT的時(shí)候(假設(shè)藍(lán)色和紅色是一個(gè)CORE里面的兩個(gè)CPU):
在關(guān)閉SMT的時(shí)候,等于每對(duì)里面只留1個(gè)CPU:
現(xiàn)在我們換一種關(guān)法,一對(duì)對(duì)關(guān),只留下五對(duì):
指令如下:
實(shí)現(xiàn)效果如下:
再重新編譯內(nèi)核:
現(xiàn)在耗時(shí)是3分10秒,想對(duì)于所有CPU全開,下降27%。相對(duì)于每個(gè)core里面只關(guān)一個(gè)線程,下降12%。
這就比較神奇了?為什么我關(guān)了5個(gè)core,性能沒有下降100%呢?這至少說明一個(gè)問題,從5core到10core,Intel I9編譯內(nèi)核性能并沒有線性地scale。只是從3分10秒,提升到2分30秒。
責(zé)任編輯:haq
-
處理器
+關(guān)注
關(guān)注
68文章
19893瀏覽量
235175 -
intel
+關(guān)注
關(guān)注
19文章
3496瀏覽量
188448
原文標(biāo)題:這到底是為什么?「元芳,你怎么看?」
文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
HPM5E31IGN單核 32 位 RISC-V 處理器
PX5高性能八核處理器深度解析
RK3399Pro處理器:高性能與AI加速的完美結(jié)合
常見處理器故障及解決方法
處理器超頻技巧與注意事項(xiàng)
量子處理器的作用_量子處理器的優(yōu)缺點(diǎn)
量子處理器是什么_量子處理器原理
盛顯科技:解決投影融合處理器的性能評(píng)估標(biāo)準(zhǔn)

對(duì)稱多處理器和非對(duì)稱多處理器的區(qū)別
ARM處理器和CISC處理器的區(qū)別
今日看點(diǎn)丨高通驍龍 X Plus 8 核處理器發(fā)布;2025 款比亞迪漢將于明日上市
影響微處理器性能的因素
微處理器的主要性能指標(biāo)

評(píng)論