一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

手機行業(yè)的跑分軟件是噱頭還是實力

B4Pb_gh_6fde77c ? 來源:龍蜥社區(qū) ? 作者:百奎、丁緩 ? 2021-08-16 15:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、背景:性能之戰(zhàn)

“不服跑個分”已經(jīng)淪為手機行業(yè)的調(diào)侃用語,但是實話實說,在操作系統(tǒng)領(lǐng)域“跑分”確實是最重要的評價方式之一。比如 Linux 內(nèi)核社區(qū)常常以跑分軟件得分,來評價一個優(yōu)化補丁的價值。甚至還有 phoronix 這樣專注于 Linux 跑分的媒體。而且今天我還想說一點,讓軟件跑分高,這是實力的體現(xiàn),是建立在對內(nèi)核的深刻理解基礎(chǔ)上的。本文的故事就源于一次日常的性能優(yōu)化分析。我們在評估自動化性能調(diào)優(yōu)軟件 tuned 的時候,發(fā)現(xiàn)它在服務(wù)器場景,對 Linux 內(nèi)核調(diào)度器相關(guān)的參數(shù)做了一些微小的修改,但是這些修改卻很大程度改善了 hackbench 這款跑分軟件的性能。是不是很有意思?讓我們一起來一探究竟。

本文將從幾個方面展開,并重點介紹黑體字部分:

相關(guān)知識簡介

hackbench 工作模式簡介

hackbench 性能受損之源

雙參數(shù)優(yōu)化

思考與拓展

二、相關(guān)知識簡介

2.1 CFS調(diào)度器

Linux 中大部分(可以粗略認(rèn)為是實時任務(wù)之外的所有)線程/進(jìn)程,都由一個叫 CFS(完全公平調(diào)度器)的調(diào)度器進(jìn)行調(diào)度,它是 Linux 最核心的組件之一。(在Linux中,線程和進(jìn)程只有細(xì)微差別,下文統(tǒng)一用進(jìn)程表述)

CFS 的核心是紅黑樹,用于管理系統(tǒng)中進(jìn)程的運行時間,作為選擇下一個將要運行的進(jìn)程的依據(jù)。此外,它還支持優(yōu)先級、組調(diào)度(基于我們熟知的 cgroup 實現(xiàn))、限流等功能,滿足各種高級需求。CFS 的詳細(xì)介紹。

2.2 hackbench

hackbench 是一個針對 Linux 內(nèi)核調(diào)度器的壓力測試工具,它的主要工作是創(chuàng)建指定數(shù)量的調(diào)度實體對(線程/進(jìn)程),并讓它們通過 sockets/pipe 進(jìn)行數(shù)據(jù)傳輸,最后統(tǒng)計整個運行過程的時間開銷。

2.3 CFS 調(diào)度器參數(shù)

本文重點關(guān)注以下兩個參數(shù),這兩個參數(shù)也是影響 hackbench 跑分性能的重要因素。系統(tǒng)管理員可以使用 sysctl 命令來進(jìn)行設(shè)置。

最小粒度時間:kernel.sched_min_granularity_ns

通過修改 kernel.sched_min_granularity_ns,可以影響 CFS 調(diào)度周期(sched period)的時間長短。例如:設(shè)置kernel.sched_min_granularity_ns = m,當(dāng)系統(tǒng)中存在大量可運行進(jìn)程時,m 越大,CFS 調(diào)度周期就越長。

如圖 1 所示,每個進(jìn)程都能夠在 CPU 上運行且時間各有長短,sched_min_granularity_ns 保證了每個進(jìn)程的最小運行時間(優(yōu)先級相同的情況下),sched_min_granularity_ns 越大每個進(jìn)程單次可運行的時間就越長。

d17d5954-fe4e-11eb-9bcf-12bb97331649.png

圖 1:sched_min_granularity_ns 示意圖

喚醒搶占粒度:kernel.sched_wakeup_granularity_ns

kernel.sched_wakeup_granularity_ns 保證了重新喚醒的進(jìn)程不會頻繁搶占正在運行的進(jìn)程,kernel.sched_wakeup_granularity_ns 越大,喚醒進(jìn)程進(jìn)行搶占的頻率就越小。
如圖 2 所示,有 process-{1,2,3} 三個進(jìn)程被喚醒,因為 process-3 的運行時間大于 curr(正在 CPU 上運行的進(jìn)程)無法搶占運行,而 process-2 運行時間小于 curr 但其差值小于 sched_wakeup_granularity_ns 也無法搶占運行,只有 process-1 能夠搶占 curr 運行,因此 sched_wakeup_granularity_ns 越小,進(jìn)程被喚醒后的響應(yīng)時間就越快(等待運行時間越短)。

d1aae216-fe4e-11eb-9bcf-12bb97331649.png

圖 2:sched_wakeup_granularity_ns 示意圖

三、hackbench 工作模式簡介

hackbench 工作模式分為 process mode 和 thread mode,主要區(qū)別就是以創(chuàng)建 process 還是 thread 為基礎(chǔ)來進(jìn)行測試,下面以 thread 來進(jìn)行介紹。

hackbench 會創(chuàng)建若干線程(偶數(shù)),均分為兩類線程:sender 和 receiver

并將其劃分為 n 個 group,每個 group 包含 m 對 sender 和 receiver。

每個 sender 的任務(wù)就是給其所在 group 的所有 receiver 輪流發(fā)送 loop 次大小為 datasize 的數(shù)據(jù)包

receiver 則只負(fù)責(zé)接收數(shù)據(jù)包即可。

同一個 group 中的sender 和 receiver 有兩種方式進(jìn)行通信:pipe 和 local socket(一次測試中只能都是 pipe 或者 socket),不同 group 之間的線程沒有交互關(guān)系。

通過上面 hackbench 模型分析,可以得知同一個 group 中的 thread/process 主要是 I/O 密集型,不同 group 之間的 thread/process 主要是 CPU 密集型。

d1eaa090-fe4e-11eb-9bcf-12bb97331649.png

圖 3: hackbench 工作模式主動上下文切換:

對于 receiver,當(dāng) buffer 中沒有數(shù)據(jù)時,receiver 會被阻塞并主動讓出 CPU 進(jìn)入睡眠。

對于 sender,如果 buffer 中沒有足夠空間寫入數(shù)據(jù)時, sender 也會被阻塞且主動讓出 CPU。

因此,系統(tǒng)中"主動上下文切換"是很多的,但同時也存在“被動上下文切換”。后者會受到接下來我們將要介紹的參數(shù)影響。

四、hackbench性能影響之源

在hackbench-socket 測試中,tuned修改了 CFS 的 sched_min_granularity_ns 和 sched_wakeup_granularity_ns 兩個參數(shù),導(dǎo)致了性能的顯著區(qū)別。具體如下:

開關(guān)/參數(shù)和性能 sched_min_granularity_ns sched_wakeup_granularity_ns 性能
關(guān) tuned 2.25ms 3ms
開 tuned 10ms 15ms

接下來我們調(diào)整這兩個調(diào)度參數(shù)來進(jìn)行進(jìn)一步的深入分析。

五、雙參數(shù)優(yōu)化

注:為了簡介表達(dá)下面會以 m 表示 kernel.sched_min_granularity_ns,w 表示 kernel.sched_wakeup_granularity_ns

為了探索雙參數(shù)對于調(diào)度器的影響,我們選擇每次固定一個參數(shù),研究另一個參數(shù)變化對于性能的影響,并使用系統(tǒng)知識來解釋這種現(xiàn)象背后的原理。

5.1 固定sched_wakeup_granularity_ns

d21f7842-fe4e-11eb-9bcf-12bb97331649.png

圖 4: 固定 w,調(diào)整m

在上圖中我們固定了參數(shù) w 并根據(jù)參數(shù) m 變化趨勢其劃分為三個部分:區(qū)域A(1ms~4ms),區(qū)域B(4ms~17ms),區(qū)域C(17ms~30ms)。在區(qū)域A中四條曲線均呈現(xiàn)一個極速下降的趨勢,而在區(qū)域B中四條曲線都處于一種震蕩狀態(tài),波動較大,最后在區(qū)域C中四條曲線都趨于穩(wěn)定。

在第二節(jié)相關(guān)知識中可以知道 m 影響著進(jìn)程的運行時間,同時也意味著它影響著進(jìn)程的“被動上下文切換”。

對于區(qū)域A而言,搶占過于頻繁,而大部分搶占都是無意義的,因為對端無數(shù)據(jù)可寫/無緩沖區(qū)可用,導(dǎo)致大量冗余的“主動上下文切換“。此時較大的 w 能讓 sender/receiver 有更多的時間來寫入數(shù)據(jù)/消耗數(shù)據(jù)來減少對端進(jìn)程無意義的“主動上下文切換“。

對于區(qū)域B而言,隨著 m 的增加漸漸滿足 sender/receiver 執(zhí)行任務(wù)的時間需求能夠在緩沖區(qū)寫入/讀出足夠的數(shù)據(jù),因此需要較小的 w 來增加喚醒進(jìn)程的搶占幾率,讓對端進(jìn)程能夠更快的響應(yīng)處理數(shù)據(jù),減少下一輪調(diào)度時的“主動上下文切換”。

對于區(qū)域C而言,m已經(jīng)足夠大,已經(jīng)幾乎不會有“被動上下文切換”發(fā)生,進(jìn)程會在執(zhí)行完任務(wù)之后進(jìn)行“主動上下文切換”等待對端進(jìn)程進(jìn)行處理,此時 m 對性能的影響就很小了。

5.2 固定sched_min_granularity_ns

d22d184e-fe4e-11eb-9bcf-12bb97331649.png

圖 5: 固定 m,調(diào)整w

在上圖中我們固定了參數(shù) m,同樣劃分了三個區(qū)域:

在區(qū)域A中,同樣存在圖 4 中的現(xiàn)象,較大 m 受 w 的影響較小,而較小的 m 隨著 w 的增大性能會越來越好。

在區(qū)域B中,中等大小的 m(8ms/12ms)進(jìn)程還是存在較多“被動上下文切換”,并且其中的進(jìn)程已經(jīng)處理了相當(dāng)一部分?jǐn)?shù)據(jù)期望對端進(jìn)程能夠盡快的響應(yīng)處理,因此較大 w 會嚴(yán)重影響中等大小 m 的性能。

在區(qū)域C中圖5和圖4表現(xiàn)一致都是趨于穩(wěn)定,因為 w 過大時幾乎不會發(fā)生喚醒搶占,因此這時單純 w 值的變化對性能的影響并不大,但是過大的 w 對于中等大小的 m 則會造成性能問題(原因同上條)。

5.4 最優(yōu)雙參數(shù)(對于 hackbench )

從上面兩節(jié)的分析可知對于 hackbench 這樣帶有“主動上下文切換”的場景可以選擇較大的 m(例如:15~20ms)。

在pipe/socket 雙向通信的場景中,對端的響應(yīng)時間會對影響進(jìn)程的下一次處理,為了讓對端進(jìn)程能夠及時響應(yīng)可以選擇一個中等大小的 w(例如:6~8ms)來獲取較高的性能。

六、思考與擴展

在桌面場景中,應(yīng)用更偏向于交互型,應(yīng)用的服務(wù)質(zhì)量也更多的體現(xiàn)在應(yīng)用對于用戶操作的響應(yīng)時間,因此可以選擇較小的 sched_wakeup_granularity_ns 來提高應(yīng)用的交互性。

在服務(wù)器場景中,應(yīng)用更偏向于計算處理,應(yīng)用需要更多的運行時間來進(jìn)行密集計算,因此可以選擇較大的 sched_min_granularity_ns,但是為了防止單個進(jìn)程獨占 CPU 過久同時也為了能夠及時處理客戶端請求響應(yīng),應(yīng)該選擇一個中等大小的 sched_wakeup_granularity_ns。

在 Linux 原生內(nèi)核中 m 和 w 的默認(rèn)參數(shù)被設(shè)置為適配桌面場景,Anolis OS的用戶,需要根據(jù)自己部署的應(yīng)用的場景,屬于桌面型還是服務(wù)器型,來選擇內(nèi)核參數(shù),或者使用tuned的推薦配置。而 hackbench 作為一個介于桌面和服務(wù)器間的應(yīng)用,也可以作為配置的參考。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11508

    瀏覽量

    213615
  • 調(diào)度器
    +關(guān)注

    關(guān)注

    0

    文章

    98

    瀏覽量

    5494

原文標(biāo)題:“不服跑個分?” 是噱頭還是實力?

文章出處:【微信號:gh_6fde77c41971,微信公眾號:FPGA干貨】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【VisionFive 2單板計算機試用體驗】coremark測試

    查看 4核risv CPU 安裝溫度sensor apt install lm-sensors 輸入sensors查看板子溫度 顯示是51.5度,有點發(fā)燙 2。進(jìn)行coremark 先從
    發(fā)表于 07-12 12:38

    【VisionFive 2單板計算機試用體驗】1、開箱初體驗(刷系統(tǒng)+靜態(tài)IP設(shè)置+GPU測評)

    。 GPU 首先用clinfo命令查看一下GPU,當(dāng)然也可以在debain-system setting-about界面看到BXE-4-32GPU benchmark軟件一般用glmark2
    發(fā)表于 07-09 21:50

    國內(nèi)十大軟件開發(fā)公司是哪家:實力與創(chuàng)新引領(lǐng)行業(yè)前行

    軟件
    北京華盛恒輝科技
    發(fā)布于 :2025年06月09日 16:39:59

    最有實力的APP開發(fā)公司是哪家?探尋行業(yè)內(nèi)的佼佼者

    軟件
    北京華盛恒輝科技
    發(fā)布于 :2025年06月09日 09:45:50

    國內(nèi)最好的軟件開發(fā)公司是哪家?實力最強的

    軟件
    北京華盛恒輝科技
    發(fā)布于 :2025年06月06日 12:22:43

    看點:雷軍:小米芯片超300萬 特斯拉愿向車企授權(quán)FSD技術(shù) 比亞迪與Grenergy簽供貨協(xié)議

    給大家?guī)硪恍?b class='flag-5'>行業(yè)資訊消息: 雷軍:小米芯片超300萬 在5月22日的小米戰(zhàn)略新品發(fā)布會上,雷軍公布小米玄戒O1芯片安兔兔結(jié)果,測評
    的頭像 發(fā)表于 05-23 14:41 ?232次閱讀

    學(xué)硬件好還是學(xué)軟件好?

    學(xué)硬件好還是學(xué)軟件好? 選擇學(xué)習(xí)硬件還是軟件取決于個人興趣、職業(yè)目標(biāo)以及對不同工作方式的偏好。以下是兩者的一些比較,幫助你做出更合適的選擇。 學(xué)習(xí)硬件可以讓你深入了解計算機和電子設(shè)備的
    發(fā)表于 04-07 15:27

    飛行汽車,是噱頭,還是未來?

    低空經(jīng)濟的概念在 2025年可謂是非?;馃幔?025年的《政府工作報告》中,也明確提出要深入推進(jìn)戰(zhàn)略性新興產(chǎn)業(yè)融合集群發(fā)展。開展新技術(shù)新產(chǎn)品新場景大規(guī)模應(yīng)用示范行動,推動商業(yè)航天、低空經(jīng)濟等新興產(chǎn)業(yè)安全健康發(fā)展。低空經(jīng)濟作為以低空空域(通常指地面以上1000米以下的空域)為載體的新型經(jīng)濟形態(tài),其核心在于利用無人機、電動垂直起降飛行器(eVTOL)、輕型運動航空器等航空器,結(jié)合智能化基礎(chǔ)設(shè)施和多樣化應(yīng)用場景,構(gòu)建起涵蓋物流
    的頭像 發(fā)表于 03-14 08:58 ?2147次閱讀
    飛行汽車,是<b class='flag-5'>噱頭</b>,<b class='flag-5'>還是</b>未來?

    vivo V50 5G手機現(xiàn)身Geekbench分庫

    vivo V50 5G 手機悄然現(xiàn)身 Geekbench 分庫,型號為 V2427,引發(fā)科技愛好者的廣泛關(guān)注。 分?jǐn)?shù)據(jù)顯示,vivo V50 5G 的 Vulkan 分?jǐn)?shù)達(dá)到 4122
    的頭像 發(fā)表于 02-05 15:22 ?699次閱讀

    AI超8000,天璣9400憑實力碾壓一眾旗艦芯片

    蘇黎世AI Benchmark榜單冠軍,以稱霸行業(yè)的AI性能,加速智能手機的智能體化進(jìn)程。 AI Benchmark自2018年推出以來,一直是業(yè)界評估AI性能的重要工具。2023年,AI Benchmark迎來了V6版本的大幅改版,進(jìn)一步提升了其測試的全面性和多樣性。V
    的頭像 發(fā)表于 01-10 12:40 ?979次閱讀
    AI<b class='flag-5'>跑</b><b class='flag-5'>分</b>超8000,天璣9400憑<b class='flag-5'>實力</b>碾壓一眾旗艦芯片

    康尼新能源亮相2024零智能汽車技術(shù)論壇暨前瞻技術(shù)展

    近日,由零和蓋世汽車主辦的“2024零智能汽車技術(shù)論壇暨前瞻技術(shù)展”在杭州零總部拉開帷幕,此次技術(shù)展匯聚了眾多汽車零部件行業(yè)的優(yōu)質(zhì)供應(yīng)商,旨在促進(jìn)深入交流與合作??的嵝履茉磾y多款
    的頭像 發(fā)表于 12-10 13:59 ?556次閱讀

    軟件系統(tǒng)數(shù)據(jù)庫的分庫表設(shè)計

    軟件系統(tǒng)數(shù)據(jù)庫的分庫表設(shè)計 系統(tǒng)讀寫分離、分庫表技術(shù)實現(xiàn)采用MyCat中間件,MyCat 是一款開源(遵循 Apache License 2.0 協(xié)議)的大數(shù)據(jù)庫集群中間件,用于搭建數(shù)據(jù)庫
    的頭像 發(fā)表于 08-22 11:39 ?584次閱讀
    <b class='flag-5'>軟件</b>系統(tǒng)數(shù)據(jù)庫的分庫<b class='flag-5'>分</b>表設(shè)計

    AMC1311是真差輸出,還是偽差輸出?可否直接給MSP430的ADC采集?

    AMC1311是真差輸出,還是偽差輸出?可否直接給MSP430的ADC采集?還是必須要轉(zhuǎn)化為單端信號提供MSP430的ADC采集?
    發(fā)表于 08-15 06:40

    飛貓榮膺世界物聯(lián)網(wǎng)500強:引領(lǐng)行業(yè)創(chuàng)新,展現(xiàn)中國實力

    此次獲獎是公司成長歷程中的重要里程碑,也是中國物聯(lián)網(wǎng)行業(yè)整體實力提升的體現(xiàn)。隨著更多中國企業(yè)的加入,中國有望成為全球物聯(lián)網(wǎng)領(lǐng)域的重要領(lǐng)導(dǎo)者,引領(lǐng)行業(yè)創(chuàng)新與發(fā)展新趨勢。
    的頭像 發(fā)表于 08-01 14:18 ?746次閱讀
    飛貓榮膺世界物聯(lián)網(wǎng)500強:引領(lǐng)<b class='flag-5'>行業(yè)</b>創(chuàng)新,展現(xiàn)中國<b class='flag-5'>實力</b>

    軟件測試六大問 全面而深入的軟件測試行業(yè)解疑

    隨著科技的進(jìn)步和大數(shù)據(jù)時代的到來,?軟件測試面臨著前所未有的挑戰(zhàn)和機遇。?在這篇文章中我們將深入討論軟件測試行業(yè)的發(fā)展前景、行業(yè)趨勢、薪資水平等,為讀者提供一次全面而深入的
    的頭像 發(fā)表于 07-30 10:28 ?557次閱讀