一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux調(diào)度器中的PELT(Per-Entity Load Tracking)

Linux閱碼場 ? 來源:fqj ? 2019-05-27 17:26 ? 次閱讀

一、為何需要per-entity load tracking?

對于Linux內(nèi)核而言,做一款好的進程調(diào)度器是一項非常具有挑戰(zhàn)性的任務(wù),主要原因是在進行CPU資源分配的時候必須滿足如下的需求:

1、它必須是公平的

2、快速響應(yīng)

3、系統(tǒng)的throughput要高

4、功耗要小

其實你仔細分析上面的需求,這些目標其實是相互沖突的,但是用戶在提需求的時候就是這么任性,他們期望所有的需求都滿足,而且不管系統(tǒng)中的負荷情況如何。因此,縱觀Linux內(nèi)核調(diào)度器這些年的發(fā)展,各種調(diào)度器算法在內(nèi)核中來來去去,這也就不足為奇了。當然,2007年,2.6.23版本引入“完全公平調(diào)度器”(CFS)之后,調(diào)度器相對變得穩(wěn)定一些。最近一個最重大的變化是在3.8版中合并的Per-entity load tracking。

完美的調(diào)度算法需要一個能夠預(yù)知未來的水晶球:只有當內(nèi)核準確地推測出每個進程對系統(tǒng)的需求,她才能最佳地完成調(diào)度任務(wù)。不幸的是,硬件制造商推出各種性能強勁的處理器,但從來也不考慮預(yù)測進程負載的需求。
在沒有硬件支持的情況下,調(diào)度器只能祭出通用的預(yù)測大法:用“過去”預(yù)測“未來”,也就是說調(diào)度器是基于過去的調(diào)度信息來預(yù)測未來該進程對CPU的需求。而在這些調(diào)度信息中,每一個進程過去的“性能”信息是核心要考慮的因素。但有趣的是,雖然內(nèi)核密切跟蹤每個進程實際運行的時間,但它并不清楚每個進程對系統(tǒng)負載的貢獻程度。

Linux調(diào)度器中的PELT(Per-Entity Load Tracking)

有人可能會問:“消耗的CPU時間”和“負載(load)”是否有區(qū)別?是的,當然有區(qū)別,Paul Turner在提交per-entity load tracking補丁集的時候?qū)@個問題做了回答。一個進程即便當前沒有在cpu上運行,例如:該進程僅僅是掛入runqueue等待執(zhí)行,它也能夠?qū)pu負載作出貢獻。
“負載”是一個瞬時量,表示當前時間點的進程對系統(tǒng)產(chǎn)生的“壓力”是怎樣的?顯然runqueue中有10個等待運行的進程對系統(tǒng)造成的“壓力”要大于一個runqueue中只有1個等待進程的場景。與之相對的“CPU使用率(usage)”不一樣,它不是瞬時量,而是一個累積量。有一個長時間運行的進程,它可能上周占用大量的處理器時間,但是現(xiàn)在可能占用很少的cpu時間,盡管它過去曾經(jīng)“輝煌”過(占用大量CPU時間),但這對現(xiàn)在的系統(tǒng)負荷貢獻很小。

3.8版本之前的內(nèi)核CFS調(diào)度器在計算CPU load的時候采用的是跟蹤每個運行隊列上的負載(per-rq load tracking)。需要注意的是:CFS中的“運行隊列”實際上是有多個,至少每個CPU就有一個runqueue。而且,當使用“按組調(diào)度”(group scheduling)功能時,每個控制組(control group)都有自己的per-CPU運行隊列。
對于per-rq的負載跟蹤方法,調(diào)度器可以了解到每個運行隊列對整個系統(tǒng)負載的貢獻。這樣的統(tǒng)計信息足以幫助組調(diào)度器(group scheduler)在控制組之間分配CPU時間,但從整個系統(tǒng)的角度看,我們并不知道當前負載來自何處。除此之外,per-rq的負載跟蹤方法還有另外一個問題,即使在工作負載相對穩(wěn)定的情況下,跟蹤到的運行隊列的負載值也會變化很大。

二、如何進行per-entity load tracking?

Per-entity load tracking系統(tǒng)解決了這些問題,這是通過把負載跟蹤從per rq推進到per-entity的層次。所謂調(diào)度實體(scheduling entity)其實就是一個進程或者control group中的一組進程。為了做到Per-entity的負載跟蹤,時間(物理時間,不是虛擬時間)被分成了1024us的序列,在每一個1024us的周期中,一個entity對系統(tǒng)負載的貢獻可以根據(jù)該實體處于runnable狀態(tài)(正在CPU上運行或者等待cpu調(diào)度運行)的時間進行計算。如果在該周期內(nèi),runnable的時間是x,那么對系統(tǒng)負載的貢獻就是(x/1024)。
當然,一個實體在一個計算周期內(nèi)的負載可能會超過1024us,這是因為我們會累積在過去周期中的負載,當然,對于過去的負載我們在計算的時候需要乘一個衰減因子。如果我們讓Li表示在周期pi中該調(diào)度實體的對系統(tǒng)負載貢獻,那么一個調(diào)度實體對系統(tǒng)負荷的總貢獻可以表示為:

L = L0+ L1*y + L2*y2+ L3*y3+ ...

其中y是衰減因子。通過上面的公式可以看出:

(1)調(diào)度實體對系統(tǒng)負荷的貢獻值是一個序列之和組成

(2)最近的負荷值擁有最大的權(quán)重

(3)過去的負荷也會被累計,但是是以遞減的方式來影響負載計算。

使用這樣序列的好處是計算簡單,我們不需要使用數(shù)組來記錄過去的負荷貢獻,只要把上次的總負荷的貢獻值乘以y再加上新的L0負荷值就OK了。

在3.8版本的代碼中,y已經(jīng)確定:y^32等于0.5。這樣選定的y值,一個調(diào)度實體的負荷貢獻經(jīng)過32個周期(1024us)后,對當前時間的的符合貢獻值會衰減一半。

一旦我們有了計算runnable調(diào)度實體負荷貢獻值的方法,那么這個負荷值可以向上傳遞,通過累加control group中的每一個調(diào)度實體負荷值可以得到該control group對應(yīng)的調(diào)度實體的負荷值。這樣的算法不斷的向上推進,可以得到整個系統(tǒng)的負荷。
當然,計算負荷不是那么簡單。因為調(diào)度器本身就會定期的觀察記錄調(diào)度實體的信息,計算runnable調(diào)度實體的負荷貢獻是容易的。但沒有處于runnable狀態(tài)的調(diào)度實體就對系統(tǒng)負荷沒有貢獻了嗎?當“密碼破解”進程由于page fault而阻塞,它其實仍然會給 “系統(tǒng)列車”增加“負荷”。因此我們需要有一種計算進入阻塞狀態(tài)的進程對系統(tǒng)負載貢獻的方法,當前不是調(diào)度器需要關(guān)注的。

當然,內(nèi)核可以選擇記錄所有進入阻塞狀態(tài)的進程,像往常一樣衰減它們的負載貢獻,并將其增加到總負載中。但這么做是非常耗費資源的。所以,相反,3.8版本的調(diào)度器在每個cfs_rq(每個control group都有自己的cfs rq)數(shù)據(jù)結(jié)構(gòu)中,維護一個“blocked load”的成員,這個成員記錄了所有阻塞狀態(tài)進程對系統(tǒng)負荷的貢獻。
當一個進程阻塞了,它的負載會從總的運行負載值(runnable load)中減去并添加到總的阻塞負載值(blocked load)中。該負載可以以相同的方式衰減(即每個周期乘以y)。當阻塞的進程再次轉(zhuǎn)換成運行態(tài)時,其負載值(適當進行衰減)則轉(zhuǎn)移到運行負荷上來。因此,跟蹤blocked load只是需要在進程狀態(tài)轉(zhuǎn)換過程中有一點計算量,調(diào)度器并不需要由于跟蹤阻塞負載而遍歷一個進入阻塞狀態(tài)進程的鏈表。

另外一個比較繁瑣的地方是對節(jié)流進程(throttled processes)負載的計算。所謂節(jié)流進程是指那些在“CFS帶寬控制器”(CFS bandwidth controller)下控制運行的進程。當這些進程用完了本周期內(nèi)的CPU時間,即使它們?nèi)匀辉谶\行狀態(tài),即使CPU空閑,調(diào)度器并不會把CPU資源分配給它們。
因此節(jié)流進程不會對系統(tǒng)造成負荷。正因為如此,當進程處于被節(jié)流狀態(tài)的時候,它們對系統(tǒng)負荷的貢獻值不應(yīng)該按照runnable進程計算。在等待下一個周期到來之前,throttled processes不能獲取cpu資源,因此它們的負荷貢獻值會衰減。

三、per-entity load tracking有什么好處?

有了Per-entity負載跟蹤機制,在沒有增加調(diào)度器開銷的情況下,調(diào)度器現(xiàn)在對每個進程和“調(diào)度進程組”對系統(tǒng)負載的貢獻有了更清晰的認識。有了更精細的統(tǒng)計數(shù)據(jù)(指per entity負載值)通常是好的,但人們可能會懷疑這些信息是否真的對調(diào)度器有用。

我們可以通過跟蹤的per entity負載值做一些有用的事情。最明顯的使用場景可能是用于負載均衡:即把runnable進程平均分配到系統(tǒng)的CPU上,使每個CPU承載大致相同的負載。如果內(nèi)核知道每個進程對系統(tǒng)負載有多大貢獻,它可以很容易地計算遷移到另一個CPU的效果。這樣進程遷移的結(jié)果應(yīng)該更準確,從而使得負載平衡不易出錯。目前已經(jīng)有一些補丁利用per entity負載跟蹤來改進調(diào)度器的負載均衡,相信這些補丁會在不久的將來進入到內(nèi)核主線。

small-task packing patch的目標是將“小”進程收集到系統(tǒng)中的部分CPU上,從而允許系統(tǒng)中的其他處理器進入低功耗模式。在這種情況下,顯然我們需要一種方法來計算得出哪些進程是“小”的進程。利用per-entity load tracking,內(nèi)核可以輕松的進行識別。

內(nèi)核中的其他子系統(tǒng)也可以使用per entity負載值做一些“文章”。CPU頻率調(diào)節(jié)器(CPU frequency governor)和功率調(diào)節(jié)器(CPU power governor)可以利用per entity負載值來猜測在不久的將來,系統(tǒng)需要提供多少的CPU計算能力。
既然有了per-entity load tracking這樣的基礎(chǔ)設(shè)施,我們期待看到開發(fā)人員可以使用per-entity負載信息來優(yōu)化系統(tǒng)的行為。雖然per-entity load tracking仍然不是一個能夠預(yù)測未來的水晶球,但至少我們對當前的系統(tǒng)中的進程對CPU資源的需求有了更好的理解。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11011

    瀏覽量

    215246
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11420

    瀏覽量

    212361

原文標題:郭健: Linux調(diào)度器中的PELT(Per-Entity Load Tracking)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Linux的Deadline實時調(diào)度算法

    每個任務(wù)都有一個高精度定時(sched_dl_entity 結(jié)構(gòu)的 dl_timer 字段),其超時時間為任務(wù)的調(diào)度周期。當定時觸發(fā)時,便會調(diào)用 dl_task_timer() 函
    發(fā)表于 01-24 13:44 ?1133次閱讀
    <b class='flag-5'>Linux</b>的Deadline實時<b class='flag-5'>調(diào)度</b>算法

    深入探討Linux的進程調(diào)度

    ,以及其運行的順序。這篇文章將詳細探討Linux進程調(diào)度的工作原理、主要算法、調(diào)度策略以及其在實際操作的應(yīng)用。
    的頭像 發(fā)表于 08-13 13:36 ?1131次閱讀
    深入探討<b class='flag-5'>Linux</b>的進程<b class='flag-5'>調(diào)度</b><b class='flag-5'>器</b>

    Linux2.4與Linux2.6內(nèi)核調(diào)度的比較研究

    高的情況下,性能受到影響。2 Linux2.4調(diào)度性能低下的原因從上面的分析可以看出,造成Linux2.4調(diào)度
    發(fā)表于 06-17 12:04

    Linux系統(tǒng)調(diào)度是實現(xiàn)特性的關(guān)鍵部分

    1、綜述  Linux作為多任務(wù)、多用戶的操作系統(tǒng),其進程/線程調(diào)度管理是實現(xiàn)這些特性的關(guān)鍵部分。調(diào)度管理決定系統(tǒng)的眾多線程哪個線程獲得
    發(fā)表于 07-05 07:05

    Linux2.4和Linux2.6的調(diào)度對比分析,Linux2.6對調(diào)度的改進有哪些方面?

    Linux2.4和Linux2.6的調(diào)度對比分析,Linux2.6對調(diào)度
    發(fā)表于 04-27 06:42

    嵌入式工程師必會的 Linux 進程調(diào)度所有知識點

    。struct sched_dl_entity dl:采用EDF算法調(diào)度的實時調(diào)度實體。 分配給 CPU 的 task,作為調(diào)度實體加入到運行隊列
    發(fā)表于 08-01 07:00

    Linux與VxWorks任務(wù)調(diào)度機制分析

    Linux與VxWorks任務(wù)調(diào)度機制分析
    發(fā)表于 03-28 09:52 ?19次下載

    linux處理機調(diào)度與死鎖

    linux處理機調(diào)度與死鎖 掌握處理機的三級調(diào)度 掌握作業(yè)調(diào)度及進程調(diào)度的概念 理解調(diào)度
    發(fā)表于 04-28 14:59 ?0次下載

    Linux 2.6進程調(diào)度

    分析了與Linux 2.6 進程調(diào)度密切相關(guān)的一些重要數(shù)據(jù)結(jié)構(gòu),詳細描述了進程調(diào)度的時機、調(diào)度的策略和調(diào)度
    發(fā)表于 06-13 10:13 ?11次下載

    uClinux進程調(diào)度的實現(xiàn)分析

    uClinux中進程調(diào)度的實現(xiàn)原理,展示了uClinux獨具特色的進程調(diào)度機制。 關(guān)鍵詞:uClinux;調(diào)度策略;進程
    發(fā)表于 11-06 14:30 ?0次下載

    Linux內(nèi)核的DL調(diào)度的細節(jié)和怎么樣使用DL調(diào)度

    Linux內(nèi)核的DL調(diào)度是一個全局EDF調(diào)度,它主要針對有deadline限制的sporadic任務(wù)。注意:這些術(shù)語已經(jīng)在本系列文章的第
    的頭像 發(fā)表于 07-16 10:54 ?5757次閱讀
    <b class='flag-5'>Linux</b>內(nèi)核的DL<b class='flag-5'>調(diào)度</b><b class='flag-5'>器</b>的細節(jié)和怎么樣使用DL<b class='flag-5'>調(diào)度</b><b class='flag-5'>器</b>?

    如何更改 Linux 的 I/O 調(diào)度

    Linux 的 I/O 調(diào)度是一個以塊式 I/O 訪問存儲卷的進程,有時也叫磁盤調(diào)度。Linux
    發(fā)表于 05-15 15:54 ?935次閱讀
    如何更改 <b class='flag-5'>Linux</b> 的 I/O <b class='flag-5'>調(diào)度</b><b class='flag-5'>器</b>

    英創(chuàng)信息技術(shù)Linux系統(tǒng)調(diào)度簡介

    1、綜述 Linux作為多任務(wù)、多用戶的操作系統(tǒng),其進程/線程調(diào)度管理是實現(xiàn)這些特性的關(guān)鍵部分。調(diào)度管理決定系統(tǒng)的眾多線程哪個線程獲得執(zhí)
    的頭像 發(fā)表于 02-05 10:31 ?1370次閱讀
    英創(chuàng)信息技術(shù)<b class='flag-5'>Linux</b>系統(tǒng)<b class='flag-5'>調(diào)度</b>簡介

    Linux進程調(diào)度時機概念分析

    Linux在眾多進程是怎么進行調(diào)度的,這個牽涉到Linux進程調(diào)度時機的概念,由Linux內(nèi)核
    的頭像 發(fā)表于 01-23 17:14 ?2932次閱讀
    <b class='flag-5'>Linux</b>進程<b class='flag-5'>調(diào)度</b>時機概念分析

    帶大家看看Linux內(nèi)核如何調(diào)度進程的

    部分,打開調(diào)度的黑匣子,來看看Linux內(nèi)核如何調(diào)度進程的。實際上,進程調(diào)度主要做兩件事:選
    的頭像 發(fā)表于 07-26 15:14 ?2150次閱讀