一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從硬件引申出內(nèi)存屏障,帶你深入了解Linux內(nèi)核RCU

電子工程師 ? 來源:未知 ? 作者:佚名 ? 2017-09-19 11:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文簡介

本文從硬件的角度引申出內(nèi)存屏障,這不是內(nèi)存屏障的詳盡手冊(cè),但是相關(guān)知識(shí)對(duì)于理解RCU有所幫助。這不是一篇單獨(dú)的文章,這是《謝寶友:深入理解Linux RCU》系列的第2篇,前序文章:

謝寶友: 深入理解Linux RCU之一——從硬件說起

作者簡介

謝寶友,在編程一線工作已經(jīng)有20年時(shí)間,其中接近10年時(shí)間工作于Linux操作系統(tǒng)。在中興通訊操作系統(tǒng)產(chǎn)品部工作期間,他作為技術(shù)總工參與的電信級(jí)嵌入式實(shí)時(shí)操作系統(tǒng),獲得了行業(yè)最高獎(jiǎng)----中國工業(yè)大獎(jiǎng)。

同時(shí),他也是《深入理解并行編程》一書的譯者。該書作者Paul E.McKeney是IBM Linux中心領(lǐng)導(dǎo)者,Linux RCU Maintainer?!渡钊肜斫釸CU》系列文章整理了Paul E.McKeney的相關(guān)著作,希望能幫助讀者更深刻的理解Linux內(nèi)核中非常難于理解的模塊----RCU。

聯(lián)系方式:

mail:scxby@163.com

微信:linux-kernel

稿件征集

歡迎您給Linuxer投稿,贏得人民郵電異步社區(qū)任意在售技術(shù)圖書。您隨便挑,詳情:Linuxer-"Linux開發(fā)者自己的媒體"首月稿件錄取和贈(zèng)書名單

Linuxer-"Linux開發(fā)者自己的媒體"第二月稿件錄取和贈(zèng)書名單

一、內(nèi)存Cache還有哪些不足?

上一篇文章我們談到了內(nèi)存Cache,并且描述了典型的Cache一致性協(xié)議MESI。Cache的根本目的,是解決內(nèi)存與CPU速度多達(dá)兩個(gè)數(shù)量級(jí)的性能差異。一個(gè)包含Cache的計(jì)算機(jī)系統(tǒng),其結(jié)構(gòu)可以簡單的表示為下圖:

僅僅只有Cache的計(jì)算機(jī)系統(tǒng),它還存在如下問題:

1、Cache的速度,雖然比內(nèi)存有了極大的提升,但是仍然比CPU慢幾倍。

2、在發(fā)生“warmup cache miss”、“capacity miss”、“associativity miss”時(shí),CPU必須等待從內(nèi)存中讀取數(shù)據(jù),此時(shí)CPU會(huì)處于一種Stall的狀態(tài)。其等待時(shí)間可能達(dá)到幾百個(gè)CPU指令周期。

顯然,這是現(xiàn)代計(jì)算機(jī)不能承受之重:)

二、Write buffer是為了解決什么問題?

如果CPU僅僅是執(zhí)行foo = 1這樣的語句,它其實(shí)無須從內(nèi)存或者緩存中讀取foo現(xiàn)在的值。因?yàn)闊o論foo當(dāng)前的值是什么,它都會(huì)被覆蓋。在僅僅只有Cache的系統(tǒng)中,foo = 1 這樣的操作也會(huì)形成寫停頓。自然而然的,CPU設(shè)計(jì)者應(yīng)當(dāng)會(huì)想到在Cache CPU之間再添加一級(jí)緩存。由于這樣的緩存主要是應(yīng)對(duì)寫操作引起的Cache Miss,并且緩存的數(shù)據(jù)與寫操作相關(guān),因此CPU設(shè)計(jì)者將它命名為“Write buffer”。調(diào)整后的結(jié)構(gòu)示意圖如下(圖中的store buffer即為write buffer):

通過增加這些Write buffer,CPU可以簡單的將要保存的數(shù)據(jù)放到Write buffer 中,并且繼續(xù)運(yùn)行,而不會(huì)真正去等待Cache從內(nèi)存中讀取數(shù)據(jù)并返回。

對(duì)于特定CPU來說,這些Write buffer是屬于本地的?;蛘咴谟布嗑€程系統(tǒng)中,它對(duì)于特定核來說,是屬于本地的。無論哪一種情況,一個(gè)特定CPU僅僅允許訪問分配給它的Writebuffer。例如,在上圖中,CPU 0不能訪問CPU 1的存儲(chǔ)緩沖,反之亦然。

Write buffer進(jìn)一步提升了系統(tǒng)性能,但是它也會(huì)為硬件設(shè)計(jì)者帶來一些困擾:

第一個(gè)困擾:違反了自身一致性。

考慮如下代碼:變量“a”和“b”都初始化為0,包含變量“a”緩存行,最初被CPU 1所擁有,而包含變量“b”的緩存行最初被CPU0所擁有:

1 a = 1;

2 b = a + 1;

3 assert(b == 2);

沒有哪一位軟件工程師希望斷言被觸發(fā)!

然而,如果采用上圖中的簡單系統(tǒng)結(jié)構(gòu),斷言確實(shí)會(huì)被觸發(fā)。理解這一點(diǎn)的關(guān)鍵在于:a最初被CPU 1所擁有,而CPU 0在執(zhí)行a = 1時(shí),將a的新值存儲(chǔ)在CPU 0Write buffer中。

在這個(gè)簡單系統(tǒng)中,觸發(fā)斷言的事件順序可能如下:

1CPU 0 開始執(zhí)行a = 1。

2CPU 0在緩存中查找“a”,并且發(fā)現(xiàn)緩存缺失。

3.因此,CPU 0發(fā)送一個(gè)讀使無效(read-invalidate message)消息,以獲得包含“a”的獨(dú)享緩存行。

4CPU 0“a”記錄到存儲(chǔ)緩沖區(qū)。

5CPU 1接收到讀使無效消息,它通過發(fā)送緩存行數(shù)據(jù),并從它的緩存行中移除數(shù)據(jù)來響應(yīng)這個(gè)消息。

6CPU 0開始執(zhí)行b = a + 1。

7CPU 0CPU 1接收到緩存行,它仍然擁有一個(gè)為“0”“a”值。

8CPU 0從它的緩存中讀取到“a”的值,發(fā)現(xiàn)其值為0

9CPU 0將存儲(chǔ)隊(duì)列中的條目應(yīng)用到最近到達(dá)的緩存行,設(shè)置緩存行中的“a”的值為1。

10CPU 0將前面加載的“a”01,并存儲(chǔ)該值到包含“b”的緩存行中(假設(shè)已經(jīng)被CPU 0所擁有)。

11CPU 0 執(zhí)行assert(b == 2),并引起錯(cuò)誤。

針對(duì)這種情況,硬件設(shè)計(jì)者對(duì)軟件工程師還是給予了必要的同情。他們會(huì)對(duì)系統(tǒng)進(jìn)行稍許的改進(jìn),如下圖:

在調(diào)整后的架構(gòu)中,每個(gè)CPU在執(zhí)行加載操作時(shí),將考慮(或者嗅探)它的Writebuffer。這樣,在前面執(zhí)行順序的第8步,將在存儲(chǔ)緩沖區(qū)中為“a”找到正確的值1 ,因此最終的“b”值將是2,這正是我們期望的。

Write buffer帶來的第二個(gè)困擾,是違反了全局內(nèi)存序??紤]如下的代碼順序,其中變量“a”、“b”的初始值是0

1 void foo(void)

2 {

3 a = 1;

4 b = 1;

5 }

6

7 void bar(void)

8 {

9 while (b == 0) continue;

10 assert(a == 1);

11 }

假設(shè)CPU 0執(zhí)行foo(),CPU1執(zhí)行bar(),再進(jìn)一步假設(shè)包含“a”的緩存行僅僅位于CPU1的緩存中,包含“b”的緩存行被CPU 0所擁有。那么操作順序可能如下:

1CPU 0 執(zhí)行a = 1。緩存行不在CPU0的緩存中,因此CPU0將“a”的新值放到Write buffer,并發(fā)送一個(gè)“讀使無效”消息。

2CPU 1 執(zhí)行while (b == 0) continue,但是包含“b”的緩存行不在它的緩存中,因此它發(fā)送一個(gè)“讀”消息。

3CPU 0 執(zhí)行 b = 1,它已經(jīng)擁有了該緩存行(換句話說,緩存行要么已經(jīng)處于“modified”,要么處于“exclusive”狀態(tài)),因此它存儲(chǔ)新的“b”值到它的緩存行中。

4CPU 0 接收到“讀”消息,并且發(fā)送緩存行中的最近更新的“b”的值到CPU1,同時(shí)將緩存行設(shè)置為“shared”狀態(tài)。

5CPU 1 接收到包含“b”值的緩存行,并將其值寫到它的緩存行中。

6CPU 1 現(xiàn)在結(jié)束執(zhí)行while (b ==0) continue,因?yàn)樗l(fā)現(xiàn)“b”的值是1,它開始處理下一條語句。

7CPU 1 執(zhí)行assert(a == 1),并且,由于CPU 1工作在舊的“a”的值,因此斷言驗(yàn)證失敗。

8CPU 1 接收到“讀使無效”消息,并且發(fā)送包含“a”的緩存行到CPU 0,同時(shí)在它的緩存中,將該緩存行變成無效。但是已經(jīng)太遲了。

9CPU 0 接收到包含“a”的緩存行,并且及時(shí)將存儲(chǔ)緩沖區(qū)的數(shù)據(jù)保存到緩存行中,CPU1的斷言失敗受害于該緩存行。

請(qǐng)注意,“內(nèi)存屏障”已經(jīng)在這里隱隱約約露出了它鋒利的爪子!?。?!

三、使無效隊(duì)列又是為了解決什么問題?

一波未平,另一波再起。

問題的復(fù)雜性還不僅僅在于Writebuffer,因?yàn)閮H僅有Write buffer,硬件還會(huì)形成嚴(yán)重的性能瓶頸。

問題在于,每一個(gè)核的Writebuffer相對(duì)而言都比較小,這意味著執(zhí)行一段較小的存儲(chǔ)操作序列的CPU,很快就會(huì)填滿它的Writebuffer。此時(shí),CPU在能夠繼續(xù)執(zhí)行前,必須等待Cache刷新操作完成,以清空它的Write buffer。

清空Cache是一個(gè)耗時(shí)的操作,因?yàn)楸仨氁谒?/span>CPU之間廣播MESI消息(使無效消息),并等待對(duì)這些MESI消息的響應(yīng)。為了加快MESI消息響應(yīng)速度,CPU設(shè)計(jì)者增加了使無效隊(duì)列。也就是說,CPU將接收到的使無效消息暫存起來,在發(fā)送使無效消息應(yīng)答時(shí),并不真正將Cache中的值無效。而是等待在合適的時(shí)候,延遲使無效操作。

下圖是增加了使無效隊(duì)列的系統(tǒng)結(jié)構(gòu):

將一個(gè)條目放進(jìn)使無效隊(duì)列,實(shí)際上是由CPU承諾:在發(fā)送任何與該緩存行相關(guān)的MESI協(xié)議消息前,處理該條目。在Cache競爭不太劇烈的情況下,CPU會(huì)很出色地完成此事。

使無效隊(duì)列帶來的問題是:在沒有真正將Cache無效之前,就告訴其他CPU已經(jīng)使無效了。這多少有一點(diǎn)欺騙的意思。然而現(xiàn)代CPU確實(shí)是這樣設(shè)計(jì)的。

這個(gè)事實(shí)帶來了額外的內(nèi)存亂序的機(jī)會(huì),看看如下示例:

假設(shè)“a”和“b”被初始化為0,“a”是只讀的(MESIshared”狀態(tài)),“b”被CPU 0擁有(MESIexclusive”或者“modified”狀態(tài))。然后假設(shè)CPU 0執(zhí)行foo()CPU1執(zhí)行bar(),代碼片段如下:

1 void foo(void)

2 {

3 a = 1;

4 smp_mb();

5 b = 1;

6 }

7

8 void bar(void)

9 {

10 while (b == 0) continue;

11 assert(a == 1);

12 }

操作順序可能如下:

1CPU 0執(zhí)行a = 1。在CPU0中,相應(yīng)的緩存行是只讀的,因此CPU 0將“a”的新值放入存儲(chǔ)緩沖區(qū),并發(fā)送一個(gè)“使無效”消息,這是為了使CPU1的緩存中相應(yīng)的緩存行失效。

2CPU 1執(zhí)行while (b == 0)continue,但是包含“b”的緩存行不在它的緩存中,因此它發(fā)送一個(gè)“讀”消息。

3CPU 1接收到CPU 0的“使無效”消息,將它排隊(duì),并立即響應(yīng)該消息。

4CPU 0接收到來自于CPU 1的響應(yīng)消息,因此它放心的通過第4行的smp_mb(),從存儲(chǔ)緩沖區(qū)移動(dòng)“a”的值到緩存行。

5CPU 0執(zhí)行b = 1。它已經(jīng)擁有這個(gè)緩存行(也就是說,緩存行已經(jīng)處于“modified”或者“exclusive”狀態(tài)),因此它將“b”的新值存儲(chǔ)到緩存行中。

6CPU 0接收到“讀”消息,并且發(fā)送包含“b”的新值的緩存行到CPU 1,同時(shí)在自己的緩存中,標(biāo)記緩存行為“shared”狀態(tài)。

7CPU 1接收到包含“b”的緩存行并且將其應(yīng)用到本地緩存。

8CPU 1現(xiàn)在可以完成while (b ==0) continue,因?yàn)樗l(fā)現(xiàn)“b”的值為1,接著處理下一條語句。

9CPU 1執(zhí)行assert(a == 1),并且,由于舊的“a”值還在CPU 1的緩存中,因此陷入錯(cuò)誤。

10.雖然陷入錯(cuò)誤,CPU 1處理已經(jīng)排隊(duì)的“使無效”消息,并且(遲到)在自己的緩存中刷新包含“a”值的緩存行。

四、內(nèi)存屏障

既然硬件設(shè)計(jì)者通過Write buffer和使無效隊(duì)列引入了額外的內(nèi)存亂序問題,那么就應(yīng)當(dāng)為軟件工程師提供某種方法來解決這個(gè)問題。即使相應(yīng)的解決方法會(huì)折磨軟件工程師。

答案就是內(nèi)存屏障。對(duì)于Linux內(nèi)核資深工程師來說,這個(gè)答案也顯得比較沉重,它太折磨人了:)

我們先看看Write buffer一節(jié)中,觸發(fā)斷言的例子,應(yīng)該怎么修改。

在那個(gè)例子中,硬件設(shè)計(jì)者不能直接幫助我們,因?yàn)?/span> CPU沒有辦法識(shí)別那些相關(guān)聯(lián)的變量(例子中的ab),更不用說它們?nèi)绾侮P(guān)聯(lián)。因此,硬件設(shè)計(jì)者提供內(nèi)存屏障指令,以允許軟件告訴CPU這些關(guān)系的存在。程序必須修改,以包含內(nèi)存屏障:

1 void foo(void)

2 {

3 a = 1;

4 smp_mb();

5 b = 1;

6 }

7

8 void bar(void)

9 {

10 while (b == 0) continue;

11 assert(a == 1);

12 }

內(nèi)存屏障smp_mb()將導(dǎo)致CPU在刷新后續(xù)的緩存行(包含b的緩存行)之前,前面的Write buffer被先刷新。在繼續(xù)處理之前,CPU可能采取的動(dòng)作是:

1、簡單的停頓下來,直到存儲(chǔ)緩沖區(qū)變成空;

2、也可能是使用存儲(chǔ)緩沖區(qū)來持有后續(xù)的存儲(chǔ)操作,直到前面所有的存儲(chǔ)緩沖區(qū)已經(jīng)被保存到緩存行中。

理解其中第2點(diǎn),能夠幫助我們理解“內(nèi)存屏障”這個(gè)單詞的來歷?。?/span>

后一種情況下,操作序列可能如下所示:

1CPU 0執(zhí)行a= 1。緩存行不在CPU0的緩存中,因此CPU 0將“a”的新值放到存儲(chǔ)緩沖中,并發(fā)送一個(gè)“讀使無效”消息。

2CPU 1 執(zhí)行while(b == 0) continue,但是包含“b”的緩存行不在它的緩存中,因此它發(fā)送一個(gè)“讀”消息。

3CPU 0執(zhí)行smp_mb(),并標(biāo)記當(dāng)前所有存儲(chǔ)緩沖區(qū)的條目。(也就是說a = 1這個(gè)條目)。

4CPU 0執(zhí)行b= 1。它已經(jīng)擁有這個(gè)緩存行了。(也就是說, 緩存行已經(jīng)處于“modified”或者“exclusive”狀態(tài)),但是在存儲(chǔ)緩沖區(qū)中存在一個(gè)標(biāo)記條目。因此,它不將“b”的新值存放到緩存行,而是存放到存儲(chǔ)緩沖區(qū)中。(但是“b”不是一個(gè)標(biāo)記條目)。

5CPU 0接收“讀”消息,隨后發(fā)送包含原始“b”值的緩存行給CPU1。它也標(biāo)記該緩存行的復(fù)制為“shared”狀態(tài)。

6CPU 1讀取到包含“b”的緩存行,并將它復(fù)制到本地緩存中。

7CPU 1現(xiàn)在可以裝載“b”的值了,但是,由于它發(fā)現(xiàn)其值仍然為“0”,因此它重復(fù)執(zhí)行while語句?!?/span>b”的新值被安全的隱藏在CPU0的存儲(chǔ)緩沖區(qū)中。

8CPU 1接收到“讀使無效”消息,發(fā)送包含“a”的緩存行給CPU 0,并且使它的緩存行無效。

9CPU 0接收到包含“a”的緩存行,使用存儲(chǔ)緩沖區(qū)的值替換緩存行,將這一行設(shè)置為“modified”狀態(tài)。

10.由于被存儲(chǔ)的“a”是存儲(chǔ)緩沖區(qū)中唯一被smp_mb()標(biāo)記的條目,因此CPU0能夠存儲(chǔ)“b”的新值到緩存行中,除非包含“b”的緩存行當(dāng)前處于“shared”狀態(tài)。

11CPU 0發(fā)送一個(gè)“使無效”消息給CPU 1。

12CPU 1接收到“使無效”消息,使包含“b”的緩存行無效,并且發(fā)送一個(gè)“使無效應(yīng)答”消息給 CPU 0。

13CPU 1執(zhí)行while(b == 0) continue,但是包含“b”的緩存行不在它的緩存中,因此它發(fā)送一個(gè)“讀”消息給 CPU 0

14CPU 0接收到“使無效應(yīng)答”消息,將包含“b”的緩存行設(shè)置成“exclusive”狀態(tài)。CPU 0現(xiàn)在存儲(chǔ)新的“b”值到緩存行。

15CPU 0接收到“讀”消息,同時(shí)發(fā)送包含新的“b”值的緩存行給 CPU 1。它也標(biāo)記該緩存行的復(fù)制為“shared”狀態(tài)。

16CPU 1接收到包含“b”的緩存行,并將它復(fù)制到本地緩存中。

17CPU 1現(xiàn)在能夠裝載“b”的值了,由于它發(fā)現(xiàn)“b”的值為1,它退出while循環(huán)并執(zhí)行下一條語句。

18CPU 1執(zhí)行assert(a== 1),但是包含“a”的緩存行不在它的緩存中。一旦它從CPU0獲得這個(gè)緩存行,它將使用最新的“a”的值,因此斷言語句將通過。

正如你看到的那樣,這個(gè)過程涉及不少工作。即使某些事情從直覺上看是簡單的操作,就像“加載a的值”這樣的操作,都會(huì)包含大量復(fù)雜的步驟。

前面提到的,其實(shí)是寫端的屏障,它解決Write buffer引入的內(nèi)存亂序。接下來我們看看讀端的屏障,它解決使無效隊(duì)列引入的內(nèi)存亂序。

要避免使無效隊(duì)列例子中的錯(cuò)誤,應(yīng)當(dāng)再使用讀端內(nèi)存屏障:

讀端內(nèi)存屏障指令能夠與使無效隊(duì)列交互,這樣,當(dāng)一個(gè)特定的CPU執(zhí)行一個(gè)內(nèi)存屏障時(shí),它標(biāo)記無效隊(duì)列中的所有條目,并強(qiáng)制所有后續(xù)的裝載操作進(jìn)行等待,直到所有標(biāo)記的條目都保存到CPUCache中。因此,我們可以在bar函數(shù)中添加一個(gè)內(nèi)存屏障,如下:

1 void foo(void)

2 {

3 a = 1;

4 smp_mb();

5 b = 1;

6 }

7

8 void bar(void)

9 {

10 while (b == 0) continue;

11 smp_mb();

12 assert(a == 1);

13 }

有了這個(gè)變化后,操作順序可能如下:

1CPU 0執(zhí)行a= 1。相應(yīng)的緩存行在CPU0的緩存中是只讀的,因此CPU0將“a”的新值放入它的存儲(chǔ)緩沖區(qū),并且發(fā)送一個(gè)“使無效”消息以刷新CPU1相應(yīng)的緩存行。

2CPU 1 執(zhí)行while(b == 0) continue,但是包含“b”的緩存行不在它的緩存中,因此它發(fā)送一個(gè)“讀”消息。

3CPU 1 接收到 CPU 0的“使無效”消息,將它排隊(duì),并立即響應(yīng)它。

4CPU 0 接收到CPU1的響應(yīng),因此它放心的通過第4行的smp_mb()語句,將“a”從它的存儲(chǔ)緩沖區(qū)移到緩存行。

5CPU 0 執(zhí)行b= 1。它已經(jīng)擁有該緩存行(換句話說, 緩存行已經(jīng)處于“modified”或者“exclusive”狀態(tài)),因此它存儲(chǔ)“b”的新值到緩存行。

6CPU 0 接收到“讀”消息,并且發(fā)送包含新的“b”值的緩存行給CPU1,同時(shí)在自己的緩存中,標(biāo)記緩存行為“shared”狀態(tài)。

7CPU 1 接收到包含“b”的緩存行并更新到它的緩存中。

8CPU 1 現(xiàn)在結(jié)束執(zhí)行while (b == 0) continue,因?yàn)樗l(fā)現(xiàn)“b”的值為 1,它處理下一條語句,這是一條內(nèi)存屏障指令。

9CPU 1 必須停頓,直到它處理完使無效隊(duì)列中的所有消息。

10CPU 1 處理已經(jīng)入隊(duì)的“使無效”消息,從它的緩存中使無效包含“a”的緩存行。

11CPU 1 執(zhí)行assert(a== 1),由于包含“a”的緩存行已經(jīng)不在它的緩存中,它發(fā)送一個(gè)“讀”消息。

12CPU 0 以包含新的“a”值的緩存行響應(yīng)該“讀”消息。

13CPU 1 接收到該緩存行,它包含新的“a”的值1,因此斷言不會(huì)被觸發(fā)。

即使有很多MESI消息傳遞,CPU最終都會(huì)正確的應(yīng)答。這一節(jié)闡述了CPU設(shè)計(jì)者為什么必須格外小心地處理它們的緩存一致性優(yōu)化操作。

但是,這里真的需要一個(gè)讀端內(nèi)存屏障么?在assert()之前,不是有個(gè)循環(huán)么?

難道在循環(huán)結(jié)束之前,會(huì)執(zhí)行assert(a == 1)

對(duì)此有疑問的讀者,您需要補(bǔ)充一點(diǎn)關(guān)于猜測(冒險(xiǎn))執(zhí)行的背景知識(shí)!可以找CPU參考手冊(cè)看看。簡單的說,在循環(huán)的時(shí)候,a== 1這個(gè)比較條件,有可能會(huì)被CPU預(yù)先加載a的值到流水線中。臨時(shí)結(jié)果不會(huì)被保存到Cache或者Write buffer中,而是在CPU流水線中的臨時(shí)結(jié)果寄存器中暫存起來 。

這是不是非常的反直覺?然而事實(shí)就是如此。

對(duì)CPU世界中反直覺的東西有興趣的朋友,甚至可以看看量子力學(xué)方面的書,量子計(jì)算機(jī)真的需要懂量子力學(xué)。讓《深入理解并行編程》一書中提到的“薛定諤的貓”來燒一下腦,這只貓已經(jīng)折磨了無數(shù)天才的大腦。除了霍金,還有愛因斯坦的大腦!

五、關(guān)于內(nèi)存屏障進(jìn)一步的思考

本文僅僅從硬件的角度,引申出內(nèi)存屏障。其目的是為了后續(xù)文章中,更好的講解RCU。因此,并不會(huì)對(duì)內(nèi)存屏障進(jìn)行深入的剖析。但是,對(duì)于理解RCU來說,本文中的內(nèi)存屏障知識(shí)已經(jīng)可以了。

更深入的思考包括:

1、讀屏障、寫屏障、讀依賴屏障的概念

2、各個(gè)體系架構(gòu)中,屏障的實(shí)現(xiàn)、及其微妙的差別

3、深入思考內(nèi)存屏障是否是必須的,有沒有可能通過修改硬件,讓屏障不再有用?

4、內(nèi)存屏障的傳遞性,這是Linux系統(tǒng)中比較微妙而難于理解的概念。

5、單核架構(gòu)中的屏障,是為了解決什么問題?怎么使用?

6、屏障在內(nèi)核同步原語中的使用,滿足了什么樣的同步原語語義?


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11511

    瀏覽量

    213858
  • 內(nèi)存屏障
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1805
  • rcu
    rcu
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    5614

原文標(biāo)題:謝寶友:深入理解Linux RCU:從硬件說起之內(nèi)存屏障

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    謝寶友教你學(xué)Linux深入理解Linux RCU硬件說起

    RCULinux內(nèi)核中很難的一部分,本系列文章一點(diǎn)一滴地來把RCU說清楚。第一次連載,是描述硬件
    的頭像 發(fā)表于 09-04 10:29 ?6247次閱讀
    謝寶友教你學(xué)<b class='flag-5'>Linux</b>:<b class='flag-5'>深入</b>理解<b class='flag-5'>Linux</b> <b class='flag-5'>RCU</b>之<b class='flag-5'>從</b><b class='flag-5'>硬件</b>說起

    基于Linux內(nèi)核源碼的RCU實(shí)現(xiàn)方案

    RCU(Read-Copy Update)是數(shù)據(jù)同步的一種方式,在當(dāng)前的Linux內(nèi)核中發(fā)揮著重要的作用。RCU主要針對(duì)的數(shù)據(jù)對(duì)象是鏈表,目的是提高遍歷讀取數(shù)據(jù)的效率,為了達(dá)到目的使用
    的頭像 發(fā)表于 09-25 15:10 ?2837次閱讀

    走進(jìn)Linux內(nèi)存系統(tǒng)探尋內(nèi)存管理的機(jī)制和奧秘

    Linux 內(nèi)存是后臺(tái)開發(fā)人員,需要深入了解的計(jì)算機(jī)資源。合理的使用內(nèi)存,有助于提升機(jī)器的性能和穩(wěn)定性。本文主要介紹Linux
    的頭像 發(fā)表于 01-05 09:47 ?1962次閱讀

    深入理解Linux RCU硬件說起之內(nèi)存屏障

    上一篇文章我們談到了內(nèi)存Cache,并且描述了典型的Cache一致性協(xié)議MESI。Cache的根本目的,是解決內(nèi)存與CPU速度多達(dá)兩個(gè)數(shù)量級(jí)的性能差異。
    的頭像 發(fā)表于 12-25 13:42 ?1260次閱讀
    <b class='flag-5'>深入</b>理解<b class='flag-5'>Linux</b> <b class='flag-5'>RCU</b>:<b class='flag-5'>從</b><b class='flag-5'>硬件</b>說起之<b class='flag-5'>內(nèi)存</b><b class='flag-5'>屏障</b>

    Linux內(nèi)核RCU的用法

    Linux內(nèi)核中,RCU最常見的用途是替換讀寫鎖。在20世紀(jì)90年代初期,Paul在實(shí)現(xiàn)通用RCU之前,實(shí)現(xiàn)了一種輕量級(jí)的讀寫鎖。后來,為這個(gè)輕量級(jí)讀寫鎖原型所設(shè)想的每個(gè)用途,最終都
    的頭像 發(fā)表于 12-27 09:56 ?2678次閱讀
    <b class='flag-5'>Linux</b><b class='flag-5'>內(nèi)核</b>中<b class='flag-5'>RCU</b>的用法

    一文帶你深入了解linux驅(qū)動(dòng)

    根本都不知道這個(gè)佛是哪一路神仙。 那今天我們就先帶大家來深入了解下嵌入式開發(fā)中至關(guān)重要的一環(huán):linux驅(qū)動(dòng)。 在學(xué)習(xí)驅(qū)動(dòng)之前,我們首先來了解下操作系統(tǒng)。 # 操作系統(tǒng)OPERATING SYSTEM
    發(fā)表于 04-15 09:59

    帶你深入了解光耦

    電子發(fā)燒友網(wǎng)帶你深入了解光耦相關(guān)知識(shí),講述光耦的作用,光耦原理及各種光耦型號(hào)和替代型號(hào),讓大家全面了解光電耦合器
    發(fā)表于 03-16 16:43
    <b class='flag-5'>帶你</b><b class='flag-5'>深入了解</b>光耦

    linux內(nèi)核rcu機(jī)制詳解

    Linux內(nèi)核源碼當(dāng)中,關(guān)于RCU的文檔比較齊全,你可以在 /Documentation/RCU/ 目錄下找到這些文件。Paul E. McKenney 是
    發(fā)表于 11-13 16:47 ?9012次閱讀
    <b class='flag-5'>linux</b><b class='flag-5'>內(nèi)核</b><b class='flag-5'>rcu</b>機(jī)制詳解

    了解IC內(nèi)部結(jié)構(gòu)嗎本文帶你深入了解

    本文檔的主要內(nèi)容詳細(xì)介紹的是IC內(nèi)部結(jié)構(gòu) 你了解IC內(nèi)部結(jié)構(gòu)嗎本文帶你深入了解
    的頭像 發(fā)表于 03-09 11:33 ?1.2w次閱讀
    你<b class='flag-5'>了解</b>IC內(nèi)部結(jié)構(gòu)嗎本文<b class='flag-5'>帶你</b><b class='flag-5'>深入了解</b>

    深入了解RCU是怎樣實(shí)現(xiàn)的?

    RCU(Read-Copy Update),顧名思義就是讀-拷貝修改,它是基于其原理命名的。對(duì)于被RCU保護(hù)的共享數(shù)據(jù)結(jié)構(gòu),讀者不需要獲得任何鎖就可以訪問它,但寫者在訪問它時(shí)首先拷貝一個(gè)副本,然后
    發(fā)表于 05-14 17:37 ?1.4w次閱讀
     <b class='flag-5'>深入了解</b><b class='flag-5'>RCU</b>是怎樣實(shí)現(xiàn)的?

    可以了解并學(xué)習(xí)Linux 內(nèi)核的同步機(jī)制

    Linux內(nèi)核同步機(jī)制,挺復(fù)雜的一個(gè)東西,常用的有自旋鎖,信號(hào)量,互斥體,原子操作,順序鎖,RCU,內(nèi)存屏障等。
    發(fā)表于 05-14 14:10 ?823次閱讀

    了解了解Linux內(nèi)核中的RCU機(jī)制

    RCU的設(shè)計(jì)思想比較明確,通過新老指針替換的方式來實(shí)現(xiàn)免鎖方式的共享保護(hù)。但是具體到代碼的層面,理解起來多少還是會(huì)有些困難。在《深入Linux設(shè)備驅(qū)動(dòng)程序內(nèi)核機(jī)制》第4章中,已經(jīng)非常明
    發(fā)表于 05-14 14:28 ?1464次閱讀

    一文帶你深入了解KVM的基本原理

    一、 概述 KVM的全稱是Kernel-based Virtual Machine,其是一種基于linux內(nèi)核的采用硬件輔助虛擬化技術(shù)的全虛擬化解決方案。它最初由以色列的初創(chuàng)公司Qumranet開發(fā)
    的頭像 發(fā)表于 10-20 09:33 ?6295次閱讀
    一文<b class='flag-5'>帶你</b><b class='flag-5'>深入了解</b>KVM的基本原理

    帶你深入了解示波器

    帶你深入了解示波器
    發(fā)表于 02-07 14:26 ?19次下載

    Linux內(nèi)核內(nèi)存屏障的原理和用法分析

    圈里流傳著一句話“珍愛生命,遠(yuǎn)離屏障”,這足以說明內(nèi)存屏障是一個(gè)相當(dāng)晦澀和難以準(zhǔn)確把握的東西。使用過弱的屏障,會(huì)導(dǎo)致軟件不穩(wěn)定。
    的頭像 發(fā)表于 09-05 09:13 ?2427次閱讀