多線程開發(fā)在 Linux 平臺上已經(jīng)有成熟的 Pthread 庫支持。其涉及的多線程開發(fā)的最基本概念主要包含三點:線程,互斥鎖,條件。其中,線程操作又分線程的創(chuàng)建,退出,等待 3 種?;コ怄i則包括 4 種操作,分別是創(chuàng)建,銷毀,加鎖和解鎖。條件操作有 5 種操作:創(chuàng)建,銷毀,觸發(fā),廣播和等待。其他的一些線程擴展概念,如信號燈等,都可以通過上面的三個基本元素的基本操作封裝出來。
線程,互斥鎖,條件在 Linux 平臺上對應(yīng)的 API 可以用表 1 歸納。為了方便熟悉 Windows 線程編程的讀者熟悉 Linux 多線程開發(fā)的 API,我們在表中同時也列出 Windows SDK 庫中所對應(yīng)的 API 名稱。
對象 操作 Linux Pthread API Windows SDK 庫對應(yīng) API 線程 創(chuàng)建 pthread_create CreateThread 退出 pthread_exit ThreadExit 等待 pthread_join WaitForSingleObject 互斥鎖 創(chuàng)建 pthread_mutex_init CreateMutex 銷毀 pthread_mutex_destroy CloseHandle 加鎖 pthread_mutex_lock WaitForSingleObject 解鎖 pthread_mutex_unlock ReleaseMutex 條件 創(chuàng)建 pthread_cond_init CreateEvent 銷毀 pthread_cond_destroy CloseHandle 觸發(fā) pthread_cond_signal SetEvent 廣播 pthread_cond_broadcast SetEvent / ResetEvent 等待 pthread_cond_wait / pthread_cond_timedwait SingleObjectAndWait
多線程開發(fā)在 Linux 平臺上已經(jīng)有成熟的 Pthread 庫支持。其涉及的多線程開發(fā)的最基本概念主要包含三點:線程,互斥鎖,條件。其中,線程操作又分線程的創(chuàng)建,退出,等待 3 種?;コ怄i則包括 4 種操作,分別是創(chuàng)建,銷毀,加鎖和解鎖。條件操作有 5 種操作:創(chuàng)建,銷毀,觸發(fā),廣播和等待。其他的一些線程擴展概念,如信號燈等,都可以通過上面的三個基本元素的基本操作封裝出來。
?
?
互斥鎖是多線程編程中基本的概念,在開發(fā)中被廣泛使用。其調(diào)用次序?qū)哟吻逦唵危航ㄦi,加鎖,解鎖,銷毀鎖。但是需要注意的是,與諸如 Windows 平臺的互斥變量不同,在默認情況下,Linux 下的同一線程無法對同一互斥鎖進行遞歸加速,否則將發(fā)生死鎖。
所謂遞歸加鎖,就是在同一線程中試圖對互斥鎖進行兩次或兩次以上的行為。其場景在 Linux 平臺上的代碼可由清單 1 所示。
// 通過默認條件建鎖 pthread_mutex_t *theMutex = new pthread_mutex_t; pthread_mutexattr_t attr; pthread_mutexattr_init(&attr); pthread_mutex_init(theMutex,&attr); pthread_mutexattr_destroy(&attr); // 遞歸加鎖 pthread_mutex_lock (theMutex); pthread_mutex_lock (theMutex); pthread_mutex_unlock (theMutex); pthread_mutex_unlock (theMutex);
在以上代碼場景中,問題將出現(xiàn)在第二次加鎖操作。由于在默認情況下,Linux 不允許同一線程遞歸加鎖,因此在第二次加鎖操作時線程將出現(xiàn)死鎖。
Linux 互斥變量這種奇怪的行為或許對于特定的某些場景會所有用處,但是對于大多數(shù)情況下看起來更像是程序的一個 bug 。畢竟,在同一線程中對同一互斥鎖進行遞歸加鎖在尤其是二次開發(fā)中經(jīng)常會需要。
這個問題與互斥鎖的中的默認 recursive 屬性有關(guān)。解決問題的方法就是顯式地在互斥變量初始化時將設(shè)置起 recursive 屬性?;诖?,以上代碼其實稍作修改就可以很好的運行,只需要在初始化鎖的時候加設(shè)置一個屬性。請看清單 2 。
pthread_mutexattr_init(&attr); // 設(shè)置 recursive 屬性 pthread_mutexattr_settype(&attr,PTHREAD_MUTEX_RECURSIVE_NP); pthread_mutex_init(theMutex,&attr);
因此,建議盡量設(shè)置 recursive 屬性以初始化 Linux 的互斥鎖,這樣既可以解決同一線程遞歸加鎖的問題,又可以避免很多情況下死鎖的發(fā)生。這樣做還有一個額外的好處,就是可以讓 Windows 和 Linux 下讓鎖的表現(xiàn)統(tǒng)一。
?
條件變量的置位和復(fù)位有兩種常用模型:第一種模型是當(dāng)條件變量置位(signaled)以后,如果當(dāng)前沒有線程在等待,其狀態(tài)會保持為置位(signaled),直到有等待的線程進入被觸發(fā),其狀態(tài)才會變?yōu)閺?fù)位(unsignaled),這種模型的采用以 Windows 平臺上的 Auto-set Event 為代表。其狀態(tài)變化如圖 1 所示:

第二種模型則是 Linux 平臺的 Pthread 所采用的模型,當(dāng)條件變量置位(signaled)以后,即使當(dāng)前沒有任何線程在等待,其狀態(tài)也會恢復(fù)為復(fù)位(unsignaled)狀態(tài)。其狀態(tài)變化如圖 2 所示:

具體來說,Linux 平臺上 Pthread 下的條件變量狀態(tài)變化模型是這樣工作的:調(diào)用 pthread_cond_signal() 釋放被條件阻塞的線程時,無論存不存在被阻塞的線程,條件都將被重新復(fù)位,下一個被條件阻塞的線程將不受影響。而對于 Windows,當(dāng)調(diào)用 SetEvent 觸發(fā) Auto-reset 的 Event 條件時,如果沒有被條件阻塞的線程,那么條件將維持在觸發(fā)狀態(tài),直到有新的線程被條件阻塞并被釋放為止。
這種差異性對于那些熟悉 Windows 平臺上的條件變量狀態(tài)模型而要開發(fā) Linux 平臺上多線程的程序員來說可能會造成意想不到的尷尬結(jié)果。試想要實現(xiàn)一個旅客坐出租車的程序:旅客在路邊等出租車,調(diào)用條件等待。出租車來了,將觸發(fā)條件,旅客停止等待并上車。一個出租車只能搭載一波乘客,于是我們使用單一觸發(fā)的條件變量。這個實現(xiàn)邏輯在第一個模型下即使出租車先到,也不會有什么問題,其過程如圖 3 所示:

然而如果按照這個思路來在 Linux 上來實現(xiàn),代碼看起來可能是清單 3 這樣。
…… // 提示出租車到達的條件變量 pthread_cond_t taxiCond; // 同步鎖 pthread_mutex_t taxiMutex; // 旅客到達等待出租車 void * traveler_arrive(void * name) { cout<< ” Traveler: ” <<(char *)name<< ” needs a taxi now! ” < 好的,運行一下,看看結(jié)果如清單 4 。 Taxi Jack arrives. Traveler Susan needs a taxi now! Taxi Mike arrives. Traveler Susan now got a taxi. 其過程如圖 4 所示: 通過對比結(jié)果,你會發(fā)現(xiàn)同樣的邏輯,在 Linux 平臺上運行的結(jié)果卻完全是兩樣。對于在 Windows 平臺上的模型一, Jack 開著出租車到了站臺,觸發(fā)條件變量。如果沒顧客,條件變量將維持觸發(fā)狀態(tài),也就是說 Jack 停下車在那里等著。直到 Susan 小姐來了站臺,執(zhí)行等待條件來找出租車。 Susan 搭上 Jack 的出租車離開,同時條件變量被自動復(fù)位。 但是到了 Linux 平臺,問題就來了,Jack 到了站臺一看沒人,觸發(fā)的條件變量被直接復(fù)位,于是 Jack 排在等待隊列里面。來遲一秒的 Susan 小姐到了站臺卻看不到在那里等待的 Jack,只能等待,直到 Mike 開車趕到,重新觸發(fā)條件變量,Susan 才上了 Mike 的車。這對于在排隊系統(tǒng)前面的 Jack 是不公平的,而問題癥結(jié)是在于 Linux 平臺上條件變量觸發(fā)的自動復(fù)位引起的一個 Bug 。 條件變量在 Linux 平臺上的這種模型很難說好壞。但是在實際開發(fā)中,我們可以對代碼稍加改進就可以避免這種差異的發(fā)生。由于這種差異只發(fā)生在觸發(fā)沒有被線程等待在條件變量的時刻,因此我們只需要掌握好觸發(fā)的時機即可。最簡單的做法是增加一個計數(shù)器記錄等待線程的個數(shù),在決定觸發(fā)條件變量前檢查下該變量即可。改進后 Linux 函數(shù)如清單 5 所示。 …… // 提示出租車到達的條件變量 pthread_cond_t taxiCond; // 同步鎖 pthread_mutex_t taxiMutex; // 旅客人數(shù),初始為 0 int travelerCount=0; // 旅客到達等待出租車 void * traveler_arrive(void * name) { cout<< ” Traveler: ” <<(char *)name<< ” needs a taxi now! ” < 因此我們建議在 Linux 平臺上要出發(fā)條件變量之前要檢查是否有等待的線程,只有當(dāng)有線程在等待時才對條件變量進行觸發(fā)。 ? 在 Linux 調(diào)用 pthread_cond_wait 進行條件變量等待操作時,我們增加一個互斥變量參數(shù)是必要的,這是為了避免線程間的競爭和饑餓情況。但是當(dāng)條件等待返回時候,需要注意的是一定不要遺漏對互斥變量進行解鎖。 Linux 平臺上的 pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex) 函數(shù)返回時,互斥鎖 mutex 將處于鎖定狀態(tài)。因此之后如果需要對臨界區(qū)數(shù)據(jù)進行重新訪問,則沒有必要對 mutex 就行重新加鎖。但是,隨之而來的問題是,每次條件等待以后需要加入一步手動的解鎖操作。正如前文中乘客等待出租車的 Linux 代碼如清單 6 所示: void * traveler_arrive(void * name) { cout<< ” Traveler: ” <<(char *)name<< ” needs a taxi now! ” < 這一點對于熟悉 Windows 平臺多線程開發(fā)的開發(fā)者來說尤為重要。 Windows 上的 SignalObjectAndWait() 函數(shù)是常與 Linux 平臺上的 pthread_cond_wait() 函數(shù)被看作是跨平臺編程時的一對等價函數(shù)。但是需要注意的是,兩個函數(shù)退出時的狀態(tài)是不一樣的。在 Windows 平臺上,SignalObjectAndWait(HANDLE a, HANDLE b, …… ) 方法在調(diào)用結(jié)束返回時的狀態(tài)是 a 和 b 都是置位(signaled)狀態(tài),在普遍的使用方法中,a 經(jīng)常是一個 Mutex 變量,在這種情況下,當(dāng)返回時,Mutex a 處于解鎖狀態(tài)(signaled),Event b 處于置位狀態(tài)(signaled), 因此,對于 Mutex a 而言,我們不需要考慮解鎖的問題。而且,在 SignalObjectAndWait() 之后,如果需要對臨界區(qū)數(shù)據(jù)進行重新訪問,都需要調(diào)用 WaitForSingleObject() 重新加鎖。這一點剛好與 Linux 下的 pthread_cond_wait() 完全相反。 Linux 對于 Windows 的這一點額外解鎖的操作區(qū)別很重要,一定得牢記。否則從 Windows 移植到 Linux 上的條件等待操作一旦忘了結(jié)束后的解鎖操作,程序?qū)⒖隙〞l(fā)生死鎖。 ? 超時是多線程編程中一個常見的概念。例如,當(dāng)你在 Linux 平臺下使用 pthread_cond_timedwait() 時就需要指定超時這個參數(shù),以便這個 API 的調(diào)用者最多只被阻塞指定的時間間隔。但是如果你是第一次使用這個 API 時,首先你需要了解的就是這個 API 當(dāng)中超時參數(shù)的特殊性(就如本節(jié)標題所提示的那樣)。我們首先來看一下這個 API 的定義。 pthread_cond_timedwait() 定義請看清單 7 。 int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict abstime); 參數(shù) abstime 在這里用來表示和超時時間相關(guān)的一個參數(shù),但是需要注意的是它所表示的是一個絕對時間,而不是一個時間間隔數(shù)值,只有當(dāng)系統(tǒng)的當(dāng)前時間達到或者超過 abstime 所表示的時間時,才會觸發(fā)超時事件。這對于擁有 Windows 平臺線程開發(fā)經(jīng)驗的人來說可能尤為困惑。因為 Windows 平臺下所有的 API 等待參數(shù)(如 SignalObjectAndWait,等)都是相對時間, 假設(shè)我們指定相對的超時時間參數(shù)如 dwMilliseconds (單位毫秒)來調(diào)用和超時相關(guān)的函數(shù),這樣就需要將 dwMilliseconds 轉(zhuǎn)化為 Linux 下的絕對時間參數(shù) abstime 使用。常用的轉(zhuǎn)換方法如清單 8 所示: /* get the current time */ struct timeval now; gettimeofday(&now, NULL); /* add the offset to get timeout value */ abstime ->tv_nsec = now.tv_usec * 1000 + (dwMilliseconds % 1000) * 1000000; abstime ->tv_sec = now.tv_sec + dwMilliseconds / 1000; Linux 的絕對時間看似簡單明了,卻是開發(fā)中一個非常隱晦的陷阱。而且一旦你忘了時間轉(zhuǎn)換,可以想象,等待你的錯誤將是多么的令人頭疼:如果忘了把相對時間轉(zhuǎn)換成絕對時間,相當(dāng)于你告訴系統(tǒng)你所等待的超時時間是過去式的 1970 年 1 月 1 號某個時間段,于是操作系統(tǒng)毫不猶豫馬上送給你一個 timeout 的返回值,然后你會舉著拳頭抱怨為什么另外一個同步線程耗時居然如此之久,并一頭扎進尋找耗時原因的深淵里。 ? 在 Linux 平臺下,當(dāng)處理線程結(jié)束時需要注意的一個問題就是如何讓一個線程善始善終,讓其所占資源得到正確釋放。在 Linux 平臺默認情況下,雖然各個線程之間是相互獨立的,一個線程的終止不會去通知或影響其他的線程。但是已經(jīng)終止的線程的資源并不會隨著線程的終止而得到釋放,我們需要調(diào)用 pthread_join() 來獲得另一個線程的終止?fàn)顟B(tài)并且釋放該線程所占的資源。 Pthread_join() 函數(shù)的定義如清單 9 。 int pthread_join(pthread_t th, void **thread_return); 調(diào)用該函數(shù)的線程將掛起,等待 th 所表示的線程的結(jié)束。 thread_return 是指向線程 th 返回值的指針。需要注意的是 th 所表示的線程必須是 joinable 的,即處于非 detached(游離)狀態(tài);并且只可以有唯一的一個線程對 th 調(diào)用 pthread_join() 。如果 th 處于 detached 狀態(tài),那么對 th 的 pthread_join() 調(diào)用將返回錯誤。 如果你壓根兒不關(guān)心一個線程的結(jié)束狀態(tài),那么也可以將一個線程設(shè)置為 detached 狀態(tài),從而來讓操作系統(tǒng)在該線程結(jié)束時來回收它所占的資源。將一個線程設(shè)置為 detached 狀態(tài)可以通過兩種方式來實現(xiàn)。一種是調(diào)用 pthread_detach() 函數(shù),可以將線程 th 設(shè)置為 detached 狀態(tài)。其申明如清單 10 。 int pthread_detach(pthread_t th); 另一種方法是在創(chuàng)建線程時就將它設(shè)置為 detached 狀態(tài),首先初始化一個線程屬性變量,然后將其設(shè)置為 detached 狀態(tài),最后將它作為參數(shù)傳入線程創(chuàng)建函數(shù) pthread_create(),這樣所創(chuàng)建出來的線程就直接處于 detached 狀態(tài)。方法如清單 11 。 ………………………………… .. pthread_t tid; pthread_attr_t attr; pthread_attr_init(&attr); pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED); pthread_create(&tid, &attr, THREAD_FUNCTION, arg); 總之為了在使用 Pthread 時避免線程的資源在線程結(jié)束時不能得到正確釋放,從而避免產(chǎn)生潛在的內(nèi)存泄漏問題,在對待線程結(jié)束時,要確保該線程處于 detached 狀態(tài),否著就需要調(diào)用 pthread_join() 函數(shù)來對其進行資源回收。 ? ? 本文以上部分詳細介紹了 Linux 的多線程編程的 5 條高效開發(fā)經(jīng)驗。另外你也可以考慮嘗試其他一些開源類庫來進行線程開發(fā)。 1. Boost 庫 Boost 庫來自于由 C++ 標準委員會類庫工作組成員發(fā)起,致力于為 C++ 開發(fā)新的類庫的 Boost 組織。雖然該庫本身并不是針對多線程而產(chǎn)生,但是發(fā)展至今,其已提供了比較全面的多線程編程的 API 支持。 Boost 庫對于多線程支持的 API 風(fēng)格上更類似于 Linux 的 Pthread 庫,差別在于其將線程,互斥鎖,條件等線程開發(fā)概念都封裝成了 C++ 類,以方便開發(fā)調(diào)用。 Boost 庫目前對跨平臺支持的很不錯,不僅支持 Windows 和 Linux ,還支持各種商用的 Unix 版本。如果開發(fā)者想使用高穩(wěn)定性的統(tǒng)一線程編程接口減輕跨平臺開發(fā)的難度, Boost 庫將是首選。 2. ACE ACE 全稱是 ADAPTIVE Communication Environment,它是一個免費的,開源的,面向?qū)ο蟮墓ぞ呖蚣?,用以開發(fā)并發(fā)訪問的軟件。由于 ACE 最初是面向網(wǎng)絡(luò)服務(wù)端的編程開發(fā),因此對于線程開發(fā)的工具庫它也能提供很全面的支持。其支持的平臺也很全面,包括 Windows,Linux 和各種版本 Unix 。 ACE 的唯一問題是如果僅僅是用于線程編程,其似乎顯得有些過于重量級。而且其較復(fù)雜的配置也讓其部署對初學(xué)者而言并非易事。
評論