資料介紹
隨著嵌入式Linux系統(tǒng)的廣泛應(yīng)用,對(duì)系統(tǒng)的可靠性提出了更高的要求,尤其是涉及到生命財(cái)產(chǎn)等重要領(lǐng)域,要求系統(tǒng)達(dá)到安全完整性等級(jí)3級(jí)以上[1],故障率(每小時(shí)出現(xiàn)危險(xiǎn)故障的可能性)為10-7以下,相當(dāng)于系統(tǒng)的平均故障間隔時(shí)間(MTBF)至少要達(dá)到1141年以上,因此提高系統(tǒng)可靠性已成為一項(xiàng)艱巨的任務(wù)。對(duì)某公司在工業(yè)領(lǐng)域14 878個(gè)控制器系統(tǒng)的應(yīng)用調(diào)查表明,從2004年初到2007年9月底,隨著硬軟件的不斷改進(jìn),根據(jù)錯(cuò)誤報(bào)告統(tǒng)計(jì)的故障率已降低到2004年的五分之一以下,但查找錯(cuò)誤的時(shí)間卻增加到原來(lái)的3倍以上。
這種解決問(wèn)題所需時(shí)間呈上升的趨勢(shì)固然有軟件問(wèn)題,但缺乏必要的手段以輔助解決問(wèn)題才是主要的原因。通過(guò)對(duì)故障的統(tǒng)計(jì)跟蹤發(fā)現(xiàn),難以解決的軟件錯(cuò)誤和從發(fā)現(xiàn)到解決耗時(shí)較長(zhǎng)的軟件錯(cuò)誤都集中在操作系統(tǒng)的核心部分,這其中又有很大比例集中在驅(qū)動(dòng)程序部分[2]。因此,錯(cuò)誤跟蹤技術(shù)被看成是提高系統(tǒng)安全完整性等級(jí)的一個(gè)重要措施[1],大多數(shù)現(xiàn)代操作系統(tǒng)均為發(fā)展提供了操作系統(tǒng)內(nèi)核“崩潰轉(zhuǎn)儲(chǔ)”機(jī)制,即在軟件系統(tǒng)宕機(jī)時(shí),將內(nèi)存內(nèi)容保存到磁盤(pán)[3],或者通過(guò)網(wǎng)絡(luò)發(fā)送到故障服務(wù)器[3],或者直接啟動(dòng)內(nèi)核調(diào)試器[4]等,以供事后分析改進(jìn)。
基于Linux操作系統(tǒng)內(nèi)核的崩潰轉(zhuǎn)儲(chǔ)機(jī)制近年來(lái)有以下幾種:
(1) LKCD(Linux Kernel Crash Dump)機(jī)制[3];
?。?) KDUMP(Linux Kernel Dump)機(jī)制[4];
?。?) KDB機(jī)制[5];
(4) KGDB機(jī)制[6]。
綜合上述幾種機(jī)制可以發(fā)現(xiàn),這四種機(jī)制之間有以下三個(gè)共同點(diǎn):
?。?) 適用于為運(yùn)算資源豐富、存儲(chǔ)空間充足的應(yīng)用場(chǎng)合;
?。?) 發(fā)生系統(tǒng)崩潰后恢復(fù)時(shí)間無(wú)嚴(yán)格要求;
?。?) 主要針對(duì)較通用的硬件平臺(tái),如X86平臺(tái)。
在嵌入式應(yīng)用場(chǎng)合想要直接使用上列機(jī)制中的某一種,卻遇到以下三個(gè)難點(diǎn)無(wú)法解決:
?。?) 存儲(chǔ)空間不足
嵌入式系統(tǒng)一般采用Flash作為存儲(chǔ)器,而Flash容量有限,且可能遠(yuǎn)遠(yuǎn)小于嵌入式系統(tǒng)中的內(nèi)存容量。因此將全部?jī)?nèi)存內(nèi)容保存到Flash不可行。
(2) 記錄時(shí)間要求盡量短
嵌入式系統(tǒng)一般有復(fù)位響應(yīng)時(shí)間盡量短的要求,有的嵌入式操作系統(tǒng)復(fù)位重啟時(shí)間不超過(guò)2s,而上述幾種可用于Linux系統(tǒng)的內(nèi)核崩潰轉(zhuǎn)儲(chǔ)機(jī)制耗時(shí)均不可能在30s內(nèi)。寫(xiě)Flash的操作也很耗時(shí)間,實(shí)驗(yàn)顯示,寫(xiě)2MB數(shù)據(jù)到Flash耗時(shí)達(dá)到400ms之多。
?。?) 要求能夠支持特定的硬件平臺(tái)
嵌入式系統(tǒng)的硬件多種多樣,上面提到的四種機(jī)制均是針對(duì)X86平臺(tái)提供了較好的支持,而對(duì)于其他體系的硬件支持均不成熟。
由于這些難點(diǎn)的存在,要將上述四種內(nèi)核崩潰轉(zhuǎn)儲(chǔ)機(jī)制中的一種移植到特定的嵌入式應(yīng)用平臺(tái)是十分困難的。因此,針對(duì)上述嵌入式系統(tǒng)的三個(gè)特點(diǎn),本文介紹一種基于特定平臺(tái)的嵌入式Linux內(nèi)核崩潰信息記錄機(jī)制LCRT(Linux Crash Record and Trace),為定位嵌入式Linux系統(tǒng)中軟件故障和解決軟件故障提供輔助手段。
1 Linux內(nèi)核崩潰的分析
分析Linux內(nèi)核對(duì)于運(yùn)行期間各種“陷阱”的處理可以得知,Linux內(nèi)核對(duì)于應(yīng)用程序?qū)е碌腻e(cuò)誤可以予以監(jiān)控,在應(yīng)用程序發(fā)生除零、內(nèi)存訪(fǎng)問(wèn)越界、緩沖區(qū)溢出等錯(cuò)誤時(shí),Linux內(nèi)核的異常處理例程可以對(duì)這些由應(yīng)用程序引起的異常情況予以處理。當(dāng)應(yīng)用程序產(chǎn)生不可恢復(fù)的錯(cuò)誤時(shí),Linux內(nèi)核可以?xún)H僅終止產(chǎn)生錯(cuò)誤的應(yīng)用程序,其他應(yīng)用程序仍然可以正常運(yùn)行。

如果Linux內(nèi)核本身或者新開(kāi)發(fā)的Linux內(nèi)核模塊存在bug,產(chǎn)生了“除零”,“內(nèi)存訪(fǎng)問(wèn)越界”、“緩沖區(qū)溢出”等錯(cuò)誤,同樣會(huì)由Linux內(nèi)核的異常處理例程來(lái)處理。Linux內(nèi)核通過(guò)在異常處理程序中判斷,如果發(fā)現(xiàn)是“嚴(yán)重的不可恢復(fù)”的內(nèi)核異常,則會(huì)導(dǎo)致“內(nèi)核恐慌”(kernel panic),即Linux內(nèi)核崩潰。圖1所示為L(zhǎng)inux內(nèi)核對(duì)異常情況的處理流程。
2 LCRT機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)
通過(guò)對(duì)Linux內(nèi)核代碼的分析可知,Linux內(nèi)核本身提供了一種“內(nèi)核通知機(jī)制”[7-8],并預(yù)定義了“內(nèi)核事件通知鏈”,使得Linux內(nèi)核擴(kuò)展開(kāi)發(fā)人員可以通過(guò)這些預(yù)定義的內(nèi)核事件通知鏈在特定的內(nèi)核事件發(fā)生時(shí)執(zhí)行附加的處理流程。通過(guò)對(duì)Linux內(nèi)核源代碼的研究發(fā)現(xiàn),對(duì)于上文中提到的“嚴(yán)重不可恢復(fù)的內(nèi)核異常”,預(yù)定義了一個(gè)通知鏈和通知點(diǎn),使得在發(fā)生Linux內(nèi)核崩潰之后,可以在Linux內(nèi)核的panic函數(shù)中預(yù)定義的一個(gè)“內(nèi)核崩潰通知鏈”[7]上掛接LCRT機(jī)制來(lái)獲得Linux內(nèi)核崩潰現(xiàn)場(chǎng)的一些信息并記錄到非易失性存儲(chǔ)器中,以便分析引起Linux內(nèi)核崩潰的原因。
這種解決問(wèn)題所需時(shí)間呈上升的趨勢(shì)固然有軟件問(wèn)題,但缺乏必要的手段以輔助解決問(wèn)題才是主要的原因。通過(guò)對(duì)故障的統(tǒng)計(jì)跟蹤發(fā)現(xiàn),難以解決的軟件錯(cuò)誤和從發(fā)現(xiàn)到解決耗時(shí)較長(zhǎng)的軟件錯(cuò)誤都集中在操作系統(tǒng)的核心部分,這其中又有很大比例集中在驅(qū)動(dòng)程序部分[2]。因此,錯(cuò)誤跟蹤技術(shù)被看成是提高系統(tǒng)安全完整性等級(jí)的一個(gè)重要措施[1],大多數(shù)現(xiàn)代操作系統(tǒng)均為發(fā)展提供了操作系統(tǒng)內(nèi)核“崩潰轉(zhuǎn)儲(chǔ)”機(jī)制,即在軟件系統(tǒng)宕機(jī)時(shí),將內(nèi)存內(nèi)容保存到磁盤(pán)[3],或者通過(guò)網(wǎng)絡(luò)發(fā)送到故障服務(wù)器[3],或者直接啟動(dòng)內(nèi)核調(diào)試器[4]等,以供事后分析改進(jìn)。
基于Linux操作系統(tǒng)內(nèi)核的崩潰轉(zhuǎn)儲(chǔ)機(jī)制近年來(lái)有以下幾種:
(1) LKCD(Linux Kernel Crash Dump)機(jī)制[3];
?。?) KDUMP(Linux Kernel Dump)機(jī)制[4];
?。?) KDB機(jī)制[5];
(4) KGDB機(jī)制[6]。
綜合上述幾種機(jī)制可以發(fā)現(xiàn),這四種機(jī)制之間有以下三個(gè)共同點(diǎn):
?。?) 適用于為運(yùn)算資源豐富、存儲(chǔ)空間充足的應(yīng)用場(chǎng)合;
?。?) 發(fā)生系統(tǒng)崩潰后恢復(fù)時(shí)間無(wú)嚴(yán)格要求;
?。?) 主要針對(duì)較通用的硬件平臺(tái),如X86平臺(tái)。
在嵌入式應(yīng)用場(chǎng)合想要直接使用上列機(jī)制中的某一種,卻遇到以下三個(gè)難點(diǎn)無(wú)法解決:
?。?) 存儲(chǔ)空間不足
嵌入式系統(tǒng)一般采用Flash作為存儲(chǔ)器,而Flash容量有限,且可能遠(yuǎn)遠(yuǎn)小于嵌入式系統(tǒng)中的內(nèi)存容量。因此將全部?jī)?nèi)存內(nèi)容保存到Flash不可行。
(2) 記錄時(shí)間要求盡量短
嵌入式系統(tǒng)一般有復(fù)位響應(yīng)時(shí)間盡量短的要求,有的嵌入式操作系統(tǒng)復(fù)位重啟時(shí)間不超過(guò)2s,而上述幾種可用于Linux系統(tǒng)的內(nèi)核崩潰轉(zhuǎn)儲(chǔ)機(jī)制耗時(shí)均不可能在30s內(nèi)。寫(xiě)Flash的操作也很耗時(shí)間,實(shí)驗(yàn)顯示,寫(xiě)2MB數(shù)據(jù)到Flash耗時(shí)達(dá)到400ms之多。
?。?) 要求能夠支持特定的硬件平臺(tái)
嵌入式系統(tǒng)的硬件多種多樣,上面提到的四種機(jī)制均是針對(duì)X86平臺(tái)提供了較好的支持,而對(duì)于其他體系的硬件支持均不成熟。
由于這些難點(diǎn)的存在,要將上述四種內(nèi)核崩潰轉(zhuǎn)儲(chǔ)機(jī)制中的一種移植到特定的嵌入式應(yīng)用平臺(tái)是十分困難的。因此,針對(duì)上述嵌入式系統(tǒng)的三個(gè)特點(diǎn),本文介紹一種基于特定平臺(tái)的嵌入式Linux內(nèi)核崩潰信息記錄機(jī)制LCRT(Linux Crash Record and Trace),為定位嵌入式Linux系統(tǒng)中軟件故障和解決軟件故障提供輔助手段。
1 Linux內(nèi)核崩潰的分析
分析Linux內(nèi)核對(duì)于運(yùn)行期間各種“陷阱”的處理可以得知,Linux內(nèi)核對(duì)于應(yīng)用程序?qū)е碌腻e(cuò)誤可以予以監(jiān)控,在應(yīng)用程序發(fā)生除零、內(nèi)存訪(fǎng)問(wèn)越界、緩沖區(qū)溢出等錯(cuò)誤時(shí),Linux內(nèi)核的異常處理例程可以對(duì)這些由應(yīng)用程序引起的異常情況予以處理。當(dāng)應(yīng)用程序產(chǎn)生不可恢復(fù)的錯(cuò)誤時(shí),Linux內(nèi)核可以?xún)H僅終止產(chǎn)生錯(cuò)誤的應(yīng)用程序,其他應(yīng)用程序仍然可以正常運(yùn)行。

如果Linux內(nèi)核本身或者新開(kāi)發(fā)的Linux內(nèi)核模塊存在bug,產(chǎn)生了“除零”,“內(nèi)存訪(fǎng)問(wèn)越界”、“緩沖區(qū)溢出”等錯(cuò)誤,同樣會(huì)由Linux內(nèi)核的異常處理例程來(lái)處理。Linux內(nèi)核通過(guò)在異常處理程序中判斷,如果發(fā)現(xiàn)是“嚴(yán)重的不可恢復(fù)”的內(nèi)核異常,則會(huì)導(dǎo)致“內(nèi)核恐慌”(kernel panic),即Linux內(nèi)核崩潰。圖1所示為L(zhǎng)inux內(nèi)核對(duì)異常情況的處理流程。
2 LCRT機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)
通過(guò)對(duì)Linux內(nèi)核代碼的分析可知,Linux內(nèi)核本身提供了一種“內(nèi)核通知機(jī)制”[7-8],并預(yù)定義了“內(nèi)核事件通知鏈”,使得Linux內(nèi)核擴(kuò)展開(kāi)發(fā)人員可以通過(guò)這些預(yù)定義的內(nèi)核事件通知鏈在特定的內(nèi)核事件發(fā)生時(shí)執(zhí)行附加的處理流程。通過(guò)對(duì)Linux內(nèi)核源代碼的研究發(fā)現(xiàn),對(duì)于上文中提到的“嚴(yán)重不可恢復(fù)的內(nèi)核異常”,預(yù)定義了一個(gè)通知鏈和通知點(diǎn),使得在發(fā)生Linux內(nèi)核崩潰之后,可以在Linux內(nèi)核的panic函數(shù)中預(yù)定義的一個(gè)“內(nèi)核崩潰通知鏈”[7]上掛接LCRT機(jī)制來(lái)獲得Linux內(nèi)核崩潰現(xiàn)場(chǎng)的一些信息并記錄到非易失性存儲(chǔ)器中,以便分析引起Linux內(nèi)核崩潰的原因。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 嵌入式linux系統(tǒng)和嵌入式android系統(tǒng)的區(qū)別和聯(lián)系
- 【嵌入式】基于ARM的嵌入式Linux開(kāi)發(fā)總結(jié)
- 基于ARM與嵌入式Linux的GPRS無(wú)線(xiàn)通訊系統(tǒng)
- (網(wǎng)盤(pán))ARM嵌入式Linux系統(tǒng)開(kāi)發(fā)詳解
- ARM11嵌入式系統(tǒng)Linux下液晶顯示的實(shí)現(xiàn)
- ARM11嵌入式系統(tǒng)Linux下LCD的驅(qū)動(dòng)的設(shè)計(jì)
- 基于arm11的嵌入式linux中nrf24l01驅(qū)動(dòng)的實(shí)現(xiàn)
- 嵌入式Linux應(yīng)用程序例程
- 基于ARM和Linux的嵌入式遠(yuǎn)程視頻監(jiān)控系統(tǒng)的設(shè)計(jì)
- 使用ARM9和Linux設(shè)計(jì)嵌入式PLC系統(tǒng)的詳細(xì)資料說(shuō)明 17次下載
- 如何使用ARM進(jìn)行嵌入式linux的系統(tǒng)設(shè)計(jì)
- 嵌入式ARM芯片及linux操作系統(tǒng) 7次下載
- ARM與嵌入式Linux 基礎(chǔ)講義 168次下載
- ARM9嵌入式技術(shù)及Linux實(shí)驗(yàn)指導(dǎo)
- ARM與嵌入式Linux開(kāi)發(fā)者大會(huì)
- 基于嵌入式Linux內(nèi)核的ARM9運(yùn)行實(shí)現(xiàn)方式介紹 1573次閱讀
- 基于ARM的嵌入式操作系統(tǒng)該如何設(shè)計(jì) 1558次閱讀
- 基于Yocto Project的定制嵌入式Linux產(chǎn)品設(shè)計(jì)淺析 1w次閱讀
- 基于32位ARM920T內(nèi)核的微處理器的嵌入式Linux系統(tǒng)構(gòu)建詳解 1913次閱讀
- 基于嵌入式Linux系統(tǒng)下Mini GUI的移植方法與過(guò)程詳解 3702次閱讀
- 從RTOS到嵌入式Linux的應(yīng)用移植步驟以及相關(guān)的關(guān)鍵技術(shù)分析 3338次閱讀
- 關(guān)于嵌入式系統(tǒng)的特點(diǎn)和Linux內(nèi)核的實(shí)時(shí)應(yīng)用分析 1141次閱讀
- 怎么才能更好的理解嵌入式操作系統(tǒng)Linux實(shí)時(shí)化技術(shù)? 1242次閱讀
- 什么是嵌入式Linux內(nèi)核調(diào)試技術(shù)?嵌入式開(kāi)發(fā)又面臨著哪些問(wèn)題? 1220次閱讀
- ARM嵌入式系統(tǒng)硬件設(shè)計(jì)及應(yīng)用實(shí)例詳解 1w次閱讀
- 基于嵌入式Linux的無(wú)線(xiàn)視頻監(jiān)控系統(tǒng)設(shè)計(jì) 3147次閱讀
- 基于嵌入式PIC32單片機(jī)的目標(biāo)檢測(cè)與跟蹤系統(tǒng) 5732次閱讀
- 對(duì)于嵌入式沒(méi)有嵌入式軟件架構(gòu)師的詳細(xì)解析 4162次閱讀
- 基于ARM9與linux的嵌入式門(mén)禁監(jiān)控系統(tǒng)設(shè)計(jì)與分析 1571次閱讀
- 基于Linux的嵌入式實(shí)時(shí)操作系統(tǒng)的研究 2353次閱讀
下載排行
本周
- 1EMC電路設(shè)計(jì)工程師必備的EMC基礎(chǔ)
- 0.42 MB | 4次下載 | 2 積分
- 2AU3116 2×60W模擬輸入雙通道Class-D 音頻功率放大器數(shù)據(jù)手冊(cè)
- 1.19 MB | 1次下載 | 免費(fèi)
- 3低壓降肖特基整流管SR340L數(shù)據(jù)手冊(cè)
- 0.78 MB | 1次下載 | 免費(fèi)
- 4ZX8002E 觸摸調(diào)光LED集成IC數(shù)據(jù)手冊(cè)
- 2.27 MB | 次下載 | 免費(fèi)
- 5SOD-323塑料封裝ESD保護(hù)二極管SD05T系列規(guī)格書(shū)
- 1.07 MB | 次下載 | 免費(fèi)
- 6SOT-23塑料封裝ESD保護(hù)二極管SMxx Series系列規(guī)格書(shū)
- 0.93 MB | 次下載 | 免費(fèi)
- 7高效率整流二極管HER151 THRU HER158數(shù)據(jù)手冊(cè)
- 0.54 MB | 次下載 | 免費(fèi)
- 8低壓降肖特基整流管SL22 THRU SL210數(shù)據(jù)手冊(cè)
- 1.03 MB | 次下載 | 免費(fèi)
本月
- 1三相逆變主電路的原理圖和PCB資料合集免費(fèi)下載
- 27.35 MB | 111次下載 | 1 積分
- 2運(yùn)算放大器基本電路中文資料
- 1.30 MB | 16次下載 | 免費(fèi)
- 3蘋(píng)果iphone 11電路原理圖
- 4.98 MB | 11次下載 | 5 積分
- 4TL494工業(yè)用開(kāi)關(guān)電源原理圖資料
- 0.22 MB | 10次下載 | 1 積分
- 5常用電子元器件介紹
- 3.21 MB | 8次下載 | 免費(fèi)
- 6QW2893應(yīng)急燈專(zhuān)用檢測(cè)芯片
- 590.40 KB | 4次下載 | 免費(fèi)
- 7相關(guān)協(xié)議信號(hào)總結(jié)
- 0.94 MB | 4次下載 | 免費(fèi)
- 8EMC電路設(shè)計(jì)工程師必備的EMC基礎(chǔ)
- 0.42 MB | 4次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935130次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191390次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183344次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81591次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65989次下載 | 10 積分
評(píng)論