軟錯(cuò)誤是指RAM或FF中非由硬錯(cuò)誤引起的位翻轉(zhuǎn),因此在斷電再重啟后會消失。以前,軟錯(cuò)誤在很大程度上被忽略了,可靠性預(yù)測主要集中在硬錯(cuò)誤上,但在IEC 61508-2:2010提到軟錯(cuò)誤后,人們再也不能忽略軟錯(cuò)誤了。這是好現(xiàn)象,因?yàn)樵谟泻艽驲AM的器件中,軟錯(cuò)誤率可能輕而易舉地比硬錯(cuò)誤率高出三個(gè)數(shù)量級。另一方面,器件即使沒有RAM,也可能存在大量FF,因此每個(gè)器件都會有一定程度的軟錯(cuò)誤。甚至模擬電路(例如使用開關(guān)電容架構(gòu)的那些電路)也可能發(fā)生軟錯(cuò)誤,但考慮到問題的相對規(guī)模,這個(gè)問題在很大程度上被忽略了。
軟錯(cuò)誤主要是由封裝材料中的α粒子和源于銀河系的中子引起的。在地面高度,二者的貢獻(xiàn)大致相同。α粒子不能深深地滲透到硅中,但它們來自芯片頂部,因此難以屏蔽,不過有文獻(xiàn)表明,聚酰胺可以幫助解決這個(gè)問題。另一方面,不使用幾米厚的水泥或鉛的話,很難屏蔽中子。因此,需要在CMOS器件層次、IC上的模塊層次、IC上的系統(tǒng)層次或高級系統(tǒng)層次采取措施予以解決。
如果您沒有更好的信息,可以使用IEC 61508-7:2010第7部分倡導(dǎo)的值——1000 FIT/兆位。廣泛接受的Siemens SN29500系列標(biāo)準(zhǔn)倡導(dǎo)的值是1200 FIT/兆位。實(shí)際上,1000 FIT/兆位已被廣為接受。最佳方案是測試每個(gè)IC,但這仍然不是沒有爭議,因?yàn)槟銜龅脚c典型器件中使用的許多不同類型FF相關(guān)的問題,與加速測試和山頂測試相關(guān)的問題,以及關(guān)于AVF(架構(gòu)漏洞因子)的討論,許多軟錯(cuò)誤可能永遠(yuǎn)不會傳播出去造成系統(tǒng)故障。
在CMOS器件層次,您可以使用加固器件(三阱、SOI、額外電容),但處理軟件錯(cuò)誤最常見的方法是在硅模塊層次給RAM增加奇偶校驗(yàn)或ECC。奇偶校驗(yàn)位檢測受保護(hù)的字節(jié)或字中是否有一位發(fā)生翻轉(zhuǎn)。但是,它無法檢測兩位翻轉(zhuǎn)的情況。如果奇偶校驗(yàn)與邏輯連續(xù)位物理分隔相結(jié)合,就可以解決這個(gè)問題,因?yàn)橐粋€(gè)粒子不再能翻轉(zhuǎn)同一個(gè)字中的兩位。另一方面,ECC通常可以檢測所有一位、兩位錯(cuò)誤和大部分更多位錯(cuò)誤。ECC優(yōu)于奇偶校驗(yàn)的一大優(yōu)勢實(shí)際上是它可以從一位錯(cuò)誤中恢復(fù)而無需干預(yù)。對于奇偶校驗(yàn)錯(cuò)誤,通常需要重啟系統(tǒng)才能清除錯(cuò)誤,但這取決于最終應(yīng)用。如果ECC或奇偶校驗(yàn)不可用,應(yīng)用設(shè)計(jì)人員仍能解決軟錯(cuò)誤,方法是將關(guān)鍵值存儲在兩個(gè)存儲器位置,使用之前比較這兩個(gè)結(jié)果。然而,這往往會擾亂應(yīng)用代碼。其他方案包括使用雙通道系統(tǒng)進(jìn)行比較。這有點(diǎn)類似于ISO 13849中的典型CAT 3或CAT 4架構(gòu)。雙核同步架構(gòu)具有類似的優(yōu)點(diǎn)。
諸如ADI的ADSP-CM417F等器件有助于實(shí)現(xiàn)上述幾種解決方案。片內(nèi)RAM具有ECC和物理分隔,RAM由多個(gè)獨(dú)立的32k模塊組成,其包含兩個(gè)核心,可提供充分的隔離。而AD7124(24位Σ-Δ ADC)之類的器件包含一個(gè)片內(nèi)狀態(tài)機(jī),它在配置狀態(tài)結(jié)束時(shí)會存儲一個(gè)標(biāo)準(zhǔn)CRC,然后狀態(tài)機(jī)以不到500uS的間隔重新計(jì)算CRC,檢查是否有任何配置位翻轉(zhuǎn)。這兩者還說明了安全數(shù)據(jù)手冊的價(jià)值,最終用戶可以獲得額外信息以幫助進(jìn)行安全分析,例如:關(guān)于RAM中邏輯連續(xù)位的物理分隔的信息;RAM不是作為一個(gè)大模塊實(shí)現(xiàn)的,而是作為幾個(gè)較小模塊實(shí)現(xiàn)的......
近來最著名的軟錯(cuò)誤案例來自汽車,人們質(zhì)疑一位翻轉(zhuǎn)便可能導(dǎo)致意外加速。其他案例包括投票機(jī)錯(cuò)誤和變電站關(guān)閉。
-
存儲器
+關(guān)注
關(guān)注
38文章
7653瀏覽量
167411 -
RAM
+關(guān)注
關(guān)注
8文章
1392瀏覽量
117539 -
CMOS器件
+關(guān)注
關(guān)注
0文章
72瀏覽量
11885
原文標(biāo)題:【工程師博客】總被忽視的軟錯(cuò)誤詳析
文章出處:【微信號:motorcontrol365,微信公眾號:電機(jī)控制設(shè)計(jì)加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
詳析示波器的使用方法和步驟
pcb設(shè)計(jì)信號失真常被忽視的來源——過孔

選購電視易被忽視的參數(shù)
人機(jī)交互:一個(gè)被忽視的重要領(lǐng)域
監(jiān)控系統(tǒng)設(shè)備構(gòu)成的分層次結(jié)構(gòu)詳析
PCB優(yōu)化設(shè)計(jì)詳析(中)

被忽視已久的新能源發(fā)電殺手
基于不變量的軟錯(cuò)誤檢測方法
8位單片機(jī)中那個(gè)溢出問題最容易被忽視

最容易被忽視的儲能逆變器參數(shù)這里全寫了
容易被忽視的五款辦公軟件,用對一個(gè)就效率翻倍
電平匹配問題,簡單卻容易被忽視

評論