為工業(yè)應(yīng)用選擇閃存設(shè)備或固態(tài)驅(qū)動器 (SSD) 非常復(fù)雜。價格性能比較幾乎沒有用,因為需求驅(qū)動的性能定義取決于許多因素。
對于標(biāo)準(zhǔn) IT 應(yīng)用程序,每 GB 價格是購買閃存的絕佳標(biāo)準(zhǔn)。在某些情況下,還會考慮寫入和讀取速度。但是,如果您需要用于工業(yè)應(yīng)用的閃存設(shè)備,或者需要用于戶外電信應(yīng)用的存儲卡,那么您的優(yōu)先級將有所不同。如果通常情況下,容量不是真正的問題,那么穩(wěn)健性和耐用性肯定是問題。持久性(即閃存介質(zhì)壽命)和保留(即保存數(shù)據(jù)的持久性)是復(fù)雜的問題。存儲介質(zhì)固件和架構(gòu)都在這里發(fā)揮作用,應(yīng)用程序的性質(zhì)也是如此。數(shù)據(jù)將如何寫入?還是更強調(diào)閱讀?如果您對閃存有特殊要求,那么您需要確切知道要問哪些問題。
背景:衰老的跡象
通常,NAND 閃存設(shè)備的單元只允許有限數(shù)量的刪除。這是因為每次產(chǎn)生隧道效應(yīng)時,通常阻止電子從浮柵流出的氧化層由于熄滅電壓而積累了高能電子。因此,閾值電壓會隨時間變化,最終導(dǎo)致單元不再可讀(圖 1)。
【圖1 | 老化電池:電子在隧道氧化層中積累,導(dǎo)致閾值電壓逐漸變化。隧道氧化層中的裂縫會引起泄漏電流路徑,從而使電荷流出。讀取錯誤增加到塊成為需要淘汰的“壞塊”的程度。]
老化的另一個影響是在氧化層中形成導(dǎo)電路徑,導(dǎo)致電池逐漸失去電荷——隨之而來的是保持位。這種效應(yīng)會因暴露在高溫下而加速,特別是在允許的編程/擦除 (P/E) 循環(huán)次數(shù)減少的情況下更容易發(fā)生,從而導(dǎo)致保留率急劇下降。因此,雖然新的單級和多級單元(SLC 和 MLC)NAND 都可靠地提供了 10 年的保留時間,但在其使用壽命結(jié)束時,這一數(shù)字下降到只有一年。但是對于 MLC NAND,這一點在 3,000 個 P/E 周期后達到,而 SLC 在 100,000 個之后達到。這就解釋了為什么 SLC 是復(fù)雜應(yīng)用的首選解決方案,以及為什么低成本三級單元 (TLC) NAND 芯片不能用于長期存儲。要使用這種技術(shù)在每個單元中寫入 3 位,您需要八個不同的電荷狀態(tài),這就是退化很快變得明顯的原因。在 TLC 中,最初的一年保留水平僅在 500 個 P/E 周期后下降到三個月。
緩解措施
使用各種機制減輕對芯片的物理損壞的影響??紤]到當(dāng)一個單元發(fā)生故障時,需要將整個塊標(biāo)記為“壞”,磨損均衡確保所有物理存儲地址都經(jīng)歷相同的使用級別。但讀取錯誤不僅僅是磨損。每次寫入數(shù)據(jù)時,已編程單元周圍的單元都會承受壓力(即它們變得更有活力)——這種現(xiàn)象稱為“編程干擾”。隨著時間的推移,單元電壓閾值會增加,從而導(dǎo)致讀取錯誤——一旦相關(guān)塊被擦除,這些錯誤就會得到修復(fù)。閱讀還會導(dǎo)致一種稱為“閱讀干擾”的壓力形式,相鄰的頁面會累積電荷。由于涉及的電壓相對較低,這種影響遠沒有寫入那么明顯——但讀取容易出現(xiàn)位錯誤,必須通過糾錯碼 (ECC) 進行糾正,并通過刪除相關(guān)塊來修復(fù)。有趣的是,這種效果在重復(fù)讀取相同數(shù)據(jù)的應(yīng)用程序中尤為明顯。這意味著即使在只讀存儲器中,也需要刪除塊并重復(fù)寫入頁面以糾正錯誤。
如何測量 SSD 的耐用性
制造商使用兩個指標(biāo)來衡量閃存設(shè)備的壽命:寫入的兆字節(jié)數(shù) (TBW) 和每天的驅(qū)動器寫入數(shù) (DWPD)。TBW表示SSD生命周期內(nèi)可以寫入的數(shù)據(jù)總量,而DWPD表示保修期內(nèi)每天可以寫入的數(shù)據(jù)量。這些基準(zhǔn)的問題在于它們極其復(fù)雜,用戶別無選擇,只能依賴制造商的規(guī)格。此外,在為給定的應(yīng)用程序選擇正確的數(shù)據(jù)介質(zhì)時,這些規(guī)范的實際相關(guān)性尚不清楚,因為獲得的數(shù)字很大程度上取決于測試工作量。例如,Swissbit 480 GBP SSD 的測試得出 1360、912 或 140 TBW 的使用壽命,具體取決于所使用的測量方法。最顯著的結(jié)果是通過測量順序?qū)懭雭韺崿F(xiàn)的。第二個值(912)由客戶工作負載產(chǎn)生,而第三個值(140)來自企業(yè)工作負載。兩種負載測試均構(gòu)成 JEDEC 標(biāo)準(zhǔn)??蛻舳斯ぷ髫撦d基于計算機用戶的行為,并且主要生成順序訪問。另一方面,企業(yè)工作負載模擬多用戶環(huán)境中服務(wù)器的性能,生成高達 80% 的隨機訪問。
雖然理論上這些標(biāo)準(zhǔn)應(yīng)該允許可比性,但問題是許多制造商根本沒有指明底層工作負載,而是將他們的產(chǎn)品信息基于順序?qū)懭胫?。而且,如示例所示,后者對于企業(yè)工作負載可能相差十倍,因此在涉及顯著且未明確指定的高耐久性值時需要格外小心。
寫放大系數(shù) (WAF) 降低
邏輯到物理映射系統(tǒng)、ECC 和稱為垃圾收集的清除塊的過程都是理解和排序閃存功能和性能的相關(guān)機制。該領(lǐng)域的一個關(guān)鍵術(shù)語是寫入放大系數(shù)或 WAF,它是來自主機的用戶數(shù)據(jù)與寫入閃存設(shè)備的實際數(shù)據(jù)量之間的比率。降低 WAF(閃存控制器效率的一項指標(biāo))是提高 SSD 耐用性的關(guān)鍵。影響 WAF 的工作負載因素包括順序訪問和順序訪問以及隨機訪問之間的差異,或者數(shù)據(jù)塊大小相對于頁面和塊大小的差異。必須滿足兩個基本條件:頁面需要一個接一個地寫入,塊需要作為一個整體刪除。在標(biāo)準(zhǔn)過程中,邏輯地址和物理地址之間的映射關(guān)系到塊。這對于順序數(shù)據(jù)非常有效,因為給定塊的頁面可以順序?qū)懭搿_@種機制的一個例子是連續(xù)積累的視頻數(shù)據(jù)。然而,對于隨機數(shù)據(jù),頁面被寫入許多不同的塊中,因此頁面的每次內(nèi)部覆蓋都需要刪除整個塊。這會導(dǎo)致更高的 WAF 和縮短的使用壽命。因此,基于頁面的映射更適合非順序數(shù)據(jù)。換句話說,固件確保來自不同來源的數(shù)據(jù)可以順序?qū)懭雴蝹€塊的頁面。這減少了刪除的數(shù)量,從而延長了生命周期并提高了寫入性能。
【圖2 | 對比測試:與常規(guī)產(chǎn)品相比,F(xiàn)-60 durabit 更耐用,WAF 更低。這是通過 DRAM 中的 FTL 和更大的過度配置來實現(xiàn)的。]
增加 WAF 的另一個因素是內(nèi)存使用量。存儲在閃存設(shè)備上的數(shù)據(jù)越多,固件需要從一個地方移動到另一個地方的比特就越多?;陧撁娴挠成湓谶@里也很有利。制造商還有另一種稱為過度配置的調(diào)整機制(即,閃存設(shè)備的空間僅保留用于后臺活動)可供他們使用。SSD 的 7%(千兆字節(jié)數(shù)字的二進制和十進制值之間的差異)通常用于此目的。但是為過度配置保留 12% 而不是 7% 是非常有效的。例如,從 MLC NAND 芯片派生的兩個相同 SSD 的耐久性比較(即企業(yè)工作負載的 TBW)表明,60 GB Swissbit F-60 durabit 達到了 6。價值比同一公司的 64 位 F-50 設(shè)備高 6 倍。事實上,240 GB 和 265 GB 版本的價值高出 10 倍。
結(jié)論和要問的九個關(guān)鍵問題
SLC 閃存器件在許多方面都是工業(yè)應(yīng)用以及斷電保護的最可靠的解決方案。然而,在許多情況下,高端 MLC 閃存介質(zhì)同樣適用于此類用途。除了機械性能達到軍用標(biāo)準(zhǔn)外,在尋找 SSD 解決方案時,還應(yīng)特別注意制造商在減少 WAF 和通過固件延長產(chǎn)品壽命方面付出的努力。發(fā)揮作用的其他因素是“數(shù)據(jù)維護管理”措施,以更好地保留,不要忘記經(jīng)過精心挑選的模塊的長期可用性,以適應(yīng)給定的應(yīng)用程序。
應(yīng)用要求決定了您在選擇 SSD 時需要特別注意哪些因素。根據(jù)要求,Swissbit 為其客戶提供 Lifetime Monitor,這是一種通過分析讀取和寫入來計算給定 SSD 耐用性的工具。如前所述,即使價格不是決定性因素,了解您是否真的需要貴 8 倍的 SSD 或 MLC 是否足以滿足您的目的也很有用。
為工業(yè)應(yīng)用選擇閃存器件時要問的關(guān)鍵問題:
我對振動、阻力和溫度范圍有特定的物理要求嗎?–工業(yè)閃存設(shè)備應(yīng)通過應(yīng)用適當(dāng)?shù)蔫b定程序,能夠證明高質(zhì)量的材料特性和良好的生產(chǎn)和加工。
內(nèi)存是否長時間暴露在高溫下?–因為高溫會更快地削弱cell的可讀性,所以應(yīng)該選擇具有數(shù)據(jù)保護功能的產(chǎn)品,定期刷新數(shù)據(jù)。
是否打算在數(shù)據(jù)載體上長期寫入和存儲大量數(shù)據(jù)?–如果是,則應(yīng)選擇 SLC 產(chǎn)品。
應(yīng)用程序是否主要需要讀取訪問權(quán)限?–如果是,則應(yīng)選擇具有數(shù)據(jù)護理功能的產(chǎn)品,該產(chǎn)品會定期刷新數(shù)據(jù)。
應(yīng)用程序是否主要需要寫入功能?–然后具有基于塊的映射的產(chǎn)品適用于順序?qū)懭牍δ?。對于隨機請求,應(yīng)選擇具有基于頁面映射的產(chǎn)品。
內(nèi)存容量是否被充分利用?–對于密集使用的應(yīng)用程序,控制器需要內(nèi)部操作空間,并且過度配置可以延長耐用性。
提供商為 TBW 或 DWPD 指定了哪些工作負載?–數(shù)據(jù)載體的比較只能通過工作量基準(zhǔn)的指示來實現(xiàn)。
是否需要更高級別的數(shù)據(jù)丟失保護?–對于特別關(guān)鍵的應(yīng)用,數(shù)據(jù)維護管理和電源故障保護是必不可少的。
幾年后,該介質(zhì)是否仍然可用?–制造商應(yīng)保證長期可用性,以便無需重新認證即可更換內(nèi)存存儲。
審核編輯:郭婷
評論