數(shù)據(jù)的備份和歸檔具有不同的功能,很多人沒有認識到兩者之間的差異,這可能導致訪問問題,甚至法律問題。而對于備份人員來說,備份和歸檔之間的差別非常明顯,很容易理解。
什么是備份?
備份是為了在損壞或丟失的情況下恢復所述數(shù)據(jù)而創(chuàng)建的數(shù)據(jù)副本。在備份完成后,不會刪除原始數(shù)據(jù)。
備份的例子包括筆記本電腦或臺式機上所有文件的每次備份,或者iPhone上的所有照片都會被復制到iCloud,以防數(shù)據(jù)隨著手機丟失而丟失。人們還將備份文件服務器(非結構化數(shù)據(jù))和數(shù)據(jù)庫(結構化數(shù)據(jù))。備份可能會更加關注數(shù)據(jù),如數(shù)據(jù)庫轉儲、服務器的操作系統(tǒng)、裸機備份,或兩者都支持VMware 的VMDK文件的備份。
備份的定義實際上歸結為目的,備份的目的始終是相同的:如果發(fā)生某些事情,則恢復數(shù)據(jù)。例如,RAID 6存儲陣列的三個磁盤可能存在故障,并且需要還原其所有數(shù)據(jù)。有人可能會意外或惡意刪除VMware、Hyper-V或AWS EC2配置中的一個或多個虛擬機,并且需要還原它們。人們可能有一天會意識到組織中的每個文件都已被勒索軟件包加密。如果沒有良好的備份系統(tǒng),其最終的選擇只能是支付贖金。而有了良好的備份系統(tǒng),則可以找到勒索軟件所勒索的數(shù)據(jù),然后恢復所有數(shù)據(jù),而無需支付黑客勒索費用。
什么是歸檔?
歸檔是為參考目的而創(chuàng)建的數(shù)據(jù)副本。雖然不是必需的,但在進行歸檔后通常會刪除原件。
如果備份的目的是將某些數(shù)據(jù)恢復到平時的樣子,那么歸檔可以用于多種目的。最常見的目的是幫助人們找到很久以前的一些數(shù)據(jù)。它可能是單個文件,其中包含一個非常重要的項目,例如幾年前客戶簽署的合同。它可能是一組相關的數(shù)據(jù),例如某個建筑物的所有結構圖?;蛘咚赡苁瞧髽I(yè)過去制作的都已經(jīng)過時的所有CAD圖紙。
另一個相關數(shù)據(jù)集可能是可以證明給定點的所有電子郵件和/或文件。也許一名員工被解雇了,這是因為公司認為他實施了沒有許可的行為,然后。企業(yè)的訴訟可能會發(fā)出一個電子發(fā)現(xiàn)請求,要求所有發(fā)送給他們的電子郵件,其中非工作時間或他們將要兼職的公司名稱。其他人可能正試圖證明其工作狀態(tài),并希望查看來自特定管理人員的所有電子郵件,這些管理人員的電子郵件將會列出。
歸檔可以幫助人們完成所有這些任務。某人可能擁有企業(yè)所提供的每個銷售訂單、報價或合同的歸檔。可以在線保留當前的合同和訂單,但是將所有這些合同和訂單保存在歸檔中,歸檔應該有一個索引,允許通過這些訂單的內容檢索訂單和合同?;蛘吣橙艘部赡軗碛泄景l(fā)送或接收的每封電子郵件的歸檔。
某些電子郵件歸檔系統(tǒng)可以從電子郵件服務器中清除已存檔的電子郵件,這些電子郵件可以通過超過一定大小,或在n天內未被訪問等條件進行消除。這有助于保持電子郵件系統(tǒng)的精簡,節(jié)省計算和存儲資源,并使備份工作更容易。如果法律不要求人們保留所有電子郵件,那么這甚至可能是歸檔的目的。
恢復與檢索
即使歸檔的目的是節(jié)省主存儲空間,它也需要能夠執(zhí)行檢索而不是恢復(如果要將其稱為存檔)。備份系統(tǒng)還原和歸檔系統(tǒng)檢索。
還原時,它通常是單個文件、服務器或數(shù)據(jù)庫。當人們檢索某些內容時,它通常是相關數(shù)據(jù)的集合,可能存儲也可能不存儲在同一服務器上,甚至可能存儲在相同的格式中。還可以對單個時間點執(zhí)行還原,例如將數(shù)據(jù)庫還原到某天的樣子。檢索使用一段時間的數(shù)據(jù),例如過去三年的所有電子郵件。
數(shù)據(jù)恢復需要人們了解文件或數(shù)據(jù)備份時的大部分內容,否則很難找到它。人們需要知道它所在的服務器的名稱,它所在的數(shù)據(jù)庫或目錄,要返回的文件或表的名稱,以及上次查看的日期。檢索不需要這些信息,人們只需要知道所有與一組參數(shù)匹配的文件或記錄。例如提供過去三年中創(chuàng)建的包含特定短語或由特定人員創(chuàng)作的所有文件或電子郵件。
差異為何重要
許多人嘗試將他們的備份系統(tǒng)用作歸檔系統(tǒng),這意味著他們將備份保存多年,甚至永遠。在第一次獲得真正的檢索請求時,人們會發(fā)現(xiàn)從執(zhí)行恢復的操作中執(zhí)行檢索是多么困難。這將使檢索花費更多、更長的時間,可能是幾個月而不是幾分鐘,并且花費更多的成本,甚至高達數(shù)百萬美元。
如果檢索是針對來自訴訟的電子發(fā)現(xiàn)請求,并且無法及時滿足,那么可能會有法院發(fā)出不利推理指令的風險。人們花費六個月的時間來滿足他們所知道的簡單要求,而卻遠遠沒有完成。法官推斷其試圖隱瞞什么。比較聞名的例子是摩根士丹利的訴訟案例,他們在這種情況下?lián)p失了數(shù)十億美元。
因此,不要將備份用作歸檔。如果人們有著長期存儲需求,請采用一個實際的歸檔系統(tǒng)。這將有一個前期成本,但從長遠來看它將是值得的。
-
數(shù)據(jù)
+關注
關注
8文章
7255瀏覽量
91819 -
備份
+關注
關注
0文章
81瀏覽量
16049
原文標題:備份與歸檔:為什么知道差異很重要
文章出處:【微信號:D1Net11,微信公眾號:存儲D1net】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
數(shù)據(jù)備份
阿里云數(shù)據(jù)庫備份DBS商業(yè)化發(fā)布,數(shù)據(jù)庫實時備份到OSS
什么是映像備份
數(shù)據(jù)備份與數(shù)據(jù)歸檔冷熱狀態(tài)的區(qū)別
氣象數(shù)據(jù)歸檔織的并行算法設計與驗證

備份在任何云策略中都至關重要,但是存儲數(shù)據(jù)的位置同樣重要
什么是熱備份_熱備份和冷備份的區(qū)別

PADS歸檔管理器管理設計數(shù)據(jù)和檔案備份
如何暴漲數(shù)據(jù)備份成功率?
恒訊科技分析:云備份與云存儲有什么區(qū)別?
SQL Server數(shù)據(jù)庫備份方法
深入理解數(shù)據(jù)備份的關鍵原則:應用一致性與崩潰一致性的區(qū)別

評論