服務器數(shù)據(jù)恢復環(huán)境:
兩臺SPARC SOLARIS操作系統(tǒng)服務器通過光纖交換機共享一臺存儲作為集群使用。平時是一臺服務器(以下稱為主服務器)在運行,如果該服務器發(fā)生故障宕機,只需要將這臺服務器關機后開啟另外一臺服務器(以下稱備用服務器)進行接管即可。由于配置不當,兩臺服務器不能很好地對存儲互斥。
服務器故障&分析:
管理員在對服務器進行巡檢時開啟備用的那臺服務器,該服務器連接了一組未知的大容量磁盤。由于該服務器在主服務器正常工作的情況下不會啟用,處于閑置的狀態(tài),所以管理員誤以為該服務器連接的這塊大容量磁盤也處于閑置狀態(tài),于是將該大容量磁盤的某個分區(qū)做了newfs。然而這個大容量磁盤就是那臺共享存儲,主服務器報警宕機。
為了挽救數(shù)據(jù),管理員做了以下操作:1、重啟主服務器,但所有文件系統(tǒng)均無法掛載。2、執(zhí)行fsck,多數(shù)分區(qū)的數(shù)據(jù)修復成功,只有在備用服務器做過newfs的文件系統(tǒng)有問題,根目錄下只有一個lost+found文件夾,里面有大量數(shù)字標號的文件。
故障文件系統(tǒng)存儲了兩組ORACLE實例,原文件系統(tǒng)為UFS,約有200~400個數(shù)據(jù)文件需要恢復。
這是一個典型的由于配置不當,服務器不能很好地對存儲互斥導致共享沖突的案例。本案例中的2臺服務器同時對UFS這個單機文件系統(tǒng)進行訪問,以想當然的獨享方式對存儲進行管理,主服務器管理的文件系統(tǒng)其實在底層上已經被備用服務器做了文件系統(tǒng)初始化,主服務器從緩沖區(qū)寫入文件系統(tǒng)的數(shù)據(jù)也會破壞備用服務器初始化的結果。
在備用服務器上執(zhí)行newfs會作用于原先的文件系統(tǒng)之上,但本案例中的情況和單純的newfs有些不同。在主服務器宕機之前,會有一小部分數(shù)據(jù)(包括元數(shù)據(jù))會寫回文件系統(tǒng)。文件系統(tǒng)newfs如果結構與之前的相同,數(shù)據(jù)區(qū)是不會被破壞的。
UFS是傳統(tǒng)的UNIX文件系統(tǒng),以塊組切割,每塊組分配若干固定的inode區(qū)。文件系統(tǒng)newfs時,如果結構與之前的相同,文件系統(tǒng)最重要的inode區(qū)會全部初始化,之前的無法保留。inode管理著所有文件的重要屬性,所以單純從文件系統(tǒng)角度考慮,數(shù)據(jù)恢復的難度很大。由于oracle數(shù)據(jù)文件的強結構性和UFS的存儲規(guī)律性,可以通過重組oracle數(shù)據(jù)文件的結構,將數(shù)據(jù)文件、控制文件、日志等恢復出來。同時,oracle數(shù)據(jù)文件本身會有表名稱描述,可以反向推斷原來的磁盤文件名。
服務器數(shù)據(jù)恢復過程:
1、對故障文件系統(tǒng)做鏡像備份。
2、北亞企安數(shù)據(jù)恢復工程師基于鏡像文件分析&重組oracle數(shù)據(jù)結構。
3、對部分結構混亂,無法重組的文件,北亞企安數(shù)據(jù)恢復工程師參考ufs結構特征進行輔助分析。
4、利用恢復的數(shù)據(jù)文件、控制文件在oracle平臺恢復數(shù)據(jù)庫。
5、恢復完成后,由用戶方工程師進行檢測,經過反復檢測,用戶方確認恢復出來的數(shù)據(jù)完整有效。本次數(shù)據(jù)恢復工作完成。
服務器數(shù)據(jù)恢復總結:
fsck是很致命的操作,在執(zhí)行fsck操作之前最好做備份。
審核編輯:湯梓紅
-
服務器
+關注
關注
13文章
9795瀏覽量
87969 -
操作系統(tǒng)
+關注
關注
37文章
7151瀏覽量
125575 -
數(shù)據(jù)恢復
+關注
關注
10文章
650瀏覽量
18150
發(fā)布評論請先 登錄
服務器數(shù)據(jù)恢復—Linux系統(tǒng)服務器崩潰的數(shù)據(jù)恢復案例
虛擬化數(shù)據(jù)恢復—VMware虛擬化環(huán)境下重裝系統(tǒng)導致服務器數(shù)據(jù)丟失的數(shù)據(jù)恢復

服務器數(shù)據(jù)恢復—如何預防服務器故障與恢復服務器數(shù)據(jù)!
服務器數(shù)據(jù)恢復—linux操作系統(tǒng)云服務器數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—Zfs文件系統(tǒng)服務器數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—光纖存儲硬盤故障燈亮起的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列+reiserfs文件系統(tǒng)數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—SAN LUN Mapping出錯導致文件系統(tǒng)共享沖突的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—EXT3文件系統(tǒng)下誤刪除數(shù)據(jù)的恢復案例

評論