服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境&故障:
兩臺(tái)SOLARIS系統(tǒng)(SPARC平臺(tái))的服務(wù)器通過(guò)光纖交換機(jī)共享同一個(gè)存儲(chǔ)作為CLUSTER使用。正常情況下只有A服務(wù)器工作。如果A服務(wù)器發(fā)生故障宕機(jī),可將A服務(wù)器關(guān)機(jī),開(kāi)啟B服務(wù)器接管。但由于配置不當(dāng)導(dǎo)致共享存儲(chǔ)互斥出現(xiàn)問(wèn)題。
管理員進(jìn)行運(yùn)維檢查時(shí)發(fā)現(xiàn)B服務(wù)器連接了一塊未知磁盤(pán)。由于B服務(wù)器并未啟用,處于閑置狀態(tài),所以管理員也將這塊磁盤(pán)當(dāng)作閑置的,于是在B服務(wù)器上將磁盤(pán)的某個(gè)分區(qū)做了newfs。沒(méi)想到這塊磁盤(pán)就是那個(gè)共享存儲(chǔ),執(zhí)行操作沒(méi)有多長(zhǎng)時(shí)間A服務(wù)器就開(kāi)始報(bào)警并宕機(jī)。
發(fā)生問(wèn)題后,管理員又做了如下操作:1、重啟A服務(wù)器但發(fā)現(xiàn)所有的文件系統(tǒng)均無(wú)法掛載。2、執(zhí)行fsck。多數(shù)分區(qū)數(shù)據(jù)修復(fù)成功,只有在B服務(wù)器做過(guò)newfs的文件系統(tǒng)修復(fù)結(jié)果不理想,根目錄下只有一個(gè)lost+found文件夾,里面有大量數(shù)字標(biāo)號(hào)的文件。
故障文件系統(tǒng)存放了兩組ORACLE實(shí)例,文件系統(tǒng)為UFS,約有數(shù)百個(gè)數(shù)據(jù)文件需要恢復(fù)。
故障分析&數(shù)據(jù)恢復(fù)方案:
光纖環(huán)境下的共享沖突案例很多。本案例中,A服務(wù)器與B服務(wù)器同時(shí)對(duì)UFS這個(gè)單機(jī)文件系統(tǒng)進(jìn)行訪(fǎng)問(wèn),兩臺(tái)服務(wù)器都以獨(dú)享方式對(duì)共享存儲(chǔ)進(jìn)行管理。A服務(wù)器正常管理的文件系統(tǒng)其實(shí)底層上已經(jīng)被B服務(wù)器做了文件系統(tǒng)初始化,A服務(wù)器從緩沖區(qū)寫(xiě)入文件系統(tǒng)的數(shù)據(jù)也會(huì)破壞B服務(wù)器初始化的結(jié)果。
B服務(wù)器上做newfs實(shí)際上直接會(huì)作用于原先的文件系統(tǒng)之上,但本案例與單純的newfs有些不同,在A服務(wù)器宕機(jī)之前,會(huì)有一小部分?jǐn)?shù)據(jù)(包括元數(shù)據(jù))回寫(xiě)回文件系統(tǒng)。newfs的結(jié)構(gòu)如果與之前的相同,數(shù)據(jù)區(qū)是不會(huì)被破壞的。如果有一小部分元數(shù)據(jù)存在,部分?jǐn)?shù)據(jù)還是可以恢復(fù)的。
UFS文件系統(tǒng)以塊組切割,每塊組分配若干固定的inode區(qū)。文件系統(tǒng)newfs時(shí),如果結(jié)構(gòu)與之前的相同,文件系統(tǒng)最重要的inode區(qū)會(huì)全部初始化,之前的無(wú)法保留。inode管理著所有文件的重要屬性,所以單純從文件系統(tǒng)角度考慮,數(shù)據(jù)恢復(fù)的難度很大。幸虧oracle數(shù)據(jù)文件的強(qiáng)結(jié)構(gòu)性和UFS文件系統(tǒng)的規(guī)律性,可以通過(guò)對(duì)oracle數(shù)據(jù)文件的結(jié)構(gòu)重組,將數(shù)據(jù)文件、控制文件、日志等恢復(fù)出來(lái)。oracle數(shù)據(jù)文件本身會(huì)有表名稱(chēng)描述,也可以反向推斷原來(lái)的磁盤(pán)文件名。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將所有文件系統(tǒng)做只讀鏡像。
2、基于鏡像文件分析&重組oracle數(shù)據(jù)結(jié)構(gòu)。
3、針對(duì)部分結(jié)構(gòu)亂,無(wú)法重組的文件,北亞企安數(shù)據(jù)恢復(fù)工程師參考ufs文件系統(tǒng)結(jié)構(gòu)特征進(jìn)行輔助分析。
4、利用恢復(fù)出來(lái)的數(shù)據(jù)文件、控制文件在oracle平臺(tái)恢復(fù)數(shù)據(jù)庫(kù)。
5、恢復(fù)完所有數(shù)據(jù)庫(kù)文件后,交由用戶(hù)方檢測(cè)。經(jīng)過(guò)仔細(xì)檢測(cè),確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整。
Tips:
fsck是很致命的操作,在fsck之前最好做好備份。光纖環(huán)境中存儲(chǔ)互斥不當(dāng)是非常多的數(shù)據(jù)災(zāi)難的原因,應(yīng)謹(jǐn)慎部署與實(shí)施。
審核編輯 黃宇
-
光纖
+關(guān)注
關(guān)注
20文章
4146瀏覽量
75220 -
服務(wù)器
+關(guān)注
關(guān)注
13文章
9795瀏覽量
87977 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
650瀏覽量
18153 -
共享存儲(chǔ)
+關(guān)注
關(guān)注
0文章
5瀏覽量
3048
發(fā)布評(píng)論請(qǐng)先 登錄
服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
虛擬化數(shù)據(jù)恢復(fù)—VMware虛擬化環(huán)境下重裝系統(tǒng)導(dǎo)致服務(wù)器數(shù)據(jù)丟失的數(shù)據(jù)恢復(fù)

服務(wù)器數(shù)據(jù)恢復(fù)—Zfs文件系統(tǒng)服務(wù)器數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—ZFS文件系統(tǒng)下RAIDZ數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—光纖存儲(chǔ)硬盤(pán)故障燈亮起的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—存儲(chǔ)硬盤(pán)指示燈顯示黃色的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—EVA存儲(chǔ)磁盤(pán)組磁盤(pán)掉線(xiàn)的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—EqualLogic存儲(chǔ)硬盤(pán)指示燈亮黃燈的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—EVA存儲(chǔ)誤刪除VDISK的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—V7000存儲(chǔ)NTFS文件系統(tǒng)數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—Linux網(wǎng)站服務(wù)器硬盤(pán)出現(xiàn)壞扇區(qū)的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—SAN環(huán)境下LUN映射錯(cuò)誤導(dǎo)致寫(xiě)操作互斥失敗的數(shù)據(jù)恢復(fù)案例
假如服務(wù)器的數(shù)據(jù)丟失,如何快速恢復(fù)丟失的數(shù)據(jù)?
服務(wù)器數(shù)據(jù)恢復(fù)—SAN環(huán)境下LUN映射出錯(cuò)導(dǎo)致文件系統(tǒng)共享沖突的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—LeftHand存儲(chǔ)結(jié)構(gòu)&raid故障的數(shù)據(jù)恢復(fù)案例

評(píng)論