服務(wù)器數(shù)據(jù)恢復(fù)案例之服務(wù)器raid6中3個(gè)磁盤離線導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器故障:
服務(wù)器中有一組由6塊盤組建的 RAID6,這臺(tái)網(wǎng)站服務(wù)器上運(yùn)行MYSQL數(shù)據(jù)庫(kù)和存放其它類型的文件。該組raid中有兩塊磁盤離線,管理員沒(méi)有及時(shí)更換磁盤,當(dāng)?shù)?個(gè)磁盤離線,raid崩潰,服務(wù)器數(shù)據(jù)丟失。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、用戶方將服務(wù)器送到我們數(shù)據(jù)恢復(fù)中心后,硬件工程師將故障服務(wù)器中所有磁盤編號(hào)后取出,檢查完硬件故障后將這6塊磁盤以只讀方式完整鏡像到北亞企安數(shù)據(jù)恢復(fù)專用存儲(chǔ)池中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析所有磁盤底層數(shù)據(jù),數(shù)據(jù)恢復(fù)工程師發(fā)現(xiàn)有兩塊磁盤離線時(shí)間比較早,這2塊磁盤上沒(méi)有寫(xiě)入新的數(shù)據(jù)。此RAID6采用的雙校驗(yàn),:第一個(gè)校驗(yàn)是由普通的XOR運(yùn)算生成,而第二個(gè)校驗(yàn)是由Reed-Solomon算法生成。因?yàn)榇薘AID6較早掉線的兩塊磁盤早已不寫(xiě)入新數(shù)據(jù),所以需要通過(guò)第二個(gè)校驗(yàn)來(lái)恢復(fù)數(shù)據(jù),否則會(huì)導(dǎo)致最新數(shù)據(jù)的丟失或損壞。
3、服務(wù)器數(shù)據(jù)恢復(fù)工程師通過(guò)分析獲取到原始RAID6的相關(guān)參數(shù),然后使用北亞企安自主編寫(xiě)的RAID6恢復(fù)軟件生成一個(gè)完整鏡像,再將鏡像導(dǎo)回用戶方新搭建好的環(huán)境中,開(kāi)機(jī)一切正常,經(jīng)過(guò)服務(wù)器管理員的仔細(xì)驗(yàn)證,沒(méi)有發(fā)現(xiàn)任何問(wèn)題,用戶方認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。
服務(wù)器數(shù)據(jù)恢復(fù)案例之服務(wù)器RAID5兩個(gè)磁盤指示燈顯示紅色導(dǎo)致服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器故障:
服務(wù)器中有一組使用NetRaid陣列卡+4塊磁盤組建的RAID5陣列,上層操作系統(tǒng)為Window2000,運(yùn)行SQLServer2000數(shù)據(jù)庫(kù)。服務(wù)器在正常工作時(shí)突然有一塊硬盤指示燈顯示紅色,機(jī)器仍然在正常運(yùn)行,一段時(shí)間后服務(wù)器無(wú)法正常工作,這時(shí)候又有一個(gè)硬盤指示燈顯示紅色。管理員將故障服務(wù)器送到北亞企安數(shù)據(jù)恢復(fù)中心要求恢復(fù)其中的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、數(shù)據(jù)恢復(fù)工程師拿到服務(wù)器后將故障服務(wù)器通電后開(kāi)啟,服務(wù)器啟動(dòng)后自檢至陣列時(shí)按Ctrl+M進(jìn)入NetRaid管理程序。查看陣列信息發(fā)現(xiàn)有2塊硬盤狀態(tài)為Failed,將其中一塊硬盤設(shè)置為OnLine,重新啟動(dòng)服務(wù)器,硬件自檢無(wú)效,啟動(dòng)失敗。
2、再次啟動(dòng)服務(wù)器,自檢至陣列時(shí)按Ctrl+M進(jìn)入NetRaid管理程序。選擇磁盤陣列,將原來(lái)手工設(shè)置為OnLine的硬盤重新設(shè)置為Failed,然后再把另一塊Failed的硬盤設(shè)置成OnLine,重新啟動(dòng)服務(wù)器后成功進(jìn)入系統(tǒng)。經(jīng)過(guò)檢查發(fā)現(xiàn)系統(tǒng)及數(shù)據(jù)庫(kù)運(yùn)行正常,再次進(jìn)入NetRaid管理程序?qū)⑹O碌哪菈K狀態(tài)為Failed的硬盤手動(dòng)設(shè)置為Rebuild,完成重建后再次重啟服務(wù)器,成功進(jìn)入系統(tǒng)。經(jīng)過(guò)檢查發(fā)現(xiàn)陣列和系統(tǒng)都恢復(fù)原狀了。經(jīng)過(guò)服務(wù)器管理員的親自驗(yàn)證,沒(méi)有發(fā)現(xiàn)任何問(wèn)題,用戶方認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。
服務(wù)器數(shù)據(jù)恢復(fù)案例之服務(wù)器硬盤出現(xiàn)壞道/壞扇區(qū)離線導(dǎo)致服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器故障:
一臺(tái)有20塊硬盤的服務(wù)器,在運(yùn)行過(guò)程中上層業(yè)務(wù)突然崩潰,管理員檢查后發(fā)現(xiàn)服務(wù)器崩潰的原因是服務(wù)器上有3塊磁盤離線,管理員將服務(wù)器內(nèi)的所有磁盤編號(hào)后按照現(xiàn)有盤序從槽位取出送到北亞企安數(shù)據(jù)恢復(fù)中心要求恢復(fù)服務(wù)器中的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、拿到故障服務(wù)器中所有磁盤后,硬件工程師對(duì)20塊硬盤進(jìn)行硬件故障檢測(cè),經(jīng)過(guò)檢測(cè)所有硬盤均可識(shí)別,沒(méi)有發(fā)現(xiàn)明顯的硬件故障。
2、以只讀方式將所有硬盤做扇區(qū)級(jí)別的完整鏡像,在鏡像過(guò)程中發(fā)現(xiàn)離線的3塊磁盤鏡像速度異常,結(jié)合之前三塊磁盤離線,可以判斷這三塊離線的磁盤應(yīng)該存在大量的壞道或者不穩(wěn)定扇區(qū)。調(diào)整鏡像策略跳過(guò)硬盤的壞扇區(qū)繼續(xù)做鏡像,直到所有磁盤都完成鏡像。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始數(shù)據(jù)造成二次破壞。
3、基于鏡像文件分析所有磁盤的底層數(shù)據(jù),通過(guò)逆向分析ext3文件系統(tǒng)獲取服務(wù)器內(nèi)磁盤盤序和校驗(yàn)信息,利用獲取到的raid信息重組raid陣列。
4、和用戶方的溝通后,北亞企安數(shù)據(jù)恢復(fù)工程師提取了故障服務(wù)器中運(yùn)行的oracle數(shù)據(jù)庫(kù)的dmp文件,然后嘗試將dmp文件導(dǎo)入來(lái)恢復(fù)oracle數(shù)據(jù)庫(kù)數(shù)據(jù),結(jié)果數(shù)據(jù)庫(kù)報(bào)告imp-0008錯(cuò)誤。分析日志文件后發(fā)現(xiàn)提取的dmp文件存在問(wèn)題,所以導(dǎo)致dmp文件導(dǎo)入失敗。
5、重新分析raid結(jié)構(gòu),進(jìn)一步確定ext3文件系統(tǒng)被破壞的程度。經(jīng)過(guò)數(shù)小時(shí)的分析后重新提取dmp文件和dbf原始庫(kù)文件,將提取出來(lái)的dmp文件移交給用戶方進(jìn)行數(shù)據(jù)導(dǎo)入的測(cè)試,經(jīng)過(guò)測(cè)試沒(méi)有發(fā)現(xiàn)問(wèn)題。對(duì)提取出來(lái)的dbf原始庫(kù)文件進(jìn)行校驗(yàn)&檢測(cè),所有文件均通過(guò)測(cè)試。
6、用戶方對(duì)恢復(fù)數(shù)據(jù)進(jìn)行驗(yàn)證后認(rèn)可數(shù)據(jù)恢復(fù)結(jié)果。在服務(wù)器上搭建了一組新的raid陣列,在數(shù)據(jù)恢復(fù)工程師的幫助下將所有數(shù)據(jù)遷移到新準(zhǔn)備的環(huán)境中。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
13文章
9797瀏覽量
88044 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
650瀏覽量
18167
發(fā)布評(píng)論請(qǐng)先 登錄
服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—如何預(yù)防服務(wù)器故障與恢復(fù)服務(wù)器數(shù)據(jù)!
服務(wù)器數(shù)據(jù)恢復(fù)—Zfs文件系統(tǒng)服務(wù)器數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器硬盤燈閃黃燈的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—ZFS文件系統(tǒng)下RAIDZ數(shù)據(jù)恢復(fù)案例


服務(wù)器數(shù)據(jù)恢復(fù)—通過(guò)開(kāi)盤恢復(fù)服務(wù)器硬盤數(shù)據(jù)的數(shù)據(jù)恢復(fù)案例#數(shù)據(jù)恢復(fù) #數(shù)據(jù)恢復(fù)

服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器raid5陣列硬盤指示燈亮紅色的數(shù)據(jù)恢復(fù)案例#數(shù)據(jù)恢復(fù) #服務(wù)器數(shù)據(jù)恢復(fù)

服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器raid5崩潰導(dǎo)致上層分區(qū)無(wú)法訪問(wèn)的數(shù)據(jù)恢復(fù)案例 #數(shù)據(jù)恢復(fù) #服務(wù)器數(shù)據(jù)恢復(fù)
服務(wù)器數(shù)據(jù)恢復(fù)—浪潮服務(wù)器硬盤指示燈亮黃燈的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—V7000存儲(chǔ)NTFS文件系統(tǒng)數(shù)據(jù)恢復(fù)案例

評(píng)論