很多企業(yè)都在考慮一個問題,就是如何創(chuàng)建一個靈活的、有彈性的數(shù)據(jù)中心。這其中包括確保計算機系統(tǒng)和其他重要設備的有序恢復,保證所有供電系統(tǒng)的正常運轉等等。為實現(xiàn)這一目標,我們需要一個完善的災難恢復規(guī)劃。
假設你希望數(shù)據(jù)中心的恢復規(guī)劃良好,你必須將數(shù)據(jù)中心看做業(yè)務流程,其中有大量相互依賴且變化的部分。并且,由于其中有大量相互關聯(lián)的部分,當意外發(fā)生時,所有要做的事情必須預先用流程的形式寫在文檔上。如果數(shù)據(jù)中心管理員對災備毫無概念,這將是非常危險的事情。當所有事情都出了問題后,每個人都會將矛頭直指該數(shù)據(jù)中心管理員。
一整套體系架構和相關應用程序的流程首先是必須的。每個部件,或每個部件組通常有支持的體系架構,并且通常來講,都有一個或一組人對其負責。因此服務器會分到服務器組中,或虛擬組中,也有可能兩個都是。所有這些通常在一個體系架構組或一個運營組下面,然而當遇到重大事故時,這些都會呈現(xiàn)星狀圖拓展開來,和各容災管理員直接對應。誰負責,誰決策,需要做什么,以及所做的順序,這類管理模型必須清晰地記錄下來。
在整個容災規(guī)劃中,每個功能模塊必須明確其角色,負責范圍,以及時間點和所需執(zhí)行的流程步驟。在數(shù)據(jù)中心中,所有的資源被完全保護并具備冗余。到一定程度后我們會驚奇地發(fā)現(xiàn)絕大多數(shù)數(shù)據(jù)中心中充斥著單點故障,這是我們必須考慮解決的。
另外,電源UPS風險也要充分考慮到。當然,還有一部分風險在于不間斷電源是否可以支撐到發(fā)電機啟動并接受所有這些麻煩。而且,讓供應商參與到實際測試中還是十分必要的。也可以通過電力公司參與測試。不過對于不間斷電源這種孤立的設備,是非常重要的……但你要從端到端考慮。不僅是不間斷電源,還有不間斷電源的不間斷電源,以及發(fā)電機,導線和電源分配器,并且按步驟從不論是變電站或發(fā)電機獲取電量。很多事可以,也應該作為預防維護事件進行。每年或每半年你應該進行負載測試;你應該做預防性的監(jiān)測;你應該進行紅外線測試來檢測電線是否老化……所有這些都是一個整體。
總之,在進行數(shù)據(jù)中心容災規(guī)劃時要考慮到從主體設備到輔助硬件的方方面面。任何一個層面出了問題都可能影響業(yè)務連續(xù)性運行。
-
電源
+關注
關注
185文章
18368瀏覽量
256268 -
UPS
+關注
關注
21文章
1261瀏覽量
93563 -
數(shù)據(jù)中心
+關注
關注
16文章
5228瀏覽量
73514
發(fā)布評論請先 登錄
中型數(shù)據(jù)中心中的差分晶體振蕩器應用與匹配方案
小型數(shù)據(jù)中心晶振選型關鍵參數(shù)全解

科力銳2025應用級災備行業(yè)峰會圓滿收官,共建數(shù)智時代災備新范式

MPS數(shù)據(jù)中心備電單元解決方案的精選問答
適用于數(shù)據(jù)中心和AI時代的800G網絡
優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
數(shù)據(jù)中心接地電阻柜為什么要做耐壓試驗
數(shù)據(jù)中心發(fā)展與改造


如何選擇數(shù)據(jù)中心服務

怎樣保障數(shù)據(jù)中心不間斷電源不斷電 提供可靠安全的供配電#數(shù)據(jù)中心


評論