關(guān)聯(lián)管理提升運(yùn)營(yíng)服務(wù)水平
智慧管理通過(guò)配置服務(wù)策略,對(duì)資源進(jìn)行監(jiān)視,發(fā)現(xiàn)影響可用性和預(yù)設(shè)服務(wù)水平的事件、狀態(tài)變化和性能降低。
當(dāng)被監(jiān)視的系統(tǒng)、設(shè)備中發(fā)生事件時(shí),該事件被記錄并關(guān)聯(lián)到相應(yīng)的業(yè)務(wù)資源。在業(yè)務(wù)系統(tǒng)影響視圖中,資源自身及依賴該資源的業(yè)務(wù)系統(tǒng)同時(shí)在界面呈現(xiàn),幫助用戶快速確定出該資源的問(wèn)題是否影響到關(guān)鍵業(yè)務(wù)系統(tǒng)。
同時(shí),管理系統(tǒng)將事件與關(guān)聯(lián)資源的可用性和響應(yīng)時(shí)間指標(biāo)結(jié)合,并可將用戶或用戶組感興趣的資源組織在一起,形成業(yè)務(wù)系統(tǒng)視圖,實(shí)現(xiàn)關(guān)聯(lián)管理。
實(shí)現(xiàn)數(shù)據(jù)中心系統(tǒng)、服務(wù)間的關(guān)聯(lián)管理,需要建設(shè)以下幾個(gè)方面的關(guān)鍵能力:
1、構(gòu)建配置、變更管理能力,實(shí)現(xiàn)資源的自動(dòng)發(fā)現(xiàn)、自動(dòng)感知變更、數(shù)據(jù)同步,使用如設(shè)備面板、功耗分布圖、溫度云圖、監(jiān)視Dashboard等工具,全面掌控環(huán)境變化。
2、建立連續(xù)供電、連續(xù)供冷、管理網(wǎng)絡(luò)等系統(tǒng)的拓?fù)潢P(guān)系圖,提供完整的部件間的上下聯(lián)關(guān)系樹(shù),并在資源能力下降時(shí),進(jìn)行關(guān)聯(lián)影響的分析。
3、共享的信息架構(gòu),通過(guò)業(yè)務(wù)關(guān)聯(lián)視圖,實(shí)現(xiàn)聯(lián)動(dòng)控制、集群調(diào)控、資源遷移、擴(kuò)容等操作,保障服務(wù)的連續(xù)性。
4、上述管理工具與服務(wù)流程(工單)結(jié)合,實(shí)現(xiàn)發(fā)現(xiàn)、測(cè)量、分析、調(diào)優(yōu)的閉環(huán)管理。
3.2?資源利用最大化
隨著數(shù)據(jù)中心的平均功率密度的持續(xù)增長(zhǎng),機(jī)位、供電能力、制冷能力的最大化利用,成為降低運(yùn)營(yíng)成本的關(guān)鍵。而基于供電、制冷、機(jī)位、端口的容量規(guī)劃和管理,是支持?jǐn)?shù)據(jù)中心可持續(xù)發(fā)展,實(shí)現(xiàn)資源利用最大化的關(guān)鍵技術(shù)。
負(fù)載均衡、能效最大化
跟蹤數(shù)據(jù)中心全局(整個(gè)數(shù)據(jù)中心)或者局部(一個(gè)機(jī)架)的電源消耗模式,并通過(guò)PUE與能耗分布識(shí)別改進(jìn)策略,持續(xù)優(yōu)化電源使用效率,是數(shù)據(jù)中心能效最大化運(yùn)營(yíng)的基本手段。通常包括如下幾個(gè)方面:
1)?完備的數(shù)據(jù)中心能效測(cè)量、分析、優(yōu)化模型;
2)?基于成功實(shí)踐的負(fù)載管理服務(wù),如應(yīng)用與負(fù)載均布;
3)?能效優(yōu)化服務(wù)能力,如多機(jī)柜管理、聯(lián)動(dòng),模擬配置和部署能力。
能耗測(cè)量是數(shù)據(jù)中心能耗管理的基礎(chǔ),包括測(cè)量點(diǎn)的選擇、測(cè)量參數(shù)等。能耗的管理策略決定了測(cè)量的模型,提供靈活的可定制的測(cè)量模型,可為不同場(chǎng)景下的數(shù)據(jù)中心能效優(yōu)化提供理論支持。
在具體的實(shí)踐中,一般采用PUE、pPUE(局部PUE)、DCiE、能耗分布等模型來(lái)評(píng)估能效,但要準(zhǔn)確的測(cè)量,需要系統(tǒng)能準(zhǔn)確的描述數(shù)據(jù)中心的供電、供冷網(wǎng)絡(luò)模型。
供電網(wǎng)絡(luò)的能耗測(cè)量借助智能電量?jī)x、智能配電設(shè)備(如rPDU)、UPS等來(lái)實(shí)現(xiàn)。對(duì)于pPUE來(lái)說(shuō),還需要綜合考慮負(fù)載分布情況,實(shí)現(xiàn)一個(gè)電源系統(tǒng)分供多個(gè)負(fù)載的精確計(jì)算。
供冷網(wǎng)絡(luò)的測(cè)量主要是借助冷量?jī)x實(shí)現(xiàn),對(duì)于一拖多的供冷網(wǎng)絡(luò),需要將支路冷量數(shù)據(jù)信息通過(guò)加權(quán)的方式將能耗分解到指定的區(qū)域負(fù)載。
因此,供電、供冷網(wǎng)絡(luò)模型的準(zhǔn)確性,所具有的測(cè)量條件,以及所采用的測(cè)量技術(shù)是能效準(zhǔn)確評(píng)估的前提條件。
負(fù)載管理服務(wù)包括規(guī)劃、監(jiān)視、配置部署幾個(gè)部分,并輔助以機(jī)位、制冷等因素,形成以供電、制冷、機(jī)位為基礎(chǔ)的容量管理,可為機(jī)架乃至數(shù)據(jù)中心的業(yè)務(wù)的持續(xù)增長(zhǎng)提供有效的支持。
負(fù)載規(guī)劃需要考慮整個(gè)數(shù)據(jù)中心(最小單位為一個(gè)機(jī)房)的負(fù)載部署,在保證業(yè)務(wù)連續(xù)可用性基礎(chǔ)上,通過(guò)單機(jī)柜、機(jī)柜間的負(fù)載平衡配置,實(shí)現(xiàn)如變壓器、UPS輸出的三相平衡等特性,改善整個(gè)機(jī)房的供電環(huán)境,提升供電品質(zhì)。同時(shí),負(fù)載的均衡分布,可促成冷量的均衡分布,規(guī)避冷、熱孤島現(xiàn)象,改善機(jī)房的散熱環(huán)境,最終顯著的提升PUE。
通過(guò)規(guī)劃設(shè)計(jì)能夠在數(shù)據(jù)中心建設(shè)初期確保設(shè)計(jì)的目標(biāo),但在實(shí)際的運(yùn)營(yíng)過(guò)程中,這些配置也不是靜態(tài)的,會(huì)隨著業(yè)務(wù)的伸縮不斷的動(dòng)態(tài)變化,如物理設(shè)備的移動(dòng)、變更、擴(kuò)容服務(wù),以及虛擬機(jī)的遷移等。一個(gè)具有跟隨配置變更的能效調(diào)控工具是實(shí)現(xiàn)能效優(yōu)化運(yùn)營(yíng)的基本需求,應(yīng)該具有多機(jī)柜關(guān)聯(lián)管理、聯(lián)動(dòng)、模擬配置和部署能力。實(shí)施可參考:
1)?實(shí)時(shí)監(jiān)視功耗,了解服務(wù)器/機(jī)架的平均和峰值功率。利用能耗管理工具,通過(guò)減少空閑容量的配置,提升電力資源的利用率;
2)?實(shí)時(shí)測(cè)量IT服務(wù)器的負(fù)載,并按照空調(diào)最佳COP調(diào)節(jié)制冷輸出,通過(guò)實(shí)時(shí)的負(fù)載溫度監(jiān)測(cè)和制冷容量的自適應(yīng)控制,實(shí)現(xiàn)按需供冷;
3)?根據(jù)功耗分布,給出負(fù)載規(guī)劃、配置優(yōu)化建議,實(shí)現(xiàn)負(fù)載再平衡。
評(píng)論