在數據中心建設初期,人們很難想到,IT業務和數據量會發生翻天覆地的變化。
隨著業務量的與日俱增,運營商不停地向數據中心填充一堆堆“鐵盒”,導致其內部散熱難、數據中心宕機等問題頻發。與此同時,數據中心用電管理出現盲點、資產追蹤和設備關系管理困難、無法了解機柜內的環境狀況、當設備變更時無法找到可用的資源等。
同時又適逢大數據時代來臨,數據量成指數級增長,數據中心向大型化轉型,如何成為高效管理成為運營商面臨的首要挑戰。
助力PUE值下降
其實我國數據中心面臨的挑戰遠還不止這些。根據Gartner的報告顯示,數據中心的能源消耗占總運營成本高達25%。2011年,美國數據中心的耗電量約占全國總耗電量的2%,占全世界總耗電量的1.3%。
但是在我國,2011年數據中心共消耗了700億度電,占全國總耗電量的5%,數據中心能耗情況更加嚴重。今年2月,工業和信息化部發布《工業節能“十二五”規劃》,針對數據中心的能耗問題提出明確要求:到2015年,國內數據中心PUE值需下降8%。
而這8%看似是一個很小的數字,但是PUE降低1%就需要對IT設備能源消耗、UPS轉化能源消耗、制冷系統能源消耗等數據中心不同層面、不同設備進行更好的節能措施。
所以是時候對數據中心進行全方位的管理了。目前,業內普遍認為,DCIM代表了數據中心管理的發展方向。因為它能夠從資產、容量、變更、電源、環境、能源等多方面對數據中心進行全面管理。
DCIM能否夠對數據中心的整個生命周期進行管理,或者對數據中心的設備進行合理的規劃和實時的監控來解決數據中心后期運維成本大幅度提高的“方法論”呢,答案是肯定的。
DCIM的“四步走”
Gartner的報告稱,DCIM已經被證明能夠降低20%的運營成本。其他研究機構數據也表明,DCIM解決方案可將部署新服務器的時間最高縮短50%,延長數據中心的壽命至少五年。
DCIM的出現可以說極大地緩解了數據中心整個生命周期的運維成本,所以DCIM成為當下數據中心建設不可缺少的一個重要組成部分,越來越受到人們的重視,那么DCIM到底是如何保證數據中心運行在正確的軌跡上的。
首先在設計階段,DCIM提供了基礎設施設計重要的信息。幫助在數據中心確定服務器的最佳位置。沒有這些信息,數據中心管理人員必須依靠猜測作出如下關鍵決定:多少設備可以放置在一個機架。設備太少,則浪費了數據中心寶貴的資源(空間資源、電力資源和冷卻資源)。設備太多,則會由于超過可用的資源增大了關機的危險。
其次在運營階段,DCIM可以幫助數據中心強制執行的標準流程。這些一致的,可重復的流程,可以減少操作錯誤,而操作錯誤所造成的系統停機多達80%。
在最重要的監測階段,DCIM提供業務數據,包括環境數據(溫度、濕度、),電力數據(設備裝置、機架、區域和數據中心水平)和冷卻數據。此外,DCIM也可以提供IT數據,如服務器資源(如處理器、內存、硬盤、網絡)。這些數據可以用來在超過閾值時,提醒管理,從而減少了維修時間,提高可用性。
最后在預測分析階段,DCIM分析監測階段投入到規劃階段的關鍵性能指標。容量規劃在這一階段進行決策。隨著時間的推移,跟蹤關鍵資源的使用情況。例如,在決定何時購買新的電力或冷卻設備可以提供寶貴的借鑒。
可以說DCIM相關的解決方案可以直觀地顯示數據中心所有物理資產和邏輯資產的完整清單,表明機柜和數據中心的場地位置和機柜熱負載。數據中心的管理人員利用DCIM,就能在實施任何可能嚴重影響數據中心性能變化的措施之前,建立復雜的假設場景,利用模型來模擬任何移動、添加或變化。
然而DCIM并不是某一個廠商單獨的概念,它是一個共同的共識,它是協助完成數據中心運行過程中的重要決策而形成的。企業只有精準地了解所擁有的資產,才能快速的制定出明智的決策,而DCIM剛好能實現這個目標。
解決易宕機難題
數據中心工作人員最擔心的事情莫過于服務器宕機了。7月26日,國外數家巨頭企業的數據中心發生宕機事故,包括微軟Window Azure、Google Talk及Twitter相繼傳出災情大小不一的斷線情況。
好在微軟不超過兩個小時就解決了問題,并且只對局部用戶產生了影響。但是Google Talk近四個小時的中斷,嚴重影響了Google的用戶形象。
而Twitter的數據中心更讓人啼笑皆非,近兩個月以來發生了兩次宕機,Twitter副總裁Mazen Rawashdeh的解釋是,Twitter架設了兩套備援服務器,但這次卻是罕見地兩臺服務器同時出現問題。
那么除了這些天災人禍不可避免的造成了宕機事故,數據中心能否提前發現問題,以便于數據中心工作人員做好防范準備,保證用戶的利益,又或者以最快的速度找出問題所在,減少用戶查找問題設備所在。
Gartner調查發現,數據中心處理宕機所花80%的時間是用于找出錯的服務器,在擁有超過500臺服務器的數據中心中,如果發生宕機事故,42%的數據中心負責人表示至少需要一天的時間來找到宕機的服務器。其次,在龐大而臃腫的數據中心,服務器的平均利用率僅為10%-20%。
所以服務器作為數據中心最直接的組成部分,數據中心工作人員必須了解所擁有的服務器的數量,以及服務器的位置所在。然而,道理總是說起來容易做起來難,將其付諸實踐并按照企業需求運作與管理遠比想象的復雜。實施數據中心每個資產的管理成為了數據中心規劃者和管理者撓頭的難題。
這時候DCIM就被寄予了厚望。理想情況下,DCIM可以保證數據中心里的所有設備的生命周期運行狀態都進入中央管理數據庫,而且這些信息使用DCIM相關軟件可以自動發現,并應該定期搜索以發現變化,數據中心內設備的每一個變化都應該第一時間讓設備管理者知曉,并且相關工具應自動向設備管理人員發出空間、電力、溫控需求改變或是警告。
DCIM能否全面保證數據中心的運維安全仍需要跟數據中心進行全面的磨合,絕不可能一勞永逸,妄想DCIM在短期內保證數據中心安全是不可能的,只有經過一段時間的試用期,數據中心才能完全的在DCIM的保護之下安全運作。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.vmgcyvh.cn/
本文標題:實現全生命周期管理 DCIM延壽數據中心