如今,信息已成為企業生存發展的必不可少的元素。隨著越來越多的企業認識到TT系統在信息處理過程中的迅捷和高效,ERP(企業資源計劃)、PLM(產品生命周期管理)等各種類型的rT系統相繼在多個企業中得到運用。IT系統在加速企業信息處理流程的同時,也產生了更多的數據。各類主數據、交易數據、電子文檔、報表是TI'系統最重要的數據,這些數據對絕大部分規模以上企業來說,是支撐企業存在和發展的信息化基石。對這些數據的保護重要性不言而喻。信息技術的應用程度越高,數據的備份就越顯得重要。在很多關鍵業務系統中,存放在機器上的數據往往比機器本身還要昂貴,因此對系統和業務數據的備份就成為非常重要的工作。備份的目的是在系統出現故障或災難時能夠快速地恢復系統或數據。要能夠做到快速災難恢復,就必須設計好災難恢復方案,選擇一個可行的備份策略。
順應數據大集中的趨勢,很多企業均已建設或在建設自己的數據中心。企業絕大部分信息系統都在數據中心內運行,IT系統承載著公司的各項業務,進一步促進信息系統的集成和整合。將分散的數據集中到了一起,零星數據變成了海量數據,數據量從原來的幾GB到幾十GB,變為了幾百GB到幾TB,甚至幾十TB,大數據的概念也由此而來。數據量的劇增也給備份和管理帶來了機遇和挑戰。首先數據的集中存放,使集中備份成為可能。然而,要實現對海量數據的集中存儲備份和統一管理,采用原有的傳統磁帶機、磁帶庫等備份設備的備份方案很難達到備份目標。磁帶或CD備份是一種最便宜的方法,也是較為有效的方法,但是它的恢復卻是最慢的。而磁盤熱備份與全系統熱備份的成本就比較高,但它的恢復速度是非常快的。因此,連續數據保護、虛擬帶庫、重復數據刪除等先進備份技術應運而生,這些技術的出現,對于構建新型高效的災備方案,保證業務數據的高效及安全,提供了強有力的技術支持。
1.現行國內工程機械行業IT災備模式分析
對國內一些主要工程機械企業的研究表明,這些企業在IT系統建設上都有很多共性:(I)用于業務支持的1T系統很多,核心的ERP系統采用國際上較為完善和通行的大型應用軟件,如SAP或ORACLE系統,對IT系統的支持和保障要求很高。(2)園區內都有兩個或兩個以上的機房或數據中心。(3)核心IT系統都采用高端存儲設備,使用光纖SAN鏈路,有一定的數據容災能力,但是沒有完整的應用容災系統。(4)大型IT項目建設的時間跨度很大,在IT建設的各個階段逐步引人多種技術方案,各個方案的建設需要保持平緩過渡,有利舊要求,以實現對原有投資的保護,降低IT的建設成本。
工程機械企業園區占地面積較大,有條件在幾百米甚至上千米外的同一園區內建設自己的另一數據機房,如另一棟樓、另一片廠區等,使得本地災備系統可以建立在本園區內的另一機房。雖然不能避免地震、洪水等自然災害,但是通過合理地設計和配置,已經可以在很大程度上避免火災和停電等外部因素的影響。通過在園區機房間內建立FCSAN網絡,使得備份可以得到較高的效率和較好的成本控制,免去了租用高成本的光纖鏈路與額外的人力資源管理成本。
對于核心應用系統的保護,最基本的是要避免系統的單點故障。主機端使用雙機熱備技術,網絡端使用雙核心的架構,存儲端使用鏡像或連續數據保護系統,通過以上對應用系統的規劃設計,基本上可以避免主機、網絡、存儲端的單點故障。通過連續數據保護系統還可以降低邏輯錯誤、誤操作等風險。
制造業對IT投人的成本較為敏感,在滿足企業對IT系統數據備份要求的同時,希望降低TT總體擁有成本(TCO)。通常情況下,由于SAP, ORA-CLE等大型ERP系統使用高端的小型機服務器,出于成本方面的考慮,園區內的主機房通常用于存放一套核心和主要業務系統,并對核心數據進行保護。園區內的備份機房主要用于存放備份設備及部分其他應用。而工程機械行業的離散制造的特征,決定了企業對IT的投人需要按實際情況分階段進行投人,并且各階段的TT建設需要保持連續性,以保護原有投資,避免重復投資和浪費。企業的災備系統建設只有適應該特征,才能在滿足需求的基礎上制定出性價比最優的方案。
數據備份系統通常會通過兩個最重要的指標來進行評估:RPO和RTO。RPO(Recovery Point Objective),即數據恢復點目標。主要用于評估業務系統所能容忍的數據丟失量,在同步數據復制方式下,RPO等于數據傳輸時延的時間;在異步數據復制方式下,RPO為異步傳輸數據排隊的時間,對于時間間隔較大的數據備份而言,RPO等于連續兩次成功備份的時間之差。RTO(Recovery Time Objective),即恢復時間目標。主要用于評估所能容忍的業務停止服務最長時間,也就是從災難發生到業務系統恢復服務功能所需要的最短時間。RTO描述了應用恢復過程需要花費的時間,即從恢復過程開始到恢復過程成功完成所經歷的時間。fITO值越小,代表災備系統的恢復能力越強。RPO和RTO的關系如圖1所示。
圖1 RTO和RPO示意圖
RPO針對的是數據丟失量,而RTO針對的是業務連續性中斷時間,二者沒有必然的關聯性,但都是判斷企業災備能力的關鍵指標。RTO和RPO的確定不僅僅是IT部門的事情,而是需要在對企業業務系統和IT狀況進行風險分析和業務影響分析后,才能根據不同的業務需求確定合適的值。對于不同企業的同一種業務,RTO和RPO的需求也會有所不同。通常情況下RPO與RTO越小,系統的可用性就越高,用戶需要的投資也越大。
在工程機械行業中,核心系統通常為ERP系統和PLM系統。對ERP系統來說,絕大部分數據的錄人都需要有原始單據,原始單據會有相當長的保留期,因此對于發生短時的系統不可用或數據失的情況,可以在后續進行單據補錄,RPO和RTO越大,后續的系統補錄工作就越大,對EPR周邊系統影響越大,同時各系統間的數據一致性就越難保證,因此ERP系統對于RPO和RTO的要求較高。而對于PLM系統來說,數據都是在系統上進行實時錄人的,數據丟失就意味著很多設計圖紙丟失了,對RPO的要求相對ERP就更高。由于現在企業中的IT系統眾多,從十幾個到幾十個,甚至上百個,相互間通過中間件或接口進行連接,數據流非常復雜,保證數據一致性也是必須要考慮的重要因素。因此在進行RPO和RTO定義時,IT部門需要與業務部門進行充分溝通,考慮各系統的特點,規劃和平衡其影響程度、范圍、成本的關系,才有可能得出相對合適的指標。
工程機械行業中這些大型企業,均采用了大型的FC一SAN為承載核心業務數據的基礎鏈路。大型FC一SAN被稱為“FC + LAN”雙網結構,這是指該系統由FC光纖通道網絡和LAN以太網絡共同構成,其中以太網絡負責工作站與服務器及工作站之間的元數據信息傳輸和交換,FC光纖通道網絡只負責實際數據的高帶寬傳輸。這種網絡結構可充分利用兩種網絡的特點,發揮出這兩個網絡的最大效率。后續災備方案也將基于這種網絡進行設計。
2.柳工災備系統建設方案介紹
企業IT災備系統的建設通常從備份開始做起。而離散制造業IT系統有自身的特點,與金融證券業以及業務連續性要求較高的汽車制造業相比,其RPO和RTO要求相對較低,因此其對備份的要求也隨之降低。針對柳工的備份需求,根據業務的特點和業務系統的數據規模,柳工數據災備項目分為三期進行。
廣西柳工機械股份有限公司(以下簡稱柳工)的災備系統建設目前已進行了三期。
第一期為企業磁帶庫建設,目的是實現基本保護,項目一期跟隨公司SAP項目同時啟動,企業的數據量備份需求由1006級上升到1OOOG級,通過部署企業磁帶庫和網絡版備份軟件,使用IP架構進行備份,將一些主要的應用系統數據和文件備份到企業磁帶庫。
第二期為連續數據保護系統建設,目的是對核心系統實現重點保護。由于當時企業核心系統數據量已超過STB,系統的備份窗口超過24.h,恢復窗口超過48h,傳統備份已經無法滿足進行快速備份和恢復的要求。同時,由于核心系統業務的復雜性,產生了對邏輯錯誤進行保護的需求,因此企業部署了連續數據保護系統,使用SAN架構進行數據同步,達到基于時間點的數據保護,核心應用系統的RPO指標數量級由一天級提升到分鐘級,RTO指標達到4h以下。通過對日志卷的回滾,具備快速恢復到保護期內多個時間點的能力,當恢復到一個時間點后,發現不是最佳恢復點還可以選擇恢復到另一時間點,這在實際使用中非常實用,并且能夠實現在不影響生產環境的前提下,快速搭建與生產環境一致的測試環境。連續數據保護系統可以對邏輯錯誤進行防護,因而具有一定的本地容災能力,通過采用HACMP的雙機熱備系統實現對主機端的保護,通過連續數據保護系統實現對存儲端的保護,使得在主存儲系統出現邏輯錯誤時可以進行快速數據回滾,而在主存儲出現物理故障時可以快速切換到備份存儲,并且可以選擇時間點恢復數據,實現分鐘級的RPO。值得強調的是,本方案支持的主備存儲為異構系統,即不同品牌、不同型號。這為企業在技術方案設計和設備選型上提供了很大的靈活性,有利于對企業原有TI基礎設施進行利舊。將原有中端存儲降級為備存儲,新引人高端存儲作為主存儲,既提高了整體性能和可靠性,也讓原有IT基礎設施得以繼續沿用,降低了項目成本。
第三期為對大數據的全面保護。隨著企業業務的發展,項目開始時TT系統的數據總量已經超過20TB,傳統的數據備份設備很難達成RTO和RPO備份目標。為此,采用了帶重復數據刪除功能的虛擬帶庫備份解決方案。以帶消重功能虛擬帶庫為前端,提高并發備份作業數并縮短備份窗口,以速度相對較慢的物理帶庫為后端,以降低備份成本。在備份鏈路上采用以太網絡和光纖SAN網絡組合的方式進行搭建。對于數據量大且重要程度高的業務系統采用高效的SAN網絡進行備份,對于數據量小的業務系統和海量的文件存儲采用經濟的千兆以太網絡進行備份。最終的拓撲示意圖如圖2所示。
圖2 備份拓撲示意圖
通過三個階段的仃備份系統建設,柳工在復雜環境下成功部署了整套本方案,連續數據保護與虛擬帶庫、物理磁帶庫結合使用,形成高中低搭配,分層次的備份體系,能夠滿足不同系統和數據的備份需求,公司形成了一套較為完備的本地備份容災方案,并且可靈活擴充到同城或異地備份容災,為柳工后續異地備份容災的規劃實施做好了準備。
3.結束語
企業業務的擴張導致企業IT系統的擴張,與此對應的是海量的數據和對數據備份容災的要求越來越高。由于工程機械制造企業的行業特點和對成本控制的敏感程度,使得企業在進行災備系統建設時,需結合企業自身的特點,依據從粗到細、由簡人繁的原則,達成從無到有并逐步完善的目標。通過統一規劃、分步實施,充分利用現有先進的備份技術構建適合本企業的備份容災方案,才能設計和實施最優TCO方案。
轉載請注明出處:拓步ERP資訊網http://www.vmgcyvh.cn/
本文標題:工程機械企業IT災備系統建設