隨著現代企業信息化進程的不斷深人,一個現代化企業對各類企業信息系統的依賴性越來越強。在企業必須依靠各類信息系統運轉的今天,存儲于各信息系統后臺的結構化數據或非結構化數據,就成為企業最為重要的資產。特別對于運營商來說,存儲于核心業務系統的大量用戶數據成為企業生存和發展的基礎,這些存儲于磁盤上的重要數據一旦發生丟失或錯誤,又沒有相應的備份或容災數據可用,那對于企業的打擊將是毀滅性的。因此,對各類核心數據進行容災備份保護刻不容緩。
隨著存儲技術的不斷發展,就單個存儲系統而言,其IO性能、可靠性、可擴展性及可管理性已相當成熟,諸如EMC、DELL、ORACLE、IBM等公司的高端存儲系統,已被廣泛運用于企業的核心信息系統,特別是SAN存儲網絡技術已成為企業結構化數據存儲的首選方案。但在實際的應用過程中,我們發現SAN存儲技術在帶來性能、使用和管理上的提升時,也帶來了對數據存儲的風險。SAN存儲網絡的運用,使得數據進一步集中,而風險也隨之集中和遞增。
那么如何保證數據的安全,如何保證在存儲系統出現故障后,能夠快速恢復應用系統的正常訪問,則是需要通過容災備份系統來解決的問題。通常我們把容災備份系統簡稱為災備系統,災備系統是在企業信息系統發生故障甚至崩潰時,能迅速將系統恢復到可用狀態的輔助IT系統。它可以保證企業信息系統在發生崩潰時,最大限度地保護企業資源,最快速地恢復企業地信息系統服務。
1.容災與備份
通常我們實現信息系統數據災備有兩種方式:Backup和Replicationo Backup就是我們通常所說的數據備份,是通過數據庫自身或專業備份軟件實現的,基于系統數據文件的數據保護方式;Replication通常指的是存儲設備自身或通過專業設備、軟件,實現數據在異機或異地的復制,作為生產系統的遠程容災系統。
備份是指為防止系統出現操作失誤或系統故障導致數據丟失,而將全系統或部分數據從主機的硬盤或陣列復制到其它存儲介質的過程,是將在線數據轉移成離線數據的過程。但是備份的數據不可直接使用,也不可掛載給主機,必須執行恢復措施后才可使用。
而容災的目的在于保證系統數據和服務的“在線性”,即當系統發生故障時,仍然能夠正常的對外提供數據和服務,以使系統應用不致中斷。做容災復制后的數據不需要恢復即可使用。
容災系統會完整地把生產系統的任何變化復制到容災系統中,包括你不想讓它復制的工作,比如由于誤操作將業務系統中的用戶信息表刪除了,同時容災端的用戶信息表也會完整地刪除。這時如果想恢復被刪除的數據,就需要從備份系統中取出最新備份的數據,通過恢復操作來恢復被誤刪除的數據。通過這一點我們可以看出,雖然在容災等級劃分上,備份也是一種容災方案,但基于數據復制的容災系統的建設是不能替代備份系統的建設的。因此備份的目的在于處理系統數據中的邏輯錯誤和歷史數據保存,是整個數據安全體系的基礎,就算建立了最高級別的容災系統,數據備份工作也是最基礎的、必須要做的工作。
那么有了備份數據,是否還需要容災系統呢?這就要看對具體信息系統的要求了,如果是企業內部的普通應用系統,允許有一定的停機時間,并允許有少量的數據丟失,那么備份系統就能滿足要求。但如果是企業的核心業務系統,對提供服務時間和數據安全性有相當高的要求,那容災系統就是必不可少的了,容災系統可以保證在災難發生時數據的完整性和業務的連續性,并在最短時間內恢復業務系統的正常運行,將損失降到最小。
2.災備系統等級劃分
我們都知道災備系統的建設是一個投人維護成本巨大,但很難能見到它發揮作用的一個應急系統。對于關系國家命脈的關鍵性行業,有國家的政策法規強制性的災備系統建設要求,這些行業在災備中心的建設和維護上會投人巨大的資金和精力。而對于中小企業來說如果沒有大型企業那樣的實力,那我們該如何建設自己的災備系統呢?是只建備份系統,還是只建容災系統,還是需要兩者同時建設?設計一個災備系統,需要考慮多方面的因素,如備份膠復數據量大小、生產中心和災備中心之間的距離和數據傳輸方式、災難發生時所要求的恢復速度、災備中心的管理及投人資金等。
根據SHARE78國際標準組織提出的標準,將容災系統定義成7個層次(見圖1),這7個層次對應的容災方案在功能、適用范圍等方面都有所不同,因此我們在選擇容災方案時應重點區分它們各自的特點和適用范圍,結合自己對災備系統的要求判斷選擇哪個層次的方案。
恢復系統所需要的時間
圖1 容災等級劃分
0級:無異地備份數據
在0級容災方案中,數據僅在本地進行備份,沒有異地備份數據,未制定災難恢復計劃。這種方式雖然是成本最低的災難恢復解決方案,但不具備真正災難恢復能力。
在這種容災方案中,最常用的是備份管理軟件加磁帶機的方式,隨著近幾年磁盤技術的發展,此處可供選擇的磁帶機有物理磁帶機和虛擬磁帶機。它是所有容災方案的基礎,從個人用戶到企業級用戶都廣泛采用了這種方案。其優點是用戶投資較少,技術實現簡單。缺點是一旦本地發生毀滅性災難,將丟失全部的本地備份數據,業務無法恢復。
1級:本地備份異地保存
第1級容災方案是將關鍵數據備份到本地磁帶介質上,然后送往異地保存,但異地沒有可用的備份中心、備份數據處理系統和備份網絡通信系統,未制定災難恢復計劃。災難發生后,使用新的主機,利用異地數據備份介質(磁帶)將數據恢復起來。
這種方案成本較低,運用本地備份管理軟件,可以在本地發生毀滅性災難后,恢復從異地運送過來的備份數據到本地,進行業務恢復。但難以管理,即很難知道什么數據在什么地方,恢復時間長短依賴于何時硬件平臺能夠被提供和準備好。以前被許多進行關鍵業務生產的大企業所廣泛采用,作為異地容災的手用戶中采用較多。對于要求快速進行業務恢復和海量數據恢復的用戶,這種方案是不能夠被接受的。
2級:熱備份站點備份
第2級容災方案是將關鍵數據進行備份并存放到異地,制定相應災難恢復計劃,一旦發生災難,利用熱備份主機系統將數據恢復。它與1級容災方案的區別在于異地有一個熱備份站點,該站點有主機系統,平時利用異地的備份管理軟件將運送到異地的數據備份介質(磁帶)上的數據備份到主機系統。當災難發生時可以快速接管應用,恢復生產。
由于有了熱備中心,用戶投資會增加,相應的管理人員也要增加。技術實現簡單,利用異地的熱備份系統,可以在本地發生毀滅性災難后,快速地進行業務恢復。但這種容災方案由于備份介質是采用交通運輸方式送往異地,異地熱備中心保存的數據是上一次備份的數據,可能會有幾天甚至幾周的數據丟失。這對于關鍵數據的容災是不能容忍的。
3級:在線數據恢復
第3級容災方案是通過網絡將關鍵數據進行備份并存放至異地,制定相應災難恢復計劃,有備份中心,并配備部分數據處理系統及網絡通信系統。該等級方案特點是用電子數據傳輸取代交通工具傳輸備份數據,從而提高了災難恢復的速度。利用異地的備份管理軟件將通過網絡傳送到異地的數據備份到主機系統。一旦災難發生,需要的關鍵數據通過網絡可迅速恢復,通過網絡切換,關鍵應用恢復時間可降低到一天或小時級。這一等級方案由于備份站點要保證持續運行,對網絡的要求較高,因此成本相應有所增加。
4級:定時數據備份
第4級容災方案是在第3級容災方案的基礎上,利用備份管理軟件自動通過通信網絡將部分關鍵數據定時備份至異地,并制定相應的災難恢復計劃。一旦災難發生,利用備份中已有資源及異地備份數據恢復關鍵業務的系統運行。
這一等級方案的特點是備份數據采用自動化的備份管理軟件備份到異地,異地熱備中心保存的數據是定時備份的數據,根據備份策略的不同,數據的丟失與恢復時間達到天或小時級。由于對備份管理軟件設備和網絡設備的要求較高,因此投人成本也會增加。但由于該級別備份的特點,業務恢復時間和數據的丟失量還不能滿足關鍵行業對關鍵數據容災的要求。
5級:實時數據備份
第5級容災方案在前面幾個級別的基礎上使用了硬件的鏡像技術和軟件的數據復制技術,也就是說,可以實現在應用站點與備份站點的數據都被更新。數據在兩個站點之間相互鏡像,由遠程異步提交來實現同步,因為關鍵應用使用了雙重在線存儲,所以在災難發生時,僅僅很小部分的數據被丟失,恢復的時間被降低到了分鐘級或秒級。由于對存儲系統和數據復制軟件的要求較高,所需成本也大大增加。
這一等級的方案由于既能保證不影響當前交易的進行,又能實時復制交易產生的數據到異地,所以這一層次的方案是目前應用最廣泛的一類,正因為如此,許多廠商都有基于自己產品的容災解決方案。如存儲廠商EMC等推出的基于智能存儲服務器的數據遠程拷貝;系統復制軟件提供商VERITAS等提供的基于系統軟件的數據遠程復制;數據庫廠商Oracle和Sybas。提供的數據庫復制方案等。
6級:零數據丟失
第6級容災方案是災難恢復中最昂貴的方式,也是速度最快的恢復方式,它是災難恢復的最高級別,利用專用的存儲網絡將關鍵數據同步鏡像至備份中心,數據不僅在本地進行確認,而且需要在異地(備份)進行確認。因為,數據是鏡像地寫到兩個站點,所以災難發生時異地容災系統保留了全部的數據,實現了零數據丟失。
這一方案在本地和遠程的所有數據被更新的同時,利用了雙重在線存儲和完全的網絡切換能力,不僅保證了數據的完全一致性,而且存儲和網絡等環境具備了應用的自動切換能力。一旦發生災難,備份站點不僅有全部的數據,而且應用可以自動接管,實現零數據丟失的備份。通常在這兩個系統中的光纖設備連接中還提供冗余通道,以備工作通道出現故障時能及時接替工作,當然由于對存儲系統和存儲系統專用網絡的要求很高,用戶的投資巨大。但在實際應用過程中,由于完全同步的方式對生產系統的運行效率會產生很大影響,所以適用于生產交易較少或非實時交易的關鍵數據系統,目前采用該級別容災方案的用戶還很少。
3.案例分析
圖2是一個典型的企業核心信息系統后臺數據存儲容災備份結構圖。
圖2 某公司業務系統數據存儲災備結構圖
3.1存儲系統
為了防止數據庫主機層面的單點故障,選用了高可用集群技術,可以支持7x24有效的數據庫應用系統,在低成本的服務器上構建高可用的數據庫系統,實現數據庫主機層面的故障容錯和無縫切換功能,將由硬件和軟件錯誤造成的對數據庫訪問的影響最小化;同時多節點可進行負載分擔,以減輕業務系統對數據庫訪問的壓力。
基于RAC的要求,整個業務運營系統的核心數據存儲于基于SAN存儲網絡上的共享存儲陣列上。存儲陣列選用雙控制器,存儲磁盤采用RAID模式,以保證存儲陣列層面的數據安全性。
3.2備份系統
業界采用磁帶備份已經有了幾十年的歷史,現在最新的磁帶技術已經能夠達到較高的備份/}I復速度,因此,物理磁帶庫以其存儲容量大、便于離線保存、價格低廉等優勢,一直占據著數據備份領域的主導地位,是目前能夠解決備份與災難性數據恢復的最經濟的解決方案之一。但是,物理磁帶庫同時也存在備份恢復能力差、備份失效率高、無容錯方式、機械部分可靠性低、對環境要求苛刻等天然的局限性,已經在制約著數據可靠性及可用性的進一步提升。隨著磁盤技術的成熟,虛擬帶庫技術彌補了物理磁帶庫的不足,從而使得備份更安全、快捷、恢復速度很快。
所謂虛擬帶庫是指使用基于磁盤的存儲(而非磁帶)介質,仿真磁帶庫功能的存儲設備。從物理角度看,虛擬帶庫是服務器和磁盤陣列的組合;但是從備份軟件的角度,通過SAN網絡,“看到”的是具有機械手/磁帶驅動器和磁帶的磁帶庫。虛擬帶庫采用基于RAID保護的磁盤陣列代替無容錯能力的磁帶作為備份存儲介質,從而將備份的可靠性較常規磁帶備份提高了若干量級。
基于以上磁盤備份的優勢,數據備份部分采用三層數據存儲架構的解決方案,即硬盤(數據保存)—硬盤(一級數據備份)—磁帶(二級數據備份)的方式。這種存儲架構,綜合應用了磁盤和磁帶兩者的技術優勢,又回避了他們自身的不足,是一種具備高性價比,各方面都比較均衡而合理的解決方案。在方案中可采用第三方備份管理軟件,將核心業務數據通過SAN存儲網絡的LAN-Free方式,首先備份至虛擬帶庫,再通過虛擬帶庫的歸檔功能,將數據歸檔至物理磁帶庫保存。采用D2D2T這種方式,對于整個備份環境來說,既提供了相當好的訪問性能和數據安全性,同時又具備了將大容量數據長期異地保存的能力,是一個比較理想的備份解決方案。
3.3容災系統
有了備份系統,我們也只是具備了數據的基本保護功能,在發生數據庫失效、數據誤操作、數據丟失等數據庫層面的故障時,我們可依靠備份的數據進行恢復,以還原某一時間點上的數據,但使用備份恢復這種方式,存在數據丟失、數據恢復時間長、對業務訪問影響大等問題。這些問題對于普通的系統可以容忍,但對于關乎企業核心運營和管理的業務系統卻是無法容忍的。因此,通常會在異地建立生產系統的容災環境,能夠在最短的時間內接管生產系統,快速、安全地恢復對業務系統的正常訪問。
在容災系統的設計中,在異地同樣部署一套基于SAN存儲網絡的同平臺數據庫存儲系統,兩地數據庫實實時同步,其中生產系統數據庫為主庫,負責對外提供數據訪問、數據處理等服務,容災系統數據庫為物理備庫,作為生產系統的應急切換數據庫,同時作為經營分析系統的數據分析源,提供數據抽取、查詢等功能,以減輕主庫的訪問壓力。同時在容災端部署應用服務器,當主備數據庫發生切換后,用戶即可訪問容災端的應用服務器,以保證業務訪問的連續性,實現生產系統的應用級遠程容災保護。
Data Guard是Oracle企業版集成的數據庫容災解決方案,該技術可以將主數據庫復制一個或多個同步備份,以實現對主數據庫的保護和負載分擔。
Data Guard的基本原理:在Data Guard 中可以配置寫日志過程,Oracle數據庫除了把日志記錄到本地的聯機日志文件和歸檔日志文件中,還可以通過網絡,把日志信息發送到遠程的備用數據庫服務器上。這個備用日志文件寫人過程可以是實時、同步的,也可以是異步的。當備份數據庫接收到日志信息后,Data Guard可以自動利用日志信息實現數據的同步。當主數據庫打開并處于活動狀態時,備用數據庫可以執行恢復操作,如果主數據庫出現了故障,備用數據庫即可以被激活并接管生產數據庫的工作。
Oracle DataGuard原理圖如圖3所示。
圖3 Oracle DataGuard原理圖
在Oracle 11g以前,DataGuard物理備庫在被以只讀方式打開時,利用Redo日志進行數據同步的過程就停止了,如果物理備庫處于恢復的過程中數據庫就不能打開查詢,也就是說日志應用和只讀打開兩個狀態是互斥的。Oracle 11g中推出的Active DataGuard 功能解決了這個矛盾,在利用日志恢復數據的同時可以用只讀的方式打開數據庫,用戶可以在備用數據庫上進行查詢、報表等操作,這類似邏輯Data Guard備用數據庫的功能(查詢功能方面),但是,數據同步的效率更高、對硬件的資源要求更低。這樣可以更大程度地發揮物理備庫的硬件資源的效能。
不同的解決方案,如SharePlex利用數據庫實例外部的流式處理過程,資源占用極小,對數據庫性能和網絡容量的影響也保持在最低限度。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.vmgcyvh.cn/
本文標題:淺議企業核心數據災備系統建設方案