目前,企業級服務器主要應用于處理大量數據、對數據處理速度和可靠性要求較高的企業和重要行業,它可為企業提電子商務、ERP(企業資源配置)、OA(辦公自動化)等服務。
1、服務器硬件分析
1.1硬件性能分析
為了更快地發現企業級服務器的故障并對其進行有效排除,必須對其特性有深入的了解。企業級服務器類屬高檔服務器,大都支持4’8個PIII Xeon(至強)或P4 Xeon(至強)處理器,并擁有獨立雙PCI通道及內存擴展板設計,要具有高內存的帶寬、大容量的熱插拔硬盤及電源、強大的數據處理功能,同時還要求必須有高度容錯的能力、優異的系統及系統擴散性能和超長的系統運行時間。
1.2硬件分類
按企業級服務器的架構不同,可分為CISC架構服務器與RISE架構服務器。CISC架構服務器采用的是英特爾架構技術,通常我們所說的PC服務器就是CISC架構服務器,而RISC架構服務器采用的則是非英特爾架構技術,比如采用Alpha、PowERPc、PA—RISC、Sparc等RISC CPU的服務器。就兩種服務器的性價比來說,RISC架構服務器LgClSC架構服務器要高出許多,而且隨著計算機技術的飛速發展,RISC架構服務器與IA架構服務器間的技術差距也變得越來越小,由于性價比的原因,很多要求相對不高的企業選擇IA架構服務器。但RISC架構服務器在許多大關鍵、大型的應用領域,仍占據十分重要的地位。
2、服務器常見故障分析
2.1硬件故障
正常情況下,服務器硬件發生故障的概率較低,主要故障多數是由服務器內部的散熱受阻等問題引起的,因此,要經常檢查服務器的相關散熱部件,察看是否有因灰塵較多而影響通風散熱等現象。其次是由于硬件耗損而出現的故障,按常見的硬件故障率,可將企業級服務器硬件的故障出現率從低到高排列為電源系統、CPU、內存、外部總線以及負載系統。接觸不良的現象在硬件故障中比較常見,主要是各種內存、卡類及CPU等部件與主板間的接觸不良,或者是電源線及數據線的接觸不良。這種故障相對比較容易解決,可以通過更換相關位置的插槽或者擦拭金手指等方法來解決。
2.2軟件故障
企業級服務器中的軟件故障約占服務器故障的70%,是服務器故障中出現機率較大的故障。引起服務器軟件出現故障的因素有很多,較為常見的有:服務器BIOS版本過低、服務器管理軟件或驅動程序中有BUG、應用程序故障以及人為的軟件故障等。此外,還有因為軟件升級和病毒導致的軟件停止運行與意外斷電等。服務器軟件的故障診斷比較復雜,首先應明確是否是不當的人為操作引起的,然后再根據相關日志、警示聲響、錯誤代碼及可疑程序等來進行診斷。軟件故障中最難診斷的便是軟件沖突所引起的故障,這種故障更多的是要求管理人員和維護人員有足夠的經驗及高度的觀察分析能力。病毒也是引起軟件故障的關鍵因素之一,雖然不能稱其為主機故障,但它同樣也引起了服務器的運行問題,因此將病毒也歸為軟件故障。一些病毒的發作現象跟硬件或軟件故障的現象十分類似,引導型病毒便是其中典型的一個例子。大多數病毒一開始是依附在系統的某一個軟件或是用戶程序上面,然后再進行擴散。病毒發作時會威脅服務器正常的運行,破壞數據和程序。可以通過攻擊面的減小、安全更新的應用、防火墻的啟用及漏洞掃描程序等方法來進行病毒防護。此外,還要注意黑客的入侵等原因引起的服務器故障,在服務器構建的初期制定安全防護方案,物力防御和軟件防御同時進行。
3、服務器故障排除
3.1硬件故障排除
目前很多企業級服務器都自帶有硬件固件測試程序,利用硬件固件測試程序和故障的代碼顯示結果,便可對故障做出初步的診斷定位。按照主機硬件負載的相關理論,在確保主機硬件正常運行的情況下,對主機的最小化負載進行診斷,準確地找出故障點后,再通過更換硬件來完成服務器的硬件維修工作。另外,還應該注意網關問題,假如網關出現了問題,將會直接導致不能正常連接等問題的出現。這種情況比較容易處理,只需更換網關,故障便可排除。
3.2軟件故障排除
對企業級服務器的軟件故障進行排除,必須要經常對FIPd㈣ARE與BIOS進行更新,其次也不能忽視對服務器軟件的更新,經常對其進行更新可解決由BUG等軟件問題所引起的軟件故障。另外也要注意,錯誤的升級方法也可能導致服務器出現軟件故障等問題,可以進行服務器內部程序清除、相關日志檢查等工作來完成服務器故障的排除。最后是人為因素引起的軟件故障,這類故障可通過相關的培訓來解決,讓相關人員進行專業的學習,養成好的機器使用習慣,經常保存數據,防止由于意外停電或非正常操作等因素而引起的意外關機及數據丟失現象的發生。
企業級服務器是整個企業信息得以有效運行的關鍵,服務器故障的分析與排除,更多的是依靠維護人員的意識、經驗與細心。服務器日常的維護工作也是必須的,其所處環境對其本身的的影響是十分重要的,它直接影響到服務器硬件的使用壽命。因此,要保持服務器所處環境的溫度和濕度,還要有必要的防火、防水及防塵等措施。在對軟件進行維護時可以從網絡系統、操作系統、數據庫和用戶數據等方面進行,及時做好漏洞補丁安裝、數據優化和數據備份等工作,同時還要在更換或卸載設備的時候做好斷電、主機接地等工作,防止由靜電引起的設備損壞。
轉載請注明出處:拓步ERP資訊網http://www.vmgcyvh.cn/
本文標題:企業級服務器故障分析及排除