杜絕宕機 不同行業服務器RAS側重點
隨著IT的發展以及企業業務的增加,服務器成為了很多企業業務支持的平臺。尤其是在我國,服務器的增長勢頭非常強勢。但由于我國IT科技發展較晚,所以企業用戶在選購服務器的時候往往不知道從何下手,甚至在采購過程中遭遇奸商欺騙等行為。錢財損失是小,但耽誤企業業務的正常運行可以說那就大了。
服務器在采購的時候要考慮多方面的因素,而安全性在“棱鏡”事件后也成迅速得到了企業事業單位用戶的重視。服務器的安全性主要體現在RAS性能上。RAS性能是指服務器的可靠性(Reliability)、可用性(Availability)以及可服務性(Serviceability)。具體RAS性能我們主要看一下幾個方面:System級別的RAS特性、CPU RAS特性、內存RAS特性、I/O RAS特性等。
可以看出,RAS性能是一個綜合性指標,對于不同行業的用戶來說,其對RAS性能的要求也不盡相同。下面我們就來具體看一下這些內容:
內存的RAS性能尤其重要
服務器內存在RAS性能中起到非常關鍵的作用,因為服務器中的所有計算幾乎都是跑在內存中的,內存性能的好壞直接影響到服務器的穩定性,從而影響企業業務的可靠性。內存的錯誤率其實比想象中的要高(refer),內存也因為老化等原因會出現性能降低,從而產生問題而影響企業業務。
針對內存方面的重要性,很多企業也采用了相應優化。例如目前許多x86服務器經銷商的賣點宣傳就是集中在內存上,比如服務器內存的ECC特性,Spare Row、Chip Kill、Single Device Data Correction (SDDC)等,其中Chip Kill是IBM的專利技術,主要用在高端服務器上。惠普服務器曾連續跑了二十年而沒有停機,而寶德也有連續跑了五年沒有停機的例子。
#p#
處理器的RAS性能的重要性
處理器相信是大家都熟悉的一個部件,很多人在購買PC和手機的時候,首先關注的就是處理器。
而在服務器領域,其服務器處理器與PC市場的型號并不相同,而是針對服務器市場的特定需求,英特爾推出了針對企業級的Xeon處理器,Xeon E3面向低端市場,Xeon E5處理器面向中端市場,面向高端市場的則是Xeon E7服務器。

Xeon平臺的可靠性、可用性和可維護性相比上一代處理器產品有了明顯的提升,其繼承了很多大型企業開發中驗證過的RAS技術。通過所有的CPU電路間的無檢測和恢復機制,避免由于CPU錯誤帶來的系統故障,并可保證CPU內部的數據傳輸和存儲的隨機錯誤通過ECC數據糾正處理和指令重試技術恢復。
而且如今的處理器即使在發生不可恢復的錯誤的時候也不會停止工作,只會繼續記錄所有的錯誤信息,因此任何錯誤原因都能夠迅速檢測出來。例如,Xeon E7在英特爾上一代的Xeon 7500為基礎,建立了面向諸多高端計算應用的支持,包括商業智能、實時數據分析和虛擬化等全新標準。可以確保數據的完整性能,從而提供整個數據中心的安全。
#p#
不同行業RAS性能的側重點不同
RAS能力是評判服務器的重要標準。但是由于RAS能力提升需要服務器的制造成本提升,而且對于不同行業的用戶來說,并不是所有的用戶都需要那些RAS指標,所以服務器提供商并不是將所有服務器的RAS性能都設定的面面俱到。需要根據具體業務來判定具體需求。
可靠性在行業應用中最主要的是指雙擊熱備份。這是用戶非常喜歡提供服務器穩定性的方式,雙擊熱備份就是一臺主機為工作計劃,另一臺主機為備份機器,在系統正常的情況下,工作機為信息系統提供支持,備份集提供監視工作機的運行,工作機也同時監視備份機是否正在。

當工作機出現問題的時候,不能夠支持業務運行,那么備份機就會主動接管工作機的工作,繼續支持業務的運行,從而確保業務的不間斷運行。當工作機經過維修恢復正常后,它將會將原來的工作自動抓回,恢復以往服務器的工作狀態。而備份集也有可能由于某些原因而出現異常,工作機則是負責通知工作人員,確保下一次切換的可靠性。
在不同行業中,不同的而延誤對可靠性的要求不同,例如在金融、電力和醫療等行業,他們對計算機的可靠性要求非常高,所以習慣采用的是雙擊備份系統。雙擊備份可以時間運行時的互相監控,在發生故障的時候自動切換保證業務7*24小時的穩定運行,從而提升了數據的安全性和業務的可靠性。
#p#
可用性指的是系統被請求使用時能夠迅速反饋并被正確操作的可能性。在一些行業中許多關鍵業務是不能在運行過程中間斷的。例如商業智能分析、業務流程處理、核心數據庫等等,特別是在政務、國防、電信、金融等領域更是注重系統的可用性。
企業的關鍵業務一旦出現意外會給用戶造成極大的傷害,甚至是無法彌補的,所以這就對支持他的IT平臺提出了非常嚴格的要求。亞馬遜宕機時間一分中的損失就高達5萬美元,所以停機事件在一些行業是不能出現的。雙備份技術可以迅速恢復系統性能,另外還有多子星系統,滿足多節點服務需求等。
高鐵的IT系統是一個非常重要的部門,其IT系統出現故障會造成整個交通的癱瘓,在高鐵運營管理中用到一種SSI標準刀片服務器,是由六個計算刀片和14個存儲刀片組成,集成度高,非常適合分散狀況下的運行管理。
其實這個方案很簡單,采用的是寶德PR6000M刀片服務器和雙擊熱備軟件,就形成了一個雙擊熱備系統,兩臺服務器通過心跳線相連,在一臺服務器出現故障時,另一臺機器能夠承擔全部的工作負荷,真正解決了集中管理與安全穩定的問題。
#p#
可維護性是指整個IT系統非常巨大,而又要求實時、動態和效率時,其承載平臺要有非常出色的擴展能力。比如在需要高性能的時候需要增加處理器數量,內存的擴充和硬盤的擴充等等,就像寶德的模塊化服務器、存儲服務器等,提供快速的解決問題的能力。
例如,在銀行的核心業務數據庫方面,其要求確保7*24小時業務不當機。如何解決這個難題呢?寶德服務器針對這個需求將銀行的核心業務部署在寶德的PR6850N服務器雙擊系統上,該服務器為6U四路服務器,擁有超過20項的RAS特性。
在發生故障后,兩臺PR6850N部署的虛擬機可以實現互相的接管,保證業務的不中斷,同時虛擬機部署的存儲實現整個虛擬機連同業務和數據庫的備份。而且這個方面還擁有非常出色的擴展能力。。
文章總結:服務器RAS性能能夠大幅提升系統的安全性,保證用戶的關鍵業務不間斷運行,但是在提升RAS性能方面,隨之成本也會隨之上升。所以對于用戶來說,還應該安裝自己行業的業務性能來選擇服務器。讓企業IT基礎架構實現***性價比的配置。























