vSphere 6.5新功能揭秘:不只DRS的高可用性
VMware除了在vSphere 6.5中增加了少量新功能外,還對已有的功能進行了重大更新,資源管理服務包括分布式資源調度以及高可用性舊貌換新顏。在本文中我們將探討下vSphere 6.5升級的部分功能。
全新的準入控制默認設置
直到vSphere 6,準入控制的默認設置是使用高可用性插槽計算,設置可容忍的出現故障的主機數。這一插槽計算在虛擬機預留值差異性非常大的環境中遇到了問題。例如,如果部分虛擬機沒有設置預留值,而一些虛擬機設置了8GB的預留值,這會導致內存大小為4GB的虛擬機占用8GB的插槽。
在之前vSphere版本中,你還可以使用基于百分比的設置,但該方法往往導致用戶過度使用集群,因為用戶設置的百分比太低了。更糟糕的是,在眾多部署中,準入控制策略會提示沒有資源可用,導致管理員完全禁用了該功能。
如圖A所示,該默認設置已經被更改為使用集群資源百分比設置,那么VMware將基于你能夠容忍的故障主機數選擇百分比。例如,在四節點集群中,百分比是25%—這意味著一臺主機故障不會影響集群的可用性。
圖A.使用集群資源百分比設置定義主機故障數
發生故障后以預先確定的順序啟動虛擬機
當ESXi主機出故障后,正在該主機上運行的虛擬機自動在另一臺主機上重啟。這非常棒,但當一臺虛擬機依賴于另一臺虛擬機加載的服務時,這時加載應用堆棧可能會出故障而且在出現故障后服務將無法恢復。
在vSphere 6.5中,你可以配置一系列的虛擬機先后啟動的依賴關系。該功能被稱為協調重啟,一個典型的用例是分層應用。你需要在應用服務器連接數據庫服務器前,先啟動數據庫服務器,當應用服務器虛擬機完全加載后,就到了啟動Web服務器的時間。另一個例子是在啟動其他機器前先啟動特定的基礎設施設備,域控制器、DNS或者DHCP服務器。
在使用重啟優先級時可以使用該功能,但并未針對準確的重啟順序或者啟動延遲進行細粒度的控制。
使用這一全新的功能你可以使用全新命名的虛擬機/主機規則VM2VM配置虛擬機相關性。如圖B所示,定義了一個規則,在啟動數據庫虛擬機組中的虛擬機前啟動位于基礎設施虛擬機組中的虛擬機。
使用全新命名的虛擬機/主機規則VM2VM配置虛擬機相關性
當有許多虛擬機需要啟動,且存在較大的依賴關系鏈時,那么將所有虛擬機分組,并針對所有分組制訂規則是非常重要的。沒有位于分組內的虛擬機將會隨機啟動。三個分組的完整列表可能如圖C所示。在基礎設施虛擬機啟動后,數據庫服務器將會啟動。然后應用服務器將會在第二個階段啟動,Web服務器將會在第三階段啟動。
已創建的虛擬機/主機規則
在打算使用該特性前必須先進行配置。出現故障時,只有在位于上一階段的虛擬機啟動并能夠對外提供服務后下一階段的虛擬機才會啟動。虛擬機優先級設置也采取上述策略:如果高優先級的所有虛擬機都啟動了,高可用性將繼續啟動低優先級的虛擬機。
然而,僅僅是因為虛擬機啟動并不意味著虛擬機上的操作系統或應用準備就緒了。因此,配置全新的虛擬機依賴重啟條件設置并在條件滿足時以允許配置HA進入下一階段是非常重要的。在上述設置下,可以選擇客戶機心跳檢測。一旦VMware Tools啟動,條件就會觸發。但這仍不能保證應用正在運行。為解決該問題,如圖D所示,可以選擇虛擬機依賴重啟條件設置下的應用心跳檢測選項。
當vSphere可用性從一個優先級進入另一優先級時,將會用重啟條件。因此即使沒有配置任何規則,在每個HA集群中重啟條件都是非常重要的。
圖D.使用虛擬機依賴重啟條件設置
監控應用狀態功能一般不會用到,尤其是在VMware停止開發vSphere App HA產品并宣布在2015年終止該產品后。但啟用該功能的API接口已經被升級,可以在vSphere 6.5中使用。
使用該功能需要用到的產品之一是Veritas ApplicationHA。然而,大多數用戶并沒有一款這樣的產品。因此無法做到100%的依賴性檢查。數據庫服務器初始化時間過長,超出VMware Tools報告的時間并不罕見。這會導致下一階段的虛擬機在依賴應用就緒前就啟動了。為解決該問題,某些管理員自己編寫了腳本,在啟動關聯機器上的應用或服務前,先檢查其他服務器或服務是否可用。

























