為什么人工智能管理數據中心需要一段時間
雖然超大規模企業已經使用人工智能來改善運營,但大多數其他數據中心的集成度還不夠高,無法使其發揮作用。
數據中心管理的工作正在迅速變化。有混合環境和多云需要處理、邊緣計算以及快速發展的網絡安全威脅的持續沖擊。
人工智能承諾解決他們所面臨的所有復雜問題。自學習系統將自行適應快速發展的環境,抵御已知和未知威脅,以超人的準確性即時響應,并且以低廉的成本完成所有工作。
由于孤立的系統和缺乏集成管理平臺,目前還沒有,而且可能不會持續很長時間。
安永咨詢服務董事總經理AmrAhmed表示,數據中心的復雜性呈指數級增長。過去,一家公司可能只有一臺大型機。然后,有了客戶端-服務器,環境增長到數十、數百或數千臺機器,他說。“分布式環境——數十萬;虛擬化——數百萬;云——數千萬。”這超出了人類的管理能力。“人工智能是必不可少的,”他告訴DCK。“沒有辦法解決它。這不是一種選擇。它不是可選的。”
最大的云提供商,超大規模者,已經將機器學習(一種人工智能)應用于這個規模問題已經有一段時間了。“預測故障、自動轉移工作負載——這些事情不會在未來十年內發生,”他說。“它已經存在。云服務提供商已經在他們的云環境中使用它。這就是他們可以大規模提供服務的方式。”
多年來,特別是在數據中心電力和冷卻領域,高級分析已被用于降低能源成本。“有許多工具可以分析這些數據并做出決策,”艾哈邁德說。
當人工智能可以幫助提高數據中心的正常運行時間時,這是一個明顯而明顯的好處——也是大型數據中心運營商關注的一個重要領域。Capgemini人工智能和分析副總裁DanSimion表示,人工智能和機器學習可用于預測關鍵任務的失敗,并避免意外的系統和服務故障或數據中心中斷。“這種方法創造了一種自我修復機制,”他告訴DCK。
他補充說,雖然大型數據中心供應商在這方面處于領先地位,但高科技公司也可能會從頭開始構建這類人工智能系統,如果它在他們的駕駛室里。
他說,數字化程度最高的公司已經從他們的人工智能投資中看到了價值,擁有大型數據中心的公司也是如此。
人工智能需要態勢感知
對于較小的數據中心,開始部署人工辭退的最簡單方法是依賴技術供應商。但是,這種方法存在局限性,即難以處理相互依賴和業務環境。
為了發揮最大的作用,人工智能需要態勢感知。對于僅限于單個供應商的產品及其功能的人工智能系統來說,這是很難做到的。
“當我看到我的網絡、我的計算或電源使用量激增時,這可能與我的勞動力變化有關,”艾哈邁德說。例如,更多的人可以在家工作。這可能是由于正在推出重大平臺升級-或者是一些邪惡的事情。“添加該業務環境為復雜性增加了第三個維度。”
大多數供應商仍處于將人工智能和機器學習功能添加到單個產品的早期階段。例如,產品可能會提供異?;顒拥木瘓?機器學習最常見的用例之一),但除此之外沒有其他太多。更高級的供應商可以提供預測分析、行動建議,甚至自動修復問題。
一種更全面、更有效的人工智能方法是領域不可知的,從所有系統中提取數據。在大多數情況下,實現這種能力還處于早期階段。
首先,通常存在組織障礙。“這一切都在孤島中,”艾哈邁德說。“有網絡團隊,有管理這個的基礎設施團隊,還有管理它的運營團隊。將它們整合在一起并使用AI和ML來理解它需要時間。”
在單個系統上部署人工智能工具更簡單,但一些組織開始采用更集中的方法。“他們正在改變他們的運作方式,”他說。
盡早打好基礎
有遠見的數據中心經理在設計他們的系統時考慮到了人工智能。
一個有吸引力的用例是預測設備何時可能會提前損壞,以便在它導致數據中心宕機之前對其進行修復或更換。
美國主要數據中心提供商QTSRealtyTrust的產品首席技術官BrentBensten表示:“供應商都在談論人工智能或機器學習的這種必殺技,以預測何時會發生故障。”
此功能需要跨不同系統的整體視圖,而這種視圖仍然很難獲得。要確定設備何時可能發生故障,您可能需要溫度數據、利用率歷史記錄、功耗數據等。
Bensten說,“孤立讓事情變得困難,直到你可以將系統與其他系統融合在一起,讓它們變得更智能,人工智能和機器學習才會變得強大。這就是我的觀點。”
在過去四年中,QTS一直在投資于統一平臺以滿足其基礎設施管理需求。他說。“我們把它們全部拿來,把它們合而為一,然后我們就可以在它上面做人工智能和機器學習。”





























