SRE 報告回顧:AIOps 預測是否經受住了考驗?
本文回顧了Catchpoint SRE報告對AIOps的預測,指出早期從業者對其價值持懷疑態度,但2024年10月后,因Gartner報告、IBM和諾基亞等公司的行動,AIOps的搜索興趣激增。報告強調將AIOps分解為組件、關注實際用例和投資培訓的重要性,并邀請讀者參與2025年SRE調查。
譯自:SRE Report Retrospectives — Have AIOps Predictions Held Up?[1]
作者:Leo Vasiliou, Denton Chikura
每年,Catchpoint 都會在其 SRE 報告[2] 中嘗試捕捉全球可靠性社區的脈搏。它調查了全球數百名站點可靠性工程師 (SRE)、可靠性工程師和運營負責人,以了解該職業的現狀:[3] 所面臨的挑戰、使用的工具和塑造實踐的趨勢。這些報告既可以作為行業現狀的快照,又可以作為行業發展方向的指南針。
但關于預測,有一點需要注意:它們有一個令人討厭的習慣,那就是容易過時。技術不斷發展,市場不斷變化,三年前看起來具有革命性的東西,今天可能正在某個人的 Kubernetes 集群的角落里積滿灰塵。
因此,作為 SRE 報告的作者,我們認為重新審視我們過去的觀點,看看它們在殘酷的生產環境現實中表現如何,這將是一件引人入勝——或許也有點令人謙卑的事情。
雖然 SRE 報告涵蓋了廣泛的主題,從混沌工程到監控最佳實踐,但在這篇文章中,我們將重點關注 AIOps[4],這是 2021 年報告中首次探討的主題。它已成為 IT 運營中討論最多、爭論最多,有些人甚至認為是變革性的概念之一。那么,那些早期的預測表現如何呢?
AIOps:永不消逝的承諾
讓我們從一段歷史開始。Garner 在 2017 年創造了“AIOps”一詞,將其定義為將人工智能和機器學習 (ML) 應用于通過大數據、分析和自動化 增強 IT 運營[5]。Gartner 將其定位為 IT 運營的未來——一種處理傳統監控工具根本無法管理的呈指數級增長的數據量、速度和多樣性的方法。
這個承諾非常誘人:想象一下,人工智能系統可以自動檢測異常,在您的整個堆棧中[6] 關聯事件,在故障發生之前預測故障,甚至無需人工干預即可修復問題。這聽起來像是運營的圣杯。最終,我們可以從被動的救火轉變為主動的、智能的基礎設施管理。
我們當時說了什么:SRE 報告對 AIOps 的看法
2021 年:謹慎樂觀與冷酷現實相遇
2021 年 SRE 報告[7] 給予了 AIOps 相當大的關注,反映了我們當時在各處看到的行業熱情。潛力是不可否認的——AIOps 有望幫助 SRE 管理不斷增加的數據量,并提取可操作的見解,從而改變我們處理監控和事件響應的方式。
但有趣的是:雖然業界對此興奮不已,但調查受訪者講述了一個不同的故事。SRE 在現實世界中的采用速度出人意料地緩慢。承諾與實踐之間的差距很大。
監控工具使用情況:2021 年 SRE 報告
[8]監控工具使用情況:2021 年 SRE 報告。
該報告當時的建議是務實的:將 AIOps 分解為各個組件,而不是追逐流行語。不要全盤接受炒作;相反,單獨評估特定功能,如異常檢測、事件關聯或自動修復。該報告還強調了 SRE 團隊內部進行 AI 和 ML 培訓的必要性,將其定位為一項長期投資,而不是一種快速解決方案。
2023 年:情節加深
2023 年 SRE 報告
[9]在 2023 年 SRE 報告[10] 發布時,我們有了更多的數據可以利用。我們連續第二年要求受訪者對 AIOps 的“收到的價值”進行評分,結果令人大開眼界。
大多數可靠性從業者繼續報告說,他們從 AIOps 收到的價值很低或不存在。但真正有趣的是:當我們按組織級別細分回復時,出現了一種有趣的模式。59% 的高管表示他們從 AIOps 收到了中等或高的價值,而只有 20% 的個人從業者表示相同。
請再讀一遍。讓它沉淀一下。
從 AIOps 收到的價值:2023 年 SRE 報告
[11]從 AIOps 收到的價值:2023 年 SRE 報告。
我們遇到了一個典型的案例,即做出購買決策的人看到了巨大的價值,而實際在生產中使用這些工具的人卻 Largely 印象不深刻。領導者和從業者之間的認知差距[12] 是顯而易見的。
該報告的建議仍然一致:不要完全忽略 AIOps,而是將其分解為能夠有意義地支持您的可觀測性和可靠性運營的特定功能。專注于務實的用例,而不是供應商的承諾。
2024-2025 年:轉向
到 2024 年,發生了一些有趣的事情。我們將調查問題從專門針對 AIOps 擴展到了一般人工智能,并添加了關于“未來兩年內”的期望的限定語。這種轉變反映了快速發展的人工智能領域和生成式人工智能 (GenAI) 的興起。
正如我們的一位現場貢獻者所指出的:“很難知道這是否是另一次人工智能炒作周期,還是前一次炒作周期的加強,但感覺 AIOps(相當缺乏細節)的推廣與 GenAI 正在發生的事情之間存在著真正的不同。”
這種區分至關重要:傳統的 AIOps 仍然狹隘地專注于現有指揮控制框架內的異常檢測和分析——本質上是“一切照舊,只是速度更快”。然而,GenAI 代表著一些根本不同的東西:“更像是與一位非常早期的同事打交道,他需要培訓和投資以及不斷的審查,但偶爾會非常有價值。”
過去是過去,現在是現在:Google Trends 現實檢驗
以上就是來自 SRE 一線的看法。但是,您如何在更廣泛的市場中實際衡量像 AIOps 這樣的東西的采用率呢?雖然有些粗略,但看看 Google[13] 搜索趨勢數據總比什么都不做好。
為什么要看 Google Trends?有兩個令人信服的理由:
? 首先,它跟蹤真實的搜索興趣,而不僅僅是炒作。Google Trends 顯示有多少人正在積極搜索有關某個主題的信息——這是了解市場、專業人士和想要學習或評估的好奇者的一扇直接窗口。
? 其次,它是公正且供應商中立的。與供應商調查或分析師報告不同,Trends 是獨立的。它不是由尋求銷售或推廣某些東西的利益相關者制作的。它反映了來自全球 數百萬用戶[14] 的自然搜索行為。
事情變得非常有趣了。
AIOps:我們從 Google 搜索趨勢數據中學到了什么
“AIOps”搜索興趣的爆炸式增長 (2024-2025)
最引人注目的發現是,從 2023 年底/2024 年初開始,“AIOps”搜索量急劇上升,到 2025 年達到峰值。
“AIOps”一詞的全球 Google 搜索興趣隨時間的變化(2021 年 8 月 – 2025 年 8 月)
[15]“AIOps”一詞的全球 Google 搜索興趣隨時間的變化(2021 年 8 月 – 2025 年 8 月)。
請記住,這發生在我們的 SRE 社區已經得出結論認為 AIOps 提供的實際價值有限之后。
亞太地區的區域集中
[16]基于全球 Google 搜索量的“AIOps”區域興趣(2021 年 8 月 – 2025 年 8 月)。
地理數據顯示,AIOps 的興趣主要集中在:
? 中國大陸(100% 的相對興趣)
? 新加坡、韓國和中國香港(13-21% 的相對興趣)
這表明亞太市場存在不同的 IT 基礎設施挑戰、不同的技術采用模式,或者可能對 AI 驅動的運營有不同的期望。
教育曲線
“什么是 AIOps”一詞的全球 Google 搜索興趣隨時間的變化(2021 年 8 月 – 2025 年 8 月)
[17]“什么是 AIOps”一詞的全球 Google 搜索興趣隨時間的變化(2021 年 8 月 – 2025 年 8 月)。
“什么是 AIOps”的搜索趨勢顯示出周期性的峰值,而不是持續的增長,這表明人們周期性地發現它,而不是持續地采用它。人們仍在學習 AIOps,而不是實施它。盡管業界討論多年,但這個概念仍然處于起步階段。
2024 年 10 月的拐點
但故事真正有趣的地方就在這里。2024 年 10 月,對 AIOps 的搜索興趣絕對是爆炸性的。
全球對“AIOps”的搜索興趣的拐點——2024 年 10 月
[18]全球對“AIOps”的搜索興趣的拐點(2024 年 10 月)。
發生了什么?
完美的風暴
2024 年 10 月為 AIOps 興趣創造了完美的風暴:
? Gartner 數字體驗監控魔力象限報告(2024 年 10 月 21 日): Gartner 首次發布了數字體驗監控魔力象限,其中包括作為評估標準的 AIOps 功能。Dynatrace 和 Catchpoint 等公司被評為領導者(是的,無恥的宣傳,但我們當之無愧),引起了業界的廣泛關注并驗證了 AIOps 領域。
? IBM Cloud Pak for AIOps v4.7 發布(2024 年 10 月 11 日): IBM 宣布了一項重大更新,其中包含可用于生產的 Linux 部署功能,這標志著企業已準備就緒。
? 諾基亞的 AIOps 集成(2024 年 10 月 18 日): 諾基亞將 AI 驅動的運營集成到其 Altiplano 接入控制器中,這表明 AIOps 正在從傳統 IT 擴展到網絡基礎設施。
? ServiceNow 的教育推動: 專門的 AIOps 研討會和培訓,表明供應商正在大力投資于市場教育。
? 多個供應商里程碑: 從 Motadata 的下一代平臺到 Keep 為其開源 AIOps 平臺籌集 270 萬美元,整個生態系統似乎同時成熟。
這種融合解釋了為什么 Google Trends 顯示出如此急劇的增長。2024 年 10 月代表著 AIOps 從“新興技術”轉變為“主流企業解決方案”的時刻,多個驗證點同時出現。
市場實際上說了什么?
這些數字令人印象深刻:全球 AIOps 市場正在以超過 25% 的復合年增長率擴張[19],預計將從 2025 年的 111.6 億美元增長到 2029 年的超過 320 億美元。目前,大約 40% 的企業在某種程度上采用了 AIOps,尤其是在受監管和數據密集型行業中,采用率特別高。
但現在的問題是:我們看到的是與從業者現實不符的炒作周期,還是 AIOps 的早期承諾最終正在實現?
我們做對了什么(以及我們錯過了什么)
我們 2021 年和 2023 年的建議仍然有效:
? 將 AIOps 分解為離散組件: 市場在很大程度上驗證了這種方法。成功的 AIOps 實施側重于特定功能——異常檢測、事件關聯、自動修復——而不是試圖一次解決所有問題。
? 專注于務實的用例: 從 AIOps 中看到價值的組織是那些確定了清晰、可衡量的問題并有策略地應用 AI/ML 工具來解決這些問題的組織。
? 投資于培訓: 我們觀察到的最成功的團隊已經對其 SRE 團隊的 AI 和 ML 素養進行了投資,將其視為一項長期能力,而不是靈丹妙藥。
我們可能低估了市場成熟所需的耐心,以及更廣泛的人工智能發展(尤其是 GenAI)在使 AIOps 功能合法化和推進 AIOps 功能方面所發揮的作用。
書寫下一章
AIOps(以及一般的 SRE)的故事仍在書寫中。這就是為什么您的聲音在 2025 年 SRE 調查中很重要。每個回復都有助于我們對趨勢進行基準測試、發現新興的最佳實踐,并突出顯示各種規模的組織中可靠性工作的實際情況。
今年,我們將更深入地研究性能和可靠性建模、混沌工程、可觀測性實踐、學習和技能提升以及工具戰略。該調查是自愿的、匿名的,大約需要 10 分鐘,但您的參與所產生的影響是深遠的。
因為我們能夠準確地反映今天的預測的唯一方法是,如果我們捕捉到全球生產環境中實際發生的真實情況。
參加 SRE 調查[20],幫助我們書寫這個故事的下一章。
引用鏈接
[1] SRE Report Retrospectives — Have AIOps Predictions Held Up?:https://thenewstack.io/sre-report-retrospectives-have-aiops-predictions-held-up/
[2]SRE 報告:https://www.catchpoint.com/asset/2025-sre-report
[4]AIOps:https://thenewstack.io/what-is-aiops-and-why-you-should-care/
[5]增強 IT 運營:https://thenewstack.io/why-aiops-failed-and-event-intelligence-solutions-are-different/
[6]在您的整個堆棧中:https://thenewstack.io/devops-embraces-observability-across-stacks-for-llm-era/
[7]2021 年 SRE 報告:https://pages.catchpoint.com/hubfs/Report/Catchpoint-2021-SRE-Report.pdf?_gl=1*jj0tkv*_gcl_au*MzE4OTA3NDc5LjE3NTE0NTAzNDk.
[8]:https://cdn.thenewstack.io/media/2025/08/ca61e7a0-image2a-1016x1024.png
[9]:https://cdn.thenewstack.io/media/2025/08/7c196688-image3-1024x561.png
[10]2023 年 SRE 報告:https://resources.catchpoint.com/hubfs/eBooks/SRE%20Report%202023%20Catchpoint.pdf?_gl=1*2gzok6*_gcl_au*MzE4OTA3NDc5LjE3NTE0NTAzNDk.
[11]:https://cdn.thenewstack.io/media/2025/08/356c15bd-image4a-1024x781.png
[12]領導者和從業者之間的認知差距:https://www.catchpoint.com/blog/sre-report-2023-are-we-aligned-yes-no-maybe
[13]Google:https://cloud.google.com/?utm_cnotallow=inline+mention
[14]數百萬用戶:https://thenewstack.io/how-to-support-a-million-users-on-your-website-a-success-story/
[15]:https://cdn.thenewstack.io/media/2025/08/70885b4f-image5a-1024x564.png
[16]![基于全球 Google 搜索量的“AIOps”區域興趣(2021 年 8 月 – 2025 年 8 月)]
[17]:https://cdn.thenewstack.io/media/2025/08/558d1c8b-image7-1024x556.png
[18]:https://cdn.thenewstack.io/media/2025/08/f7df4874-image8-1024x381.png
[19]全球 AIOps 市場正在以超過 25% 的復合年增長率擴張:https://www.gminsights.com/industry-analysis/aiops-market






















