為何僅5%的企業能實現真正的AI投資回報

今年早些時候,麻省理工學院研究人員公布了一項數據,該數據引發了廣泛關注:盡管企業在兩年內為GenAI投入了近400億美元,但僅有5%的企業能夠指出真正的業務回報。
該報告提出了“GenAI鴻溝”的概念,即少數成功將試驗項目轉化為基礎設施的企業與大量仍停留在永久試驗階段的企業之間的差距日益擴大。
一些企業報告了較為隱蔽但意義重大的收益,如員工留存率提高、后臺錯誤減少、供應商摩擦減少等,而另一些企業則從未走出試驗階段。
研究人員將這一差異歸因于一個核心原則:成功的企業構建的系統能夠在實踐中學習,每次循環后都能得到改進,并與人們的實際工作方式相契合。
為何企業級AI工具未能達到預期效果
如今,企業中最廣泛使用的GenAI工具與員工午餐時在手機上使用的工具相同。ChatGPT、微軟Copilot和Claude在各團隊中每日使用,往往未經正式批準、培訓或集成(即所謂的“影子AI”)。這些工具幫助員工總結文檔、整理電子郵件和集思廣益。它們易于采用,因為無需獲得許可。
《人工愚蠢》(Artificial Unintelligence)一書的作者、紐約大學阿瑟·L·卡特新聞學院副教授梅雷迪思·布魯薩德(Meredith Broussard)告訴我們:“當公司告訴員工‘你必須使用AI’時,這不是個好主意。要求必須使用這些新工具,就像要求必須使用黃色熒光筆一樣。你應該考慮的是為任務使用合適的工具。”
她警告不要將新奇性等同于可信度。“作為企業,你必須考慮‘你的業務是否建立在客戶信任的基礎上?’如果是,你就不希望GenAI面向客戶。沒人想和聊天機器人交談。”
將AI試驗轉化為真正的投資回報率
然而,這種易用性卻制造了一種奇怪的錯覺。企業認為自己在采用GenAI,因為員工正在對其進行試驗。但實際上,他們只是將知識工作的小片段外包給了與其核心業務脫節的系統。
麻省理工學院的研究表明,有意義的AI投資回報率始于AI系統在已至關重要的工作流程中扎根。取得進展的企業從狹窄的用例入手,避免采用寬泛的戰略,而是選擇具有明確任務定位的工具。例如:
? 縮短供應商爭議的發票處理系統
? 起草回復并隨使用而改進的支持代理
這些系統在演示中很少給人留下深刻印象。它們的價值體現在下一季度的指標上。
在看到回報的企業中,生成式系統不斷進化。它們從使用中學習,對邊緣情況進行響應,并積累上下文信息。而在沒有看到回報的企業中,AI成為季度創新更新中的反復話題。它被困在幻燈片和內部展示中,偶爾產生想法,但從未產生結果。
為何大多數AI試驗項目在生產階段失敗
AI試驗項目的初期階段往往進展迅速,演示激發了熱情,團隊設想系統如何融入日常工作,界面反應靈敏,早期輸出看起來干凈整潔,但當工具進入生產階段并開始抵抗周圍環境時,動力便逐漸消退。
正如Hatchworks AI的首席技術官奧馬爾·尚蒂(Omar Shanti)所解釋的:“GenAI項目容易開展,但難以做好。進入試驗階段很容易,但對大多數企業來說,進入生產階段卻是一個難以實現的目標。”
在真正的AI增強工作流程中,工具的行為會有所不同,它會忘記最近的指令,它會重復可避免的錯誤,它需要人們已經提供過的上下文信息。幾周后,團隊開始繞過它。項目仍然存在,但進展停滯。
麻省理工學院的研究詳細捕捉了這一模式。當系統無法學習時,它們便不再受到關注。每次會話都從頭開始,反饋消失,團隊失去信心,因為系統不會隨使用而進化。每次加載時,它都表現得像新產品一樣。
成功的系統遵循不同的模式,它們:
? 在明確的流程中啟動
? 接受持續的糾正
? 保留調整
? 隨時間推移而改進
最初的小工具成為運營中可靠的一部分。它之所以適合,是因為它在學習。直到形成這種循環,大多數AI試驗項目在技術上仍然活躍,但在功能上卻無關緊要。
5%的佼佼者:頂尖AI領導者如何推動可衡量的投資回報率
擺脫試驗困境的企業有一個共同特點:它們從一開始就專注于能帶來真正價值的工作流程。它們沒有追逐潮流,而是將精力投入到能產生重大影響的任務上。
帶來投資回報率的高影響力用例
強生公司(Johnson & Johnson)在發現大約10-15%的GenAI試驗項目產生了約80%的價值后,取消了數百個分散的試驗項目。他們轉向賦予供應鏈和研究等個別部門自由,讓它們擁有與自身工作相契合的AI流程和工具。
德勤的分析也反映了這一轉變。他們的案例研究表明,專注于有限的一組高影響力用例(尤其是那些疊加在現有工作流程上的用例)可以加速投資回報率的實現。集中治理也有助于確保集成和可擴展性,而不會過度干預。
麻省理工學院的研究也描繪了同樣的圖景。產生真正價值的團隊往往與在上下文和領域熟練度方面具有專長的外部供應商合作。這些合作伙伴關系帶來的價值大約是內部構建的兩倍。它們的方法以適應性、持續改進和深入集成到團隊已有工作方式中為核心。
對布魯薩德來說,錯誤在于追求顛覆而非實用性。“電子郵件有用嗎?有用。它完全取代了手寫材料嗎?沒有。以同樣的方式使用GenAI。關注平凡而非光鮮,這樣你才能做出更好的決策。”
除了戰略和治理外,智能的AI部署還擁抱學習循環。
一項針對韓國一家大型企業費用處理的研究表明,將GenAI與智能文檔處理相結合,可以將處理時間縮短80%以上。智能系統處理異常情況,從人工糾正中學習,并隨使用而穩步改進——這正是將試驗項目轉化為生產價值所需的累積價值。
總之,頂尖企業的運作方式如下:
? 它們選擇高價值的工作流程
? 它們將精心挑選的外部工具與內部工作流程相結合,創建持續改進的反饋循環
? 它們的系統從使用中積累上下文信息,而不是消失在幻燈片中
AI準備度并非你所想的那樣
當大多數組織批準GenAI試驗項目時,它們認為自己已經做好了準備,它們有預算,它們有領導層的支持,它們甚至可能有供應商協議和工具包,但啟動試驗項目所需的準備度與產生價值所需的準備度是不同的。
Avidbots的首席財務官兼首席運營官維瓦爾·阿瓦爾(Vivar Aval)表示:“我對這么多企業無法衡量投資回報率并不感到驚訝,早期采用是一個迭代過程,試驗階段是你了解基準、定義正確指標的階段,只有那時你才能證明價值。”
實現持續回報的企業往往投資于不同的基礎設施,它們將反饋視為必要條件,它們設計人與系統之間的交接,以創造共同責任。最強大的系統始于實際流程中,并通過重復使用而改進。每次糾正都保留在系統中。每次結果都與任務更加契合。隨著時間的推移,工具變得更容易信任,因為它以人們可以看到和驗證的方式進行調整。
準備度體現在細節中。誰擁有反饋權?改進在哪里顯示在儀表板上?當工具成功時,哪些團隊獲得了優勢?這些答案揭示了企業是準備擴大AI規模,還是只是準備嘗試一下。
縮小AI試驗項目與企業績效之間的差距
從GenAI中看到結果的企業構建的系統能夠邊做邊學。它們的工具隨每次交互而改進。它們保持在工作流程中,與塑造績效的相同AI績效指標、團隊和約束條件相連接。
麥肯錫在其關于自主智能代理的研究中指出了這一轉變,系統能夠在工作流程中回憶、適應和行動,這些工具成為流程的一部分。它們通過使用獲得相關性。
架構也很重要。當工作流程支持糾正且系統對此做出響應時,AI才能帶來價值。反饋成為循環的一部分。治理則強化了這種效果。跟蹤結果并分配責任的團隊為改進創造了條件。它們衡量變化,它們期望學習,AI通過在這兩方面都表現出色而贏得了一席之地。
取得進展的企業從小處著手。它們將AI置于已經具有重要性的工作流程中,它們選擇能夠看到改進的角色。回報起初緩慢到來,然后穩步增加。首先,工具適合,然后它學習,然后它留下來。



























