萬億級AI難題:Snowflake、Tableau與BlackRock為何公開其數據核心機密

Snowflake、Salesforce、dbt Labs以及另外十幾家科技公司于周二宣布,將共同制定一項通用標準,用于定義企業數據并實現跨平臺共享,以此解決企業高管口中AI面臨的最根本瓶頸問題。
開放語義交換(Open Semantic Interchange,簡稱OSI)計劃集結了原本競爭激烈的企業,這些企業一致認為,企業系統間數據定義不一致阻礙了AI的規模化應用。該計劃得到了貝萊德(BlackRock)的支持,Alation、Atlan、Blue Yonder、Cube、Hex、Honeydew、Mistral AI、Omni、RelationalAI、Select Star、Sigma和ThoughtSpot等公司也參與其中。他們將共同制定首個供應商中立的語義元數據規范,這堪稱是企業數據的“羅塞塔石碑”(Rosetta Stone,指破解關鍵難題的鑰匙)。
“我們不是要鎖住數據,而是要讓數據更易獲取、更有價值,”Snowflake產品執行副總裁Christian Kleinerman在接受采訪時表示,“我們的客戶在實現AI投資回報率時面臨的最大障礙并非競爭對手,而是數據碎片化問題。”
銷售與市場部門對“客戶”定義不一,AI模型就會失效
該計劃旨在解決自商業計算誕生以來就一直困擾企業的難題,而這一難題如今正威脅著AI的推廣應用:每個軟件系統對業務指標的定義都不盡相同。例如,零售商的銷售平臺可能將“活躍客戶”定義為過去90天內購買過的客戶,而其營銷系統則將該術語定義為過去一個月內與內容有過互動的任何人。基于這兩個系統訓練的AI模型會得出不可靠的預測結果,進而破壞人們對AI生成洞察的信任。
“試想一下,企業訓練AI模型來預測客戶流失率等指標,”Kleinerman解釋道,“當AI模型從這兩個[定義不同的]系統中提取數據時,最終會得到相互矛盾的定義。這種不一致性降低了AI的準確性,也加大了其規模化應用的難度。”
這種語義混亂給企業造成了數百萬美元的損失。數據和AI團隊在AI項目啟動前,要花費數周時間來協調相互矛盾的定義并重新格式化數據,這推高了運營成本,也延誤了AI應用的上市時間。許多企業發現,AI作為生產力倍增器的潛力,被準備不一致數據所需的人工勞動所抵消。
Tableau與Snowflake擱置競爭,攜手修復數據生態系統
此次合作打破了企業軟件領域傳統的競爭態勢。Salesforce旗下直接與多家OSI參與方競爭的商業智能部門Tableau,與Snowflake共同牽頭了這項計劃。
“這項計劃具有變革性,因為它并非由某一家公司主導標準制定,而是整個行業攜手合作,”Tableau首席產品官Southard Jones在接受采訪時表示,“AI的未來取決于信任,而信任始于一致、可靠的數據。”
Jones透露,Tableau將貢獻其供應商中立語義層的藍圖,該藍圖基于數十年來開發商業智能工具的經驗。“我們的工作一直致力于為數據賦予明確的業務含義,即以企業內所有人都能信任的方式定義指標、業務邏輯和上下文。借助OSI,我們將把這些知識編纂成一項開放標準。”
選擇采取開放、協作的方式,這表明專有語義標準已宣告失敗。Kleinerman指出:“其獨特之處在于,它專注于基于SQL的分析模型,并納入了AI特有的元數據,如自定義指令和同義詞。”而現有的元數據標準,如資源描述框架(Resource Description Framework,簡稱RDF)和Web本體語言(Web Ontology Language,簡稱OWL),缺乏現代AI應用所需的編譯引擎。
技術藍圖承諾與現有工具實現即時兼容
OSI針對的是語義層,即數據的業務含義,而不僅僅是其技術屬性。該規范使用YAML文件定義,可與dbt的語義層等現有工具實現即時兼容。
“我們將幾乎立即提供支持,”dbt Labs首席產品官Ryan Segar表示,“數據和分析工程師現在可以放心地開展工作,因為他們知道自己的工作成果可在整個數據生態系統中得到利用。重復工作和返工將成為過去。”
該標準納入了AI特有的功能,如自然語言同義詞和業務術語。“如今,AI模型常常被迫從原始元數據中推斷關系,這可能導致誤解和輸出不準確,”ThoughtSpot產品管理高級副總裁Francois Lopitaux在接受采訪時解釋道,“通過提供一項通用、開放的標準,OSI將為智能體(包括我們自己的Spotter)提供一種共同語言,以理解業務上下文。”
大型企業因AI投資因數據不佳而停滯,迫切需求解決方案
企業對AI能力的需求推動了OSI計劃的緊迫性。Snowflake報告稱,在2026財年第二季度,近半數新客戶選擇該平臺是為了獲取AI能力,每周有超過6100家客戶使用其AI產品。在AI相關需求的推動下,該公司5月份季度營收首次突破10億美元。
目前,已成立了一個專門的合作伙伴工作組來制定首個OSI規范,不過高管們拒絕提供具體的時間表。“客戶對OSI的初步反饋極為積極,”Kleinerman表示,許多企業都表示希望盡早采用該標準。
貝萊德看到了該標準在金融服務領域的即時應用前景。“阿拉丁(Aladdin)平臺通過公共和私人市場的通用數據語言,統一了投資管理流程,”貝萊德全球阿拉丁數據主管Diwakar Goel表示,“我們很高興能參與開放語義交換計劃,幫助制定一項通用的、供應商中立的規范,這不僅將簡化數據交換,還將加速AI和商業智能應用在整個金融行業的推廣應用。”
標準化數據定義將加劇而非削弱競爭
該計劃將改變軟件公司的競爭方式。高管們認為,標準化將加劇競爭,將競爭焦點從數據定義轉向用戶體驗和AI能力的創新。
“標準化并非同質化,而是一種催化劑,”Jones辯稱,“就像標準電源插座一樣:插座本身并非創新所在,而是你能插上什么。我們的重點是成為你能連接到數據上的最智能、最直觀、最強大的‘電器’。”
Tableau計劃加速開發Jones所謂的“智能分析智能體”(agentic analytics),即能夠揭示上下文、突出機遇、提示風險并提出后續建議的AI代理,而不僅僅是報告數字。“語義定義將AI代理從靜態工具轉變為分析伙伴。”他表示。
ThoughtSpot的Lopitaux對此表示贊同:“雖然OSI將為語義層制定一個與供應商無關的行業標準,但我們仍將在產品創新、整個平臺的用戶體驗以及提供前所未有的客戶價值方面展開競爭。”
行業押注合作而非控制,以贏得未來
OSI的成功取決于能否維持供應商中立的治理模式,考慮到參與公司的市場地位和戰略利益各不相同,這無疑是一項挑戰。“OSI的核心在于沒有任何一家供應商能夠控制它,”Kleinerman強調,“每個成員都負責維護自己的映射和集成,其價值來自于共享框架,而非任何一家公司的實施方式。”
企業客戶將從中獲得最大收益:AI部署速度加快、準確性提高,以及消除手動數據協調成本。企業可以在保持現有語義模型投資的同時,采用最佳技術,而無需犧牲一致性。
“當語義無處不在、唾手可得時,它們‘存儲’的位置就變得不那么重要了,”dbt Labs的Segar指出,“在任何地方構建,在任何地方利用。”
科技行業已認定,要實現AI的承諾,就必須做出不同尋常的犧牲:放棄對業務數據定義方式的專有控制。在AI領域投入巨資的公司得出結論:在一個行之有效的系統中占據一席之地,勝過控制一個千瘡百孔的系統。
“我們鼓勵并歡迎更多公司加入,”Kleinerman表示,“因為參與的視角越多,標準就越強大、越中立。”




























