如何構建AI原生應用?從大模型到知識中臺,從數據到規則邏輯。AI原生=模型原生+知識原生+價值原生
大家好,我是人月聊IT。今天繼續聊AI和大模型方面的話題。即什么是AI原生,如何構建一個真正意義上的AI原生系統?
對于這個問題,我們先看下AI大模型自己給出的答案。
即AI原生是指從設計之初就將AI能力作為核心架構和功能基礎來構建的系統或應用,而不是在傳統系統上后期添加AI功能。
一個個真正的AI原生系統通常具備以下特點:
1. 架構層面
- AI優先設計:架構圍繞AI模型的訓練、推理和持續學習來設計
- 數據驅動核心:數據流和AI模型是系統的中樞,而非輔助組件
- 動態適應性:系統能夠根據AI模型的輸出自動調整行為和決策
2. 功能層面
- 智能是主要價值:核心功能依賴AI實現,去掉AI后價值大幅降低
- 持續學習能力:系統能夠從用戶交互和新數據中不斷學習優化
- 個性化體驗:基于AI為每個用戶提供定制化的服務
3. 用戶體驗層面
- 自然交互:支持對話式、語音、視覺等AI驅動的交互方式
- 預測性服務:主動預測用戶需求而非被動響應
- 智能自動化:自動完成復雜任務,減少人工干預
我們可以將類似ChatGPT,Claude,GitHub Copilot,Midjourney理解為AI原生應用。但是對于傳統IT系統增加了AI知識庫,AI智能報表,AI智能排產或圖像識別等,只能叫AI賦能或AI集成,而非AI原生。
圖片
所以從上面的AI自己的回答也可以看到基本把AI原生的關鍵點都講到了。AI原生必須是土生土長的,系統一開始構建就原生在系統里面的能力,而不是已有系統后簡單嫁接或集成AI大模型能力。那些把傳統IT系統改造集成AI大模型能力后叫AI原生是相當錯誤的說法。
AI原生-大模型原生+知識原生+價值原生
一個系統能夠稱之為叫AI原生系統呢?這里面核心的一個關鍵就是整個系統核心的能力是架構在底層的AI大模型和底層的知識層上面的。你如果滿足這么一個條件,那你們做一個系統就可以叫做AI原生系統。
我原來談AI原生的時候談到過,AI原生核心是知識原生,為何你當前企業有數據庫數據,有資料文檔,不能快速的構建AI原生應用?里面的關鍵就是數據到智能的轉化,中間需要知識層。
所以你拿著我這個問題你可能就會思考,我現在基于AI大模型的能力,基于我已有的數據,我去開發了上層很多AI Agent智能體應用,這些AI智能體的應用是不是一個AI原生應用呢?
圖片
所以在這里再做一個說明:
當前業界有另外一個說法,就是AI原生應用就是基于AI大模型能力開發的應用,即AI原生應用的特征是其區別于傳統應用的核心。AI原生應用是基于大模型開發的。這里的大模型指的是具有強大計算能力和豐富數據訓練的AI算法,如GPT-4、百度的文心一言等,它們構成了應用的核心驅動力。大模型不僅僅是完成特定任務的工具,更是AI原生應用創新的基石。
注意這個說法只解決了AI原生應用的大模型原生問題,并沒有解決知識原生的問題。如果按這個說法所有的AI智能體應用都是AI原生應用,但是我的理解,AI原生應用的核心重點應該是在知識原生上面。
大家可以自己看一下,或者是復盤一下你開發的AI智能體,實際上你在AI智能體應用里面仍然出現了大量的業務規則邏輯處理或者是相關的業務流的編排,這些內容并沒有內置到底層的大模型的里面。
也就是說我底層雖然說有相關的一些數據支持,但是涉及到相關的業務處理規則邏輯,涉及到我個人的一些處理經驗的內容,仍然是在上層,沒有在我底層的大模型里面,所以對于AI智能體應用,我個人的理解也很難稱之為一個AI原生應用。
知識本體論-從數據到信息,從信息到知識
圖片
注意DIKW知識管理金字塔模型的都知識,在整個模型里面從下到上為數據-信息-知識-智慧。大家一定要注意,數據不能直接產生智慧,知識才是產生智慧的基礎。
經過加工清晰的有用數據可以變成信息,而經過我們大量實踐驗證的信息最終才能夠轉變為知識和經驗。知識就是我們大量實踐經驗的高度顯性化表達。
我原來在講知識管理的時候舉過一個例子,知識不是最終你形成的這么一個文檔這個結果,而是你思考形成文檔的過程,這個過程才是核心的知識或者是經驗。才是我們構建AI原生的關鍵基礎能力。
那么當前企業在數字化轉型或構建AI原生的時候面臨的實際情況是什么呢?其一就是連數據這個層次都沒搞明白,數據不標準,不一致,重復等問題嚴重,連體現數據驅動都難;其二就是我們應用數據或應用系統的經驗沒有濃縮為知識沉淀下來,或者簡單說缺少知識這個重要分層。
所以在前面我曾經談到過Palantir這家公司,一開始我的理解僅僅是大模型賦能下的一個數據中臺和提供數據服務的公司,但是實際這家公司核心是基于是基于Ontology本體系統構建了一個核心的知識中臺。
Palantir 的核心架構是基于 Ontology(業務本體),它不僅整合數據,更定義了企業中的“決策邏輯”。AI 模型被嵌入到這個本體中,成為可復用、可治理的“決策函數”,從而實現:
- AI+規則混合決策:既可用 AI 預測需求,也可用業務規則設定庫存閾值,系統會自動協調兩者
- 實時反饋閉環:AI 的預測結果會寫回 Ontology,成為下一次決策的輸入,形成持續優化的閉環。
本體=對象+屬性+關系
而知識本體類似我們經常談到的知識圖譜,知識圖譜重要的不僅僅是實體,而是實體間的關系。有了關系才能夠形成完整的推理能力。類似我們在進行面向對象分析建模一樣,不僅僅有對象和對象熟悉,更加重要的是有方法和行為。而方法和行為形成了對象間的關系連接。在整個本體建模中真正重要的是行為建模,關系建模。有了關系才能夠形成相應大模型推理的邏輯基礎。
類似我們拿醫療供應鏈業務舉例,我們在建模時講相關數據映射到 Ontology 的三類元素:
- 對象(Objects):口罩生產線、供應商、倉庫、客戶訂單、運輸路線……
- 屬性(Properties):每條產線的當前產能、每個倉庫的庫存量、訂單的交付截止日期。
- 關系(Links):供應商 A 為 生產線 B 提供 熔噴布;訂單 C 由 倉庫 D 履行。
傳統IT系統構建方式的變革
圖片
在前面我也談到過AI軟件工程3.0,包括AI時代對軟件軟件構建方式的影響,包括AI編程和VibeCoding。但是這些內容更多的都是在從技術層面談AI時代對軟件開發構建模式上的影響和變革。
基于前面談到的本體論的思想,實際在AI原生時代,更大的變革來自于AI應用模型構建上面的變更,來源于對數據和知識構建模式的變革。
所以再回過頭來我們再去考慮一下我們原來it系統的構建模式,當然很簡單,你有了相關的需求分析,你去做架構設計,然后再去做開發實現,最后部署出一個完整的it系統,一般的it系統它都有底層的數據庫和上層的應用。包括到了微服務架構階段,上層應用出現了前后端進一步分離。
知識=對象+屬性+行為關系
但是我們仍然可以看到有上層的應用和底層的數據庫兩層的一個劃分,底層的數據庫,數據架構和數據模型,沉淀了相關的數據,包括數據和數據之間的一些關系,但是這一些數據很難說叫一個完整的知識,知識是什么東西呢?那么對于一個it系統這些知識在哪里呢?
這些知識實際上是沉淀在你上層的應用里面,沉淀在你上層應用實現的代碼里面,包括代碼里面,我們實現的數據應該怎么樣去處理和流轉,相關的業務規則應該怎么樣去處理?這些東西都是在代碼里面,并沒有沉淀到下層的我們的數據庫里面。
包括前面我談到的,我們雖然在面向對象分析建模的時候,構建了完整的對象,屬性和行為關系。但是轉到IT系統構建實現的時候實際這兩個部分內容進行了分離。對象和屬性落地到數據庫模型里面,而行為和關系邏輯實際體現在了上層應用的代碼里面。
也就是當前的傳統IT系統,你僅僅是通過底層的數據庫和數據,這個不是完整意義上的知識,缺乏了數據形成的知識,缺乏了數據之間的關系和行為邏輯。因為這個邏輯沒有進行模型化沉淀,是在你上層應用代碼里面。
圖片
所以你現在要構建一個AI原生系統,里面有相當重要的兩個核心的內容,第一個就是我原有的數據庫數據,這些信息我怎么樣經過進一步的加工和興起,朝我的核心的知識庫轉移。第二個點就是我原來構建在上層應用里面的相關的處理規則和邏輯,怎么樣進一步下成為相關的模型,沉淀到我的知識庫里面,只有這樣你才能夠逐漸形成一個關鍵的知識中臺。
只有這樣才能夠形成完整意義上的知識層,有了知識這一塊內容,再加上AI大模型的能力,你才能夠真正的去構建AI原生的應用。
所以這個其實就是我一直強調的,我們真正的離AI原生應用還有相當長的一個距離。至于我個人的想法就是至少在3~5年的時間都很難真正達到一個AI原生應用的這么一個理想的狀態。里面還有一個很核心的原因,就是我原來講過的,對于AI大模型,它的天生的能力是在處理模糊的東西,而不是處理精確的規則。很多精確的規則,你即使前期做了相關的規則化的定義,規則的定義,形成提示語,基于上下文的工程,你把它落地到了大模型里面,那么你在用這一些精確規則的時候,大模型往往也會出現相應的處理的幻覺,這個問題短期其實是很難克服的。
最后,當我們重新在思考AI原生應用的時候,可以先問自己三個問題,或許你就有了這個應用是否AI原生的正確答案,即:
- 去掉AI后,這個系統還能實現其核心價值嗎?
- AI是后期添加的功能,還是從第一天就是系統基礎?
- 系統的競爭力主要來自AI能力,還是傳統軟件工程?
AI原生代表了軟件開發的新范式,它改變了我們思考和構建應用的方式,讓智能成為軟件的基因而非附加功能。
今天的分享就到這里,希望對大家有所啟發。



























