面試官:聊聊RAG的執行流程?
RAG、MCP 和 FunctionCall 等都是 AI 的核心技術,同時也是面試中最長問的知識點,那么今天就來看下:RAG 技術及其執行流程。
概述
RAG(Retrieval-Augmented Generation,檢索增強生成)是指在將原始問題發送給大語言模型之前,先通過外部知識庫將數據進行注入,之后先在知識庫中檢索相關信息,然后再將檢索結果和原始問題一起發送給大模型組織、整理答案的一種技術手段。
通過這種實現方式,大語言模型可以獲取到特定領域的相關信息,并能夠利用這些信息進行回復,從而降低了發生幻覺的可能性。
RAG 優勢:
- 提高準確性:通過引用外部知識庫,減少幻覺現象。
- 實時更新:允許模型訪問最新信息,解決知識局限性問題。
- 經濟高效:與重新訓練模型相比,降低了更新成本。
執行流程
RAG 執行流程通常分為以下兩個階段:
1.生成索引階段:這個階段通常包括文檔清理,以及分詞也就是將它們拆分為更小的數據塊,并把這些數據庫轉換成向量,最后存儲在向量數據庫的過程。
圖片
2. 檢索階段:使用用戶提出的問題,在向量數據庫中檢索查詢的過程。
圖片
整體執行流程
圖片
使用場景
RAG 典型使用場景有以下幾個。
1. 企業級知識問答系統
- 場景:公司內部文檔(如 HR 政策、技術手冊、客戶 FAQ)的智能問答。
- 痛點:傳統 LLM 無法訪問非公開數據,且知識可能過時。
- RAG 作用:實時檢索內部知識庫,生成準確且可溯源的答案。
2.客服與技術支持
- 場景:電商、SaaS 產品的客戶支持(如訂單狀態查詢、故障排查)。
- 痛點:需依賴實時數據(訂單、庫存)和動態知識(如促銷規則)。
- RAG 作用:結合用戶實時數據(如訂單 ID)和知識庫,生成個性化回答。
3.醫療與法律咨詢
- 場景:輔助醫生查詢最新診療指南,或律師分析判例庫。
- 痛點:對事實準確性要求極高,且知識需更新(如新藥品、法律條文)。
- RAG 作用:從權威數據庫(如 PubMed、法律條文庫)檢索證據,減少幻覺。
小結
RAG 是給大模型“外接”知識庫,讓大模型能夠更加精準回答問題的一種技術實現手段。它的執行主要分為兩個階段:索引生成階段(知識庫添加到向量數據庫的過程),檢索階段(根據用戶輸入信息在向量數據庫查詢結果的階段),當然其中有一些執行細節也需要了解并在面試中回答出來。



























