面試官：聊聊RAG的執行流程？

作者：磊哥 2025-07-25 01:45:00

RAG 是給大模型“外接”知識庫，讓大模型能夠更加精準回答問題的一種技術實現手段。它的執行主要分為兩個階段：索引生成階段（知識庫添加到向量數據庫的過程），檢索階段（根據用戶輸入信息在向量數據庫查詢結果的階段），當然其中有一些執行細節也需要了解并在面試中回答出來。

RAG、MCP 和 FunctionCall 等都是 AI 的核心技術，同時也是面試中最長問的知識點，那么今天就來看下：RAG 技術及其執行流程。

概述

RAG（Retrieval-Augmented Generation，檢索增強生成）是指在將原始問題發送給大語言模型之前，先通過外部知識庫將數據進行注入，之后先在知識庫中檢索相關信息，然后再將檢索結果和原始問題一起發送給大模型組織、整理答案的一種技術手段。

通過這種實現方式，大語言模型可以獲取到特定領域的相關信息，并能夠利用這些信息進行回復，從而降低了發生幻覺的可能性。

RAG 優勢：

RAG 執行流程通常分為以下兩個階段：

1.生成索引階段：這個階段通常包括文檔清理，以及分詞也就是將它們拆分為更小的數據塊，并把這些數據庫轉換成向量，最后存儲在向量數據庫的過程。

圖片

2. 檢索階段：使用用戶提出的問題，在向量數據庫中檢索查詢的過程。

圖片

圖片

RAG 典型使用場景有以下幾個。

責任編輯：武曉燕來源：磊哥和Java