Google 讓 RAG 變得前所未有地簡單:全新 File Search 工具震撼登場
如果你曾嘗試自己搭一套 RAG(Retrieval-Augmented Generation,檢索增強生成),你大概懂那種痛:要管理 embeddings(向量嵌入)、vector databases(向量數據庫)、把文本正確地 chunking(切分),還得確保一切能和你的模型順暢協作、又不至于燒錢。
好吧,Google 直接把這攤麻煩全給你搞沒了。
他們悄悄地在 Gemini API 里_推出了全新的 File Search Tool,由它來替你處理 RAG 的所有繁瑣工作_。你把文件丟進去,提出問題,它就把剩下的事都搞定。

圖片來源 - Google
這玩意兒是什么?
本質上,File Search 讓 Gemini 能“理解”你的數據。你可以上傳 PDF、DOCX、純文本、JSON,甚至代碼文件。當你向 Gemini 提問時,它不會瞎猜——而是檢索你上傳的文件,定位相關部分,并據此作答。
就像把你的私人“腦庫”直接接到 Gemini 上。無需單獨的 vector database、無需 retrieval pipeline(檢索管線),也沒什么需要你運維的。
就是:文件進,答案出。
很便宜,真的很便宜
這點著實讓我意外。你不為查詢或存儲付費;只在一個時刻付費——當你索引文件的時候。
用 gemini-embedding-001 模型創建 embedding 的費用是每 100 萬 tokens 收費 0.15 美元。和用 Pinecone 或 Weaviate 自己搭一整套管線相比,簡直不值一提。
之后,你可以隨便、無限次查詢這些文件。
它到底怎么運作
File Search 會自動完成文件的 chunking、生成 embeddings、存儲與檢索,并把上下文注入到你的 Gemini 提示詞中,從而把 RAG 簡化到底。
這一切都在你已經在用的 generateContent API 調用里完成。
當你發起查詢時,它會在幕后用最新的 Gemini Embedding 模型執行一次 vector search(向量搜索)。因此它理解的是“語義”,而不只是關鍵詞。
更棒的是:Gemini 的回答會包含 citations(引用)——明確標出來源的文件和具體位置。你可以點進去核實。再也不用猜模型是不是在幻覺了。
用例:Beam 的極速游戲生成
早期測試方之一 Phaser Studio,把 File Search 用在他們的 AI 驅動游戲平臺 Beam 上。
他們有一個包含 3000 多個文件的資料庫——模板、代碼片段、設計文檔和其他內部數據。File Search 讓他們可以在不到 2 秒內查詢整庫。過去要手工查同樣的信息,得花上_好幾個小時_。
他們的 CTO Richard Davey 如此總結:
“過去要用幾天才能打樣的點子,如今幾分鐘就能玩上手。”
相當瘋狂。
一個簡短的 Python 示例
上手不需要太多代碼。看這個簡單示例:
from google import genai
from google.genai import types
import time
client = genai.Client()
store = client.file_search_stores.create()
upload_op = client.file_search_stores.upload_to_file_search_store(
file_search_store_name=store.name,
file='path/to/your/document.pdf'
)
while not upload_op.done:
time.sleep(5)
upload_op = client.operations.get(upload_op)
response = client.models.generate_content(
model='gemini-2.5-flash',
cnotallow='Summarize the research on sustainable AI.',
cnotallow=types.GenerateContentConfig(
tools=[types.Tool(
file_search=types.FileSearch(
file_search_store_names=[store.name]
)
)]
)
)
print(response.text)
grounding = response.candidates[0].grounding_metadata
sources = {c.retrieved_context.title for c in grounding.grounding_chunks}
print('Sources:', *sources)就是這樣。上傳文件、提出問題、拿到帶來源的答案。搞定。
為何重要
每個 AI 開發者都會遇到同一個問題——模型聽起來很強,但碰不到你公司的內部數據。
File Search 改變這一點,讓 Gemini 能在無需復雜 retrieval setup(檢索搭建)的前提下分析_你的_內容。
如果你在做需要時效性或垂直領域知識的東西——客服機器人、內部工具、文檔問答——這就是游戲規則改變者。
自己試試
你現在就能在 Google AI Studio 里體驗 File Search。有一個名為 “Ask the Manual” 的 demo——上傳幾份文件,提幾個問題,看看答案的溯源效果有多好。
上手之后,你可以改造這個 demo,或者直接把它集成到你的應用里。
本文轉載自??AI大模型觀察站??,作者:AI研究生

















