精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI 與非結構化數據:簡單 RAG 的局限及生產級解決方案全解析

人工智能
非結構化數據涵蓋了電子郵件、PDF 文件、會議記錄等多種形式,它們充斥在各個角落,卻由于缺乏固定的格式,給傳統的數據處理工具帶來了巨大的挑戰。而人工智能(AI)的出現,尤其是大型語言模型(LLMs),為解決非結構化數據的難題帶來了新的希望。

非結構化數據涵蓋了電子郵件、PDF 文件、會議記錄等多種形式,它們充斥在各個角落,卻由于缺乏固定的格式,給傳統的數據處理工具帶來了巨大的挑戰。而人工智能(AI)的出現,尤其是大型語言模型(LLMs),為解決非結構化數據的難題帶來了新的希望。但在實際應用中,簡單的檢索增強生成(RAG)方法卻存在諸多不足,無法滿足復雜的生產級場景需求。本文將深入探討這些問題,并詳細闡述如何構建適用于生產環境的有效解決方案。

簡單 RAG 為何行不通:深入剖析

RAG 作為 AI 領域的熱門技術,將檢索和生成相結合,理論上能夠從大量數據中找到相關信息并生成答案。但在實際應用中,它存在著諸多局限性。

實際案例 1:缺乏上下文和精確性

假設在研究論文和報告的語料庫中搜索 “具有戰略領導經驗的可再生能源專家”。簡單的 RAG 系統可能會檢索到包含 “可再生能源” 和 “領導” 這兩個詞的文檔,但很可能會忽略一些關鍵細節。如果一篇論文討論的是 “可持續能源戰略”,但沒有直接使用 “可再生能源” 這個短語,RAG 系統就可能會遺漏這篇文檔,因為它過度依賴詞匯的相似性。更糟糕的是,大型語言模型在生成回答時,可能會在沒有核實戰略角度的情況下,將 “領導” 和 “項目管理” 混淆,從而給出模糊或錯誤的答案。

實際案例 2:可擴展性和延遲問題

當處理數百萬份文檔時,比如十年的客戶反饋數據,簡單 RAG 系統的問題就會更加凸顯。由于向量相似性過于寬泛,它可能會檢索到大量不相關的文本塊,這不僅會拖慢響應時間,還會讓大型語言模型在篩選信息時感到困惑。例如,當詢問 “客戶對產品可靠性有什么看法” 時,系統可能會返回數千個提到 “產品” 和 “問題” 的文本塊,但其中很多可能是關于定價或運輸延遲等無關話題的。這樣一來,大型語言模型很難從中提取出有用的信息,導致回答不一致或不完整。

實際案例 3:缺乏控制和可解釋性

在使用簡單 RAG 時,用戶往往對檢索和生成的內容缺乏精細的控制。如果用戶要求 “顯示 2023 年討論數據隱私的法律文件”,RAG 系統可能僅僅根據向量相似性來檢索文檔,忽略了 “日期” 和 “主題” 等關鍵結構化篩選條件。最終生成的輸出可能只是一個通用的摘要,難以進行驗證和審計,這對于受監管的行業來說是完全不可接受的。

正確的方法:適用于生產的藍圖

那么,如何構建一個能夠超越簡單 RAG 和簡單 AI 聊天機器人局限性的生產級解決方案呢?這需要一個全面的方法,包括使用大型語言模型結構化數據、進行文本分塊以提高效率、生成向量嵌入以理解語義,以及使用混合搜索引擎進行搜索。

利用 LLMs 和提示將非結構化數據轉換為結構化洞察

首先要面對的挑戰是將雜亂無章的非結構化數據轉化為可用的形式。這就需要借助大型語言模型和精心設計的提示。用戶可以將非結構化數據輸入到大型語言模型中,這些模型可以在本地托管,也可以通過像 Hugging Face Inference 這樣的平臺進行訪問。關鍵在于使用有針對性的提示來引導大型語言模型的輸出。

例如,對于一系列研究論文,可以設計這樣的提示:“從每份文檔中提取以下內容:標題、作者、出版日期、摘要(不超過 200 字)以及關鍵主題。將輸出格式化為每個類別都有相應字段的 JSON 格式。” 大型語言模型會根據對語言的理解,對每份文檔進行處理,將相關信息識別并組織成結構化的字段。

對于更復雜的情況,如客戶反饋或法律合同,提示可以進一步細化。假設處理客戶電子郵件,可以設計這樣的提示:“對于每封電子郵件,識別發件人、收件人、日期、情感(積極、消極、中性)、主要主題(如產品問題、賬單問題)以及緊急程度(高、中、低)。將結果以結構化的 CSV 格式返回。” 大型語言模型的推理引擎會分析文本,利用其預訓練的知識推斷語義和關系,輸出清晰的、機器可讀的數據。

為了優化成本和性能,用戶可以使用 RunPod、vLLM 或 SGLang 等工具來托管自己的大型語言模型。在進行初始批量加載時,可以在 RunPod 上部署 vLLM,一次性處理數千份文檔,并使用連續批處理來最小化內存使用和成本。SGLang 的優化推理內核可以進一步加快令牌生成速度,確保即使是大型數據集也能高效地進行結構化處理。這樣的方法使得用戶可以在不依賴昂貴的云 API 的情況下擴展推理能力,非常適合生產環境。

一旦大型語言模型輸出了結構化數據,如 JSON 或 CSV 文件,用戶就有了進一步構建的基礎。每份文檔現在都有了相關的元數據(如 “標題”“日期”“主題”),可以通過分塊和向量化進行進一步的豐富,以實現高級搜索。

在 Elasticsearch 中存儲數據:為何它是正確的選擇

有了結構化數據后,下一步就是存儲和索引。Elasticsearch 作為一個分布式的、基于 RESTful 的搜索和分析引擎,基于 Apache Lucene 構建,非常適合處理這種情況。

Elasticsearch 具有先進的搜索功能。它原生支持基于關鍵詞的 Query DSL 搜索、用于向量搜索的 k 最近鄰(k-NN)算法,以及通過插件或自定義配置實現的混合搜索。這意味著用戶可以同時查詢結構化字段(如 “2023 年的文檔”)和向量空間(如 “與可持續性語義相似的內容”),這是其他系統無法如此無縫實現的。

此外,Elasticsearch 的相關性排名和優化功能也很強大。它使用像 TF-IDF 和 BM25 這樣的評分算法進行詞匯搜索,使用余弦相似度或 L2 距離進行向量搜索,確保結果按相關性進行排名。它還能夠通過互惠排名融合(RRF)等技術將這些方法結合起來,實現混合搜索,平衡精確性和上下文。

將自然語言查詢轉換為 DSL、混合和語義搜索

接下來,讓我們看看用戶如何與這個系統進行交互。目標是讓用戶能夠用自然語言提問,比如 “給我展示具有戰略經驗的可持續性專家” 或 “查找去年討論數據隱私的文檔”,并獲得精確、相關的結果。

用戶通過界面(如 Web 應用程序或 API)輸入查詢,該界面會將自然語言提示傳遞給大型語言模型進行處理。大型語言模型可以通過 Hugging Face、RunPod 或類似的設置進行托管,它會解釋查詢并將其轉換為搜索引擎能夠理解的格式。例如,對于 “給我展示具有戰略經驗的可持續性專家” 這個查詢,大型語言模型可能會將其分解為 “可持續性”(語義概念)、“專家”(角色或領域)和 “戰略經驗”(技能或上下文)等組件。

然后,系統會生成三種類型的查詢,它們協同工作:

  • 關鍵詞驅動的 DSL 查詢大型語言模型為 Elasticsearch 構建一個 DSL 查詢,針對結構化字段進行搜索。對于上述示例,它可能生成 {"bool": {"must": [{"match": {"topic": "sustainability"}}, {"match": {"role": "expert"}}, {"match": {"skills": "strategic experience"}}]}}。這樣可以確保在 “主題” 或 “技能” 等字段上進行精確匹配,為需要特定術語的用戶提供精確性。
  • 語義向量查詢同時,大型語言模型或專門的嵌入模型(如 Sentence-BERT)會將查詢轉換為向量,然后在 Elasticsearch 中用于 k-NN 搜索。對于 “可持續性與戰略經驗”,該向量可能會找到討論 “綠色能源戰略” 或 “可持續領導力” 的文檔,即使這些確切的短語沒有出現,也會根據余弦相似度進行排名。
  • 混合查詢真正的強大之處在于將這兩種查詢結合起來。Elasticsearch 的混合搜索功能允許用戶合并 DSL 和向量搜索的結果,并根據相關性對每個結果進行加權。例如,可以將 DSL 查詢的權重設置為 0.6(以提高精確性),將向量查詢的權重設置為 0.4(以提供上下文),然后使用 RRF 融合排名。這樣可以確保既獲得精確匹配(如明確標記為 “可持續性” 的文檔),又獲得相關概念(如 “環境戰略”),實現兩者的優勢互補。

這些查詢協同工作是因為它們各自利用了不同的優勢。DSL 對于結構化數據的搜索快速且精確,向量搜索對于非結構化數據的洞察靈活且具有上下文感知,而混合搜索則彌補了兩者之間的差距,在準確性和相關性方面進行了優化。大型語言模型就像是一個指揮家,確保自然語言查詢被智能地解析并轉換為正確的搜索組合,而 Elasticsearch 則快速、大規模地執行這些搜索。

整合所有環節以獲得最佳結果

這種方法的美妙之處在于它的協同效應。用戶通過提示大型語言模型來結構化數據、分塊并生成嵌入,這些嵌入隨后在 Elasticsearch 中進行索引,以便存儲和搜索。當查詢進來時,大型語言模型將其轉換為 DSL、向量和混合搜索的組合,Elasticsearch 實時執行這些搜索,并根據相關性對結果進行排名。例如,當用戶詢問 “查找 2023 年關于數據隱私的法律文件” 時,可能會通過 DSL 匹配到 “2023 年” 和 “數據隱私”,通過向量匹配到相關術語(如 “GDPR”),并通過混合排名優先顯示最具上下文相關性的文檔。

這并非只是理論,而是一個適用于生產的藍圖。通過在像 RunPod 這樣具有成本效益的平臺上使用 vLLM 或 SGLang 托管大型語言模型,使用精確的提示來結構化數據,并利用 Elasticsearch 無與倫比的搜索能力,用戶可以創建一個可擴展、安全且高效的系統。這不是關于快速修復或花哨的演示,而是關于構建在現實世界中真正有效的 AI,通過每次查詢將非結構化數據轉化為可操作的洞察。

責任編輯:武曉燕 來源: 大模型之路
相關推薦

2025-07-15 16:36:25

2025-06-05 01:22:00

2021-12-12 08:37:18

結構化數據非結構化數據數據

2024-05-27 00:32:45

2019-10-18 13:07:14

PB數據非結構化數據數據集

2018-04-03 14:00:03

結構化數據非結構化數據數據庫

2011-04-11 15:27:11

結構化布線

2009-10-15 17:32:53

結構化布線解決方案

2019-07-13 15:00:17

結構化SQLNOSQL數據庫

2018-10-08 13:31:56

華為AI人工智能

2020-11-20 19:07:27

PB級數據銀行

2017-11-16 05:22:34

非結構化數據分析數據

2020-09-07 11:42:40

Hitachi Van

2014-02-09 09:53:05

2011-05-25 15:16:55

非結構化數據庫異構數據庫

2024-05-10 12:52:01

2009-02-16 15:41:04

非結構化數據SQL Server SQL Server

2018-05-14 12:30:49

數據備份非結構
點贊
收藏

51CTO技術棧公眾號

久热精品视频| 成午夜精品一区二区三区软件| 久久蜜桃av一区精品变态类天堂| 国产成人亚洲精品| 国产又粗又猛又爽视频| 久久久加勒比| 一区二区三区欧美日| 精品国产一二| 中文字幕一区二区在线视频| 亚洲精品一二三区区别| 欧美精品一区二区久久久| 欧美日韩在线中文| 午夜看片在线免费| 国产成人免费视| 57pao精品| 翔田千里88av中文字幕| 校花撩起jk露出白色内裤国产精品| 在线免费观看一区| 草b视频在线观看| 超碰免费97在线观看| 国产成人啪午夜精品网站男同| 欧美与欧洲交xxxx免费观看 | 国产亚洲精品精品国产亚洲综合| 亚洲精选视频免费看| 欧美第一黄网| www.日日夜夜| 日韩va欧美va亚洲va久久| 欧美国产在线视频| 东京热无码av男人的天堂| 超碰地址久久| 67194成人在线观看| 99福利在线观看| 中文字幕有码在线观看| 欧美国产视频在线| 久久狠狠久久综合桃花| 国产熟女精品视频| 免费成人你懂的| 2019中文在线观看| 日本熟妇毛茸茸丰满| 国产韩国精品一区二区三区| 亚洲少妇中文在线| 精品中文字幕在线播放| 欧美久久亚洲| 666欧美在线视频| wwwwwxxxx日本| 欧美电影免费观看| 精品国产户外野外| 欧美视频在线第一页| 嫩草香蕉在线91一二三区| 久久九九影视网| 蜜桃传媒视频麻豆第一区免费观看 | 国产成人极品视频| 国产精品久久久久久99| 亚洲精品综合| 性欧美暴力猛交69hd| 久久久久久久久久99| 亚洲人metart人体| 久久影院资源网| 国产午夜精品理论片| 国产精品久久久久久| 在线观看欧美www| 三年中国中文观看免费播放| 免费久久精品| 一本色道久久88综合亚洲精品ⅰ| 黄瓜视频污在线观看| 亚洲人成网www| 国产视频一区在线| 91成人在线免费视频| 精品久久中文| 在线观看日韩av| 天堂а√在线中文在线鲁大师| 日韩免费高清| 久久亚洲一区二区三区四区五区高| 狂野欧美性猛交| 91tv官网精品成人亚洲| 欧美日韩福利电影| 国产精品6666| 美女精品在线| 国产精品久久久久久久久久久久久 | 精品久久久久一区二区三区 | 在线观看黄网址| 天天综合亚洲| 国内揄拍国内精品| 精品人妻一区二区三区潮喷在线| 欧美aaa在线| 91免费精品国偷自产在线| 国产精品主播一区二区| 成人午夜激情片| 久久99精品久久久久久青青日本| 九色视频成人自拍| 亚洲精品videosex极品| 无码精品a∨在线观看中文| 亚洲wwww| 欧美一级xxx| 亚洲国产第一区| 青青草综合网| 久久久久久久爱| 免费无码国产精品| 激情综合色播五月| 韩国成人一区| 天堂地址在线www| 亚洲狠狠爱一区二区三区| aaaaaa亚洲| 亚洲码欧美码一区二区三区| 亚洲欧洲国产一区| 国产极品国产极品| 久久亚洲精选| 2019国产精品视频| 国产精品影院在线| 亚洲午夜久久久久久久久电影院| 无码内射中文字幕岛国片| 欧美电影在线观看一区| 在线播放日韩专区| 亚洲精品午夜久久久久久久| 久久精品国产精品青草| 精品在线不卡| 在线三级电影| 欧美丝袜自拍制服另类| 免费看毛片的网站| 国产精品久久久久久久久久10秀 | 国产亚洲欧美另类中文| 久久激情免费视频| 美女网站一区二区| 好看的日韩精品视频在线| 浪潮av一区| 色噜噜狠狠色综合中国| 日本黄色www| 日本一区二区在线看| 国产91精品久久久久久| 成人黄色在线观看视频| 国产精品高清亚洲| 国产真人无码作爱视频免费| 久久精品凹凸全集| 欧美黑人性猛交| 亚洲中文字幕在线观看| 久久久精品日韩欧美| 国产在线xxxx| 成人av在线播放| 在线色欧美三级视频| 亚洲国产成人精品激情在线| 国产精品一品二品| 在线视频亚洲自拍| 日本免费在线一区| 国产亚洲a∨片在线观看| 少妇一级淫片免费放中国 | 一本一道久久a久久精品综合蜜臀| 制服下的诱惑暮生| 亚洲国产精品91| 国产综合久久久久久| 国产乱理伦片a级在线观看| 欧美性生活大片免费观看网址| 久久久老熟女一区二区三区91| 影音先锋久久久| 成人国产1314www色视频| 成人片在线看| 日韩无一区二区| 欧美成人三级视频| 国产不卡视频在线观看| 欧美日韩不卡在线视频| 波多野结衣欧美| 97视频com| 欧美日韩免费做爰大片| 色哟哟在线观看一区二区三区| 亚洲人人夜夜澡人人爽| 国产精品亚洲产品| 日韩久久久久久久| 亚洲精品aa| 欧美另类精品xxxx孕妇| 欧日韩在线视频| 黑人精品xxx一区一二区| 免费观看一级一片| 日韩和欧美一区二区三区| 日韩免费一区二区三区| 视频91a欧美| 欧美理论电影在线播放| 五月婷婷在线播放| 欧洲一区二区三区在线| 欧洲美女女同性互添| 粉嫩av一区二区三区| 人妻少妇精品无码专区二区| 欧美日韩播放| 国产日韩在线一区| 国产一线二线在线观看| 亚洲精品国产精品国产自| 无码人妻丰满熟妇奶水区码| 国产精品三级av| 伊人影院在线观看视频| 在线亚洲一区| 亚洲精品9999| 婷婷视频一区二区三区| 欧美在线视频网站| 激情在线小视频| 亚洲国产成人91精品| 波多野结衣电影在线播放| 亚洲日本一区二区| 色噜噜在线观看| 加勒比av一区二区| 欧美日韩一道本| 手机在线电影一区| 国内精品国语自产拍在线观看| 韩国成人在线| 欧美精品第一页在线播放| 国产高清在线| 欧美精品一区二区三区四区| 青娱乐在线免费视频| 亚洲国产欧美另类丝袜| 国产性猛交xx乱| av在线播放成人| 红桃视频 国产| 久久99伊人| 国产九色porny| 欧美韩日高清| 热re99久久精品国99热蜜月| 精品伊人久久| 国产精品欧美日韩一区二区| av在线播放资源| 免费91在线视频| 国产69久久| 亚洲成人久久网| jlzzjlzz亚洲女人18| 91黄色免费看| 日本一级一片免费视频| 樱花草国产18久久久久| 极品久久久久久久| 99re免费视频精品全部| 国产精品19p| 麻豆精品视频在线| 黄色av免费在线播放| 在线日韩视频| 免费观看国产视频在线| 成人久久久久| 欧美理论一区二区| 欧美日韩麻豆| 国产精品一区二区在线观看 | 久操视频在线观看免费| caoporm超碰国产精品| 成人三级做爰av| 韩国一区二区视频| 欧美日韩一区二区三区69堂| 久久美女性网| 日韩欧美xxxx| 亚洲欧美日韩精品一区二区| 高清欧美精品xxxxx| 精品二区久久| av网站手机在线观看| 欧美黄色aaaa| 国产成人一二三区| 欧美精品入口| 激情五月六月婷婷| 欧美性色综合| www.亚洲视频.com| 精品91视频| 黄网站欧美内射| 国产一区导航| 少妇高清精品毛片在线视频| 一区二区毛片| www.亚洲天堂网| 爽好多水快深点欧美视频| 亚洲成人福利在线观看| 日本午夜一区二区| 亚洲xxx在线观看| 九九热在线视频观看这里只有精品| 在线黄色免费看| 狠狠色丁香婷婷综合久久片| 亚欧精品在线视频| 国产成人在线看| www.美色吧.com| av不卡免费电影| 国产黄色网址在线观看| 久久精品日韩一区二区三区| 国产又粗又硬视频| 日韩美女视频一区二区| 久久久久无码精品国产| 激情久久av一区av二区av三区| 国产性猛交╳xxx乱大交| 日本韩国一区二区三区视频| 中文字幕一区二区三区四区视频| 欧美一区二区三区视频在线观看| 国产夫绿帽单男3p精品视频| 亚洲大胆美女视频| 免费毛片在线| 久久中国妇女中文字幕| 爱情岛论坛亚洲品质自拍视频网站| 97视频在线免费观看| yw.尤物在线精品视频| 亚洲xxxxx性| 林ゆな中文字幕一区二区| 日本午夜精品一区二区| 久久久国产精品| 日本福利视频一区| 麻豆国产欧美日韩综合精品二区| 337p日本欧洲亚洲大胆张筱雨| 93久久精品日日躁夜夜躁欧美| 亚洲av成人无码久久精品| 亚洲人吸女人奶水| 亚洲不卡视频在线观看| 宅男在线国产精品| 色天堂在线视频| 欧美大成色www永久网站婷| 悠悠资源网亚洲青| 91精品天堂| 精品国产一区二区三区四区 | 99久久99| 欧美军人男男激情gay| wwwwww欧美| 蜜臀久久久久久久| 免费无码一区二区三区| 亚洲视频每日更新| 国产一区免费看| 欧美精品一区二| 在线日本中文字幕| 国产91精品久久久久久| 亚洲3区在线| 亚洲欧洲精品一区| 先锋a资源在线看亚洲| 三上悠亚 电影| 国产精品二区一区二区aⅴ污介绍| 日本少妇激情舌吻| 欧美一级一区二区| 在线免费av电影| 日韩美女主播视频| 久久91在线| 国内精品国产三级国产99| 日本少妇一区二区| 97人妻天天摸天天爽天天| 亚洲一区二区高清| 国产精品午夜福利| 色哟哟入口国产精品| 国产超碰精品| 久久免费看av| 一区二区激情| 男女一区二区三区| 亚洲自拍另类综合| 国产深喉视频一区二区| 中文字幕视频在线免费欧美日韩综合在线看 | 野外做受又硬又粗又大视频√| 国产综合久久久久久久久久久久| 无码人妻aⅴ一区二区三区69岛| 精品福利一区二区| 日批免费在线观看| 久久久视频在线| 99re8这里有精品热视频免费| 影音先锋成人资源网站| 激情综合一区二区三区| 蜜臀av午夜精品久久| 欧美老年两性高潮| 日本高清视频在线观看| 国产日韩精品在线观看| 欧美韩日高清| 91性高潮久久久久久久| 亚洲美女偷拍久久| 国产sm主人调教女m视频| 久久最新资源网| 麻豆精品在线| 97超碰在线人人| av成人免费在线| 久久久久久久久久久影院| 亚洲男人天天操| 精品123区| 一区二区三区欧美在线| 国产一区二区三区四| 澳门黄色一级片| 精品国产免费人成电影在线观看四季| 黄页网站大全在线免费观看| 国产视频在线观看一区| 国产午夜久久| 亚洲第一视频区| 欧美精品粉嫩高潮一区二区| bt在线麻豆视频| 国产精品久久久久久久久久直播| 99精品热6080yy久久| a天堂中文字幕| 欧美丰满一区二区免费视频| 色黄网站在线观看| 久久精品国产综合精品| 日韩精品乱码av一区二区| 国内毛片毛片毛片毛片毛片| 欧美一区二区三区免费大片| sis001亚洲原创区| 欧美成人蜜桃| 久久99热狠狠色一区二区| 黄色一级片中国| 日韩激情第一页| 欧美一区=区三区| 国产尤物av一区二区三区| 91女厕偷拍女厕偷拍高清| 中国a一片一级一片| 欧美xxxx做受欧美| 亚洲区小说区| 最新国产黄色网址| 亚洲高清三级视频| av在线日韩国产精品| 国产不卡一区二区在线观看| 久久久久国产精品一区三寸| 欧美风情第一页| 日韩av网址在线| 国产精久久一区二区| 成人午夜视频免费在线观看| 国产精品久久久久久久久免费樱桃| www.看毛片|