精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG-Anything:PDF、表格、公式全能讀!港大開源神器讓AI真正理解復雜文檔? 精華

發布于 2025-7-14 08:10
瀏覽
0收藏

?RAG-Anything是一個由香港大學數據智能實驗室開發的開源多模態RAG系統,支持處理包含文本、圖像、表格和公式的復雜文檔,提供從文檔攝取到智能查詢的端到端解決方案。系統基于多模態知識圖譜、靈活的解析架構和混合檢索機制,顯著提升復雜文檔處理能力,支持多種文檔格式,如PDF、Office文檔、圖像和文本文件等。

一、技術原理

(一)圖增強文本索引

RAG-Anything基于LLM從文本中提取實體(節點)及其關系(邊),將信息用于構建知識圖譜。為每個實體節點和關系邊生成文本鍵值對,鍵是用于高效檢索的單詞或短語,值是總結相關外部數據片段的文本段落。識別、合并來自不同文本片段的相同實體和關系,減少圖操作的開銷,提高數據處理效率。

(二)雙重檢索范式

  • 低層次檢索:專注于檢索特定實體及其屬性或關系,適用需要精確信息的詳細查詢。
  • 高層次檢索:處理更廣泛的主題和主題,基于聚合多個相關實體和關系的信息,提供對高級概念和總結的見解。
  • 圖和向量集成:結合圖結構和向量表示,檢索算法用局部和全局關鍵詞,提高檢索效率和結果相關性。

(三)檢索增強型答案生成

用檢索到的信息,基于LLM生成基于收集數據的答案,包括實體和關系的名稱、描述及原始文本片段。將查詢與多源文本統一,LLM生成與用戶需求一致的答案,確保與查詢意圖對齊。

(四)復雜性分析

圖基索引階段用LLM從每個文本塊中提取實體和關系,無需額外開銷,高效管理新文本更新。圖基檢索階段用LLM生成相關關鍵詞,依靠向量搜索進行檢索,顯著減少檢索開銷。

二、主要功能

(一)端到端多模態流水線

從文檔解析到多模態智能查詢,提供一體化工作流程。系統能夠自動識別文檔中的不同模態內容,并將其路由到相應的處理通道,實現高效的內容解析和理解。

(二)多格式文檔支持

兼容PDF、Office文檔(DOC/DOCX、PPT/PPTX、XLS/XLSX)、圖像(JPG、PNG等)和文本文件(TXT、MD)。無論用戶手中的文檔是何種格式,RAG-Anything都能輕松應對,滿足不同場景下的文檔處理需求。

(三)多模態內容分析引擎

針對圖像、表格、公式和通用文本內容部署專門的處理器,確保各類內容的精準解析。例如,視覺內容分析器能夠生成基于視覺語義的上下文感知描述性標題,并提取視覺元素之間的空間關系和層次結構;結構化數據解釋器則對表格和結構化數據格式進行系統解釋,識別數據趨勢和語義關系。

(四)知識圖譜索引

自動提取實體和跨模態關系,構建語義連接網絡。通過構建多模態知識圖譜,系統能夠更好地理解文檔內容之間的關聯,為智能問答提供豐富的語義信息支持。

(五)靈活的處理架構

支持MinerU智能解析模式和直接多模態內容插入模式,適配多樣化場景。用戶可以根據自己的需求選擇合適的處理模式,無論是對復雜文檔的深度解析,還是對特定模態內容的快速處理,RAG-Anything都能提供靈活的解決方案。

(六)跨模態檢索機制

實現跨文本和多模態內容的智能檢索,提供精準的信息定位和匹配能力。用戶可以通過輸入文本查詢,系統能夠理解查詢意圖,并在多模態文檔中檢索出與之相關的信息,無論是文本描述、圖像內容還是表格數據,都能精準匹配。

三、應用場景

(一)學術研究

快速解析和理解大量學術文獻,提取關鍵信息和研究結果,支持文獻綜述和實驗數據分析,助力跨學科研究。研究人員可以利用RAG-Anything高效地處理學術論文,快速獲取所需信息,加速研究進程。

(二)企業知識管理

整合企業內部文檔,如會議記錄、項目報告等,提供智能查詢和知識共享,提升內部信息流通效率。企業員工可以通過RAG-Anything快速查找所需資料,促進知識共享和團隊協作。

(三)金融分析

處理財務報表和市場研究報告,提取關鍵財務指標和市場趨勢,輔助風險評估和投資決策。金融分析師可以借助RAG-Anything深入分析金融文檔,挖掘有價值的信息,為投資決策提供有力支持。

(四)醫療健康

解析病歷中的文本、圖像和表格,支持醫療診斷和治療方案制定,處理醫學研究文獻和實驗數據。醫療專業人員可以利用RAG-Anything高效地處理醫療文檔,提高診斷準確性和治療效果。

(五)智能客服

快速回答客戶問題,提高客服效率,整合企業知識庫,提供智能查詢和知識推薦,優化客戶體驗。客服人員可以借助RAG-Anything快速準確地回答客戶咨詢,提升客戶滿意度。

四、快速使用

(一)安裝

1、從PyPI安裝(推薦)

# 
基本安裝
pip install raganything
# 
安裝所有可選依賴
pip install 'raganything[all]'

2、從源碼安裝

git clone https://github.com/HKUDS/RAG-Anything.git
cd RAG-Anything
pip install -e .

(二)使用示例

1、端到端文檔處理

import asyncio
from raganything import RAGAnything, RAGAnythingConfig
from lightrag.llm.openai import openai_complete_if_cache, openai_embed
from lightrag.utils import EmbeddingFunc


async def main():
    # 設置API配置
    api_key = "your-api-key"
    base_url = "your-base-url"  # 可選


    # 創建RAGAnything配置
    config = RAGAnythingConfig(
        working_dir="./rag_storage",
        mineru_parse_method="auto",
        enable_image_processing=True,
        enable_table_processing=True,
        enable_equation_processing=True,
    )


    # 定義LLM模型函數
    def llm_model_func(prompt, system_prompt=None, history_messages=[], **kwargs):
        return openai_complete_if_cache(
            "gpt-4o-mini",
            prompt,
            system_prompt=system_prompt,
            history_messages=history_messages,
            api_key=api_key,
            base_url=base_url,
            **kwargs,
        )


    # 定義視覺模型函數用于圖像處理
    def vision_model_func(
        prompt, system_prompt=None, history_messages=[], image_data=None, **kwargs
    ):
        if image_data:
            return openai_complete_if_cache(
                "gpt-4o",
                "",
                system_prompt=None,
                history_messages=[],
                messages=[
                    {"role": "system", "content": system_prompt}
                    if system_prompt
                    else None,
                    {
                        "role": "user",
                        "content": [
                            {"type": "text", "text": prompt},
                            {
                                "type": "image_url",
                                "image_url": {
                                    "url": f"data:image/jpeg;base64,{image_data}"
                                },
                            },
                        ],
                    }
                    if image_data
                    else {"role": "user", "content": prompt},
                ],
                api_key=api_key,
                base_url=base_url,
                **kwargs,
            )
        else:
            return llm_model_func(prompt, system_prompt, history_messages, **kwargs)


    # 定義嵌入函數
    embedding_func = EmbeddingFunc(
        embedding_dim=3072,
        max_token_size=8192,
        func=lambda texts: openai_embed(
            texts,
            model="text-embedding-3-large",
            api_key=api_key,
            base_url=base_url,
        ),
    )


    # 初始化RAGAnything
    rag = RAGAnything(
        cnotallow=config,
        llm_model_func=llm_model_func,
        vision_model_func=vision_model_func,
        embedding_func=embedding_func,
    )


    # 處理文檔
    await rag.process_document_complete(
        file_path="path/to/your/document.pdf",
        output_dir="./output",
        parse_method="auto"
    )


    # 查詢處理后的內容
    # 純文本查詢 - 用于基本知識庫搜索
    text_result = await rag.aquery(
        "What are the main findings shown in the figures and tables?",
        mode="hybrid"
    )
    print("Text query result:", text_result)


    # 多模態查詢,包含特定多模態內容
    multimodal_result = await rag.aquery_with_multimodal(
    "Explain this formula and its relevance to the document content",
    multimodal_cnotallow=[{
        "type": "equation",
        "latex": "P(d|q) = \\frac{P(q|d) \\cdot P(d)}{P(q)}",
        "equation_caption": "Document relevance probability"
    }],
    mode="hybrid"
)
    print("Multimodal query result:", multimodal_result)


if __name__ == "__main__":
    asyncio.run(main())

2、直接多模態內容處理

import asyncio
from lightrag import LightRAG
from lightrag.llm.openai import openai_complete_if_cache, openai_embed
from lightrag.utils import EmbeddingFunc
from raganything.modalprocessors import ImageModalProcessor, TableModalProcessor


async def process_multimodal_content():
    # 設置API配置
    api_key = "your-api-key"
    base_url = "your-base-url"  # 可選


    # 初始化LightRAG
    rag = LightRAG(
        working_dir="./rag_storage",
        llm_model_func=lambda prompt, system_prompt=None, history_messages=[], **kwargs: openai_complete_if_cache(
            "gpt-4o-mini",
            prompt,
            system_prompt=system_prompt,
            history_messages=history_messages,
            api_key=api_key,
            base_url=base_url,
            **kwargs,
        ),
        embedding_func=EmbeddingFunc(
            embedding_dim=3072,
            max_token_size=8192,
            func=lambda texts: openai_embed(
                texts,
                model="text-embedding-3-large",
                api_key=api_key,
                base_url=base_url,
            ),
        )
    )
    await rag.initialize_storages()


    # 處理圖像
    image_processor = ImageModalProcessor(
        lightrag=rag,
        modal_caption_func=lambda prompt, system_prompt=None, history_messages=[], image_data=None, **kwargs: openai_complete_if_cache(
            "gpt-4o",
            "",
            system_prompt=None,
            history_messages=[],
            messages=[
                {"role": "system", "content": system_prompt} if system_prompt else None,
                {"role": "user", "content": [
                    {"type": "text", "text": prompt},
                    {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}}
                ]} if image_data else {"role": "user", "content": prompt}
            ],
            api_key=api_key,
            base_url=base_url,
            **kwargs,
        ) if image_data else openai_complete_if_cache(
            "gpt-4o-mini",
            prompt,
            system_prompt=system_prompt,
            history_messages=history_messages,
            api_key=api_key,
            base_url=base_url,
            **kwargs,
        )
    )


    image_content = {
        "img_path": "path/to/image.jpg",
        "img_caption": ["Figure 1: Experimental results"],
        "img_footnote": ["Data collected in 2024"]
    }


    description, entity_info = await image_processor.process_multimodal_content(
        modal_cnotallow=image_content,
        content_type="image",
        file_path="research_paper.pdf",
        entity_name="Experimental Results Figure"
    )


    # 處理表格
    table_processor = TableModalProcessor(
        lightrag=rag,
        modal_caption_func=lambda prompt, system_prompt=None, history_messages=[], **kwargs: openai_complete_if_cache(
            "gpt-4o-mini",
            prompt,
            system_prompt=system_prompt,
            history_messages=history_messages,
            api_key=api_key,
            base_url=base_url,
            **kwargs,
        )
    )


    table_content = {
        "table_body": """
        | Method | Accuracy | F1-Score |
        |--------|----------|----------|
        | RAGAnything | 95.2% | 0.94 |
        | Baseline | 87.3% | 0.85 |
        """,
        "table_caption": ["Performance Comparison"],
        "table_footnote": ["Results on test dataset"]
    }


    description, entity_info = await table_processor.process_multimodal_content(
        modal_cnotallow=table_content,
        content_type="table",
        file_path="research_paper.pdf",
        entity_name="Performance Results Table"
    )


if __name__ == "__main__":
    asyncio.run(process_multimodal_content())

結語

RAG-Anything作為香港大學數據智能實驗室推出的開源多模態RAG系統,憑借其創新的技術架構和強大的功能,為多模態文檔處理與智能問答領域帶來了新的突破。它不僅支持多種文檔格式,還能精準解析圖像、表格、公式等多模態內容,并通過構建知識圖譜實現跨模態的智能檢索與問答。

GitHub倉庫:https://github.com/HKUDS/RAG-Anything

arXiv技術論文:?https://arxiv.org/pdf/2410.05779

本文轉載自???????小兵的AI視界???????,作者:AGI小兵


收藏
回復
舉報
回復
相關推薦
久久国产尿小便嘘嘘| 粉嫩av国产一区二区三区| 久久综合色综合88| 国产精品久久久久久久久久| 国产传媒在线看| 精品一区二区三区中文字幕| 精品久久久视频| 伊人久久大香线蕉午夜av| 国产夫绿帽单男3p精品视频| 久久人人超碰| 欧美第一淫aaasss性| 波多野结衣福利| 亚洲国产一区二区久久| 欧美色播在线播放| 粉嫩av一区二区三区天美传媒| 天天摸夜夜添狠狠添婷婷| 蜜臀av亚洲一区中文字幕| 国语自产精品视频在线看| 999精品视频在线观看播放| 日韩成人一级| 日韩三区在线观看| 天天爱天天操天天干| 97人人爽人人澡人人精品| 亚洲丝袜美腿综合| 免费久久久一本精品久久区| 国产原创在线观看| 人人妻人人澡人人爽人人精品| 色在线中文字幕| 国产欧美日韩视频在线观看| 国产精品成人观看视频免费| 国产精品国产精品国产专区| 性娇小13――14欧美| 欧美高清在线观看| 免费看特级毛片| 红桃成人av在线播放| 亚洲二区中文字幕| 亚洲国产欧美日韩在线| 神马电影网我不卡| 激情亚洲一区二区三区四区| www.激情网| 黄网站视频在线观看| 国产人成一区二区三区影院| 久久久久久九九| 日韩中文字幕影院| 国产精品18久久久| 亚洲一区二区三区777| 亚洲综合一区中| 日产国产高清一区二区三区| 日本欧美黄网站| 久久一区二区三区视频| 亚洲免费播放| 91精品国产成人| 精品成人免费视频| 一道本一区二区| 777777777亚洲妇女| 日韩av黄色片| av成人天堂| 青草青草久热精品视频在线观看| 日韩精品无码一区二区| 亚洲少妇诱惑| 日本久久久a级免费| 一级特黄免费视频| 蜜臀精品一区二区三区在线观看| 国产国语videosex另类| 少妇无套内谢久久久久| 久久国产免费看| 69174成人网| а√中文在线资源库| 懂色av一区二区夜夜嗨| 精品视频第一区| 欧美xxx.com| 中文字幕欧美日本乱码一线二线 | 中文字幕第四页| 午夜一区在线| 国产精品视频网址| 国产熟女一区二区三区四区| 国产精品羞羞答答xxdd | 精品久久久中文字幕| 中文日韩电影网站| 日本aⅴ在线观看| 亚洲国产高清一区| 国产精品高精视频免费| 99精品视频在线播放免费| 国产99久久久国产精品潘金| 九色一区二区| 麻豆91在线| 性做久久久久久免费观看欧美| 日韩精品视频一区二区在线观看| 91亚洲视频| 欧美变态tickle挠乳网站| 添女人荫蒂视频| 天天精品视频| 91极品女神在线| 2020国产精品极品色在线观看| 日本亚洲三级在线| 成人日韩av在线| 空姐吹箫视频大全| 欧美激情自拍偷拍| 天天做天天躁天天躁| 性xxxxfreexxxxx欧美丶| 欧美美女网站色| 国产精品无码在线| 性xxxx欧美老肥妇牲乱| 5566成人精品视频免费| 国产伦精品一区二区三区免.费| 91一区二区在线观看| 亚洲 欧洲 日韩| 欧美国产大片| 日韩免费高清视频| 在线观看日本黄色| 噜噜噜躁狠狠躁狠狠精品视频| 2022国产精品| 中文字幕在线视频区| 亚洲成av人在线观看| 最新免费av网址| 加勒比久久综合| 97超级碰碰碰久久久| 精品毛片在线观看| 国产精品第五页| 粉嫩虎白女毛片人体| 成人性生交大片免费看96| 日韩在线视频观看正片免费网站| 国产精品男女视频| 成人一级片在线观看| aaa免费在线观看| 78精品国产综合久久香蕉| 亚洲精品国产欧美| 久久精品www| 国产精品1区2区3区| 一区二区免费在线观看| 浪潮色综合久久天堂| 日韩精品在线视频观看| 国产真实乱偷精品视频| 国产黄色精品网站| 日韩精品一区二区三区电影| 久久人体av| 一区二区成人av| 尤物视频免费观看| 国产亚洲福利社区一区| 成年人视频在线免费| 蜜桃国内精品久久久久软件9| 久久理论片午夜琪琪电影网| www.色婷婷.com| 亚洲午夜精品在线| 一二三区视频在线观看| 亚洲图片在线| 91精品国产91久久久久青草| www在线视频| 欧美成人一区二区| 欧美精品99久久久| 国产99久久久国产精品免费看| 国产精品久久久久久久久电影网| 亚洲午夜免费| 久久人人爽人人爽人人片av高清| 精品久久久久久亚洲综合网站| 亚洲美女视频一区| 日本精品一二三| 亚洲国产一区二区三区a毛片 | 国产专区在线视频| 中文字幕一区二区三区四区久久 | 精品国模一区二区三区| 中文字幕欧美精品在线 | 亚洲精品美女网站| 好看的av在线| 国产精品污www在线观看| 久久黄色片网站| 欧美成人高清| 国产综合精品一区二区三区| 亚洲成人激情社区| 久久久999国产精品| 东京干手机福利视频| 图片区小说区国产精品视频| aaaaa一级片| 精品一区二区日韩| 2018国产在线| 日韩久久精品| 成人一区二区三区四区| 性欧美18~19sex高清播放| 中文字幕成人精品久久不卡| 国产999久久久| 欧美性xxxx极品hd欧美风情| 最新日韩免费视频| 成人亚洲一区二区一| 日韩无套无码精品| 欧美日韩免费| 欧美亚州在线观看| 午夜免费欧美电影| 日本电影亚洲天堂| 操你啦视频在线| 日韩精品在线观看一区| 国产免费黄色录像| 日韩欧美中文字幕在线观看| 四虎永久免费在线| 26uuu成人网一区二区三区| 亚洲天堂国产视频| 亚洲综合精品四区| 中国 免费 av| 国产成人短视频在线观看| 91欧美视频网站| 不卡一二三区| 欧美激情精品久久久久久黑人| 国产黄在线播放| 亚洲第一页中文字幕| 中文字幕人妻丝袜乱一区三区| 亚洲自拍偷拍图区| 久久日免费视频| 91色综合久久久久婷婷| 中文字幕一区二区三区四| 免费看的黄色欧美网站| 99久久99久久精品| 欧美aaaaaaaaaaaa| 欧美资源一区| 麻豆精品少妇| 国产福利一区二区三区在线观看| 欧美福利在线播放| 亚州成人av在线| 在线不卡日本v二区707| 最新国产精品拍自在线播放| 精品999视频| 亚洲国产精品va在看黑人| 国产黄a三级三级看三级| 欧美日韩一区中文字幕| 四虎影院在线免费播放| 精品欧美一区二区三区| 久久久久久久伊人| 亚洲乱码中文字幕综合| 少妇高潮一区二区三区喷水| 国产亚洲欧美激情| 日韩中文字幕电影| 91丝袜美腿高跟国产极品老师| 四虎成人免费视频| 国产精品18久久久久久久网站| 国产女同无遮挡互慰高潮91| 麻豆国产精品777777在线| 亚洲免费一级视频| 日本欧美一区二区在线观看| 男人舔女人下面高潮视频| 午夜一区不卡| 日韩欧美精品在线观看视频| 国产精品美女久久久| 黄色av网址在线播放| 亚洲精品激情| 黄色片网址在线观看| 亚洲久久在线| 成人免费观看视频在线观看| 免费久久99精品国产自在现线| 99精品视频在线看| 国产乱码精品| 日韩久久一级片| 日本不卡视频在线观看| 国产高清视频网站| 精品在线视频一区| 国产一级片中文字幕| 国产精品亚洲а∨天堂免在线| 香蕉网在线视频| 岛国一区二区三区| 国产肉体xxxx裸体784大胆| 2024国产精品| av男人的天堂av| 中文成人av在线| 特一级黄色录像| 亚洲一区国产视频| 无码人妻精品一区二区| 欧美午夜影院一区| 国产黄色一级大片| 亚洲国产欧美一区| 91视频在线观看| 色综合久久悠悠| 色戒汤唯在线观看| 国产一区视频在线播放| 亚洲国产视频二区| 麻豆蜜桃91| 天天色天天射综合网| 天堂…中文在线最新版在线| 日韩国产欧美在线观看| 欧美一级免费在线| 91视频xxxx| 国产suv一区二区三区| 欧美日韩性生活视频| 中文字幕欧美色图| 亚洲国产精品字幕| 在线a人片免费观看视频| 欧美理论片在线观看| 亚洲精品中文字幕| 亚洲一区二区三区xxx视频| 天美av一区二区三区久久| 一区二区三区视频在线播放| 亚洲国产欧美国产综合一区| 天天干天天草天天| 成人免费高清视频| 91精品一区二区三区蜜桃| 精品成人乱色一区二区| 国产一区二区三区三州| 日韩国产在线看| 超碰在线观看免费| 国产精品福利在线| 激情小说亚洲图片| 国产又粗又硬又长| 肉色丝袜一区二区| 日本不卡视频一区| 国产精品入口麻豆原神| 日本黄色片视频| 4hu四虎永久在线影院成人| 免费黄色片在线观看| 久久频这里精品99香蕉| av在线播放一区二区| 欧美日韩国产高清视频| 亚洲精品黄色| 2025中文字幕| 中文字幕一区二区三区视频| 国产一区二区视频免费| 亚洲精品久久久久久久久久久久久 | 日韩欧美一区二区一幕| 91精品国产综合久久精品性色| 能在线看的av| 97涩涩爰在线观看亚洲| 日韩精品视频一区二区三区| 一卡二卡3卡四卡高清精品视频| 久久久久国内| av鲁丝一区鲁丝二区鲁丝三区| 亚洲精品乱码久久久久久| 一区二区三区精| 中文字幕精品www乱入免费视频| 在线天堂资源| 精品一区在线播放| 99精品福利视频| 稀缺呦国内精品呦| 亚洲永久免费av| www.国产.com| 久久中文字幕在线视频| 亚洲精品aa| 亚洲精品视频一二三| 免费在线观看视频一区| 国产一级久久久久毛片精品| 色综合久久中文字幕| 毛片网站在线观看| 日韩av电影免费观看高清| 亚洲成aⅴ人片久久青草影院| 日韩欧美一区二| 91一区二区在线观看| 亚洲天堂一区在线| 亚洲女成人图区| 性欧美gay| 秋霞久久久久久一区二区| 亚洲精品久久久久久久蜜桃臀| 成人午夜免费视频| 久久久国产高清| 亚洲欧美中文字幕| 激情亚洲影院在线观看| 日韩欧美一区二区三区四区| 日本午夜精品一区二区三区电影| 精品手机在线视频| 91精品国产aⅴ一区二区| av电影免费在线观看| 99九九视频| 中文在线一区| 永久免费毛片在线观看| 欧美精品色综合| 97caopron在线视频| 国产精品区二区三区日本| 国产日韩视频| 99精品欧美一区二区| 欧美综合一区二区| 久久精品无码av| 国产亚洲精品一区二555| 欧美极品在线| 欧美在线观看视频免费| jlzzjlzz亚洲日本少妇| 国产嫩bbwbbw高潮| 在线播放亚洲激情| 亚洲福利影视| 中文字幕无码精品亚洲资源网久久| 99精品久久只有精品| 中文天堂在线播放| 欧美成人精品在线| 亚洲精品播放| 亚洲 国产 图片| 五月婷婷激情综合网| 超碰免费97在线观看| 亚洲www视频| 先锋影音久久久| 亚洲欧洲综合网| 精品久久久久久久一区二区蜜臀| 欧美xxx性| 国产激情在线看| 国产亚洲美州欧州综合国| 午夜精品久久久久久久91蜜桃| 日本精品视频在线观看| 欧美在线网址| 熟女少妇内射日韩亚洲| 日韩精品一区二区三区swag | 日韩成人综合| xxxwww国产| 欧美人成免费网站| 中文在线8资源库| 9l视频自拍9l视频自拍| 久久久五月婷婷| 国模人体一区二区| 国产自产女人91一区在线观看| 久久不射中文字幕|