OpenLens AI：清華推出的醫(yī)學(xué)研究全自主AI助手，開啟科研新紀元

發(fā)布于 2025-10-21 00:43

瀏覽

0收藏

在醫(yī)學(xué)研究領(lǐng)域，隨著數(shù)據(jù)量的爆炸式增長和研究復(fù)雜性的不斷提高，傳統(tǒng)的研究方式面臨著諸多挑戰(zhàn)。研究人員需要花費大量時間在文獻調(diào)研、實驗設(shè)計、數(shù)據(jù)分析等繁瑣的流程上，這極大地限制了科研效率和創(chuàng)新速度。為了解決這一問題，清華大學(xué)自動化系推出了一款名為OpenLens AI的全自主人工智能研究助手，它能夠模擬人類研究員的工作流程，實現(xiàn)醫(yī)學(xué)研究全流程的自動化，為醫(yī)學(xué)研究帶來了一場深刻的變革。

OpenLens AI：清華推出的醫(yī)學(xué)研究全自主AI助手，開啟科研新紀元-AI.x社區(qū)

一、項目概述

OpenLens AI是一個專為醫(yī)學(xué)研究設(shè)計的高度自主人工智能研究助手，由清華大學(xué)自動化系開發(fā)。它通過多智能體協(xié)作，能夠從文獻綜述、實驗設(shè)計、數(shù)據(jù)分析到論文生成的全流程自動化，將科研周期從“月級”縮短至“小時級”，極大地提升了醫(yī)學(xué)研究效率。該系統(tǒng)不僅支持處理健康信息學(xué)領(lǐng)域復(fù)雜的、多模態(tài)的數(shù)據(jù)，還提供了用戶友好的網(wǎng)頁版交互界面，用戶只需上傳數(shù)據(jù)集和簡單的研究想法，即可啟動研究項目。

OpenLens AI：清華推出的醫(yī)學(xué)研究全自主AI助手，開啟科研新紀元-AI.x社區(qū)

二、核心功能

（一）全流程自動化研究

OpenLens AI覆蓋醫(yī)學(xué)研究的各個階段，從研究靈感的產(chǎn)生到最終論文的撰寫，無需人工干預(yù)即可完成整個研究流程。它能夠自動檢索和綜合相關(guān)文獻，為研究提供全面且準確的理論基礎(chǔ)。根據(jù)用戶的研究問題，生成詳細的實驗計劃，并將其轉(zhuǎn)換為可執(zhí)行代碼。在數(shù)據(jù)分析方面，OpenLens AI能夠處理多種醫(yī)學(xué)數(shù)據(jù)，如時間序列、基因組信息等，生成結(jié)構(gòu)化、可解釋的洞察，并提供可視化、統(tǒng)計摘要和自然語言解釋。最終，它還能整合所有模塊的輸出，生成高質(zhì)量的科研論文，支持LaTeX格式，確保圖表質(zhì)量和格式一致性。

（二）多模態(tài)數(shù)據(jù)處理

該系統(tǒng)支持處理健康信息學(xué)領(lǐng)域復(fù)雜的、多模態(tài)的數(shù)據(jù)，能夠理解和生成多模態(tài)信息。這使得OpenLens AI能夠更好地適應(yīng)醫(yī)學(xué)研究中多樣化和復(fù)雜的數(shù)據(jù)類型，為研究人員提供更全面和深入的分析結(jié)果。

（三）用戶友好交互

OpenLens AI提供網(wǎng)頁版應(yīng)用，用戶可以通過上傳數(shù)據(jù)集和簡單的研究想法啟動研究項目。這種用戶友好的交互方式降低了使用門檻，使研究人員能夠更輕松地利用AI技術(shù)進行醫(yī)學(xué)研究。

（四）研究流程優(yōu)化

通過自動化執(zhí)行繁瑣的研究任務(wù)，OpenLens AI提高了研究效率和質(zhì)量。它能夠快速地完成文獻調(diào)研、實驗方案制定、數(shù)據(jù)處理與分析等任務(wù)，大大縮短了科研周期。同時，系統(tǒng)還內(nèi)置了嚴格的質(zhì)量控制流程，確保研究結(jié)果的準確性和可靠性。

OpenLens AI：清華推出的醫(yī)學(xué)研究全自主AI助手，開啟科研新紀元-AI.x社區(qū)

三、技術(shù)揭秘

（一）多智能體架構(gòu)

OpenLens AI采用了模塊化多智能體系統(tǒng)架構(gòu)，通過智能體之間的協(xié)同工作來完成復(fù)雜的醫(yī)學(xué)研究任務(wù)。該系統(tǒng)包括以下幾個核心智能體：

主管模塊（Supervisor）：作為全局協(xié)調(diào)者，將用戶查詢分解為結(jié)構(gòu)化子任務(wù)，確保整個研究流程的透明度和可解釋性。
文獻綜述者（Literature Reviewer）：構(gòu)建自主知識探索管道，用基于ReAct的推理框架，檢索、綜合相關(guān)文獻。
數(shù)據(jù)分析者（Data Analyzer）：協(xié)調(diào)多階段數(shù)據(jù)處理流程，將原始醫(yī)學(xué)數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化、可解釋的洞察。
編碼器（Coder）：將高級實驗計劃轉(zhuǎn)換為可執(zhí)行代碼，通過視覺語言模型評估輸出質(zhì)量。
LaTeX寫作者（LaTeX Writer）：整合所有前序模塊的輸出，生成出版級的科學(xué)論文。

（二）質(zhì)量控制機制

OpenLens AI集成了多種質(zhì)量控制機制，以確保研究結(jié)果的可靠性和可復(fù)現(xiàn)性。

學(xué)術(shù)嚴謹性檢查：自動驗證實驗方法的合理性，檢測數(shù)據(jù)泄露和不當(dāng)性能指標等常見陷阱。
證據(jù)可追溯性檢查：將每個研究聲明鏈接到基礎(chǔ)證據(jù)，生成結(jié)構(gòu)化可追溯性報告，確保研究的透明度。
文獻檢查：驗證所有引用的參考文獻，確認元數(shù)據(jù)的準確性，刪除不可驗證的條目，保證學(xué)術(shù)背景的可靠性。
視覺語言反饋：在關(guān)鍵階段評估圖表質(zhì)量，提供感知反饋，增強結(jié)果的可讀性和科學(xué)有效性。

（三）模塊化設(shè)計

OpenLens AI的模塊化設(shè)計使得每個智能體專注于特定任務(wù)，通過標準化接口協(xié)同工作，提高了系統(tǒng)的靈活性和可擴展性。這種設(shè)計不僅便于系統(tǒng)的維護和升級，還允許研究人員根據(jù)需要添加新的智能體或工具。

四、應(yīng)用場景

（一）疾病預(yù)測建模

OpenLens AI可以基于歷史患者數(shù)據(jù)開發(fā)疾病預(yù)測模型，例如預(yù)測急性腎損傷（AKI）的精度。通過自動化的數(shù)據(jù)分析和模型構(gòu)建，研究人員能夠快速得到可靠的預(yù)測結(jié)果，為疾病的早期診斷和治療提供支持。

（二）藥物相互作用研究

在臨床醫(yī)學(xué)中，藥物相互作用是影響治療效果和患者安全的關(guān)鍵因素之一。OpenLens AI通過其先進的數(shù)據(jù)分析能力，能夠深入分析最新的藥物相互作用研究成果，為臨床醫(yī)生和研究人員提供關(guān)鍵的決策支持。

（三）醫(yī)學(xué)圖像分析

在醫(yī)學(xué)圖像分析領(lǐng)域，OpenLens AI可以處理多種類型的醫(yī)學(xué)圖像數(shù)據(jù)，如X光、CT、MRI等。它能夠自動識別圖像中的病變區(qū)域，進行圖像分割和特征提取，并生成詳細的分析報告。這有助于醫(yī)生更快速、準確地進行疾病診斷，提高醫(yī)療效率和質(zhì)量。

（四）基因組學(xué)研究

對于基因組學(xué)研究，OpenLens AI能夠處理復(fù)雜的基因序列數(shù)據(jù)，進行基因表達分析、基因關(guān)聯(lián)研究等。它可以幫助研究人員發(fā)現(xiàn)新的基因標志物，為個性化醫(yī)療和精準醫(yī)學(xué)提供支持。

（五）臨床試驗設(shè)計

OpenLens AI可以輔助設(shè)計臨床試驗方案，包括樣本量計算、實驗組和對照組的分配等。它能夠根據(jù)研究目標和數(shù)據(jù)特性，生成最優(yōu)的試驗設(shè)計，提高臨床試驗的科學(xué)性和可靠性。

五、快速使用

（一）環(huán)境準備

在開始使用OpenLens AI之前，需要確保你的系統(tǒng)滿足以下環(huán)境要求：

Python 3.9或更高版本：OpenLens AI基于Python開發(fā)，需要Python環(huán)境支持。
Docker：用于容器化部署，確保環(huán)境的一致性和隔離性。
Git：用于克隆項目代碼。
API密鑰：需要以下API密鑰：
LLM服務(wù)（如DeepSeek、OpenAI、Qwen等）的API密鑰。
Tavily搜索API的API密鑰。

（二）安裝步驟

1. 克隆項目代碼

git clone https://github.com/jarrycyx/openlens-ai.git
cd openlens-ai

2. 安裝依賴

# 如果需要可視化工作流，安裝graphviz：
# sudo apt-get install graphviz graphviz-dev
# pip install pygraphviz
conda create -n py312 pythnotallow=3.12 # 或使用uv/venv
conda activate py312
pip install --upgrade pip
pip install -e .

3. 配置環(huán)境變量

cp .env.example .env
# 編輯.env文件，填入你的API密鑰和模型設(shè)置

在`.env`文件中，需要配置以下內(nèi)容：

MODEL="glm-4.5-air" # 主語言模型
CODE_MODEL="glm-4.5-air" # 代碼相關(guān)任務(wù)的語言模型
VISION_MODEL="glm-4.1v-9b-thinking" # 圖像分析任務(wù)的視覺模型
OPENAI_API_KEY="<YOUR API KEY>" # LLM服務(wù)的API密鑰
BASE_URL="https://cloud.infini-ai.com/maas/v1/" # 模型API服務(wù)的基地址
RERANK_MODEL="bge-reranker-v2-m3" # 提高搜索結(jié)果相關(guān)性的重排序模型
RERANK_API_KEY="<YOUR API KEY>" # 重排序模型的API密鑰
RERANK_BASE_URL="https://cloud.infini-ai.com/maas/v1/" # 重排序模型API服務(wù)的基地址
TAVILY_API_KEY="<YOUR API KEY>" # Tavily搜索服務(wù)的API密鑰
MAX_CONTEXT_TOKEN_CNT=32000 # 正常操作中上下文允許的最大token數(shù)
MAX_CONTEXT_TOKEN_CNT_LARGE=96000 # 大操作中上下文允許的最大token數(shù)
LITERATURE_SEARCH_MIN_TOOL_CALL=10 # 文獻搜索的最小工具調(diào)用次數(shù)
MAX_TOOL_TOKEN_CNT=2000 # 工具響應(yīng)允許的最大token數(shù)
OPENHANDS_MAX_ITER=100 # OpenHands代理執(zhí)行的最大迭代次數(shù)
MAX_SUBTASK_REDO=2 # 子任務(wù)的最大重試次數(shù)
MAX_LATEX_POLISH_ROUND=2 # LaTeX文檔潤色的最大輪數(shù)
DOCKER_NAME=agent-med-cpu # 代理環(huán)境使用的Docker容器名稱

4. 確保Docker安裝

docker --version
# 拉取Docker鏡像
ALIYUN_REMOTE_DOCKER_NAME=crpi-hbt8nkulkjqjqkie.cn-hangzhou.personal.cr.aliyuncs.com/cyx-docker/openlens-ai:cpu-latest
docker pull $ALIYUN_REMOTE_DOCKER_NAME
docker tag $ALIYUN_REMOTE_DOCKER_NAME openlens-ai:cpu-latest
# 或者構(gòu)建Docker鏡像
bash openlens_ai/tools/openhands_configs/build_docker_cpu.sh

（三）運行應(yīng)用

1. 命令行界面

通過命令行界面運行OpenLens AI，可以使用以下命令：

python -m openlens_ai.build_graph --question "Your research question" --dataset-path "path/to/dataset" --thread-id "Unique id for this job"

例如：

python -m openlens_ai.build_graph --question "What is the prediction precision of AKI based on historical 2 day data?" --dataset-path "datasets/mimic" --thread-id "test_000"

2. 交互式Web界面

通過交互式Web界面運行OpenLens AI，可以使用以下命令：

streamlit run start_app.py

然后在瀏覽器中打開`http://localhost:8501`，即可訪問交互式界面。

六、結(jié)語

OpenLens AI作為一款專為醫(yī)學(xué)研究設(shè)計的全自主人工智能研究助手，以其強大的功能和高效的性能，為醫(yī)學(xué)研究領(lǐng)域帶來了全新的研究模式和思路。它不僅能夠顯著提高研究效率，還能幫助研究人員更深入地探索醫(yī)學(xué)問題，推動醫(yī)學(xué)研究的快速發(fā)展。