OpenLens AI:清華推出的醫(yī)學(xué)研究全自主AI助手,開啟科研新紀元
在醫(yī)學(xué)研究領(lǐng)域,隨著數(shù)據(jù)量的爆炸式增長和研究復(fù)雜性的不斷提高,傳統(tǒng)的研究方式面臨著諸多挑戰(zhàn)。研究人員需要花費大量時間在文獻調(diào)研、實驗設(shè)計、數(shù)據(jù)分析等繁瑣的流程上,這極大地限制了科研效率和創(chuàng)新速度。為了解決這一問題,清華大學(xué)自動化系推出了一款名為OpenLens AI的全自主人工智能研究助手,它能夠模擬人類研究員的工作流程,實現(xiàn)醫(yī)學(xué)研究全流程的自動化,為醫(yī)學(xué)研究帶來了一場深刻的變革。

一、項目概述
OpenLens AI是一個專為醫(yī)學(xué)研究設(shè)計的高度自主人工智能研究助手,由清華大學(xué)自動化系開發(fā)。它通過多智能體協(xié)作,能夠從文獻綜述、實驗設(shè)計、數(shù)據(jù)分析到論文生成的全流程自動化,將科研周期從“月級”縮短至“小時級”,極大地提升了醫(yī)學(xué)研究效率。該系統(tǒng)不僅支持處理健康信息學(xué)領(lǐng)域復(fù)雜的、多模態(tài)的數(shù)據(jù),還提供了用戶友好的網(wǎng)頁版交互界面,用戶只需上傳數(shù)據(jù)集和簡單的研究想法,即可啟動研究項目。

二、核心功能
(一)全流程自動化研究
OpenLens AI覆蓋醫(yī)學(xué)研究的各個階段,從研究靈感的產(chǎn)生到最終論文的撰寫,無需人工干預(yù)即可完成整個研究流程。它能夠自動檢索和綜合相關(guān)文獻,為研究提供全面且準確的理論基礎(chǔ)。根據(jù)用戶的研究問題,生成詳細的實驗計劃,并將其轉(zhuǎn)換為可執(zhí)行代碼。在數(shù)據(jù)分析方面,OpenLens AI能夠處理多種醫(yī)學(xué)數(shù)據(jù),如時間序列、基因組信息等,生成結(jié)構(gòu)化、可解釋的洞察,并提供可視化、統(tǒng)計摘要和自然語言解釋。最終,它還能整合所有模塊的輸出,生成高質(zhì)量的科研論文,支持LaTeX格式,確保圖表質(zhì)量和格式一致性。
(二)多模態(tài)數(shù)據(jù)處理
該系統(tǒng)支持處理健康信息學(xué)領(lǐng)域復(fù)雜的、多模態(tài)的數(shù)據(jù),能夠理解和生成多模態(tài)信息。這使得OpenLens AI能夠更好地適應(yīng)醫(yī)學(xué)研究中多樣化和復(fù)雜的數(shù)據(jù)類型,為研究人員提供更全面和深入的分析結(jié)果。
(三)用戶友好交互
OpenLens AI提供網(wǎng)頁版應(yīng)用,用戶可以通過上傳數(shù)據(jù)集和簡單的研究想法啟動研究項目。這種用戶友好的交互方式降低了使用門檻,使研究人員能夠更輕松地利用AI技術(shù)進行醫(yī)學(xué)研究。
(四)研究流程優(yōu)化
通過自動化執(zhí)行繁瑣的研究任務(wù),OpenLens AI提高了研究效率和質(zhì)量。它能夠快速地完成文獻調(diào)研、實驗方案制定、數(shù)據(jù)處理與分析等任務(wù),大大縮短了科研周期。同時,系統(tǒng)還內(nèi)置了嚴格的質(zhì)量控制流程,確保研究結(jié)果的準確性和可靠性。

三、技術(shù)揭秘
(一)多智能體架構(gòu)
OpenLens AI采用了模塊化多智能體系統(tǒng)架構(gòu),通過智能體之間的協(xié)同工作來完成復(fù)雜的醫(yī)學(xué)研究任務(wù)。該系統(tǒng)包括以下幾個核心智能體:
- 主管模塊(Supervisor):作為全局協(xié)調(diào)者,將用戶查詢分解為結(jié)構(gòu)化子任務(wù),確保整個研究流程的透明度和可解釋性。
- 文獻綜述者(Literature Reviewer):構(gòu)建自主知識探索管道,用基于ReAct的推理框架,檢索、綜合相關(guān)文獻。
- 數(shù)據(jù)分析者(Data Analyzer):協(xié)調(diào)多階段數(shù)據(jù)處理流程,將原始醫(yī)學(xué)數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化、可解釋的洞察。
- 編碼器(Coder):將高級實驗計劃轉(zhuǎn)換為可執(zhí)行代碼,通過視覺語言模型評估輸出質(zhì)量。
- LaTeX寫作者(LaTeX Writer):整合所有前序模塊的輸出,生成出版級的科學(xué)論文。
(二)質(zhì)量控制機制
OpenLens AI集成了多種質(zhì)量控制機制,以確保研究結(jié)果的可靠性和可復(fù)現(xiàn)性。
- 學(xué)術(shù)嚴謹性檢查:自動驗證實驗方法的合理性,檢測數(shù)據(jù)泄露和不當(dāng)性能指標等常見陷阱。
- 證據(jù)可追溯性檢查:將每個研究聲明鏈接到基礎(chǔ)證據(jù),生成結(jié)構(gòu)化可追溯性報告,確保研究的透明度。
- 文獻檢查:驗證所有引用的參考文獻,確認元數(shù)據(jù)的準確性,刪除不可驗證的條目,保證學(xué)術(shù)背景的可靠性。
- 視覺語言反饋:在關(guān)鍵階段評估圖表質(zhì)量,提供感知反饋,增強結(jié)果的可讀性和科學(xué)有效性。
(三)模塊化設(shè)計
OpenLens AI的模塊化設(shè)計使得每個智能體專注于特定任務(wù),通過標準化接口協(xié)同工作,提高了系統(tǒng)的靈活性和可擴展性。這種設(shè)計不僅便于系統(tǒng)的維護和升級,還允許研究人員根據(jù)需要添加新的智能體或工具。
四、應(yīng)用場景
(一)疾病預(yù)測建模
OpenLens AI可以基于歷史患者數(shù)據(jù)開發(fā)疾病預(yù)測模型,例如預(yù)測急性腎損傷(AKI)的精度。通過自動化的數(shù)據(jù)分析和模型構(gòu)建,研究人員能夠快速得到可靠的預(yù)測結(jié)果,為疾病的早期診斷和治療提供支持。
(二)藥物相互作用研究
在臨床醫(yī)學(xué)中,藥物相互作用是影響治療效果和患者安全的關(guān)鍵因素之一。OpenLens AI通過其先進的數(shù)據(jù)分析能力,能夠深入分析最新的藥物相互作用研究成果,為臨床醫(yī)生和研究人員提供關(guān)鍵的決策支持。
(三)醫(yī)學(xué)圖像分析
在醫(yī)學(xué)圖像分析領(lǐng)域,OpenLens AI可以處理多種類型的醫(yī)學(xué)圖像數(shù)據(jù),如X光、CT、MRI等。它能夠自動識別圖像中的病變區(qū)域,進行圖像分割和特征提取,并生成詳細的分析報告。這有助于醫(yī)生更快速、準確地進行疾病診斷,提高醫(yī)療效率和質(zhì)量。
(四)基因組學(xué)研究
對于基因組學(xué)研究,OpenLens AI能夠處理復(fù)雜的基因序列數(shù)據(jù),進行基因表達分析、基因關(guān)聯(lián)研究等。它可以幫助研究人員發(fā)現(xiàn)新的基因標志物,為個性化醫(yī)療和精準醫(yī)學(xué)提供支持。
(五)臨床試驗設(shè)計
OpenLens AI可以輔助設(shè)計臨床試驗方案,包括樣本量計算、實驗組和對照組的分配等。它能夠根據(jù)研究目標和數(shù)據(jù)特性,生成最優(yōu)的試驗設(shè)計,提高臨床試驗的科學(xué)性和可靠性。
五、快速使用
(一)環(huán)境準備
在開始使用OpenLens AI之前,需要確保你的系統(tǒng)滿足以下環(huán)境要求:
- Python 3.9或更高版本:OpenLens AI基于Python開發(fā),需要Python環(huán)境支持。
- Docker:用于容器化部署,確保環(huán)境的一致性和隔離性。
- Git:用于克隆項目代碼。
- API密鑰:需要以下API密鑰:
- LLM服務(wù)(如DeepSeek、OpenAI、Qwen等)的API密鑰。
- Tavily搜索API的API密鑰。
(二)安裝步驟
1. 克隆項目代碼
git clone https://github.com/jarrycyx/openlens-ai.git
cd openlens-ai2. 安裝依賴
# 如果需要可視化工作流,安裝graphviz:
# sudo apt-get install graphviz graphviz-dev
# pip install pygraphviz
conda create -n py312 pythnotallow=3.12 # 或使用uv/venv
conda activate py312
pip install --upgrade pip
pip install -e .3. 配置環(huán)境變量
cp .env.example .env
# 編輯.env文件,填入你的API密鑰和模型設(shè)置在`.env`文件中,需要配置以下內(nèi)容:
MODEL="glm-4.5-air" # 主語言模型
CODE_MODEL="glm-4.5-air" # 代碼相關(guān)任務(wù)的語言模型
VISION_MODEL="glm-4.1v-9b-thinking" # 圖像分析任務(wù)的視覺模型
OPENAI_API_KEY="<YOUR API KEY>" # LLM服務(wù)的API密鑰
BASE_URL="https://cloud.infini-ai.com/maas/v1/" # 模型API服務(wù)的基地址
RERANK_MODEL="bge-reranker-v2-m3" # 提高搜索結(jié)果相關(guān)性的重排序模型
RERANK_API_KEY="<YOUR API KEY>" # 重排序模型的API密鑰
RERANK_BASE_URL="https://cloud.infini-ai.com/maas/v1/" # 重排序模型API服務(wù)的基地址
TAVILY_API_KEY="<YOUR API KEY>" # Tavily搜索服務(wù)的API密鑰
MAX_CONTEXT_TOKEN_CNT=32000 # 正常操作中上下文允許的最大token數(shù)
MAX_CONTEXT_TOKEN_CNT_LARGE=96000 # 大操作中上下文允許的最大token數(shù)
LITERATURE_SEARCH_MIN_TOOL_CALL=10 # 文獻搜索的最小工具調(diào)用次數(shù)
MAX_TOOL_TOKEN_CNT=2000 # 工具響應(yīng)允許的最大token數(shù)
OPENHANDS_MAX_ITER=100 # OpenHands代理執(zhí)行的最大迭代次數(shù)
MAX_SUBTASK_REDO=2 # 子任務(wù)的最大重試次數(shù)
MAX_LATEX_POLISH_ROUND=2 # LaTeX文檔潤色的最大輪數(shù)
DOCKER_NAME=agent-med-cpu # 代理環(huán)境使用的Docker容器名稱4. 確保Docker安裝
docker --version
# 拉取Docker鏡像
ALIYUN_REMOTE_DOCKER_NAME=crpi-hbt8nkulkjqjqkie.cn-hangzhou.personal.cr.aliyuncs.com/cyx-docker/openlens-ai:cpu-latest
docker pull $ALIYUN_REMOTE_DOCKER_NAME
docker tag $ALIYUN_REMOTE_DOCKER_NAME openlens-ai:cpu-latest
# 或者構(gòu)建Docker鏡像
bash openlens_ai/tools/openhands_configs/build_docker_cpu.sh(三)運行應(yīng)用
1. 命令行界面
通過命令行界面運行OpenLens AI,可以使用以下命令:
python -m openlens_ai.build_graph --question "Your research question" --dataset-path "path/to/dataset" --thread-id "Unique id for this job"例如:
python -m openlens_ai.build_graph --question "What is the prediction precision of AKI based on historical 2 day data?" --dataset-path "datasets/mimic" --thread-id "test_000"2. 交互式Web界面
通過交互式Web界面運行OpenLens AI,可以使用以下命令:
streamlit run start_app.py然后在瀏覽器中打開`http://localhost:8501`,即可訪問交互式界面。
六、結(jié)語
OpenLens AI作為一款專為醫(yī)學(xué)研究設(shè)計的全自主人工智能研究助手,以其強大的功能和高效的性能,為醫(yī)學(xué)研究領(lǐng)域帶來了全新的研究模式和思路。它不僅能夠顯著提高研究效率,還能幫助研究人員更深入地探索醫(yī)學(xué)問題,推動醫(yī)學(xué)研究的快速發(fā)展。
項目地址
項目官網(wǎng):??https://openlens.icu/??
GitHub倉庫:??https://github.com/jarrycyx/openlens-ai??
技術(shù)論文:???https://arxiv.org/pdf/2509.14778??
本文轉(zhuǎn)載自???小兵的AI視界???,作者:AGI小兵

















