不確定知識圖譜(UKGs)增強中醫(yī)藥大模型:藥食同源個性化膳食推薦的智能化新突破
圖片
Leveraging Retrieval-Augmented Large Language Models for Dietary Recommendations With Traditional Chinese Medicine's Medicine Food Homology: Algorithm Development and Validation
文章摘要
研究團隊開發(fā)了Yaoshi-RAG框架,通過構建藥食同源知識圖譜和檢索增強生成技術,顯著提升了大語言模型在中醫(yī)藥食同源膳食推薦方面的準確性和可靠性,為傳統(tǒng)中醫(yī)智慧與現(xiàn)代AI技術的融合開辟了新路徑。
原文PDF鏈接: https://t.zsxq.com/wiQZ5
正文
引言:傳統(tǒng)智慧遇見人工智能
中醫(yī)藥學中的"藥食同源"理念歷史悠久,強調某些物質既可作為營養(yǎng)食品,又可作為治療藥物,這一古老哲學在現(xiàn)代醫(yī)療保健系統(tǒng)中獲得了廣泛認可。然而,藥食同源原理的實際應用在很大程度上依賴于中醫(yī)專家的知識和人工解釋,這給自動化藥食同源膳食推薦帶來了挑戰(zhàn)。
雖然大語言模型(LLMs)在醫(yī)療決策支持方面顯示出潛力,但它們在中醫(yī)藥等專業(yè)領域的表現(xiàn)往往受到幻覺和領域知識缺乏的限制。為了克服這些局限性,研究團隊提出了一個創(chuàng)新的解決方案:將不確定知識圖譜(UKGs)與大語言模型通過檢索增強生成(RAG)技術相結合,實現(xiàn)了藥食同源原理的結構化和忠實表示,同時增強了LLMs理解中醫(yī)藥知識固有不確定性和異質性的能力。
研究方法與技術創(chuàng)新
Yaoshi-RAG框架概述
本研究提出的Yaoshi-RAG框架是一個專門設計的RAG框架,旨在增強大語言模型基于藥食同源原理生成循證膳食推薦的能力。該框架包含兩個核心模塊:

- 知識圖譜構建模塊:通過多源數(shù)據編譯綜合語料庫,使用LLM驅動的開放信息提取技術構建藥食同源知識圖譜,并應用不確定知識圖譜推理來測量提取三元組的置信度并完成缺失的三元組?。

- 檢索增強生成模塊:在給定用戶查詢時,框架首先識別并鏈接查詢實體到藥食同源知識圖譜,然后構建關系路徑以便檢索推理路徑,隨后通過后處理(包括排序和過濾)來提取最相關的推理路徑,從而提高檢索準確性? ?。
數(shù)據來源與知識圖譜構建
研究團隊系統(tǒng)性地構建了一個包含1359個相關文檔的語料庫,涵蓋古典文獻、現(xiàn)代中醫(yī)文獻、食品和草藥信息、監(jiān)管文件、研究論文和中醫(yī)方劑等多個來源。具體分布如下:
- 古典文獻:75篇
- 現(xiàn)代中醫(yī)文獻:228篇
- 食品和草藥信息:400篇
- 監(jiān)管文件:42篇
- 研究論文:432篇
- 中醫(yī)方劑:182篇

[表格1:1359個文檔的統(tǒng)計分布]
為了提高實體-關系三元組提取的效率和準確性,每個文檔被分割成300個標記的段落,然后通過精心設計的提示輸入到LLMs中,以解決代詞指代問題并過濾掉無關內容。
實驗結果與性能評估
知識圖譜構建成果
構建完成的藥食同源知識圖譜包含24,984個實體、22種關系和29,292個三元組。這一規(guī)模龐大的知識圖譜為后續(xù)的檢索增強生成提供了豐富的知識基礎。
模型性能比較
研究團隊評估了多個主流大語言模型,包括GPT-4、LLaMA2-Chat-7B、Qwen2.5-7B和DeepSeek-R1。實驗結果表明,集成藥食同源知識圖譜顯著提高了LLMs的性能,平均Hits@1提升14.5%,F(xiàn)1分數(shù)提升8.7%。
在所有評估的LLMs中,DeepSeek-R1取得了最佳性能,Hits@1達到84.2%,F(xiàn)1分數(shù)達到71.5%。人工評估進一步驗證了這些結果,確認Yaoshi-RAG在所有評估質量維度上始終優(yōu)于基線模型。
評估方法
研究采用了自動化評估和人工評估相結合的方式。自動化評估使用了Hits@1和F1分數(shù)兩個指標:
- Hits@1測量排名最高的預測推薦與真實答案匹配的查詢比例
- F1分數(shù)捕獲精確度和召回率的調和平均值,提供平衡的評估
人工評估則彌補了自動化評估的局限性,特別是在評估推薦的有效性、用戶接受度和可解釋性方面。
答案生成與提示工程
研究團隊使用提示工程技術來提高LLM生成答案的準確性和相關性。提示模板包含四個關鍵組件:
- 任務規(guī)范
- 用戶查詢
- 檢索到的推理路徑
- 食品和菜品實體的屬性

這種結構化的提示促進了外部知識的整合,提高了LLMs對藥食同源原理的理解,支持生成更準確的響應。

技術優(yōu)勢與創(chuàng)新點
關鍵貢獻
本研究的主要貢獻包括:
- 一個集成框架,利用知識圖譜增強的LLMs生成個性化和循證的藥食同源膳食推薦
- 一種LLM驅動的開放信息提取方法,用于從異構多源數(shù)據自動構建專門針對中醫(yī)藥食同源的不確定知識圖譜
- 對幾種主流LLMs在藥食同源膳食推薦生成方面的系統(tǒng)評估
- 實驗結果和案例研究,證明所提出框架在提供個性化和專業(yè)藥食同源膳食推薦方面的能力
技術創(chuàng)新
通過編碼領域特定知識并解決與藥食同源相關的不確定性,藥食同源知識圖譜使LLMs能夠提供更個性化、循證和可靠的膳食推薦。通過測量置信度分數(shù),可以更好地管理藥食同源原理中的固有不確定性,優(yōu)先考慮可靠的關系,同時減輕不太可信關系的影響。
研究局限性與未來方向
當前局限性
研究團隊誠實地承認了幾個局限性:
- 藥食同源知識圖譜使用開放信息提取構建,可能引入不準確性,無法涵蓋藥食同源原理的所有知識
- 研究沒有專門針對關系路徑生成對LLMs進行微調,這可能限制了框架的檢索有效性,特別是對于涉及多種癥狀或條件的復雜案例
未來發(fā)展計劃
研究團隊計劃在未來重點關注以下幾個方向:
- 實施更有效的知識提取方法
- 通過額外的藥食同源文獻擴展知識圖譜
- 探索優(yōu)化的檢索策略
- 微調開源LLMs以進一步提高生成膳食推薦的準確性和可靠性
結論與意義
本研究展示了Yaoshi-RAG這一新框架,通過整合不確定知識圖譜增強了LLMs在生成藥食同源膳食推薦方面的能力。該框架利用多步LLM調用進行開放信息提取,自動構建藥食同源知識圖譜,結合不確定知識圖譜推理來測量現(xiàn)有三元組的置信度并完成缺失的三元組。
實驗評估證明,DeepSeek-R1是藥食同源膳食推薦生成的最佳基礎模型。該框架促進了適應個人健康狀況和癥狀需求的膳食推薦,同時考慮多樣化的食材和菜品,并提供基于藥食同源原理的全面解釋。
這項研究不僅為傳統(tǒng)中醫(yī)智慧與先進語言模型的結合提供了有效途徑,還為個性化醫(yī)療保健和精準營養(yǎng)領域的發(fā)展做出了重要貢獻。通過將古老的中醫(yī)藥食同源理念與現(xiàn)代人工智能技術相結合,為實現(xiàn)更加智能化、個性化的健康管理開辟了新的可能性。
本文轉載自??知識圖譜科技??,作者:KGGPT

















