精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型也能“知其然知其所以然”——看SimRAG如何通過提問提升自己 精華

發布于 2024-10-30 14:52
瀏覽
0收藏

1. 引言部分

今天要給大家分享一篇很有意思的論文。這篇論文主要解決的是什么問題呢?就是如何讓大語言模型在專業領域,比如醫療、科學領域表現得更好。

你們有沒有想過,雖然現在的ChatGPT、Claude這些大模型很厲害,但在專業領域它們的表現還是不夠好,對吧?比如說,當我們問它一個關于"支氣管擴張"的專業問題時,它可能就答不太準確了。這是為什么呢?

主要原因是這樣的 - 這些專業領域有很多特殊的知識和術語,普通模型可能理解得不夠深入。就像我們普通人看醫學論文一樣,沒有專業背景的話,很多術語都看不懂,是不是?

那么現在有一個很好的技術叫RAG(檢索增強生成),這個技術的原理其實很像我們人類查資料的過程。比如當我們要回答一個問題時,會先去查找相關的資料,然后再基于這些資料來回答,對不對?RAG就是讓模型也這樣做 - 先檢索相關文檔,再基于這些文檔來回答問題。

但是呢,這里又出現了一個新的問題。就算用了RAG技術,在專業領域的表現還是不夠理想。這是為什么呢?因為模型可能不太懂得如何正確使用檢索到的專業文獻。就像一個醫學院新生,即使給他一堆醫學文獻,他也不一定能準確理解和應用這些知識,對吧?那現在已經有哪些解決方案呢?主要有這么幾種:

  1. 在專業文獻上繼續預訓練,就像讓模型多讀點專業書籍
  2. 用專業領域的指令來微調模型
  3. 用GPT-4這樣的強大模型來生成訓練數據

但這些方法都有什么問題呢?

  • 第一個方法成本很高,就像要付很多學費一樣
  • 第二個方法需要大量標注數據,這個在專業領域特別難獲取
  • 第三個方法不但貴,而且在一些涉及隱私的領域(比如醫療)可能還有安全隱患

這就是為什么我們需要一個更好的解決方案。那作者是怎么解決的呢?他們提出了一個叫SimRAG的方法。這個方法最有趣的地方是它讓模型同時學會了兩個能力:一個是回答問題,一個是提出問題。

你們覺得為什么要讓模型同時具備這兩種能力呢?這就像我們學習一樣,不僅要會答題,還要會出題,對吧。只有真正理解了知識,才能提出好的問題。這兩個能力相輔相成,可以幫助模型更好地理解專業知識。

2. 相關工作

在講具體方法之前,我們先來了解一下相關的研究工作。這就像我們做研究之前,要先知道前人都做了什么。首先是RAG技術。它是怎么工作的呢?就像我們寫論文要先查文獻一樣,RAG也是先去找相關的資料,然后再基于這些資料來回答問題。近期有很多研究者在改進這個技術,比如說:

  • 有的在研究如何找到更相關的文檔,就像圖書館員幫我們找最合適的參考資料一樣
  • 有的在研究如何過濾掉無關的內容,就像我們寫論文時要去掉不相關的引用一樣
  • 還有的在研究如何讓模型更好地理解和使用這些資料

第二個重要的技術叫自訓練。這個概念聽起來可能有點陌生,但其實很好理解。它就像是“教學相長”的過程 - 模型一邊學習,一邊用學到的知識來教自己。具體怎么做呢?

  • 先讓模型學習一些基礎知識
  • 然后讓它自己生成一些訓練數據
  • 再用這些數據來提升自己

但這個過程也有個問題,就像我們自學時可能會學到一些錯誤的知識一樣,模型生成的訓練數據也可能有錯誤。所以研究者們想了很多辦法來解決這個問題:

  • 有的會仔細篩選生成的數據,只用質量好的
  • 有的會給不同的數據分配不同的重要性

第三個是領域特定的大語言模型。現在已經有很多專門針對特定領域的模型了,比如醫療領域的、法律領域的。他們是怎么訓練這些模型的呢?主要有兩種方式:

  • 一種是讓模型不斷地讀專業文獻,就像醫學生要不斷學習專業知識一樣
  • 另一種是用特定領域的問題來訓練模型,就像針對性地做習題

但這些方法都有什么問題呢?

  • 成本太高了,就像請個一對一家教一樣貴
  • 效率不夠高,投入了很多資源可能效果卻不理想
  • 有些方法還依賴GPT-4這樣的大模型來生成訓練數據,這就更貴了

現在大家應該能明白為什么需要一個新的解決方案了吧。就是因為現有的這些方法都不夠完美。

3. SimRAG的具體方法

接下來要講的是本文最核心的部分了 - SimRAG具體是怎么工作的。這個方法很巧妙,分為兩個主要階段。

模型也能“知其然知其所以然”——看SimRAG如何通過提問提升自己-AI.x社區

3.1 第一階段:基礎訓練

第一階段是做什么呢?就是先教會模型一些基本功。這就像我們學習任何新東西一樣,要先掌握基礎知識,對吧。具體來說,要讓模型學習三類知識:

  1. 首先是基本的指令理解能力。這就像我們要先學會聽懂老師的話一樣。用了哪些訓練數據呢?

OpenAssistant的數據

Dolly的數據

SODA的數據

這些數據都是幫助模型理解人類指令的。

  1. 然后是問答能力的訓練。用了很多問答數據集,比如:

Squad數據集,這是關于閱讀理解的

DROP數據集,這需要一些推理能力

NQ(自然問題)數據集,這些都是真實用戶的提問

這就像給學生做各種類型的習題,幫助他們提高解題能力。

  1. 最后是檢索相關的訓練。這個訓練分兩部分:

教模型怎么從文檔中找到可能的答案

教模型怎么根據文檔和答案來提出好問題

就像教會學生不僅要會做題,還要會出題一樣。

3.2 第二階段:自我提升

這個階段是最有意思的部分。模型要用第一階段學到的能力來提升自己,具體怎么做呢?首先是答案生成。模型會讀一段專業文獻,然后找出里面可能成為答案的內容。比如讀到這樣一段醫學文獻:

For its survival, the body needs to ensure a continuous delivery of energy despite highly variable supplies of nutrients from the external environment.

模型就會找出重要的概念,比如"continuous delivery of energy"這樣的關鍵信息。然后是問題生成。基于找到的答案,模型會生成相應的問題。而且,模型會生成不同類型的問題:

  • 有的是簡單的填空題
  • 有的是多選題
  • 有的是判斷對錯的題

這樣做的好處是什么呢?就像我們復習時用不同類型的題目來測試自己,可以全面地掌握知識。最后還有個重要的步驟 - 質量控制。不是所有生成的問題都會被用來訓練,而是要經過篩選:

  • 會檢查答案是否能在相關文檔中找到
  • 會看問題是否清晰合理,就像老師出題也要經過反復推敲一樣。

4. 實驗結果分析

好,現在到了最激動人心的部分了 - 我們來看看這個方法到底效果如何。

4.1 實驗設置

首先,作者選擇了三個非常重要的領域來測試:

  1. 醫療領域:選了7個數據集

PubMedQA:這是關于醫學研究的問答

BioASQ:這是生物醫學領域的問題

MedQA:這個更專業,是醫學執照考試的題目

還有其他幾個數據集

就像是讓模型去參加不同類型的醫學考試一樣。

  1. 科學領域:用了3個數據集

ARC:這是中學級別的科學題目

SciQ:這包含了物理、化學、生物等各種科學問題

MMLU-sci:這個更全面,包含了14個科學學科

相當于是從基礎到高等的科學知識都測試了一遍。

  1. 計算機科學領域:

用了最新的CS-Bench數據集

包含了編程、算法等各種計算機科學的問題

這就像是給模型來了次計算機系的期末考試。那模型用什么"教材"來學習呢?

  • 醫療領域:用了醫學教科書、維基百科、PubMed的文章
  • 科學領域:主要用維基百科的內容
  • 計算機領域:用了維基百科的CS部分和arXiv上的論文

4.2 比較對象

作者找了好幾類模型來比較,就像舉辦一場比賽一樣:

  1. 通用大模型選手:這些就像是全能型選手。

GPT-3.5

GPT-4

Llama3-8B

  1. 專業領域選手:這些就像是專攻某個領域的專家。

醫療領域有PMC-llama、MEDITRON

科學領域有SciTulu

  1. RAG技術選手:這些是專門做檢索增強的高手。

Self-RAG

ChatQA

4.3 實驗結果

在醫療領域:

模型也能“知其然知其所以然”——看SimRAG如何通過提問提升自己-AI.x社區

在科學領域:

模型也能“知其然知其所以然”——看SimRAG如何通過提問提升自己-AI.x社區

在計算機科學領域:

模型也能“知其然知其所以然”——看SimRAG如何通過提問提升自己-AI.x社區

雖然分數看起來不是很高,但要知道CS-Bench的題目是很難的,這個成績已經很不錯了。

4.4 深入分析

作者還做了一些很有意思的分析:

  1. 不同問題類型的表現:

多選題表現最好,因為選項可以提供線索

開放性問題稍微差一點,這很正常,因為需要自由發揮嘛

判斷題介于兩者之間

  1. 生成數據的質量分析,讓我們看個例子:

模型也能“知其然知其所以然”——看SimRAG如何通過提問提升自己-AI.x社區

生成的問題很自然,答案也很準確,不是簡單的復制粘貼。

  1. 一個很有趣的發現:如果不做數據過濾,性能會下降約2%。這說明什么?說明質量控制真的很重要,就像我們學習也要注意區分哪些是對的,哪些是錯的信息。

5. 局限性和未來展望

當然,這個方法也不是完美的,還有一些可以改進的地方:

  1. 目前只做一輪生成:

就像我們復習,多復習幾遍效果會更好

未來可以嘗試迭代式的生成方式

  1. 計算開銷問題:

生成和過濾數據需要不少時間

但好在這些都是訓練時的開銷,用的時候不會變慢

  1. 還可以用更強的模型:

比如說用70B的模型可能效果會更好

但這樣就需要更多計算資源了

這種自我提升的思路其實在很多領域都能用。比如說,我們學習新知識的時候,也可以先掌握基礎,然后自己出題來檢驗,這樣不是很像SimRAG的思路嗎?

原文:《SimRAG: Self-Improving Retrieval-Augmented Generation for Adapting Large Language Models to Specialized Domains

本文轉載自 ??芝士AI吃魚??,作者: 雷厲風行

收藏
回復
舉報
回復
相關推薦
免费中文字幕在线| 992tv人人草| 国产在线日本| 国产在线播精品第三| 日韩在线观看免费高清| 亚洲熟妇一区二区| 成人欧美magnet| 中文字幕日韩一区二区| 国产精品乱码一区二区三区| 国产视频1区2区| 你懂的亚洲视频| 亚洲天堂成人在线视频| 一级黄色免费毛片| 日韩精品影院| 一区二区三区日韩精品| 免费影院在线观看一区| 国产麻豆一精品一男同| 亚洲综合好骚| 九九热这里只有精品免费看| 午夜精产品一区二区在线观看的| 毛片大全在线观看| 国产人妖乱国产精品人妖| 99在线热播| av首页在线观看| 尹人成人综合网| 日韩亚洲欧美中文在线| 精品国产av无码| aiai久久| 91精品国产入口| 88av.com| 亚洲最大网站| 亚洲一级二级在线| 日本xxxxx18| 在线观看二区| 国产午夜精品福利| 美女视频久久| 日韩一级片免费看| 国产麻豆视频一区| 国产精品自拍偷拍| 69av视频在线观看| 久久午夜电影| 青草青草久热精品视频在线网站| 免费看污片的网站| 日韩美女毛片| 亚洲国产精品久久久久秋霞不卡| 免费在线观看亚洲视频| av网站在线免费| 亚洲三级小视频| 日本婷婷久久久久久久久一区二区| 亚洲天堂手机在线| 秋霞电影网一区二区| 国产精品第三页| 黄色片视频免费| 久久综合五月| 国产91色在线|免| 免费av中文字幕| 丝袜美腿高跟呻吟高潮一区| 国产成人精品免高潮费视频| 特级毛片www| 肉丝袜脚交视频一区二区| 欧美中文字幕精品| 中文字幕视频网站| 日韩在线观看一区二区| 国产脚交av在线一区二区| 欧美人一级淫片a免费播放| 日本在线不卡视频一二三区| 国产精品久久久久免费a∨| 亚洲精品国产精品国自产网站按摩| 欧美日一区二区三区在线观看国产免| 亚洲国产99精品国自产| 日本护士做爰视频| 伊人成综合网yiren22| 亚洲欧洲激情在线| 日本成人免费在线观看| 综合日韩在线| 国内外成人免费激情在线视频 | 丁香社区五月天| 午夜在线精品偷拍| 国产精品丝袜高跟| www.色播.com| 91网页版在线| 亚洲成人18| a级影片在线观看| 香港成人在线视频| 国产aaa一级片| 日韩毛片网站| 精品不卡在线视频| 亚洲国产av一区| 忘忧草精品久久久久久久高清| 亚洲性猛交xxxxwww| 又色又爽的视频| 牛牛国产精品| 日韩美女在线观看一区| 国产伦理吴梦梦伦理| 不卡电影免费在线播放一区| 欧美一区二区福利| 欧美xxxx视频| 91国产免费观看| 精品人妻人人做人人爽夜夜爽| 四虎影视精品永久在线观看| 精品播放一区二区| 国产小视频你懂的| 国产精品一二| 岛国一区二区三区高清视频| 色婷婷av一区二区三区之红樱桃| 成人av电影免费在线播放| 欧美一区二视频在线免费观看| 亚洲aⅴ乱码精品成人区| 国产精品美女久久福利网站| 国产黄色片免费在线观看| 91伊人久久| 日韩精品视频免费专区在线播放| 在线天堂www在线国语对白| 日韩精品免费| 欧美一区二区三区精品电影| 国产精品自产拍| 久久先锋影音av| 国产 欧美 日韩 一区| 成人国产综合| 国产视频精品va久久久久久| 免费一级肉体全黄毛片| 韩国v欧美v日本v亚洲v| 日韩高清国产一区在线观看| zzzwww在线看片免费| 欧美精选一区二区| 91l九色lporny| 午夜一区在线| 精品国产一区二区三区四区精华| 亚洲三区在线播放| 一区二区三区国产豹纹内裤在线| 国产免费裸体视频| 国产激情综合| 一区二区三区久久精品| 台湾佬中文在线| www.av亚洲| 国产人妻人伦精品| 欧美a在线观看| 久久躁日日躁aaaaxxxx| 亚洲综合一区中| 国产欧美日韩精品a在线观看| 亚洲一区二区三区精品在线观看 | 国产毛片久久久久| 国产精品伦理在线| 91插插插插插插插插| 国产一区日韩| 国产精品扒开腿做| 国产毛片在线| 欧美视频一二三区| 天堂网av2018| 国产精一品亚洲二区在线视频| 国产成人亚洲欧美| fc2ppv国产精品久久| 欧美一区二区大片| 人妻久久一区二区| 夫妻av一区二区| 日韩a级在线观看| 久本草在线中文字幕亚洲| 午夜精品久久久久久久男人的天堂| 一级久久久久久| 国产欧美日韩不卡| 亚洲欧洲日本精品| 一区二区三区午夜探花| 91在线看网站| 24小时免费看片在线观看| 亚洲а∨天堂久久精品9966| 精品成人av一区二区在线播放| 久久成人免费电影| 三年中国中文在线观看免费播放 | 国产精品网红直播| 免费在线观看黄色网| 日韩一级黄色片| 精品少妇爆乳无码av无码专区| 青青青伊人色综合久久| 亚洲一区二区三区色| 精品中文视频| 性欧美办公室18xxxxhd| 免费国产在线视频| 欧美久久婷婷综合色| 中文字幕第28页| 26uuu久久综合| 超碰人人草人人| 欧美网站在线| 久久国产精品99久久久久久丝袜| 在线中文字幕-区二区三区四区| 疯狂蹂躏欧美一区二区精品| 99视频在线视频| 欧美成人午夜| 欧美不卡三区| 国产精品久久久久久久久久辛辛| 中文字幕在线国产精品| 亚洲国产精彩视频| 日本电影亚洲天堂一区| 久久精品亚洲a| 波多野结衣精品在线| 无码少妇一区二区三区芒果| 香蕉国产精品| 欧美连裤袜在线视频| 国产精品1区| 日本高清不卡在线| 日韩影视在线| 中文字幕在线日韩| 色猫av在线| 日韩欧美色综合网站| 国产真人无遮挡作爱免费视频| 久久久精品国产免费观看同学| 成年人网站免费视频| 久久影院一区| 免费久久久一本精品久久区| 精品国产亚洲一区二区三区| 国产精品91在线| 91美女主播在线视频| 久久艹在线视频| jizzjizz在线观看| 精品无人区乱码1区2区3区在线| 青青草av在线播放| 亚洲欧美日韩精品久久久久| 免费看污片的网站| 99国产精品久久久久| 香蕉视频色在线观看| 日本成人超碰在线观看| 国产美女在线一区| 中文字幕一区二区三区在线视频 | 欧美性生活一级片| 成人妇女淫片aaaa视频| 日本少妇一区| 国产91色在线播放| 欧洲一区精品| 性欧美长视频免费观看不卡 | 色偷偷av亚洲男人的天堂| 手机在线观看毛片| 精品国产乱码久久久久久久| 国产伦精品一区二区三区免.费| 亚洲精品视频在线观看免费| 女人黄色一级片| 久久久久久久久97黄色工厂| bl动漫在线观看| 成人黄色综合网站| 毛茸茸free性熟hd| 国产成人免费在线| 波多野结衣中文字幕在线播放| 亚洲美女黄网| 欧美国产视频一区| 国产精品hd| 免费人成在线观看视频播放| 午夜激情一区| 粉嫩av一区二区三区天美传媒| 美国十次av导航亚洲入口| www.久久艹| 中文字幕视频精品一区二区三区| 97超级碰在线看视频免费在线看| 国产女人在线观看| 国产亚洲人成a一在线v站| 国产精品天堂| www.日韩视频| 精品视频在线一区二区| 美女精品视频一区| 超碰在线最新网址| **欧美日韩vr在线| 涩涩视频在线免费看| 日本成熟性欧美| se69色成人网wwwsex| 成人妇女淫片aaaa视频| 亚洲国产视频二区| 国产视频一区二区不卡| 亚洲桃色综合影院| 亚洲v日韩v欧美v综合| 国产精品久久久久蜜臀| 喜爱夜蒲2在线| 国产亚洲精品久久久久婷婷瑜伽| 国产日产欧美一区二区| 欧美日韩在线大尺度| 日本免费不卡一区二区| 日韩电影在线一区| 久久黄色片网站| 国产成人99久久亚洲综合精品| а 天堂 在线| 岛国一区二区三区| 熟女俱乐部一区二区| 国产精品视频你懂的| 黄页网站免费观看| 色8久久精品久久久久久蜜| 中文字幕在线2019| 精品国产亚洲在线| 国产精品ⅴa有声小说| 久久久成人精品| 在线观看特色大片免费视频| 国产精品视频中文字幕91| 亚洲五码在线| 日本一区二区三区精品视频| 亚洲色图二区| 无码精品国产一区二区三区免费| 日韩香蕉视频| 国产三级三级看三级| www.亚洲免费av| 国产又黄又粗又猛又爽的| 亚洲一区二区三区中文字幕在线| 久久久久99精品成人片试看| 婷婷丁香激情综合| 亚洲系列在线观看| 亚洲国产三级网| 黄色网页网址在线免费| 97在线视频观看| 色婷婷成人网| 日本一区二区三区视频在线观看 | 亚洲品质视频自拍网| a视频在线观看| 国产精品www网站| 久久综合五月婷婷| 日韩 欧美 自拍| 日韩av一二三| 国产中文字幕一区二区| 亚洲乱码国产乱码精品精可以看 | 天堂地址在线www| 97精品视频在线| 精品一区二区三区中文字幕在线| 91视频在线免费观看| 欧美呦呦网站| 国产男女在线观看| 国产不卡在线一区| 欧美精品久久久久久久久46p| 亚洲麻豆国产自偷在线| 波多野结衣视频观看| 日韩国产中文字幕| 男女免费观看在线爽爽爽视频| 久久久人成影片一区二区三区| 日本不良网站在线观看| 成人av片网址| 先锋资源久久| xxx国产在线观看| 亚洲国产精品传媒在线观看| 日韩一级在线视频| 亚洲精品xxxx| 国产ktv在线视频| 成人影片在线播放| 国产精品草草| 久久久久无码精品| 亚洲乱码国产乱码精品精的特点| 男女视频免费看| 精品久久免费看| 在线观看的网站你懂的| 成人网欧美在线视频| 99久久婷婷国产综合精品电影√| 国产男女免费视频| 成人精品鲁一区一区二区| 国产suv一区二区三区| 91精品国产乱码久久蜜臀| 九色porny丨首页在线| 亚洲一区二区三区在线视频 | 亚洲欧洲精品一区二区| 久久福利精品| 婷婷色一区二区三区| 色婷婷综合久久久| av基地在线| 国产日韩在线看| 亚洲成av人电影| 黄色片子免费看| 亚洲午夜免费福利视频| 欧美 日韩 人妻 高清 中文| 国外成人在线播放| 综合国产视频| 激情五月俺来也| 日韩毛片在线免费观看| 精品久久在线观看| 668精品在线视频| 国产精品一区二区三区av麻| 性欧美极品xxxx欧美一区二区| 成人av第一页| 波多野结衣视频在线看| 久久精品国产亚洲精品| 成人动态视频| 免费在线观看日韩视频| 国产精品久久久久一区二区三区| 精品欧美一区二区三区免费观看| 日韩三级视频中文字幕| 麻豆网站免费在线观看| 欧美三级华人主播| 狠狠久久亚洲欧美| 日本五十熟hd丰满| 中文字幕久久亚洲| 日韩精品免费视频一区二区三区| 亚洲不卡中文字幕| 日本欧美在线观看| 欧美精品成人久久| 亚洲精品小视频在线观看| 日韩成人精品一区二区三区| 国产精品一色哟哟| 欧美国产一区二区| 高h放荡受浪受bl| 国产精品91免费在线| 国产精品videosex极品| a天堂中文字幕| 欧美电影精品一区二区| 影视一区二区三区| 成人国产一区二区三区| 久久精品夜色噜噜亚洲a∨| 国产黄色片免费观看| 日本精品视频在线观看| 欧美激情aⅴ一区二区三区| 免费网站在线高清观看| 精品电影一区二区|