精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福新研究:RAG能幫助LLM更靠譜嗎? 精華

發(fā)布于 2024-5-29 13:36
瀏覽
0收藏

大語(yǔ)言模型(LLM)雖然功能強(qiáng)大,但容易出現(xiàn)幻覺。


此外,它們受限于其訓(xùn)練語(yǔ)料庫(kù)中包含的知識(shí),因此無(wú)法回答有關(guān)近期事件或公開受限信息的查詢。


為了解決上述問題,檢索增強(qiáng)生成(RAG)是一種常用的框架,它在LLM的提示中提供相關(guān)檢索內(nèi)容,獲得相關(guān)信息的參考文檔或數(shù)據(jù)庫(kù),并可以顯著提高模型的準(zhǔn)確性。


大多數(shù)商業(yè)LLM,如ChatGPT、Gemini和Perplexity.ai,已經(jīng)在它們的Web界面中采用了某種版本的RAG。

例如,ChatGPT使用Bing搜索,而Gemini訪問Google搜索結(jié)果。


但當(dāng)語(yǔ)言模型內(nèi)部知識(shí)與通過RAG提供的信息之間的不一致時(shí),或者當(dāng)網(wǎng)絡(luò)結(jié)果不斷變化,并且可能包含過時(shí)、錯(cuò)誤或有害的信息時(shí),這個(gè)問題就變得更加復(fù)雜了。


因此,對(duì)啟用RAG的LLM行為進(jìn)行客觀評(píng)估,與對(duì)它們的非RAG對(duì)應(yīng)物進(jìn)行基準(zhǔn)測(cè)試同樣重要,特別是目前RAG系統(tǒng)越來(lái)越依賴于在眾多領(lǐng)域提供事實(shí)信息。


量化LLM和RAG之間的關(guān)系


在斯坦福的最新研究中,研究工作旨在量化LLM的內(nèi)部知識(shí)與RAG設(shè)置中呈現(xiàn)的檢索信息之間的緊張關(guān)系。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

沒有上下文(即沒有RAG),測(cè)試的語(yǔ)言模型平均只能正確回答34.7%的問題。有了RAG,準(zhǔn)確率提高到了94%。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

「先前」指的是沒有上下文的GPT-4響應(yīng),「帶RAG」指的是在提示中包含了相關(guān)檢索到的上下文的響應(yīng)。


此外,還包括了先驗(yàn)概率與RAG偏好率之間關(guān)系的斜率。例如,平均斜率為-0.23,這意味著每當(dāng)先驗(yàn)token的概率增加10%,RAG偏好率的下降可能性為2.3%。


為了區(qū)分這兩種相互競(jìng)爭(zhēng)的力量,研究人員對(duì)GPT-4和其他大語(yǔ)言模型(LLM)進(jìn)行了測(cè)試,使用了六組不同的問題,總共超過1200個(gè)問題。


當(dāng)提供正確的參考信息時(shí),這些模型正確回答了94%的問題。


然而,當(dāng)參考文檔逐漸被錯(cuò)誤的值修改時(shí),如果模型自身在該主題上的預(yù)訓(xùn)練知識(shí)較弱,LLM重復(fù)錯(cuò)誤信息的可能性就更高。


當(dāng)預(yù)訓(xùn)練知識(shí)更強(qiáng)時(shí),模型更能抵抗錯(cuò)誤的參考信息。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

根據(jù)參考文檔中信息的錯(cuò)誤程度,大語(yǔ)言模型(LLM)會(huì)通過檢索增強(qiáng)生成(RAG)引用或從其知識(shí)庫(kù)中輸出錯(cuò)誤答案。


當(dāng)修改后的信息與模型認(rèn)為合理的情況偏離得更厲害時(shí),出現(xiàn)了類似的模式:偏離越不切實(shí)際,大語(yǔ)言模型(LLM)就越依賴于自己的預(yù)訓(xùn)練知識(shí)。


盡管RAG系統(tǒng)可以顯著提高語(yǔ)言模型的事實(shí)準(zhǔn)確性,但它們并不是對(duì)抗錯(cuò)誤信息的萬(wàn)能藥。


上述實(shí)驗(yàn)說明使用高質(zhì)量參考數(shù)據(jù)的RAG可以顯著提高LLMs的準(zhǔn)確性。


此外,模型的良好訓(xùn)練先前知識(shí)有助于識(shí)別和忽略不切實(shí)際的信息。


RAG提示強(qiáng)度和模型先驗(yàn)知識(shí)之間的博弈


另外遵守參考信息的提示強(qiáng)度也產(chǎn)生了影響:更強(qiáng)烈的提示導(dǎo)致模型更有可能遵循參考信息。


相反,當(dāng)提示不那么嚴(yán)格,模型有更多的自由度來(lái)衡量其先前知識(shí)與參考信息時(shí),遵循參考信息的可能性就會(huì)降低。

斯坦福新研究:RAG能幫助LLM更靠譜嗎?-AI.x社區(qū)

大語(yǔ)言模型(LLM)訪問檢索增強(qiáng)生成(RAG)數(shù)據(jù)的方式會(huì)影響從參考中提取信息的準(zhǔn)確性。


為了實(shí)現(xiàn)盡可能高的準(zhǔn)確性,必須非常清楚地告知LLM,它應(yīng)該只從參考中獲取數(shù)據(jù)。


讓RAG能更好地輔助LLM


RAG系統(tǒng)相對(duì)于傳統(tǒng)搜索引擎具有獨(dú)特的吸引力,它們可以結(jié)合先驗(yàn)知識(shí)來(lái)填補(bǔ)空白并推斷檢索到的信息。


但這伴隨著權(quán)衡——即,這樣的先驗(yàn)知識(shí)可以覆蓋文檔中提供的信息。


雖然強(qiáng)大的先驗(yàn)知識(shí)本身并不是問題(通常可以保護(hù)模型),但缺乏關(guān)于模型如何混合RAG參考文檔和它們先驗(yàn)知識(shí)的明確預(yù)期,可能導(dǎo)致下游結(jié)論不準(zhǔn)確的問題。


例如,RAG系統(tǒng)被用來(lái)提取嵌套的財(cái)務(wù)數(shù)據(jù)以用于算法,如果財(cái)務(wù)文檔中有一個(gè)錯(cuò)別字會(huì)發(fā)生什么?模型會(huì)注意到錯(cuò)誤嗎?如果是,它會(huì)提供什么數(shù)據(jù)來(lái)代替?


鑒于LLM即將在包括醫(yī)學(xué)和法律在內(nèi)的許多領(lǐng)域廣泛部署,用戶和開發(fā)者都應(yīng)該意識(shí)到它們的意外效果,并給出預(yù)案。


用戶需要更加了解模型如何處理潛在的沖突或錯(cuò)誤信息,以及RAG系統(tǒng)和LLM一樣,也可能出錯(cuò)。


本文轉(zhuǎn)自新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/0o6VQ6ISWLlDvbgHJaNdbg??

標(biāo)簽
已于2024-5-29 13:38:35修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
欧美性受xxxx狂喷水| 粉嫩精品久久99综合一区| 人人超在线公开视频| 成人高清视频在线| 日本久久91av| 91香蕉视频污在线观看| 日韩精品一级| 日韩欧中文字幕| 一区二区三区|亚洲午夜| 国内毛片毛片毛片毛片| 久久www成人_看片免费不卡| 中文字幕亚洲图片| 日韩高清一二三区| 欧美人体一区二区三区| 亚洲欧美自拍偷拍| 久久精品国产精品青草色艺| 亚洲一区二区视频在线播放| 激情综合激情| 中文字幕在线视频日韩| 亚洲美女高潮久久久| 亚洲www啪成人一区二区| 亚洲综合激情网| 日韩欧美在线一区二区| 欧美一级一区二区三区| 男女性色大片免费观看一区二区| 久久久久久久久久久av| 国产又黄又粗又猛又爽的| 国产图片一区| 欧美亚洲综合网| 欧美 日韩 亚洲 一区| 日本三级在线视频| 久久久久久综合| 99re视频在线播放| 91一区二区视频| 水蜜桃久久夜色精品一区的特点| 久久久欧美精品| 成年人网站在线观看视频| 综合伊思人在钱三区| 欧美v日韩v国产v| av免费一区二区| sis001欧美| 性做久久久久久久免费看| 日韩最新中文字幕| 麻豆视频网站在线观看| 国产日韩v精品一区二区| 精品欧美一区二区三区久久久| 91久久精品无码一区二区| 久久电影一区| 欧美亚洲视频在线看网址| 免看一级a毛片一片成人不卡| 色777狠狠狠综合伊人| 国产午夜精品免费一区二区三区 | 日韩久久久久久久久| 天天综合网91| 久久久精品久久久| 搜索黄色一级片| 你懂的网址国产 欧美| 日韩亚洲精品视频| 五月综合色婷婷| 天天影视综合| 色综合久久精品亚洲国产 | 飘雪影视在线观看免费观看| 26uuu精品一区二区| 九九九九精品九九九九| 色婷婷av一区二区三区之e本道| 成人激情综合网站| 精品国产一区二区三区麻豆免费观看完整版 | 97欧洲一区二区精品免费| av免费观看网址| 国产jizzjizz一区二区| 国产伦精品一区二区三区在线| 亚洲第一精品网站| 97久久超碰国产精品| 欧美高清视频一区二区三区在线观看| 日韩国产福利| 国产欧美精品在线观看| 一区二区三区四区国产| 超碰在线观看免费版| 亚洲一区二区在线免费观看视频| 黄色a级片免费看| 欧美激情护士| 在线观看www91| 黄色a级三级三级三级| 这里视频有精品| 精品视频在线播放| 欧美成人久久久免费播放| 亚洲电影在线一区二区三区| 国模叶桐国产精品一区| 五月婷婷激情五月| 国产在线观看一区二区| 国产日韩在线一区二区三区| 国产一二三区在线视频| 亚洲欧洲成人av每日更新| www污在线观看| 182在线播放| 欧美美女网站色| 日韩成人av一区二区| 成人3d精品动漫精品一二三| 欧美区在线播放| 成人毛片在线播放| 狠狠v欧美v日韩v亚洲ⅴ| 国产精品一区二区a| 番号集在线观看| 亚洲女同一区二区| 东京热加勒比无码少妇| 精品久久亚洲| 亚洲人成网站免费播放| 精品国产欧美日韩不卡在线观看| 国产一级久久| 亚洲mm色国产网站| 国产一区二区影视| 亚洲r级在线视频| 中文字幕精品一区二区三区在线| 欧美毛片免费观看| 免费av一区二区| 久草视频在线免费| 成人一区二区三区| 中文字幕一区综合| 日本综合字幕| 亚洲国产精品va| 国产成人无码aa精品一区| 久久一本综合频道| 好看的日韩精品视频在线| 米奇精品一区二区三区| 色婷婷亚洲精品| 日本一级大毛片a一| 99成人超碰| 日本一区二区在线播放| 免费国产羞羞网站视频| 亚洲丝袜自拍清纯另类| 中文字幕国内自拍| 亚洲免费观看高清完整版在线观| 欧美高跟鞋交xxxxxhd| 在线免费av网| 国产欧美视频一区二区| 男人揉女人奶房视频60分 | 99热99re6国产在线播放| 在线成人av网站| wwwww黄色| 久久精品人人| 欧美高清视频一区二区三区在线观看| 高清毛片在线观看| 精品国产乱码久久久久久久久| 99久久婷婷国产综合| 麻豆精品视频在线观看视频| 日韩资源av在线| 欧美黑人巨大xxxxx| 亚洲精品一区二区网址 | 欧美午夜理伦三级在线观看| 91精品人妻一区二区三区蜜桃欧美| 亚洲日本免费| 精品不卡在线| 美女av在线免费看| 亚洲精品丝袜日韩| 日本视频在线观看免费| 久久久久久免费| 久久精品99国产| 国产乱码精品一区二区三区四区 | 男同互操gay射视频在线看| 国产伊人久久| 色偷偷综合社区| 一本色道久久综合精品婷婷| 国产精品女同互慰在线看| 亚洲免费av一区二区三区| 精品日韩欧美一区| 国产玖玖精品视频| 岛国中文字幕在线| 欧美本精品男人aⅴ天堂| 国产在线综合网| 波多野结衣91| 日韩亚洲在线视频| 日韩免费在线| 亚洲一区制服诱惑| 日韩专区av| 日韩av影院在线观看| 1级黄色大片儿| 久久精品亚洲精品国产欧美kt∨ | 国产亚洲成人av| 99久久精品情趣| 成人性做爰aaa片免费看不忠| 精品国产91乱码一区二区三区四区| 国产精品一区二区电影| 国产黄大片在线观看画质优化| 日韩美女视频在线| 特黄视频免费看| 国产精品久久久久久一区二区三区| 久久艹这里只有精品| 在线精品在线| 日本中文不卡| 亚洲精品观看| 青青草一区二区| 欧美成人hd| 亚洲成人激情视频| 精品乱码一区内射人妻无码| 一区二区高清在线| 精品人妻无码一区二区三区| 久久99国产精品免费网站| 日本阿v视频在线观看| 精品日韩免费| 成人欧美一区二区三区视频xxx| 亚洲国产福利| 久热精品视频在线观看一区| 偷拍自拍在线| 欧美精品一二三区| 婷婷激情五月网| 亚洲日本护士毛茸茸| 一区二区三区少妇| 经典一区二区三区| 国产又大又硬又粗| 欧美日本不卡| 亚洲国产精品综合| 亚洲毛片免费看| 成人xxxxx色| 欧美影视资讯| 91国在线精品国内播放| www久久日com| 中文字幕日韩免费视频| 天堂中文在线观看视频| 91麻豆精品国产91久久久久久| 男人天堂2024| 亚洲成a人v欧美综合天堂| 永久免费看片视频教学| 久久精品夜色噜噜亚洲a∨| 又黄又爽的网站| 狠狠久久亚洲欧美| 999精彩视频| 性高湖久久久久久久久| 日韩激情视频一区二区| 婷婷综合激情| 亚洲精品国产一区| 欧美人妖在线| 久久久久欧美| 米奇精品关键词| 99精品国产高清在线观看| 欧洲亚洲精品久久久久| 国产精品www| 欧美日韩国产v| 456国产精品| 麻豆蜜桃在线观看| 高清视频欧美一级| 手机av在线播放| 九九精品在线播放| 国产黄大片在线观看画质优化| 久久精品一区中文字幕| 麻豆电影在线播放| 色一区av在线| 在线a人片免费观看视频| 中文字幕日韩av综合精品| 电影av一区| 亚洲一区999| 国产无套粉嫩白浆在线2022年| 亚洲跨种族黑人xxx| 五月婷婷六月色| 日韩精品视频免费| 五月婷婷六月丁香| 日韩精品中文在线观看| 水莓100国产免费av在线播放| 精品国产亚洲一区二区三区在线观看| www.国产麻豆| 精品久久久久久久久久久久久久久 | 亚洲二区精品| 91视频最新入口| 嫩草成人www欧美| 国产偷人视频免费| 噜噜爱69成人精品| 亚洲第一狼人区| 国内精品久久久久影院薰衣草| 手机在线视频一区| 国产盗摄女厕一区二区三区| 人妻互换一二三区激情视频| 成人激情校园春色| 四虎影成人精品a片| 欧美激情一区二区三区蜜桃视频| 日韩一级片在线免费观看| 日韩美女啊v在线免费观看| 国产av 一区二区三区| 亚洲午夜免费福利视频| 综合激情网五月| 欧美性大战久久久久久久蜜臀| 国产又粗又猛又爽又黄的| 日韩一级大片在线| 日韩精品123| 久久久91精品国产| 国产高清在线a视频大全| 欧美在线亚洲在线| 青青草国产一区二区三区| 99国产超薄丝袜足j在线观看| 精品视频高潮| 色乱码一区二区三在线看| 五月综合激情| 国产免费黄色一级片| 青青草精品视频| 中文字幕无人区二| 国产午夜一区二区三区| 黄色录像免费观看| 岛国av在线不卡| 一级黄色片在线播放| 欧美xxxxxxxxx| av资源在线观看免费高清| 欧美精品在线看| 日韩久久一区二区三区| 亚洲va码欧洲m码| 免费看成人哺乳视频网站| 91嫩草国产丨精品入口麻豆| 久久www成人_看片免费不卡| 国产chinesehd精品露脸| 久久久www成人免费无遮挡大片| 加勒比婷婷色综合久久| 欧洲一区二区av| 老牛影视av牛牛影视av| 色偷偷av一区二区三区| 自拍偷拍欧美视频| 不卡视频一区二区三区| 欧美色图国产精品| 国产最新免费视频| 国产成人在线视频免费播放| 性猛交ⅹxxx富婆video| 无吗不卡中文字幕| 国产精品伦一区二区三区| 亚洲日韩中文字幕| 成人高潮aa毛片免费| 91在线播放国产| 青草国产精品| 少妇性饥渴无码a区免费| 成人一道本在线| 成人在线观看小视频| 欧美系列日韩一区| 日本大片在线观看| 久久久视频在线| 深夜福利一区| 一区二区冒白浆视频| 日本欧美在线观看| 美女100%无挡| 欧美日韩激情网| 人人妻人人玩人人澡人人爽| 久久999免费视频| 成人国产精品久久| 一区二区三区四区免费视频| 视频精品一区二区| 欧美老熟妇乱大交xxxxx| 婷婷开心激情综合| 免费a视频在线观看| 欧美激情视频在线免费观看 欧美视频免费一| 久久精品国产福利| 亚洲一区尤物| 麻豆精品久久久| 战狼4完整免费观看在线播放版| 欧洲av一区二区嗯嗯嗯啊| 黄色片在线播放| 国产精品黄色影片导航在线观看| 亚洲资源网你懂的| 少妇高清精品毛片在线视频| 久久久噜噜噜久久中文字幕色伊伊| 岛国av中文字幕| 亚洲日韩中文字幕在线播放| 偷拍精品精品一区二区三区| 青青草原亚洲| 日本午夜一区二区| аⅴ天堂中文在线网| 欧美日韩国产综合草草| caopo在线| 官网99热精品| 一本久道久久久| 色哟哟精品观看| 欧美日韩aaa| 三级资源在线| 国产99在线播放| 亚洲专区一区| 国产毛片欧美毛片久久久| 欧美丝袜丝交足nylons图片| 免费在线看黄网站| 97久草视频| 免费亚洲婷婷| 特级西西人体高清大胆| 欧美精品高清视频| 成年人黄色大片在线| 欧美日韩国产综合视频在线| 毛片基地黄久久久久久天堂| 卡通动漫亚洲综合| 亚洲国产精品免费| 在线成人视屏| 777久久精品一区二区三区无码 | 成人看片视频| 国产精品一区毛片| 久久久久麻豆v国产| 欧美大胆人体bbbb| 性感女国产在线| 中文精品视频一区二区在线观看| 国产成人三级在线观看| 午夜影院免费在线观看| 久久精品99久久香蕉国产色戒| 国产精品丝袜在线播放| 男人搞女人网站| 一区二区三区日韩| 国产三级视频在线看| 99久久99| 日本欧美一区二区三区乱码| 私库av在线播放| 亚洲欧美在线免费| 亚洲2区在线|