精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

何時檢索,何時生成?Self-DC:自我分治解決復合問題

發布于 2024-3-28 14:30
瀏覽
0收藏
當前研究關注大型語言模型在處理已知和未知問題時的知識邊界。主要問題可分為四類:單一已知問題可通過模型內部知識解決,單一未知問題需調用外部工具獲取知識,組合已知問題需要復雜推理,而組合未知問題則包含其他可能性。如何選擇使用外部檢索或模型內部知識來回答問題是個挑戰。一種方法是樸素RAG,另一種是先評估問題的確定性或不確定性,然后調用生成-讀取或檢索-讀取。然而,這兩種方法都有局限性,簡單地調用外部檢索并不能保證性能,而將問題二元分類過于簡化。為此,本文研究者提出了CuQA數據集和Self-dc框架,使模型能夠自適應地選擇不同方法,提高性能和效率。

現有的工作非常關注大模型本身的知識邊界,以達成對于大模型known和unknown的問題能夠進行不同的處理。簡單來說,有四大類主要的問題

  • Single known: 簡單的通過大模型內部的知識即可解決,比如常見的generate-then-read方法
  • Single unknown: 需要調用外部工具如搜索引擎等獲取外部知識進行解決,比如retrieve-then-read方法
  • Compositional known: 需要進行復雜推理,比如compositional reasoning將問題進行分解
  • Compositional unknown: 這個問題是其中最為復雜的,因為一個compositional unknown 問題包括其他所有可能性,比如一個compositional known和single unknown的結合等。

對于一個復合問題,我們什么時候利用外部檢索,什么時候促使大模型產生已知的知識,以回答當前的問題?

為了解決這個問題,可以不加區分地使用外部檢索方法,也就是樸素RAG,也可以首先評估關于該問題的大型語言模的確定性或不確定性,隨后根據評估調用生成-讀取或檢索-讀取。

例如,《Can llms express their uncertainty? an empirical evaluation of confi-dence elicitation in llm》,這個工作列舉了多種方式,基于語言的Verbalized,基于一致性的Consistency-based,以及它們的混合方法Hybrid。

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

這兩種方法都有自己的局限性,例如,簡單地對每個問題調用外部檢索并不能保證更好的性能,而且會浪費大量已知知識浪費,而且在存在迭代檢索的情況下,也會帶來嚴重的效率問題。此外,將問題分為已知和未知的二元對立過于簡化了問題的復雜性,在某些情況下并不可行以及效果并不佳。

例如,如圖1所示,一個組合未知問題由已知和未知子問題組成。因此,它將退化為簡單地自動調用每個問題的檢索,因為未知的組成仍然是llm的未知問題。

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

“先檢索后讀取”和“再生成后讀取”是開放域問答中處理未知和已知問題的兩種典型解決方案,前者檢索需要的外部知識,后者提示大語言模型生成編碼在參數中的內部已知知識,但也存在一些由已知或未知的子問題組成的未知問題。

此外,簡單的二元分類(已知或未知)變得次優且效率低下,因為它會對每個組成未知問題過多地調用外部檢索。

為此,《Self-DC: When to retrieve and When to generate? Self Divide-and-Conquer for Compositional Unknown Questions》提出了第一個組合未知問答數據集(CuQA),并引入了一個自分而治(Self-dc)框架,使llm能夠自適應地按需調用不同的方法,從而提高了性能和效率。

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

論文題目: 

Self-DC: When to retrieve and When to generate? Self Divide-and-Conquer for Compositional Unknown Questions 

論文鏈接: 

??https://arxiv.org/pdf/2402.13514??

一、主要實現思路

Self-DC主要采用的是自我分而治之的思路,如圖2所示:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

一般來說,給定一個問題,首先得到大模型對該問題的置信度分數,然后可以相應地選擇處理當前問題的方式。具體地,其將置信度評分分為 [0,α-β],(α-β,α+β),[α+β,1] 三個范圍,其中 α 和 β 是超參數。因此,當置信度分數落在左側 ([0,α?β]) 或右側 ([α+β,1]) 時,可以分別調用檢索-讀取或生成-讀取來回答。

此外,當遇到不確定或令人困惑的問題時,將問題分解成幾個子問題,旨在減少不確定性。為了保證迭代不溢出,設置了幾個終止條件:1)子問題數為1,即可能是單個問題;2)迭代深度的次數小于一個預定義的 t ,在這種情況下,簡單地將當前子問題視為未知問題,然后調用retrieve-then-read。然后,將所有子問題的答案結合起來,以提示大模型獲得原始問題的最終答案。

對應的偽代碼如下:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

二、關于回復置信度的估計

使用兩種類型的方法來提示LLM本身獲得置信度分數來回答問題。

一種是基于語言化的方法verbalize-based,直接指示llm在問題的答案之后輸出從0到100的置信水平,置信水平表示確定性的程度,然后將置信度分數重新映射到區間[0,1]。提示如下:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

另一種是基于概率probability-based的方法,還利用概率信息來計算置信分數。首先使用幾個單詞提示llm生成答案,然后得到生成內容中第 i 個token的概率 pi ,根據如下公式獲取序列中概率的平均值作為置信度分數。

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

這個思路很有意思,啟發來自于 《A stitch in time saves nine: Detecting and mitigating hallucinations of llms by validating low-confidence generation.》,這個工作也是一個幻覺緩解框架,其思想在于:給定輸入,迭代地從模型中生成句子,并主動檢測和減輕幻覺。在檢測階段,首先識別重要概念,計算模型在其上的不確定性,然后通過檢索相關知識驗證不確定性概念的正確性。在緩解階段,使用檢索到的知識作為證據來修復幻覺句子。最后,將修復后的句子附加到輸入(以及之前生成的句子)上,并繼續生成下一個句子。

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

其中的不確定估計是我們在這里要討論的重點,該工作認為,GPT-3等模型也在其預測中提供logit輸出值,因此可以采用這些logit輸出值來檢測幻覺。這個logit輸出值可以通過對每個標記位置的logit值應用softmax函數來獲得這些概率。例如,記為 p1, p2, p3,…,pn 分別表示 n 個token的位置。

可以取平均值(Average of Token Probabilities)

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

概率的歸一化積(Normalized Product of Token Probabilities)

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

取概率的最小值作為分數(Minimum of Token Probabilities)

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

為此,還加入 α 和 β 兩個參數來控制不確定性的范圍以提高Self-DC的魯棒性和靈活度。

三、針對問題的不同操作

根據不同的置信度,精心設計了幾個功能來完成組合性問答任務,包括幾個模塊

先生成后閱讀generate-then-read: 首先提示大模型從維基百科生成背景文檔來回答給定的問題,然后要求大模型通過引用生成的段落來回答問題。對應的prompt如下:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

先檢索后閱讀retrieve-then-read: 在第一步使用檢索器檢索外部知識,然后要求LLM根據檢索到的文章來回答問題,對應的prompt如下:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

問題分解decompose: 提示大模型將總體問題分解為幾個較小的子問題,這些子問題的答案共同有助于得出原始總體問題的答案,類似于Press等人(2023)和Xu等人(2023),這種用法很常見,其實就是query-expansion的處理。

這塊對應的prompt如下:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區


典型的分析工作,可以參考 《Measuring and Narrowing the Compositionality Gap in Language Models》,如下所示,通過提示大模型,針對某個問題進行分解,可以得到一些細分問題,從而提升性能。

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區


迭代問答combine-sub-qas:分解后,調用main函數進入下一個迭代,為了得到每個子問題的答案,可以將所有子問題的答案合并得到原始問題的答案,對因的prompt如下:

何時檢索,何時生成?Self-DC:自我分治解決復合問題-AI.x社區

四、總結

RAG個大系統,就像當時KG一樣,都說要替代掉,但其本身是個大系統,依舊是要往前走的,要有工程觀和落地觀念。

本文主要關注RAG的一個工作,也重新溫習了使用大模型對自身生成內容置信度估計的方案,與之前介紹內容不同的是,除了使用verblized based方案之外,還可以利用token的預測概率,如均值等,這些都是很好玩的思路。

此外,self-DC這套方案,前置要求大模型的置信準確性,也融合了問題擴展等思路,但也存在一些問題,例如,簡單問題和難問題之間存在著很大的差距,如該工作所說的, 對大模型的依賴性太強,當使用verblized based方法時,在gpt-3.5-turbo-1106上,發現超過65%的情況下置信度得分為0,大約20%的情況下置信度得分超過0.9。但當使用gpt-3.5-turbo-instruct,趨勢相反,給出0.9更高的頻率(≈45%),也就是說,大模型似乎要么高估了正確性,要么直接承認不確定性并拒絕回答。此外,細粒度置信分數(即0.82,0.61)相當罕見,使得β的細粒度選擇毫無意義。

另一方面,當使用probb方法時,有更多的細粒度置信信號,并且大多數落在<0.5部分(≈90%)。結果表明,gpt-3.5-turbo-1106在不確定性估計方面優于gpt-3.5-turbo-instruct,prob方法優于動詞方法,獲得了更準確的置信度分數,分解次數受置信度分數的影響很大,這可能又會落入到一個閾值的調節怪圈里。

所以說,在NLP領域,并不存在一個放之四海而皆準的防范,都是需要特事特辦,都是一堆補丁,即便有了長文本,也有一堆RAG的補丁要做。

Illustration From IconScout By Delesign Graphics

本文轉載自??將門創投??,作者:劉煥勇????

收藏
回復
舉報
回復
相關推薦
欧美三级在线| 小h片在线观看| 国产成人高清在线| 欧洲一区二区视频| 欧美三级视频网站| 日韩欧美久久| 一本色道亚洲精品aⅴ| 亚洲国产日韩综合一区| 亚洲风情第一页| 日韩电影在线观看一区| 久久999免费视频| 亚洲欧洲久久久| 亚洲精品在线a| 在线一区二区视频| av无码久久久久久不卡网站| 成人午夜影视| 成人av免费观看| 成人激情视频在线| 国产成人亚洲欧洲在线| 日韩一区欧美| 精品伊人久久97| 两女双腿交缠激烈磨豆腐| 成人免费直播| 亚洲一区二区av在线| 日本在线视频不卡| 女人18毛片一区二区三区| 日韩精品1区2区3区| 久久久久久久91| 青青操在线播放| 深爱激情综合网| 亚洲а∨天堂久久精品9966| 在线免费黄色网| 91综合国产| 精品人妻av一区二区三区| 国产精品日韩在线播放| 成人免费在线视频| 六月丁香久久丫| 一本一道人人妻人人妻αv| 亚洲中文字幕无码一区二区三区| 日韩精品在线视频观看| 欧美r级电影| 超碰成人福利| 亚洲一区二区精品视频| 亚洲人成网站在线观看播放| 视频在线不卡| thepron国产精品| 成人欧美一区二区| www.97av.com| 国产iv一区二区三区| 亚洲aa在线观看| 91久久精品无码一区二区| 免费成人av在线| 国产精品欧美激情| 精品一区二区无码| 丝袜美腿一区二区三区| 欧美一级黄色网| 男人的天堂一区二区| 国内激情久久| 欧美精品久久久久a| 中文字幕另类日韩欧美亚洲嫩草| 大色综合视频网站在线播放| 国产亚洲精品久久久久动| 成人午夜剧场视频网站| 国产伦一区二区三区| 亚洲免费精彩视频| 久久久久久久久久久久久久久| 真实原创一区二区影院| 国产亚洲精品美女| 亚洲一级片在线播放| 久久国产精品成人免费观看的软件| 在线成人免费视频| 精品视频高潮| 日本中文字幕在线| 欧美视频在线观看视频 | 欧美一区二视频在线免费观看| 亚洲经典中文字幕| 久久久国产午夜精品| 午夜先锋成人动漫在线| 中文字幕一区二区av| 一本色道久久88亚洲综合88| 亚洲精品国产一区黑色丝袜| 欧美一级精品| 久久天天躁狠狠躁夜夜躁2014| 全网免费在线播放视频入口| 野花国产精品入口| 国产成人精品日本亚洲| 中文字幕一区2区3区| 激情五月婷婷综合网| 国产高清精品一区二区| 欧美色视频免费| 国产精品盗摄一区二区三区| av日韩在线看| 免费污视频在线一区| 欧美久久久一区| 高清中文字幕mv的电影| 国产99精品一区| 久久综合五月天| 久久久久久久久久影院| 久久精品久久综合| 国产精品视频福利| 国产视频第一页在线观看| 亚洲蜜臀av乱码久久精品蜜桃| 每日在线更新av| 涩涩涩久久久成人精品| 亚洲黄页网在线观看| 萌白酱视频在线| 一本色道久久综合亚洲精品不卡 | 久久99最新地址| 日韩欧美电影在线| 国产成人精品综合在线观看| 亚洲春色h网| 国产日韩电影| 你懂的免费在线观看| av大全在线观看| 最近中文字幕在线mv视频在线| 日本a√在线观看| 亚洲欧美另类动漫| 中文字幕高清在线播放| 91精品国产综合久久久久久漫画 | 北条麻妃久久精品| 久久99国产综合精品免费| 国产一区二区女| 日韩欧美亚洲v片| 欧亚在线中文字幕免费| 日韩小视频在线观看专区| 在线观看日本黄色| 国产日韩欧美一区在线| 97久久天天综合色天天综合色hd | 亚洲精品精品亚洲| 亚洲成色www.777999| 亚洲丁香日韩| 欧美精品久久久久久久| 精品国产av鲁一鲁一区| 国产精品国产自产拍高清av | 国产一级在线观看视频| 韩日欧美一区二区三区| 一本久道久久综合| 91精品影视| 亚洲毛片在线免费观看| 日韩精品在线不卡| 成人国产精品视频| 久久亚洲精品无码va白人极品| 欧洲精品99毛片免费高清观看 | 日韩一区二区精品葵司在线 | 亚洲日本在线播放| 午夜日韩在线电影| 一级黄色电影片| 国产一区二区三区四区老人| 亚洲影视九九影院在线观看| 国产在线激情| 欧美精品乱人伦久久久久久| 欧日韩不卡视频| 久久er精品视频| 一级特黄妇女高潮| 久久久久久久久成人| 欧美成人午夜剧场免费观看| 99久久国产免费| 夜夜嗨av一区二区三区| 可以看的av网址| 影音先锋日韩资源| 九色91国产| 成人午夜精品| 日韩中文字幕在线看| 99在线观看免费| 亚洲午夜久久久久久久久电影网| 国产精品成人免费一区久久羞羞| 激情久久婷婷| 免费看成人av| 欧美亚洲人成在线| 欧美日韩福利电影| 污视频软件在线观看| 色婷婷激情久久| 女人裸体性做爰全过| 国内精品久久久久影院薰衣草 | 久久久久成人精品免费播放动漫| 周于希免费高清在线观看| 中文字幕欧美精品在线| 99这里有精品视频| 欧美日韩国产专区| 亚洲欧美va天堂人熟伦| 国产一区二区三区在线观看免费视频| 欧美做受777cos| 思热99re视热频这里只精品| 国产精品自产拍在线观| 美女日批视频在线观看| 国产视频久久久| 国产老妇伦国产熟女老妇视频| 夜夜操天天操亚洲| 国产综合精品在线| 国产不卡视频一区| 亚洲五月天综合| 欧美日韩一视频区二区| 欧美人与性禽动交精品| 国产一精品一av一免费爽爽| 欧美综合第一页| 麻豆影视在线观看_| 亚洲激情在线观看| 国产一区二区在线视频观看| 亚洲444eee在线观看| 日本人亚洲人jjzzjjz| 国产成+人+日韩+欧美+亚洲| 天天操天天爱天天爽| 亚洲午夜精品久久久久久app| 视频一区在线免费观看| 亚洲精品观看| 国产欧亚日韩视频| 密臀av在线播放| 欧美成人午夜免费视在线看片| 欧洲视频在线免费观看| 日韩欧美国产一区二区在线播放| 免费观看日批视频| 亚洲福利视频一区二区| 搜索黄色一级片| 久久久91精品国产一区二区精品 | 欧美—级高清免费播放| 福利视频在线播放| 亚洲精品福利视频| 国产成人a人亚洲精品无码| 在线影视一区二区三区| 国产网友自拍视频| 亚洲精品伦理在线| 亚洲午夜久久久久久久国产| 不卡欧美aaaaa| 日本女人性视频| 麻豆国产精品一区二区三区 | 国产在线精品不卡| 亚洲精品高清无码视频| 国产美女精品| 欧美不卡在线播放| 欧美日韩精品| www.激情网| 久久久久亚洲| 在线丝袜欧美日韩制服| 日韩欧美大片| 视频一区视频二区视频| 精品国产一区二区三区小蝌蚪| 精品高清视频| 欧美顶级毛片在线播放| 国产精品区一区二区三含羞草| 日本一区二区乱| 亚洲综合在线做性| 狂野欧美xxxx韩国少妇| 91免费国产网站| 韩国一区二区三区视频| 91久久久久久久久| 伊人久久一区| 91手机在线视频| 亚洲不卡在线| 国产经典一区二区三区| av成人资源| 国内外成人免费视频| 奇米777国产一区国产二区| 九九久久99| 久久不见久久见国语| 日本精品国语自产拍在线观看| 九九久久精品| 日韩免费av一区二区三区| 红桃成人av在线播放| 视频一区二区三| 91成人精品视频| 97免费视频观看| 在线播放亚洲| 欧美成人黑人猛交| 青草av.久久免费一区| 国产福利在线免费| 国产麻豆成人精品| 色诱av手机版| 91性感美女视频| 天天躁夜夜躁狠狠是什么心态| 欧美激情一区二区在线| 91传媒免费观看| 亚洲.国产.中文慕字在线| 久久精品五月天| 欧美一区二区三区视频在线| 精品女同一区二区三区| 亚洲精品一区av在线播放| 都市激情一区| 欧美黄色片免费观看| 欧美羞羞视频| 成人黄色午夜影院| 久久a级毛片毛片免费观看| 少妇免费毛片久久久久久久久| 久久精品亚洲人成影院 | 精品国产国产综合精品| 亚洲欧美一区二区三区孕妇| 久久精品国产av一区二区三区| 欧美性xxxxx极品娇小| 伊人成人在线观看| 精品国产免费久久| 国产三级在线免费观看| 欧美成人激情视频免费观看| 午夜影院在线播放| 成人天堂噜噜噜| 亚州综合一区| 丰满人妻一区二区三区53号 | 一区二区三区视频在线观看| 国产毛片aaa| 欧美一级专区免费大片| 香港三日本三级少妇66| 久久久999国产| 最新欧美色图| 俄罗斯精品一区二区三区| 国内黄色精品| 男女视频网站在线观看| 久久精品免费看| 九色porny自拍视频| 亚洲最新视频在线播放| 中文字幕视频一区二区| 亚洲激情久久久| 欧美xxxx少妇| 国产日韩精品一区二区| 婷婷综合一区| 日b视频免费观看| 美女视频免费一区| 在线 丝袜 欧美 日韩 制服| 一区二区三区四区国产精品| 中日韩av在线| 亚洲女人天堂成人av在线| jizz一区二区三区| 91欧美精品成人综合在线观看| 一区二区三区视频免费观看| 欧美又粗又长又爽做受| 国产主播一区二区三区| 青娱乐国产视频| 狠狠躁夜夜躁人人爽天天天天97| www.国产精品视频| 久久人人爽亚洲精品天堂| 成人精品电影在线| 精品久久蜜桃| av成人毛片| 中文欧美日本在线资源| 精品美女视频在线观看免费软件| 欧美激情在线一区| 国产美女亚洲精品7777| 亚洲五月六月| 日本一区中文字幕| 国产肥白大熟妇bbbb视频| 精品女厕一区二区三区| 后进极品白嫩翘臀在线视频| 免费av一区二区| 国产一区二区视频在线看| 一区国产精品| 国内成+人亚洲+欧美+综合在线 | 欧美人妖在线观看| 全黄性性激高免费视频| 成人h动漫精品一区二| 午夜偷拍福利视频| 亚洲国产精品va在线| 久草在线视频网站| 国产伦精品一区二区三毛| 欧美久久一区| 亚洲色图欧美另类| 亚洲午夜视频在线| 欧美熟妇另类久久久久久不卡 | 亚洲男女性事视频| 欧美色网一区| 性欧美大战久久久久久久免费观看| 日本在线观看不卡视频| 国产综合精品久久久久成人av| 欧美色综合天天久久综合精品| 91社区在线观看| 成人免费激情视频| 小小影院久久| 美女露出粉嫩尿囗让男人桶| 亚洲电影一级黄| 久久久久久青草| 国产精品老牛影院在线观看| 99视频精品全国免费| 极品白嫩的小少妇| 懂色av影视一区二区三区| 黄色毛片在线看| 91精品久久久久| 黄色综合网站| 男女做爰猛烈刺激| 欧美日韩极品在线观看一区| 亚洲欧美成人影院| 国产精选在线观看91| 久久久久久穴| 性欧美videos| 精品视频在线播放| 成人福利片在线| 国产日韩亚洲欧美在线| 久久综合狠狠综合久久综合88 | 亚洲精品555| 国产成人三级视频| 97aⅴ精品视频一二三区| 亚洲欧美另类在线视频| 久久九九全国免费精品观看| 久久九九热re6这里有精品| 亚洲午夜无码av毛片久久| 国产精品伦理在线| 韩国av永久免费| 国产精品福利无圣光在线一区| 欧美日本精品| a天堂中文字幕| 欧美videos中文字幕| 国产韩日精品| 日韩xxxx视频| 亚洲人成网站色在线观看| 秋霞av在线|