精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當prompt策略遇上分治算法,南加大、微軟讓大模型煉成「火眼金睛」

人工智能 新聞
為了使 LLM 更好地分辨并盡可能避免這種中間錯誤,來自南加州大學、微軟的研究者提出了一種基于分治算法的提示策略。這種策略利用分治程序來引導 LLM。

近年來,大語言模型(LLMs)由于其通用的問題處理能力而引起了大量的關注。現(xiàn)有研究表明,適當?shù)奶崾驹O計(prompt enginerring),例如思維鏈(Chain-of-Thoughts),可以解鎖 LLM 在不同領域的強大能力。

然而,在處理涉及重復子任務和 / 或含有欺騙性內容的任務(例如算術計算和段落級別長度的虛假新聞檢測)時,現(xiàn)有的提示策略要么受限于表達能力不足,要么會受到幻覺引發(fā)的中間錯誤的影響。

為了使 LLM 更好地分辨并盡可能避免這種中間錯誤,來自南加州大學、微軟的研究者提出了一種基于分治算法的提示策略。這種策略利用分治程序來引導 LLM。

論文地址:https://arxiv.org/pdf/2402.05359.pdf

具體來講,我們將一個大任務的解決過程解耦為三個子過程:子問題劃分、子問題求解以及子問題合并。理論分析表明,我們的策略可以賦予 LLM 超越固定深度 Transformer 的表達能力。實驗表明,我們提出的方法在受到中間錯誤和欺騙性內容困擾的任務中(例如大整數(shù)乘法、幻覺檢測和錯誤信息檢測)可以比經典的提示策略獲得更好的性能。

太長不看版:我們發(fā)現(xiàn)在應用 LLM 處理較長的問題輸入時,把輸入拆分然后分而治之可以取得更好的效果。我們從理論上解釋了這一現(xiàn)象并實驗角度進行了驗證。

研究動機

本文的研究動機來自于實驗中觀察到的有趣現(xiàn)象。具體來說,我們發(fā)現(xiàn)對于涉及重復子任務和 / 或含有欺騙性內容的任務(如段落級別長度的虛假新聞檢測),對輸入進行拆分可以提升模型對于錯誤信息的分辨能力。下圖展示了一個具體的例子。

在這個例子當中,我們調用大語言模型來評估一段總結性文本是否與完整的新聞報道存在事實性沖突。

在這個任務中,我們嘗試了兩種策略:耦合策略和分治策略。在耦合策略下,我們直接為模型提供完整的新聞報道和整段總結性文本,然后要求模型評估二者是否存在沖突。模型錯誤地認為二者不存在沖突,并且忽視了我們標紅的沖突點(新聞中明確表示調查人員否定了錄像的存在,然而總結中的第一句話表示錄像已被成功復原)。

而當我們采取分治策略,也就是簡單地將總結性文本拆分成多句話,然后分別對每句話進行評估,模型成功地識別出了沖突。

這個例子向我們展示了:對長輸入進行劃分可以幫助我們更好地解鎖模型的能力。基于這一點,我們提出利用分治程序來引導 LLM,從而賦予模型更強的分辨力。

基于分治的提示(prompting)策略

我們提出使用分治(Divide-and-Conquer, DaC)程序來引導 LLM。該程序包括三個不同的子過程:子問題劃分、子問題求解以及子解答合并

在子問題劃分,我們提示 LLM 將任務分解為一系列具有較小規(guī)模的并行同質子任務(例如將長段落分解為句子)。這里的并行原則保證模型可以分別處理這些子任務而不依賴于某些特定的求解順序。也因此,一個子任務的解答不會依賴于其它子任務的解答的正確性,這增強了模型對于中間錯誤的魯棒性,使模型獲得更強的分辨力。

之后,在子問題求解階段,我們提示 LLM 分別求解每個子任務。

最后,在子解答合并階段,我們提示 LLM 將每個子任務的答案組合起來并獲得最終答案。在這個過程中,所有三個階段的推理過程都被隔離開來以避免干擾。它們都由一個程序而不是 LLM 來引導,以避免幻覺或來自輸入上下文的欺騙。

在下面的示意圖中,我們將自己的方法和目前流行的提示策略進行了對比。

為了解決不同規(guī)模的任務,我們提出了兩種變體:單級分治策略 (Single-Level Divide-and-Conquer) 多級分治策略 (Multi-Level Divide-and-Conquer)。單級策略中,我們只對輸入進行一次劃分,然后就開始進行求解。在多級策略中,我們可以遞歸調用分治程序,從而把求解過程展開成一棵多層的樹。

圖片

理論分析

我們通過理論分析展示了為什么分治策略能夠提升大語言模型的分辨力。

此前的工作(Feng et al 2023, Merrill & Sabharwal 2023)已經證明,現(xiàn)有的通用大語言模型所普遍采用的固定深度與對數(shù)精度的預訓練 Transformer,存在表達能力上的限制。

具體來說,假設 NC1 類問題嚴格難于 TC0 類時(TC0 和 NC1 是并行計算理論中的兩大類問題,其關系類似 P 與 NP),那么這些 Transformer 模型在處理 NC1 完全問題時,其模型寬度需要以超多項式(如指數(shù))級別的速度隨問題規(guī)模增長。NC1 完全問題包含了很多常見的問題,比如兩色 2 叉子樹匹配問題。

而我們此前提到的評估兩段文本是否存在事實性沖突的問題,恰好可以被視為判斷總結文本所對應的語義樹是否匹配新聞材料的語義樹的一棵子樹。因此,當總結性文本足夠長時,大語言模型會面臨表達能力不足的問題。我們的理論分析嚴格證明了,在基于分治的提示策略下,存在一個寬度和深度均為常數(shù)的 Transformer,可以在 log(n)的時間復雜度下解決任意規(guī)模的兩色 2 叉子樹匹配問題

實驗結果

我們考慮了三個任務:大整數(shù)乘法、幻覺檢測、新聞驗證。我們基于 GPT-3.5-Turbo 和 GPT-4 進行評估。對于大整數(shù)乘法,此前的工作已經證明,ChatGPT 難以正確計算 4 位以上的整數(shù)乘法問題。因此我們使用 5 位乘 5 位的乘法來驗證我們的提示策略的有效性。

結果如下圖所示,可以看出,無論是準確率指標還是編輯距離指標,我們的方法相對其他 baseline 都具有明顯優(yōu)勢。

對于幻覺檢測,我們采用 HaluEval 數(shù)據(jù)集中的 Summarization Hallucination Detection 子集。對于該子集,模型需要根據(jù)一段新聞材料判斷一段總結性文本是否包含幻覺。我們將總結性文本劃分為單句并分別進行檢測。

檢測結果如下,可以看到,我們的方法相對 baseline 更好的平衡了精確度和召回率,從而取得了更好的準確率和 F1 score。

圖片

對于新聞驗證,我們基于 SciFact 數(shù)據(jù)集構造了一個段落驗證數(shù)據(jù)集。對于該數(shù)據(jù)集,模型需要根據(jù)一篇學術論文中的段落判斷一段新聞報道是真新聞還是假新聞。我們將新聞報道劃分為單句并分別進行檢測。

檢測結果如下,可以看到,我們的方法相對 baseline 取得了更好的準確率和 G-Mean score。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2011-03-08 09:27:33

2013-01-23 09:12:13

云存儲服務云存儲提供商選擇云存儲

2021-03-19 11:05:50

Linux目錄命令

2017-06-23 17:18:56

互聯(lián)網

2017-10-17 09:49:06

2020-05-26 12:52:06

Windows 10網絡故障

2023-09-06 07:11:41

大模型人工智能

2018-11-28 14:59:56

云計算

2010-11-17 13:35:50

BUG

2020-07-08 13:26:47

Python

2025-03-17 09:40:00

2024-08-06 12:00:00

監(jiān)督學習視覺

2011-12-20 09:23:09

2018-11-09 13:36:10

企業(yè)上云華為云

2020-10-27 19:30:37

人工智能AI火星新隕石

2022-02-24 11:00:12

安全美國中國

2010-11-17 15:43:55

軟件測試Bug

2013-04-25 10:22:48

2011-11-26 12:09:23

激光打印機推薦

2012-05-16 09:19:27

云電視云計算
點贊
收藏

51CTO技術棧公眾號

欧美一区二区三区精品| 国产69精品久久99不卡| 中文字幕在线观看日韩| 激情五月婷婷基地| 主播国产精品| www.久久精品| 国产精品入口福利| 曰本女人与公拘交酡| 米奇精品关键词| 欧美天天综合网| 午夜啪啪福利视频| 国产又粗又大又爽| 永久亚洲成a人片777777| 日韩av影视在线| 国产欧美激情视频| 中文字幕成在线观看| 亚洲欧美日韩中文播放| 免费成人av网站| 99热这里只有精品3| 三级欧美韩日大片在线看| 不卡中文字幕av| 四虎永久免费影院| 91精品入口| 欧美日韩激情一区二区三区| 成人在线免费在线观看| 在线电影福利片| 中文字幕国产一区| 久久精品欧美| 免费成人在线看| 国产在线精品国自产拍免费| 欧美亚洲视频在线观看| 麻豆一区产品精品蜜桃的特点| 免费欧美一区| 亚洲精品av在线| 在线播放第一页| 国产乱码精品一区二区三区亚洲人| 色系网站成人免费| 老太脱裤让老头玩ⅹxxxx| 国产秀色在线www免费观看| 国产视频不卡一区| 欧美极品一区| 奇米影视888狠狠狠777不卡| 国产一区二区福利| 成人精品一区二区三区电影免费| 波多野结衣一区二区三区在线 | 欧美丰满嫩嫩电影| 亚洲色图38p| 不卡av影片| 色综合咪咪久久| 国产 福利 在线| 日本乱码一区二区三区不卡| 亚洲一区二区成人在线观看| 国产专区在线视频| 色呦呦在线视频| 亚洲午夜精品网| 无码人妻少妇伦在线电影| 国产高清在线a视频大全| 一区二区在线看| 亚洲免费视频播放| 最新日本在线观看| 亚洲夂夂婷婷色拍ww47| 2018中文字幕第一页| 国内小视频在线看| 亚洲va欧美va国产va天堂影院| 一本久道高清无码视频| 超碰资源在线| 一本久久a久久免费精品不卡| 国产又黄又大又粗视频| 免费观看欧美大片| 91精品91久久久中77777| 凹凸日日摸日日碰夜夜爽1| 亚洲一区二区三区四区| 欧美视频在线观看一区二区| 亚洲一区精品视频在线观看| 久久视频社区| 亚洲精品av在线| 亚洲成人黄色av| 91精品国产91久久久久久密臀| 欧美成人手机在线| 国产做受高潮漫动| 国产精品女主播一区二区三区| 欧美一级电影在线| 中文字幕在线播放日韩| 国产主播一区二区| 精品国产一区二区三区四区vr| 天堂中文在线8| 久久精品日韩一区二区三区| 日韩第一页在线观看| 日韩激情av| 色综合天天综合网天天狠天天| jizz18女人| 日韩在线精品强乱中文字幕| 日韩精品极品毛片系列视频| 激情无码人妻又粗又大| 欧美视频网站| 国产精品激情av电影在线观看 | 亚洲精品国产精品国自产在线| 偷拍夫妻性生活| 欧美激情综合| 国产大片精品免费永久看nba| 91精品国产乱码久久久| 99热国产精品| 99精品一区二区三区的区别| 美女91在线看| 正在播放亚洲一区| 一级片手机在线观看| 亚洲人metart人体| 日本一区二区三区四区视频| jizz中国女人| 久久久www免费人成精品| 超碰10000| 国产精品亚洲一区二区三区在线观看| 日韩一区二区在线观看视频播放| 免费观看av网站| 欧美激情aⅴ一区二区三区| 热久久这里只有精品| 国产xxxx在线观看| 国产精品免费免费| 色欲av无码一区二区人妻| 欧美片网站免费| 中文在线不卡视频| www成人在线| 国产成人日日夜夜| 亚洲精品一区二区三区四区五区| sm在线播放| 日韩欧美亚洲国产精品字幕久久久| 国产精品1000部啪视频| 好看的亚洲午夜视频在线| 国产精品网红福利| 男人av在线| 欧美日韩精品中文字幕| 中文在线字幕观看| 亚洲综合色网| 成人黄色免费网站在线观看| p色视频免费在线观看| 欧美性xxxxx极品| 日本xxxx免费| 真实国产乱子伦精品一区二区三区| 国产欧美一区二区三区久久| 国产精品一级伦理| 日韩欧美一区视频| 成人网站免费观看| 国产毛片久久| 人偷久久久久久久偷女厕| 天堂av中文在线观看| 亚洲成人av片| 亚洲欧美在线视频免费| 成人av网站在线| 无码 制服 丝袜 国产 另类| 99这里只有精品视频| 欧美尺度大的性做爰视频| 国产丝袜视频在线观看| 亚洲男同1069视频| 亚洲丝袜在线观看| 欧美日韩网址| 国产欧美一区二区三区另类精品| 菠萝蜜视频在线观看www入口| 日韩欧美你懂的| 久久久精品99| www.欧美精品一二区| 欧洲av无码放荡人妇网站| 亚洲第一二三区| 国产ts人妖一区二区三区| 三区在线视频| 欧美午夜片在线看| 国产激情无码一区二区三区| 国产一区二区在线影院| 亚洲精品天堂成人片av在线播放| 91麻豆精品激情在线观看最新| 久久久久亚洲精品国产| 日韩中文字幕免费在线观看| 性做久久久久久久久| 免费看黄色av| 久久狠狠亚洲综合| 免费网站永久免费观看| 久久动漫网址| 日本精品视频在线播放| chinese偷拍一区二区三区| 69久久夜色精品国产69蝌蚪网| 最新一区二区三区| 成年人国产精品| 亚洲最大综合网| 伊人久久大香线| 国产视频在线观看一区| 99久久综合国产精品二区| 久久伊人精品一区二区三区| 亚洲狼人综合网| 色域天天综合网| 亚洲二区在线播放| 99久久er热在这里只有精品66| 天天碰免费视频| 午夜国产精品视频免费体验区| 蜜桃av久久久亚洲精品| 日韩国产大片| 欧美亚洲国产成人精品| 免费a级在线播放| 亚洲精品国产精品乱码不99按摩 | 亚洲欧美日韩国产yyy| 91蜜桃臀久久一区二区| 国产精品 欧美在线| 日本高清在线观看| 亚洲天堂网在线观看| 精品区在线观看| 在线视频一区二区三| 免费在线一区二区三区| 中文字幕乱码一区二区免费| 国产精品果冻传媒| 久久国产精品无码网站| 日韩av综合在线观看| 自拍欧美日韩| 亚洲欧洲三级| 要久久爱电视剧全集完整观看| 91美女高潮出水| 亚洲www啪成人一区二区| 欧美精品videosex牲欧美| 日韩精品毛片| 亚洲欧洲自拍偷拍| 天天操天天干天天操| 欧美一区二区三区的| 中文字幕免费高清在线观看| 亚洲国产wwwccc36天堂| 欧美日韩午夜视频| 久久久久久久久久久黄色 | 理论片一区二区在线| 成人国产在线视频| 精品女同一区二区三区在线观看| 66m—66摸成人免费视频| 神马午夜伦理不卡 | 色吧亚洲日本| 韩国一区二区电影| 性欧美高清come| 久久人人爽人人爽爽久久| 久久精品蜜桃| 日韩毛片在线观看| 四虎影视在线观看2413| 亚洲护士老师的毛茸茸最新章节| www.av日韩| 日韩欧美一区在线| 国产99视频在线| 欧美一区二区三区四区高清| 国产精品无码在线播放| 7777精品久久久大香线蕉| 在线视频免费观看一区| 欧美在线你懂得| 中文字幕av片| 欧美日韩在线直播| 亚洲天堂中文在线| 欧美日韩成人综合| 国产精品国产三级国产aⅴ| 欧美久久久久久久久| 国产又大又长又粗| 51久久夜色精品国产麻豆| 国产免费高清av| 日韩午夜在线影院| 囯产精品久久久久久| 欧美v国产在线一区二区三区| 午夜精品久久久久久久爽 | 毛片激情在线观看| 久久天天躁日日躁| 国语对白在线刺激| 欧美最顶级丰满的aⅴ艳星| 高清不卡亚洲| 国产精品羞羞答答| 国产日韩一区二区三免费高清| 亚洲精品免费网站| 国产精品x8x8一区二区| 久久亚洲综合网| 日本激情一区| 亚洲欧美一区二区三区极速播放| 91精品国产综合久久久蜜臀图片 | 一本色道88久久加勒比精品| 国产精品久久..4399| 亚洲精品资源| 青青在线免费观看视频| 精品一区二区三区免费观看| 中文字幕第10页| 97精品国产露脸对白| 波多野在线播放| 亚洲欧美偷拍卡通变态| 日韩av在线电影| 欧美手机在线视频| 黑人乱码一区二区三区av| 日韩电影免费在线观看中文字幕| 成黄免费在线| 久99久在线视频| 高清不卡av| 99c视频在线| 国产一区国产二区国产三区| 国产三级中文字幕| 久久久久99| 欧美体内she精高潮| 91小视频在线免费看| 一本在线免费视频| 精品magnet| 国产理论片在线观看| 亚洲精品综合久久中文字幕| 黄色片网站在线| 亲子乱一区二区三区电影 | 日韩电影一区二区三区四区| www.偷拍.com| 国产亚洲自拍一区| 国产一级二级毛片| 欧美人妇做爰xxxⅹ性高电影| 黄片毛片在线看| 久久久精品视频在线观看| 久草免费在线视频| 亚洲淫片在线视频| 精品盗摄女厕tp美女嘘嘘| 日韩精品一区二区免费| 免费成人性网站| 免费观看av网站| 午夜激情一区二区三区| 国产人妖一区二区| 国产一区二区三区视频| а_天堂中文在线| 成人黄色av网| 日韩精品永久网址| 茄子视频成人免费观看| 国产东北露脸精品视频| 三级黄色片在线观看| 色婷婷久久久综合中文字幕| 日韩在线视频观看免费| 欧美成人免费va影院高清| 青娱乐极品盛宴一区二区| 久久伊人资源站| 99国产精品久久久久久久成人热| 91蝌蚪视频在线| 国产精品乱码一区二区三区软件 | 亚洲第一图区| 91免费电影网站| 欧美高清视频在线观看mv| 国产1区2区在线| 26uuu亚洲综合色欧美| 91av在线免费视频| 亚洲成人免费在线视频| 手机在线免费av| av一区二区三区免费| 午夜亚洲福利| 99热这里只有精品2| 自拍av一区二区三区| 影音先锋黄色网址| 中文字幕少妇一区二区三区| 欧美性理论片在线观看片免费| 欧美激情视频一区二区三区| 亚洲欧美日韩国产综合精品二区 | 色呦色呦色精品| 中文字幕一区二区在线观看| 91福利在线观看视频| 久久精品夜夜夜夜夜久久| 伦一区二区三区中文字幕v亚洲| 日韩视频精品| 久久精品国产99久久6| 天天色天天综合| 在线不卡中文字幕| 91香蕉在线观看| 国产精品乱码视频| 99xxxx成人网| 手机免费看av| 欧美日韩国产另类不卡| 精品国产白色丝袜高跟鞋| 99久久精品免费看国产一区二区三区 | 久久精品国产久精国产爱| 国精品人伦一区二区三区蜜桃| 6080国产精品一区二区| 四虎亚洲精品| 久久精品国产一区二区三区不卡| 日韩精品一级中文字幕精品视频免费观看 | 日本欧美www| 久久精品91久久香蕉加勒比| 视频一区日韩| 91黄色小网站| 国产精品久久久久久久久图文区| 国产精品视频一二区| 久久久免费高清电视剧观看| 小嫩嫩12欧美| 日韩在线一区视频| 亚洲成人高清在线| 国外av在线| 亚洲xxxx视频| 久久综合激情| 青娱乐91视频| 亚洲欧美成人一区二区在线电影| www.成人在线视频| 青春草国产视频| 日本一区二区三区视频视频| 国产免费的av| 青青草原成人在线视频| 91精品国偷自产在线电影| 女同性恋一区二区三区| 欧美日精品一区视频| wwww亚洲| 亚洲一区二区精品在线观看| 国产成人在线网站| 波多野结衣一二区| 孩xxxx性bbbb欧美| 四虎成人精品永久免费av九九| 国产国语老龄妇女a片| 欧美午夜寂寞影院| 僵尸再翻生在线观看免费国语| 一区国产精品|