精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepMind讓大模型學(xué)會(huì)歸納和演繹,GPT-4準(zhǔn)確率提升13.7%

人工智能 機(jī)器學(xué)習(xí)
現(xiàn)在,來自谷歌、Mila 研究所等研究機(jī)構(gòu)的研究者聯(lián)合探索了一種新方法 —— 讓 LLM 學(xué)習(xí)推理規(guī)則,并提出一種名為假設(shè)到理論(Hypotheses-to-Theories,HtT)的新框架。

當(dāng)前,大型語言模型(LLM)在推理任務(wù)上表現(xiàn)出令人驚艷的能力,特別是在給出一些樣例和中間步驟時(shí)。然而,prompt 方法往往依賴于 LLM 中的隱性知識(shí),當(dāng)隱性知識(shí)存在錯(cuò)誤或者與任務(wù)不一致時(shí),LLM 就會(huì)給出錯(cuò)誤的回答。

現(xiàn)在,來自谷歌、Mila 研究所等研究機(jī)構(gòu)的研究者聯(lián)合探索了一種新方法 —— 讓 LLM 學(xué)習(xí)推理規(guī)則,并提出一種名為假設(shè)到理論(Hypotheses-to-Theories,HtT)的新框架。這種新方法不僅改進(jìn)了多步推理,還具有可解釋、可遷移等優(yōu)勢。

論文地址:https://arxiv.org/abs/2310.07064

對(duì)數(shù)值推理和關(guān)系推理問題的實(shí)驗(yàn)表明,HtT 改進(jìn)了現(xiàn)有的 prompt 方法,準(zhǔn)確率提升了 11-27%。學(xué)到的規(guī)則也可以遷移到不同的模型或同一問題的不同形式。

方法簡介

總的來說,HtT 框架包含兩個(gè)階段 —— 歸納階段和演繹階段,類似于傳統(tǒng)機(jī)器學(xué)習(xí)中的訓(xùn)練和測試。

在歸納階段,LLM 首先被要求生成并驗(yàn)證一組訓(xùn)練樣例的規(guī)則。該研究使用 CoT 來聲明規(guī)則并推導(dǎo)答案,判斷規(guī)則的出現(xiàn)頻率和準(zhǔn)確性,收集經(jīng)常出現(xiàn)并導(dǎo)致正確答案的規(guī)則來形成規(guī)則庫。

有了良好的規(guī)則庫,下一步該研究如何應(yīng)用這些規(guī)則來解決問題。為此,在演繹階段,該研究在 prompt 中添加規(guī)則庫,并要求 LLM 從規(guī)則庫中檢索規(guī)則來進(jìn)行演繹,將隱式推理轉(zhuǎn)換為顯式推理。

然而,該研究發(fā)現(xiàn),即使是非常強(qiáng)大的 LLM(例如 GPT-4)也很難在每一步都檢索到正確的規(guī)則。為此,該研究開發(fā)了 XML tagging trick,來增強(qiáng) LLM 的上下文檢索能力。

實(shí)驗(yàn)結(jié)果

為了評(píng)估 HtT,該研究針對(duì)兩個(gè)多步驟推理問題進(jìn)行了基準(zhǔn)測試。實(shí)驗(yàn)結(jié)果表明,HtT 改進(jìn)了少樣本 prompt 方法。作者還進(jìn)行了廣泛的消融研究,以提供對(duì) HtT 更全面的了解。

他們?cè)跀?shù)值推理和關(guān)系推理問題上評(píng)估新方法。在數(shù)值推理中,他們觀察到 GPT-4 的準(zhǔn)確率提高了 21.0%。在關(guān)系推理中,GPT-4 的準(zhǔn)確性提高了 13.7%,GPT-3.5 則獲益更多,性能提高了一倍。性能增益主要來自于規(guī)則幻覺的減少。

具體來說,下表 1 顯示了在算術(shù)的 base-16、base-11 和 base-9 數(shù)據(jù)集上的結(jié)果。在所有 base 系統(tǒng)中,0-shot CoT 在兩個(gè) LLM 中的性能都最差。

表 2 呈現(xiàn)了在 CLUTRR 上比較不同方法的結(jié)果。可以觀察到,在 GPT3.5 和 GPT4 中,0-shot CoT 的性能最差。對(duì)于 few-shot 提示方法,CoT 和 LtM 的性能相似。在平均準(zhǔn)確率方面,HtT 始終比兩種模型的提示方法高出 11.1-27.2%。值得注意的是,GPT3.5 在檢索 CLUTRR 規(guī)則方面并不差,而且比 GPT4 從 HtT 中獲益更多,這可能是因?yàn)?CLUTRR 中的規(guī)則比算術(shù)中的規(guī)則少。

值得一提的是,使用 GPT4 的規(guī)則,GPT3.5 上的 CoT 性能提高了 27.2%,是 CoT 性能的兩倍多,接近 GPT4 上的 CoT 性能。因此,作者認(rèn)為 HtT 可以作為從強(qiáng) LLM 到弱 LLM 的一種新的知識(shí)蒸餾形式。

表 3 顯示,HtT 顯著提高了 GPT-4(文本版)的性能。對(duì)于 GPT3.5 來說,這種改進(jìn)并不顯著,因?yàn)樵谔幚砦谋据斎霑r(shí),它經(jīng)常產(chǎn)生除規(guī)則幻覺以外的錯(cuò)誤。

責(zé)任編輯:趙寧寧 來源: 機(jī)器之心
相關(guān)推薦

2023-10-14 13:09:53

谷歌模型

2023-09-19 14:56:00

模型訓(xùn)練

2024-08-02 13:14:51

2025-05-26 08:33:00

2023-11-20 21:56:04

AI推理

2024-01-03 13:37:00

模型數(shù)據(jù)

2023-09-19 09:20:16

2025-01-21 08:00:00

2023-12-04 13:51:00

模型數(shù)據(jù)

2023-09-03 12:56:43

2024-02-26 00:50:00

數(shù)據(jù)AI

2025-05-06 15:32:23

模型AI測試

2024-01-29 12:49:00

AI模型

2023-11-15 09:23:00

模型AI

2023-11-03 13:07:00

AI模型

2024-03-08 13:18:44

模型訓(xùn)練

2023-10-26 08:40:15

模型隱私推理

2024-12-06 14:19:50

2024-11-18 09:50:00

模型訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日本电影亚洲天堂| 亚洲1区2区3区视频| 国产精品亚洲第一区| 久久久精品少妇| 香蕉大人久久国产成人av| 亚洲1区2区3区视频| 丝袜美腿玉足3d专区一区| 国产一区二区三区四区视频| 雨宫琴音一区二区三区| 国产婷婷97碰碰久久人人蜜臀| 91色国产在线| 免费污视频在线观看| 26uuu国产在线精品一区二区| 国产精品亚洲аv天堂网| 中文字幕第28页| 日韩精品一区二区久久| 亚洲成av人影院在线观看| 91制片厂毛片| 忘忧草在线影院两性视频| 综合久久国产九一剧情麻豆| 麻豆亚洲一区| 肥臀熟女一区二区三区| 六月丁香婷婷色狠狠久久| 午夜美女久久久久爽久久| 国产精品麻豆免费版现看视频| 国产亚洲成av人片在线观黄桃| 欧美日韩精品免费观看视频| 免费观看国产精品视频| 超碰超碰在线| 国产精品看片你懂得| 蜜桃臀一区二区三区| 精品久久久久久亚洲综合网站| 日日夜夜免费精品视频| 国自在线精品视频| 日本黄色免费片| 国产一区二区三区探花| 亚洲精品电影网| 中文字幕第3页| 一本一道久久a久久| 欧美精品一卡两卡| 可以免费观看av毛片| 成av人片在线观看www| 一区二区理论电影在线观看| 在线免费观看成人网| 国产精品久久久久久久龚玥菲| av毛片久久久久**hd| 国产精品9999久久久久仙踪林| 97人妻一区二区精品免费视频| 三级影片在线观看欧美日韩一区二区| 国内精品久久久久影院 日本资源| 9999热视频| 亚洲一区在线| 欧美美最猛性xxxxxx| 人人澡人人澡人人看| 婷婷成人基地| 欧美成人久久久| 国产黄色片在线免费观看| 国产精品久久久久9999赢消| 日韩亚洲精品视频| 国产高潮呻吟久久| 精品美女视频| 色香阁99久久精品久久久| 精品人体无码一区二区三区| 日本一区二区高清不卡| 色久欧美在线视频观看| 亚洲精品自拍视频在线观看| 日韩欧美视频专区| 久久久国产在线视频| 国产探花在线播放| 激情综合在线| 26uuu另类亚洲欧美日本一| 日韩在线视频免费播放| 久久九九99| 国产三级精品网站| 99热这里只有精品66| 成人午夜视频网站| 欧美日韩亚洲免费| eeuss影院在线播放| 中文字幕日韩一区| 日韩精品手机在线观看| 99爱在线观看| 色就色 综合激情| 久久久久久久久久一区二区| 欧美激情三级| 精品香蕉一区二区三区| xxxxx99| 亚洲成人二区| 韩国日本不卡在线| 国内av在线播放| 国产一区二区伦理| 久久精品ww人人做人人爽| 国产福利在线| 亚瑟在线精品视频| 成人午夜激情av| 美女精品视频在线| 亚洲乱亚洲乱妇无码| av最新在线观看| 午夜亚洲福利在线老司机| 国产精品天天狠天天看| 内射无码专区久久亚洲| 国产视频不卡一区| 国产欧美123| 日本精品裸体写真集在线观看| 91精品国产一区二区| 日本护士做爰视频| 偷拍欧美精品| 热99精品只有里视频精品| 国产美女www爽爽爽视频| 久久综合网色—综合色88| 一级全黄肉体裸体全过程| 伊人久久综合一区二区| 欧美一级黄色大片| jizz中文字幕| 亚洲日本激情| 亚洲综合中文字幕在线观看| 精品推荐蜜桃传媒| 亚洲一区二区在线视频| 中文字幕永久有效| 国产成人ay| 97人洗澡人人免费公开视频碰碰碰| 综合网在线观看| 成人美女视频在线看| 天天成人综合网| 欧美电影免费观看| 欧美精品一区二| 黄色片在线观看网站| 蜜桃av噜噜一区| 欧美精品亚洲精品| 精品三级久久| 精品久久久久一区二区国产| 裸体武打性艳史| 美女www一区二区| 人偷久久久久久久偷女厕| zzzwww在线看片免费| 精品日韩99亚洲| 人妻人人澡人人添人人爽| 蜜臀av亚洲一区中文字幕| 欧美亚洲一级二级| 麻豆免费在线| 日韩成人av网址| 国产精品成人av久久| 国产福利91精品一区| 国产人妻互换一区二区| 亚洲狼人综合| 久久九九精品99国产精品| 在线不卡免费视频| 欧美国产日本视频| www.99av.com| 人人狠狠综合久久亚洲婷婷| 国产精品久久久久久久久免费看| 麻豆影视在线| 欧日韩精品视频| 精品国产aaa| 麻豆视频观看网址久久| 亚洲高清在线播放| 久久日本片精品aaaaa国产| 国产亚洲精品久久久| 久久久久久91亚洲精品中文字幕| 91在线视频18| 激情六月丁香婷婷| 精品久久不卡| 成人在线观看视频网站| 午夜伦理在线视频| 精品99一区二区三区| www.国产成人| 91麻豆swag| 一本岛在线视频| 久久精品国内一区二区三区水蜜桃 | 色综合久久网| 91久久精品美女| 免费影视亚洲| 亚洲三级 欧美三级| 亚洲午夜无码久久久久| 亚洲欧美一区二区在线观看| 亚洲精品乱码久久久久久9色| 影院欧美亚洲| 日韩av电影免费观看| 色8久久久久| 久久久人成影片一区二区三区观看| 无码国产精品一区二区色情男同| 欧美性色xo影院| 国精品人伦一区二区三区蜜桃| 国产成人亚洲综合a∨婷婷图片| 美女日批免费视频| 精品国产美女| 99国产高清| gogo亚洲高清大胆美女人体| 精品国产一区二区三区久久狼5月| 国产极品久久久| 欧美午夜精品在线| 成年人网站在线观看视频| 成人午夜电影久久影院| 国产av无码专区亚洲精品| 91精品国产成人观看| 精品一区二区三区国产| 深夜福利亚洲| 91精品国产色综合久久不卡98| 天天在线视频色| 亚洲成av人影院在线观看| 亚洲天堂网在线视频| 亚洲福利视频一区二区| 男人天堂资源网| 99re亚洲国产精品| 日本不卡一区在线| av不卡免费看| 老司机av福利| 国产精品密蕾丝视频下载| 99三级在线| 男女啪啪999亚洲精品| 国语自产精品视频在线看一大j8 | 色免费在线视频| 在线亚洲精品| 免费观看亚洲视频| 不卡视频在线| 免费成人深夜夜行视频| 日韩在线精品强乱中文字幕| 国产精品h在线观看| 99thz桃花论族在线播放| 欧美成人激情视频| seseavlu视频在线| 亚洲精品自拍视频| 黄色av免费观看| 91精品国产乱码久久蜜臀| 国产精品无码粉嫩小泬| 午夜视频一区二区| 青娱乐免费在线视频| 国产精品毛片a∨一区二区三区| 草草影院第一页| aaa亚洲精品| 国产午夜在线一区二区三区| 国产一区二区视频在线播放| 国产又大又黄又猛| 日日欢夜夜爽一区| 久久9精品区-无套内射无码| 亚洲激情黄色| 欧美性潮喷xxxxx免费视频看| 亚洲国产精品日韩专区av有中文| 性刺激综合网| 第四色成人网| 亚洲欧美日韩国产成人综合一二三区| 国产亚洲第一伦理第一区| 久久久久久国产精品免费免费| 国产日韩三级| 精品一区久久| 宅男在线一区| 日韩欧美一区二区视频在线播放| 妖精视频一区二区三区| 久久久久久久久久久久久9999| 日本欧美高清| 麻豆精品传媒视频| 视频一区欧美| 婷婷四房综合激情五月| 色琪琪久久se色| 在线丝袜欧美日韩制服| 91精品一区二区三区综合在线爱| 日韩第一页在线观看| 欧美伊人久久| 激情伊人五月天| 免费精品视频| 国产精品v日韩精品v在线观看| 日本强好片久久久久久aaa| 手机看片一级片| 国产精品一级片在线观看| jjzz黄色片| 久久亚洲一区二区三区四区| 欧美 日韩 国产 成人 在线观看 | www.天天色| 黄色一区二区三区| 9i精品福利一区二区三区| 在线免费亚洲电影| 国产又大又黑又粗| 欧美精品一区二区在线观看| 亚洲 欧美 激情 小说 另类| 夜夜嗨av一区二区三区四区| 久久黄色美女电影| 欧美激情18p| 亚洲成人看片| 91欧美视频网站| 欧美男男freegayvideosroom| 欧美中日韩一区二区三区| 999国产精品永久免费视频app| 久久亚洲国产成人精品无码区| 国产深夜精品| 久热在线视频观看| 不卡一区二区在线| 娇妻被老王脔到高潮失禁视频| 亚洲美女偷拍久久| 二区视频在线观看| 欧美丰满少妇xxxxx高潮对白| 国模私拍视频在线| 在线观看亚洲视频| 国内老司机av在线| 国产精品视频免费观看www| 亚洲视频一起| 日韩欧美在线观看强乱免费| 午夜精品久久99蜜桃的功能介绍| 黄色a级片免费| 国产成人午夜精品5599| 久久久视频6r| 亚洲成人av一区| 亚洲一区二区人妻| 日韩激情在线视频| 成人看av片| 国产精品白嫩美女在线观看 | 亚洲第一男人av| 香蕉视频免费在线播放| 午夜欧美不卡精品aaaaa| 国产精品美女久久久久人| 久久综合九色综合网站| 欧美成人久久| 中文字幕天天干| 91色在线porny| 九九视频在线免费观看| 欧美中文字幕亚洲一区二区va在线 | 久草国产在线观看| 欧美日韩精品一区二区在线播放| 天天躁日日躁狠狠躁喷水| 久久成年人视频| 免费污视频在线一区| 久久av一区二区三区漫画| 你懂的视频一区二区| 一道本在线免费视频| 国产午夜精品理论片a级大结局| 69精品久久久| 欧美变态凌虐bdsm| 午夜dj在线观看高清视频完整版| 国产三级精品网站| 精品理论电影在线| 青青在线视频观看| 久久这里只精品最新地址| 福利一区二区三区四区| 精品国产乱码久久久久久免费 | 国内精品视频在线观看 | 日本伊人午夜精品| 美女久久久久久久久久| 精品国产999| 姝姝窝人体www聚色窝| 久久久视频免费观看| 99久久人爽人人添人人澡| 国产日产欧美一区二区| 国产资源精品在线观看| 欧美日韩色视频| 91精品综合久久久久久| 国产婷婷视频在线| 91久久在线视频| 欧美搞黄网站| 成人免费播放视频| 一级中文字幕一区二区| 亚洲精品视频专区| 高清亚洲成在人网站天堂| 嗯用力啊快一点好舒服小柔久久| 女人帮男人橹视频播放| 粉嫩av亚洲一区二区图片| 久久精品国产亚洲av高清色欲| 精品999在线播放| sm在线播放| 日本精品免费| 麻豆极品一区二区三区| 国产精品99久久久久久成人| 日韩一区二区免费在线电影| 日本无删减在线| 精品乱色一区二区中文字幕| 久久成人精品| 国产精品麻豆一区| 日韩欧美国产电影| а√天堂资源官网在线资源| 欧美日本亚洲| 久久国产精品99久久久久久老狼 | 国产尤物视频在线| 国产欧美日韩专区发布| 欧美aa国产视频| 亚州av综合色区无码一区| 色哦色哦哦色天天综合| 黄色免费在线看| 国产精品推荐精品| 久久精品男女| 国产尤物在线播放| 亚洲精品久久久久久久久久久久 | 欧美一区二区日韩| free性欧美16hd| 热re99久久精品国产99热| 精品一区二区影视| 国产精品自拍视频一区| 夜夜嗨av一区二区三区四区| 影音先锋欧美激情| 日本毛片在线免费观看| 国产精品成人网| 日韩中文字幕免费观看| 国产精品高潮视频| 国内一区二区三区| 亚洲第一综合网| 欧美成人欧美edvon| 婷婷激情一区| 成人免费网站入口| 国产精品乱子久久久久| 人妻少妇精品无码专区久久| 国产久一一精品| 亚洲一区成人| 青春草免费视频| 中文亚洲视频在线|