精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI慢思考蒸餾進(jìn)快思考,Llama2躍升至GPT-4水平,不寫(xiě)過(guò)程也能做對(duì)題

人工智能
研究人員通過(guò)把AI的“慢思考”結(jié)果蒸餾進(jìn)“快思考”,讓Llama2表現(xiàn)提升了257%,變得比GPT4還能打,同時(shí)還能降低推理成本。

《思考快與慢》中人類(lèi)的兩種思考方式,屬實(shí)是被Meta給玩明白了。

研究人員通過(guò)把AI的“慢思考”結(jié)果蒸餾進(jìn)“快思考”,讓Llama2表現(xiàn)提升了257%,變得比GPT4還能打,同時(shí)還能降低推理成本。

圖片

這里的快慢兩種思考方式,指的就是2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼推廣的系統(tǒng)1和系統(tǒng)2——

簡(jiǎn)單說(shuō),系統(tǒng)1是簡(jiǎn)單無(wú)意識(shí)的直覺(jué),速度更快;系統(tǒng)2則是復(fù)雜有意識(shí)的推理,準(zhǔn)確性更強(qiáng)。

Meta所做的“蒸餾”,就是用系統(tǒng)2生成數(shù)據(jù),然后對(duì)用系統(tǒng)1推理的模型進(jìn)行微調(diào)。

有網(wǎng)友看了后表示,這種模式和人類(lèi)很像,一旦解決了一個(gè)難題,再解決(相似的問(wèn)題)就變得簡(jiǎn)單了。

圖片

將系統(tǒng)2蒸餾到系統(tǒng)1

對(duì)于大模型而言,模仿人類(lèi)的“系統(tǒng)2”的方式有很多種,在模型中所處的環(huán)節(jié)也不盡相同,這里作者一共研究了四種:

  • CoT,即Chain of Thought,思維鏈,從提示詞入手讓模型逐步思考。
  • S2A,即System 2 Attention,由Meta自己提出,直接修改了模型的注意力機(jī)制,屏蔽與任務(wù)無(wú)關(guān)的信息。
  • RaR,即Rephase and Respond,先對(duì)問(wèn)題進(jìn)行重新表述,再根據(jù)重述后的問(wèn)題生成答案。
  • BSM,即Branch-Solve-Merge,將復(fù)雜任務(wù)分解為多個(gè)分支,針對(duì)每個(gè)分支獨(dú)立生成評(píng)分,再將各個(gè)分支的評(píng)分綜合。

圖片

但從整體流程上看則是殊途同歸,各種“系統(tǒng)2方法”都會(huì)在未標(biāo)注數(shù)據(jù)集上生成推理結(jié)果。

在這過(guò)程當(dāng)中,模型會(huì)在給出結(jié)果的同時(shí)生成詳細(xì)的中間推理步驟,但研究人員只保留最終的輸出結(jié)果。

然后就得到了輸入-系統(tǒng)2輸出的數(shù)據(jù)對(duì),可以視為一種無(wú)監(jiān)督的“偽標(biāo)簽”,將這些數(shù)據(jù)對(duì)收集起來(lái),就形成初步的蒸餾數(shù)據(jù)集。

當(dāng)然了,這步得到的數(shù)據(jù)還不能直接拿來(lái)微調(diào)系統(tǒng)1模型,需要進(jìn)行過(guò)濾以確保其擁有足夠高的質(zhì)量。

過(guò)濾的具體依據(jù),是一致性和魯棒性。

一致性篩選當(dāng)中,對(duì)每個(gè)輸入樣本,都會(huì)用系統(tǒng)2模型采樣生成多個(gè)輸出,然后通過(guò)多數(shù)投票等方法進(jìn)行比較,如果大多數(shù)都一致,則認(rèn)為該輸出是可靠的;

魯棒性篩選是對(duì)一個(gè)輸入樣本進(jìn)行適當(dāng)?shù)臄_動(dòng),如改變無(wú)關(guān)細(xì)節(jié)、調(diào)整詞序等,然后觀察系統(tǒng)2模型在擾動(dòng)前后的輸出是否一致。

篩選后的高質(zhì)量蒸餾數(shù)據(jù),就可以對(duì)系統(tǒng)1模型進(jìn)行無(wú)監(jiān)督微調(diào)了。

微調(diào)過(guò)程可以看作是一種知識(shí)蒸餾,但又與與傳統(tǒng)的知識(shí)蒸餾不同,這里兩種系統(tǒng)使用的是同一個(gè)基礎(chǔ)模型。

系統(tǒng)1模型的目標(biāo)是直接學(xué)到系統(tǒng)2模型的輸出行為,而不是中間的復(fù)雜推理過(guò)程,在后續(xù)推理時(shí)也不需要執(zhí)行系統(tǒng)2的推理步驟,而是直接生成輸出。

但從輸出質(zhì)量上來(lái)看,表現(xiàn)卻能接近系統(tǒng)2模型,也就是實(shí)現(xiàn)了系統(tǒng)2能力向系統(tǒng)1的轉(zhuǎn)移。

那么,為什么要專(zhuān)門(mén)收集數(shù)據(jù)去微調(diào)系統(tǒng)1模型,而不直接用系統(tǒng)2模型推理呢,作者也給出了解釋。

道理其實(shí)很簡(jiǎn)單,從系統(tǒng)2的另一個(gè)名字“慢系統(tǒng)”當(dāng)中,很容易就能看出答案:

因?yàn)橄到y(tǒng)2的速度慢,在實(shí)時(shí)交互、移動(dòng)設(shè)備部署等場(chǎng)景下,模型的延遲可能是無(wú)法接受的。

另外,由于需要輸出完整的推理過(guò)程,系統(tǒng)2輸出的token長(zhǎng)度也是系統(tǒng)1的數(shù)百倍。

就像開(kāi)頭那位網(wǎng)友說(shuō)的,系統(tǒng)2把復(fù)雜的推理解決了,再將數(shù)據(jù)喂給系統(tǒng)1,問(wèn)題對(duì)其而言也會(huì)變得容易。

從表現(xiàn)上看,這樣的模式也確實(shí)讓系統(tǒng)1模型的表現(xiàn)大幅進(jìn)步,甚至超過(guò)了真·系統(tǒng)2模型。

讓Llama2超越GPT-4

針對(duì)前面四種不同的系統(tǒng)2方法,研究人員分別使用不同的數(shù)據(jù)集,在不同的任務(wù)上進(jìn)行了測(cè)試。

針對(duì)BSM方法,作者采用的數(shù)據(jù)集是Open Assistant 2和MT-bench,評(píng)估了模型作為“評(píng)判者”時(shí)的表現(xiàn)。

可以看到,在兩個(gè)數(shù)據(jù)集中,Llama-2的表現(xiàn)(人類(lèi)一致性)分別從32.0%和28.1%,提高到了58.4%和72.4%,最高增幅達(dá)到了257%,比CoT方法更加有效。

而且,微調(diào)后的模型均超過(guò)了系統(tǒng)1版的GPT-4,甚至達(dá)到了GPT-4配合CoT的水準(zhǔn)。

同時(shí)(改變選項(xiàng)位置后的)不一致性也大幅降低,而且和系統(tǒng)2相比,Token數(shù)量少到幾乎可以忽略不計(jì)。

圖片

同時(shí)針對(duì)MT-Bench不同的子類(lèi)任務(wù),作者也分別分析了各種方法的人類(lèi)一致性。

圖片

接下來(lái)是S2A方法,它主要解決的是模型偏見(jiàn)問(wèn)題,因此評(píng)估時(shí)采用了帶偏見(jiàn)的TriviaQA任務(wù)。

結(jié)果蒸餾后的準(zhǔn)確率達(dá)到81.3%,超過(guò)了原始S2A的76%,生成的token數(shù)量也從147個(gè)減少到了56個(gè)。

圖片

RaR的測(cè)試目標(biāo)則是完成一些推理任務(wù),這里作者測(cè)試了Last letter concatenation和Coin flip。

在Letter任務(wù)中,蒸餾后的系統(tǒng)模型準(zhǔn)確率從30%飛升到了98%,也超過(guò)了系統(tǒng)1自蒸餾的69.5%,同時(shí)也優(yōu)于原始的RaR方式。

而在Coin flip任務(wù)里,蒸餾后的準(zhǔn)確率達(dá)到 75.69%,也與接近2-步原始RaR的77.2%接近,但生成的token數(shù)量大幅減少。

圖片

不足的一點(diǎn)是,CoT的蒸餾效果與另外三種大相徑庭,作者發(fā)現(xiàn),在數(shù)學(xué)推理任務(wù)上,CoT的推理能力很難遷移到系統(tǒng)1當(dāng)中。

在GSM8K數(shù)據(jù)集上,蒸餾后的模型在k=1時(shí)準(zhǔn)確率僅為7.13%,k=10時(shí)也只有7.35%,甚至不如沒(méi)蒸餾之前的版本。

圖片

所以,作者認(rèn)為,接下來(lái)的研究目標(biāo)是進(jìn)一步明確這種蒸餾的應(yīng)用場(chǎng)合,找到更類(lèi)似于人類(lèi)學(xué)習(xí)的方式。

論文地址:https://arxiv.org/abs/2407.06023

參考鏈接:https://x.com/emollick/status/1810659417634869610。

責(zé)任編輯:姜華 來(lái)源: 量子位
相關(guān)推薦

2023-07-25 09:23:23

Llama 2GPT-4

2024-02-07 12:13:03

AI模型

2025-05-08 02:02:02

2023-08-11 13:17:12

AI模型

2023-08-21 10:36:23

2023-06-19 08:19:50

2023-12-11 12:46:42

GPT-4LLaMA2模型

2023-09-11 15:57:16

人工智能模型GPT-4

2025-04-16 09:35:03

2024-04-19 10:32:08

2023-07-19 11:43:59

AIGPT-4

2023-05-29 09:29:52

GPT-4語(yǔ)言模型

2024-01-12 19:07:26

GPT-4AI產(chǎn)品

2023-08-25 13:12:59

AI開(kāi)源

2023-06-08 11:27:10

模型AI

2023-07-24 14:26:58

OpenAIGPT-4Karpathy

2023-09-11 13:28:00

AI模型

2025-05-30 07:40:56

2024-04-03 12:13:58

2023-08-15 15:03:00

AI工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品日本一区二区三区在线| 免费毛片在线| 国产欧美在线| 伊人av综合网| 宇都宫紫苑在线播放| 超碰97免费在线| 久久久久久日产精品| 成人午夜在线观看| 国产超碰人人爽人人做人人爱| 成人黄色av| 亚洲精品一区二区三区99| 久久久久久久久久福利| 新版中文在线官网| 国产亚洲欧美日韩日本| 99久久伊人精品影院| 成人毛片一区二区三区| 欧美日本一区| 中文字幕在线观看亚洲| 欧美熟妇精品一区二区蜜桃视频| 国产精品诱惑| 欧美性猛交xxxx黑人猛交| 日本女人高潮视频| 精品一二三区视频| 成人免费高清在线观看| 91精品久久久久久久久| 国产精品久久久久久久久久久久久久久久久| 日韩成人a**站| 日韩av综合中文字幕| 亚洲精品乱码久久久久久动漫| 一区二区乱码| 性欧美大战久久久久久久久| 国产又粗又大又爽的视频| 成人jjav| 国产亚洲精品免费| 麻豆91蜜桃| 色呦呦中文字幕| 久久99蜜桃精品| 日本精品久久久久影院| 天天插天天操天天干| 欧美搞黄网站| 久久久精品网站| 少妇视频在线播放| 一区二区三区视频免费观看| 亚洲精品动漫100p| 欲求不满的岳中文字幕| 天堂精品久久久久| 日韩一区二区三区精品视频| 中文字幕在线视频精品| 99久久久国产| 91精品麻豆日日躁夜夜躁| 不卡的在线视频| 日韩电影免费观看高清完整版在线观看| 日本乱码高清不卡字幕| 日批视频在线免费看| 美女100%一区| 一本到高清视频免费精品| 男人揉女人奶房视频60分 | 中国a一片一级一片| 老妇喷水一区二区三区| 国产精品精品久久久| 久久久999久久久| 久久爱www久久做| 91精品视频专区| 国产极品999| www.久久精品| 蜜桃久久精品乱码一区二区| 免费播放片a高清在线观看| 99麻豆久久久国产精品免费| 久久av免费观看| 午夜18视频在线观看| av在线不卡免费看| 精品综合在线| 亚洲 欧美 激情 另类| 久久久久88色偷偷免费| 青娱乐国产91| 91ph在线| 一区二区三区鲁丝不卡| 久久亚洲a v| 日本大胆在线观看| 亚洲丶国产丶欧美一区二区三区| 中文精品无码中文字幕无码专区| 韩国日本一区| 亚洲欧美激情视频在线观看一区二区三区 | yy6080久久伦理一区二区| 欧洲视频一区二区| 无人在线观看的免费高清视频 | 成人好色电影| 中文字幕在线不卡国产视频| 日本女人高潮视频| 女同一区二区免费aⅴ| 亚洲成av人片| 免费无码毛片一区二三区| 国产超碰精品| 欧美二区三区91| 免费观看污网站| 午夜精品福利影院| 自拍偷拍亚洲欧美| 国产精品99久久久久久成人| 国内一区二区三区| 欧美一级淫片播放口| 中国a一片一级一片| 激情深爱一区二区| 成人免费视频网址| 天天操天天操天天| 国产精品国产自产拍在线| 特级黄色录像片| 国产精品蜜臀| 欧美亚洲国产bt| 丰满人妻一区二区三区53视频| jazzjazz国产精品麻豆| 亚洲网站视频福利| 欧美丰满艳妇bbwbbw| 999亚洲国产精| 91丨九色丨国产在线| 婷婷国产在线| 中文字幕不卡的av| 久久国产精品网| 九九热这里有精品| 亚洲精品www久久久| 婷婷国产成人精品视频| 亚洲一卡久久| 亚洲一区二区在线播放| 丰满肥臀噗嗤啊x99av| 久久综合九色综合欧美98| a级网站在线观看| 性欧美1819sex性高清| 91精品国产免费| 蜜臀久久99精品久久久久久| 黄色精品一区| 国产精品三级在线| 日本私人网站在线观看| 一区二区三区成人在线视频| 在线视频日韩一区| 国产免费播放一区二区| 久久免费国产视频| 国产精品久久久久久久久久久久久久久久久久 | 欧美—级a级欧美特级ar全黄| 日韩中文字幕高清| 91蜜桃在线观看| 久久久久久久久久久视频| 亚洲高清在线一区| 中文国产亚洲喷潮| 亚洲精品中文字幕乱码三区91| 粉嫩av亚洲一区二区图片| 中文字幕日韩精品一区二区| 日本韩国欧美| 精品呦交小u女在线| 国产精品suv一区二区69| 秋霞成人午夜伦在线观看| 免费av一区二区三区| 久草在线中文最新视频| 精品国产麻豆免费人成网站| 手机在线免费看片| 精品亚洲国产成人av制服丝袜| 日本一区二区三区视频在线播放| 僵尸再翻生在线观看| 亚洲白拍色综合图区| 青草草在线视频| 国产麻豆精品一区二区| 日韩资源av在线| 欧美91在线|欧美| 中文字幕av一区二区| 免费av中文字幕| 国产亚洲精品7777| 国产aaaaa毛片| 成人综合久久| 国产精品视频一二三| 亚洲国产精品字幕| 久久国产精品波多野结衣| 丝袜诱惑制服诱惑色一区在线观看 | 天海翼在线视频| 免费成人你懂的| 欧洲xxxxx| 综合久久成人| 69视频在线播放| 亚洲人午夜射精精品日韩| 欧美日韩精品在线观看| 国产伦精品一区二区三区妓女| 99香蕉国产精品偷在线观看| 久久精品国产第一区二区三区最新章节| 97人澡人人添人人爽欧美| 日韩国产激情在线| 日本系列第一页| 国产人成一区二区三区影院| 在线观看免费视频高清游戏推荐| 国产精品99视频| 99精品国产高清在线观看| 国产探花视频在线观看| 亚洲精品中文字| 在线观看中文字幕码| 亚洲美女淫视频| 亚洲精品乱码久久| 国产中文字幕精品| 国产乱子伦精品无码专区| 久久久久观看| 国产精品久久中文| 八戒八戒神马在线电影| 亚洲国产古装精品网站| 自拍偷拍色综合| 亚洲最快最全在线视频| theav精尽人亡av| 久久99久久精品| 少妇无码av无码专区在线观看| 欧美aaaaa级| 国产成人综合精品| 怡红院在线播放| 精品国产一区二区三区忘忧草 | 福利视频在线看| 日韩精品一区二| 国产一级片毛片| 国产精品久久久久婷婷二区次| 任你躁av一区二区三区| 久久这里有精品15一区二区三区| 欧洲美女和动交zoz0z| 91免费精品国偷自产在线在线| 人人爽久久涩噜噜噜网站| 久热国产在线| 亚洲欧美日韩国产中文专区| 国产永久免费视频| 天天av天天翘天天综合网 | 无码精品国产一区二区三区免费| 日韩综合网站| 久久精品中文字幕一区二区三区| **日韩最新| 国产成人久久久精品一区| 在线网址91| 在线国产精品播放| 欧美精品少妇| 亚洲二区在线播放视频| 91极品身材尤物theporn| 欧美日韩一区二区三区在线免费观看 | 在线观看18视频网站| 精品国内自产拍在线观看视频 | 中文在线第一页| 亚洲视频 欧洲视频| 一级特黄曰皮片视频| 久久久九九九九| 欧美深性狂猛ⅹxxx深喉| 国产老肥熟一区二区三区| 国产高潮免费视频| 免费日韩一区二区| 黄色一级在线视频| 午夜激情一区| 潘金莲一级淫片aaaaa免费看| 99久久精品费精品国产风间由美 | 精品国产成人av在线免| 影院欧美亚洲| 日韩在线视频在线| 雨宫琴音一区二区三区| 日本一区二区三区精品视频| 欧美日韩亚洲在线观看| 久久久久久久免费| 精品少妇3p| 国内精品久久国产| 国产精品极品| 高清日韩一区| 国产成人夜色高潮福利影视| 91在线观看免费高清| 午夜日韩影院| 成人18视频| 亚洲欧洲国产精品一区| 91原创国产| 亚洲精品不卡在线观看| 99三级在线| 999国产精品一区| 成人女保姆的销魂服务| 高潮久久久久久久久久久久久久 | 成人福利视频在线看| 黄色免费视频网站| www.久久久久久久久| 精品1卡二卡三卡四卡老狼| 成人av网站免费观看| 国产 xxxx| 久久久久久久av麻豆果冻| 波多野结衣 在线| 久久久噜噜噜久噜久久综合| 水蜜桃av无码| 国产欧美日韩精品在线| 69xxx免费| 亚洲欧美日韩电影| 国产乡下妇女做爰视频| 欧美性生活大片免费观看网址| 日日摸天天添天天添破| 在线观看免费一区| 国产黄色片av| 亚洲成人av片| 成年午夜在线| 久久av资源网站| 国产在线88av| 国产精品白丝jk喷水视频一区| 欧美91在线|欧美| 国产亚洲一区二区三区在线播放 | 最近中文字幕免费| 中文字幕在线一区二区三区| 天堂在线中文视频| 午夜欧美视频在线观看| 国产性生活视频| 91精品国产综合久久久久久| 日本加勒比一区| 一本色道久久88亚洲综合88| 丝袜在线视频| 日产精品久久久一区二区福利| 精品一区二区三区中文字幕在线 | 黄大色黄女片18第一次| 国产成人免费网站| 国产精品扒开腿做爽爽| 自拍偷拍国产亚洲| 国产精彩视频在线| 91精品国产色综合久久不卡蜜臀| 日韩中文字幕免费观看| 正在播放国产一区| 51漫画成人app入口| 国产精品入口免费视频一| gogo久久日韩裸体艺术| 亚洲国产欧洲综合997久久| 亚洲第一毛片| 中文字幕视频三区| 91一区二区在线| 黑人巨大精品一区二区在线| 色偷偷成人一区二区三区91 | 国内成人免费视频| 中国美女乱淫免费看视频| 亚洲欧洲99久久| 精品国产xxx| 欧美一级二级在线观看| 拍真实国产伦偷精品| 55夜色66夜色国产精品视频 | 色吊一区二区三区| 天堂在线视频网站| 美日韩丰满少妇在线观看| 欧美最新精品| 久久99欧美| 在线播放一区| 91精品国产三级| 国产清纯美女被跳蛋高潮一区二区久久w | 天天操天天操天天操天天| 欧美一级久久久久久久大片| 国产九色在线| 欧美中文在线免费| 黄色美女久久久| 黄色一级大片免费| 青青草一区二区三区| 国产调教在线观看| 色婷婷综合久久久| 日本五码在线| 欧洲永久精品大片ww免费漫画| 超碰成人在线观看| av久久久久久| 国产精品一二一区| 精品爆乳一区二区三区无码av| 91精品国产高清一区二区三区 | 樱花www成人免费视频| 日韩电影一区二区三区四区| 国产三级国产精品| 午夜影院在线观看欧美| 欧日韩在线视频| 久久久久久久999精品视频| 日韩中文字幕在线一区| 久久观看最新视频| 国产精品一区二区三区网站| 亚洲色偷偷综合亚洲av伊人| 9191久久久久久久久久久| 黄色网在线看| 国产日韩欧美影视| 欧美日本不卡高清| 99免费观看视频| 午夜日韩在线电影| 欧美女同网站| 国产精品免费观看在线| 久久精品国产99久久| 国产一级不卡毛片| 1024成人网| jizz中国少妇| 欧美精品福利在线| 欧美一级一片| 欧美精品第三页| 国产精品卡一卡二| 国产一区二区三区四区视频| 欧美xxxx18国产| 极品束缚调教一区二区网站| 一区二区传媒有限公司| 久久久国产综合精品女国产盗摄| 国产又粗又猛又爽又| 色阁综合伊人av| 91丨精品丨国产| 97在线国产视频| 成年人国产精品| 成人午夜精品视频| 中文国产成人精品| 豆花视频一区二区| 蜜臀av午夜一区二区三区| 国产精品久久影院| 丰满熟女一区二区三区| 欧美最近摘花xxxx摘花| japanese国产精品| 伊人网综合视频| 欧美日韩视频第一区| 欧美6一10sex性hd| 日本电影一区二区三区| 国产真实乱对白精彩久久|