精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題

發布于 2024-7-12 11:44
瀏覽
0收藏

《思考快與慢》中人類的兩種思考方式,屬實是被Meta給玩明白了。


研究人員通過把AI的“慢思考”結果蒸餾進“快思考”,讓Llama2表現提升了257%,變得比GPT4還能打,同時還能降低推理成本。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

這里的快慢兩種思考方式,指的就是2002年諾貝爾經濟學獎得主丹尼爾·卡尼曼推廣的系統1和系統2——


簡單說,系統1是簡單無意識的直覺,速度更快;系統2則是復雜有意識的推理,準確性更強。


Meta所做的“蒸餾”,就是用系統2生成數據,然后對用系統1推理的模型進行微調。


有網友看了后表示,這種模式和人類很像,一旦解決了一個難題,再解決(相似的問題)就變得簡單了。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

將系統2蒸餾到系統1

對于大模型而言,模仿人類的“系統2”的方式有很多種,在模型中所處的環節也不盡相同,這里作者一共研究了四種:


  • CoT,即Chain of Thought,思維鏈,從提示詞入手讓模型逐步思考;
  • S2A,即System 2 Attention,由Meta自己提出,直接修改了模型的注意力機制,屏蔽與任務無關的信息;
  • RaR,即Rephase and Respond,先對問題進行重新表述,再根據重述后的問題生成答案;
  • BSM,即Branch-Solve-Merge,將復雜任務分解為多個分支,針對每個分支獨立生成評分,再將各個分支的評分綜合。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

但從整體流程上看則是殊途同歸,各種“系統2方法”都會在未標注數據集上生成推理結果。

在這過程當中,模型會在給出結果的同時生成詳細的中間推理步驟,但研究人員只保留最終的輸出結果


然后就得到了輸入-系統2輸出的數據對,可以視為一種無監督的“偽標簽”,將這些數據對收集起來,就形成初步的蒸餾數據集。


當然了,這步得到的數據還不能直接拿來微調系統1模型,需要進行過濾以確保其擁有足夠高的質量。


過濾的具體依據,是一致性和魯棒性


一致性篩選當中,對每個輸入樣本,都會用系統2模型采樣生成多個輸出,然后通過多數投票等方法進行比較,如果大多數都一致,則認為該輸出是可靠的;


魯棒性篩選是對一個輸入樣本進行適當的擾動,如改變無關細節、調整詞序等,然后觀察系統2模型在擾動前后的輸出是否一致。


篩選后的高質量蒸餾數據,就可以對系統1模型進行無監督微調了。


微調過程可以看作是一種知識蒸餾,但又與與傳統的知識蒸餾不同,這里兩種系統使用的是同一個基礎模型。


系統1模型的目標是直接學到系統2模型的輸出行為,而不是中間的復雜推理過程,在后續推理時也不需要執行系統2的推理步驟,而是直接生成輸出。


但從輸出質量上來看,表現卻能接近系統2模型,也就是實現了系統2能力向系統1的轉移。

那么,為什么要專門收集數據去微調系統1模型,而不直接用系統2模型推理呢,作者也給出了解釋。


道理其實很簡單,從系統2的另一個名字“慢系統”當中,很容易就能看出答案:

因為系統2的速度慢,在實時交互、移動設備部署等場景下,模型的延遲可能是無法接受的。


另外,由于需要輸出完整的推理過程,系統2輸出的token長度也是系統1的數百倍。

就像開頭那位網友說的,系統2把復雜的推理解決了,再將數據喂給系統1,問題對其而言也會變得容易。


從表現上看,這樣的模式也確實讓系統1模型的表現大幅進步,甚至超過了真·系統2模型。

讓Llama2超越GPT-4

針對前面四種不同的系統2方法,研究人員分別使用不同的數據集,在不同的任務上進行了測試。


針對BSM方法,作者采用的數據集是Open Assistant 2和MT-bench,評估了模型作為“評判者”時的表現。


可以看到,在兩個數據集中,Llama-2的表現(人類一致性)分別從32.0%和28.1%,提高到了58.4%和72.4%,最高增幅達到了257%,比CoT方法更加有效。


而且,微調后的模型均超過了系統1版的GPT-4,甚至達到了GPT-4配合CoT的水準。


同時(改變選項位置后的)不一致性也大幅降低,而且和系統2相比,Token數量少到幾乎可以忽略不計。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

同時針對MT-Bench不同的子類任務,作者也分別分析了各種方法的人類一致性。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

接下來是S2A方法,它主要解決的是模型偏見問題,因此評估時采用了帶偏見的TriviaQA任務。


結果蒸餾后的準確率達到81.3%,超過了原始S2A的76%,生成的token數量也從147個減少到了56個。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

RaR的測試目標則是完成一些推理任務,這里作者測試了Last letter concatenation和Coin flip。


在Letter任務中,蒸餾后的系統模型準確率從30%飛升到了98%,也超過了系統1自蒸餾的69.5%,同時也優于原始的RaR方式。


而在Coin flip任務里,蒸餾后的準確率達到 75.69%,也與接近2-步原始RaR的77.2%接近,但生成的token數量大幅減少。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

不足的一點是,CoT的蒸餾效果與另外三種大相徑庭,作者發現,在數學推理任務上,CoT的推理能力很難遷移到系統1當中。


在GSM8K數據集上,蒸餾后的模型在k=1時準確率僅為7.13%,k=10時也只有7.35%,甚至不如沒蒸餾之前的版本。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

所以,作者認為,接下來的研究目標是進一步明確這種蒸餾的應用場合,找到更類似于人類學習的方式。


論文地址:
???https://arxiv.org/abs/2407.06023??


本文轉自 量子位,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/l-fGuCMvnRngznYbmqOWhA??

標簽
收藏
回復
舉報
回復
相關推薦
国内精品国产三级国产99| 欧美激情伊人电影| 免费视频爱爱太爽了| www.久久久久久久久久| 黄色综合网站| 亚洲国产三级网| 成人羞羞国产免费网站| 天堂中文8资源在线8| 国产精品一区二区三区99| 九色精品免费永久在线| aaaaaav| 国产成人精品一区二区三区免费 | 成人网欧美在线视频| 日本a级片视频| 欧美日韩大片免费观看| 欧美视频日韩视频在线观看| 国产911在线观看| 牛牛热在线视频| 激情国产一区二区| 午夜精品一区二区三区av| 日韩人妻无码精品综合区| 国产黄色一区| 亚洲一二三四在线观看| 日本一区二区三区www| 国产成人精品毛片| 久久国产欧美| 欧美成人sm免费视频| 白丝校花扒腿让我c| 国产精品字幕| 亚洲一区二区三区影院| 日韩av电影免费播放| 中文字幕日日夜夜| 亚洲国产一区二区精品专区| 在线a欧美视频| 美女扒开腿免费视频| 亚洲mmav| 亚洲精品中文在线| 亚洲蜜桃在线| 免费在线看v| 国产一区二区导航在线播放| 国产99在线|中文| 日本黄色小说视频| 手机在线电影一区| 亚洲精品久久久久久久久久久久| 激情五月俺来也| 中日韩脚交footjobhd| 一区二区三区中文字幕电影| 亚洲高清精品中出| 成人午夜免费在线观看| 久久激情综合网| 国产精品久久久久影院日本| 精品一级少妇久久久久久久| 全球成人免费直播| 亚洲欧美中文字幕| 丰满岳乱妇一区二区| 不卡的国产精品| 色网综合在线观看| 国产成人无码精品久久久性色| 午夜伦理在线视频| 亚洲色图欧美激情| 国产精品av免费| 阿v免费在线观看| 国产亚洲一区二区三区在线观看| 国外成人免费视频| 特黄视频在线观看| 99在线热播精品免费| 国产精品一区在线观看| 性欧美18一19性猛交| 国产成人av自拍| 亚洲自拍小视频免费观看| 97人妻人人澡人人爽人人精品| 免费在线成人网| 国产精品久久久亚洲| 亚洲精品一区二三区| 久久综合中文| 欧美一级视频在线观看| 国产黄色片免费看| 亚洲综合电影一区二区三区| 97成人在线视频| 日本韩国欧美中文字幕| 久久黄色网页| 国产精品美女www| 亚洲熟女乱色一区二区三区久久久| 视频在线在亚洲| 国产精品久久久久av免费| 在线观看污污网站| 美女视频黄久久| 91久久精品美女| 亚洲av无码片一区二区三区 | 性一交一黄一片| 凹凸成人在线| 亚洲视频在线观看网站| 99久久99久久精品免费| 欧美在线高清| 97久久国产精品| 男人天堂视频在线| 久久精品二区亚洲w码| 91网站免费看| 人人妻人人玩人人澡人人爽| 26uuu欧美| 亚洲一区三区电影在线观看| a黄色片在线观看| 亚洲va欧美va人人爽午夜| 18岁视频在线观看| 全球中文成人在线| 亚洲黄一区二区| 乐播av一区二区三区| 中文乱码免费一区二区三区下载| 久久国产一区二区三区| 97热在线精品视频在线观看| 性欧美videos| 国产精品观看| 日本精品视频在线观看| 久久综合九色综合欧美亚洲| 日韩中文字幕在线视频| 免费在线观看一级片| 日韩午夜在线电影| 国产精品旅馆在线| 成人爽a毛片一区二区| 国产亚洲1区2区3区| 天天想你在线观看完整版电影免费 | 在线日韩网站| 日韩一区二区三区在线播放| 国产亚洲精品女人久久久久久| 老妇喷水一区二区三区| 成人做爰66片免费看网站| 国产免费永久在线观看| 亚洲特级片在线| av动漫在线看| 日韩精品视频在线看| 国产午夜精品一区二区三区| 久久久美女视频| 久久精品久久久精品美女| 国严精品久久久久久亚洲影视| 在线国产情侣| 色综合天天综合网天天看片| 亚洲天堂小视频| 久久精品国产亚洲夜色av网站| 97精品视频在线观看| av官网在线观看| 2020国产精品自拍| 免费看毛片的网址| 亚洲影视资源| 亚洲区一区二区| 久久久久久久黄色片| 国产精品一区免费视频| 五码日韩精品一区二区三区视频| 黄视频网站在线观看| 884aa四虎影成人精品一区| 国产成人无码精品久久二区三| 欧美二区视频| 91在线网站视频| 黄网址在线观看| 欧美日韩国产精品成人| 免费黄在线观看| 免费亚洲视频| 精品欧美一区二区久久久伦| 国产盗摄在线视频网站| 日韩一级片网址| 黄色片在线观看网站| 久久成人18免费观看| 日韩中文字幕av在线| 亚洲综合在线电影| 亚洲欧美综合区自拍另类| 国产毛片aaa| 91在线视频观看| 男人日女人下面视频| 9999久久久久| 久久久人成影片一区二区三区| 精品国产区一区二| 一区二区三区国产| 美女被爆操网站| 香蕉视频国产精品 | 456成人影院在线观看| 欧美精品一区二区蜜臀亚洲| 日本天堂网在线观看| 成人美女在线视频| 免费观看国产精品视频| 欧美一区自拍| 国产成人a亚洲精品| 成人资源www网在线最新版| 天天色 色综合| 波多野结衣影院| 日韩一区欧美二区| 在线免费一区| 视频国产精品| 欧美精品video| 日韩在线无毛| 欧美系列在线观看| 免费国产羞羞网站美图| 成人小视频免费观看| 18岁网站在线观看| 国产探花一区二区| 国产精品色视频| 在线免费观看a视频| 精品国产乱码久久久久久浪潮| 日韩在线播放中文字幕| 中文字幕一区免费在线观看| 2一3sex性hd| 精品一区二区三区欧美| 欧美综合在线播放| 欧美大片aaaa| 久久偷窥视频| 日韩中文字幕视频网| 国产精品久久久久久超碰| 日本天码aⅴ片在线电影网站| 亚洲人成绝费网站色www| www.com在线观看| 欧美日韩一区视频| 国偷自拍第113页| 亚洲久草在线视频| 丰满的亚洲女人毛茸茸| 972aa.com艺术欧美| 免费看的av网站| 欧美aaaaaa午夜精品| 国产婷婷一区二区三区| 亚洲电影在线一区二区三区| 欧美一区亚洲二区| 国产精品45p| 91夜夜未满十八勿入爽爽影院| 成人免费看视频网站| 久久久久久69| 在线中文字幕-区二区三区四区| 中日韩美女免费视频网址在线观看| 色呦呦视频在线| 欧美一区二区播放| 97成人在线观看| 欧美日韩在线综合| 97人妻一区二区精品视频| 亚洲18色成人| 精品午夜福利视频| 一级做a爱片久久| 欧美黑人性猛交xxx| 亚洲欧洲韩国日本视频| 人妻无码一区二区三区免费| 国产欧美精品在线观看| 日韩av在线看免费观看| 久久综合99re88久久爱| 内射中出日韩无国产剧情| 成人avav影音| 国产女人18毛片水真多18| 国产大陆精品国产| 91丨porny丨九色| 国产成人精品aa毛片| 亚洲av无码成人精品区| 国产成人综合网| 男女性杂交内射妇女bbwxz| 国产黄色成人av| 又色又爽又黄18网站| 成人精品视频一区二区三区| 一级少妇精品久久久久久久| 成人av网站免费| 国模私拍在线观看| 91丝袜高跟美女视频| 成人无码www在线看免费| 2021久久国产精品不只是精品| www.久久国产| 亚洲国产精品传媒在线观看| 男人天堂资源网| 亚洲欧美另类小说视频| 欧美成人片在线观看| 亚洲国产精品综合小说图片区| 国产一级特黄a高潮片| 图片区小说区国产精品视频| 日韩精品一区不卡| 欧美日韩aaaaa| 国产浮力第一页| 亚洲精品成人久久电影| 国产精品久久久久一区二区国产 | 1024在线看片| 亚洲色欲色欲www| 久久精品www人人爽人人| 精品国产乱码久久久久久婷婷| 成年人免费高清视频| 欧美亚洲精品一区| www.爱爱.com| 精品丝袜一区二区三区| 99re在线视频| 欧美疯狂性受xxxxx另类| 欧美巨大丰满猛性社交| 国产精品久久久久久久久久久不卡 | 国产网红在线观看| 日本精品中文字幕| 亚洲午夜剧场| 久久精品国产理论片免费| 青青一区二区三区| 97超碰在线人人| 免费成人在线网站| 韩国成人动漫在线观看| 免费激情视频网站| 亚洲欧美综合区自拍另类| 久操视频在线播放| 欧美综合第一页| 国产精品一区二区精品视频观看| 国产综合第一页| 日韩不卡一区| 国产黄页在线观看| 国产在线精品免费| 中文字幕一区二区三区人妻| 亚洲欧美日韩成人高清在线一区| 国产www在线| 日韩欧美不卡在线观看视频| 国产一级二级三级在线观看| 欧美大尺度在线观看| 欧美日韩在线精品一区二区三区激情综合 | 亚州国产精品视频| 欧美日韩免费高清一区色橹橹 | 一个人看的www日本高清视频| 精品国产污网站| 老司机在线永久免费观看| 欧美在线视频播放| 亚洲国产欧美在线观看| 色综合电影网| 国产视频一区欧美| 国产成人精品一区二区三区在线观看| 91美女片黄在线观看| 欧美日韩精品在线观看视频| 欧美午夜电影网| 天堂网www中文在线| 国产性色一区二区| 久久久久无码国产精品不卡| 欧美日韩精品一区二区三区| 亚洲aⅴ在线观看| 欧美激情久久久| 欧美.com| 一本二本三本亚洲码| 免费人成黄页网站在线一区二区 | 一级黄色片在线看| 亚洲日韩中文字幕| 不卡av播放| 久久久久久久久久久久久久久久av| 欧美日韩1区| 亚洲一区二区中文字幕在线观看| 中文字幕国产一区二区| 精品久久久久久久久久久久久久久久久久| 精品av久久707| 国产蜜臀在线| 99re国产视频| 国产精品99免费看| 午夜免费福利影院| 亚洲愉拍自拍另类高清精品| 超碰免费在线97| 欧美日韩第一页| 91精品丝袜国产高跟在线| 日韩人妻一区二区三区蜜桃视频| 久久99久久精品欧美| 肉色超薄丝袜脚交69xx图片| 青春草视频在线观看| 久久影视电视剧免费网站清宫辞电视 | 99re66热这里只有精品8| 一道本视频在线观看| 亚洲国产精品黑人久久久| 一级特黄aaa| 久久九九亚洲综合| 国产一区精品二区| 97久久国产亚洲精品超碰热| 成人一区二区三区视频在线观看 | 91视频在线观看| 国产一区视频在线| 国内综合精品午夜久久资源| 在线播放av网址| 日韩欧美在线字幕| a视频网址在线观看| 成人综合网网址| 午夜视频一区| 国产极品一区二区| 欧美午夜精品伦理| 永久免费av在线| 亚洲自拍高清视频网站| 极品中文字幕一区| 西西444www无码大胆| 欧美色区777第一页| sm国产在线调教视频| 含羞草久久爱69一区| 日韩主播视频在线| 免费国产羞羞网站美图| 亚洲精品在线电影| av成人在线观看| 黄色一级片黄色| 久久夜色精品国产欧美乱极品| 中文字幕 亚洲视频| 欧美国产日韩视频| 少妇精品久久久| 中文字幕亚洲影院| 懂色av影视一区二区三区| 最新97超碰在线| 风间由美久久久| 日日夜夜精品免费视频| 免费在线观看黄色小视频| 亚洲第一网站男人都懂| yw.尤物在线精品视频| 激情成人开心网| 久久九九全国免费| 亚洲AV无码乱码国产精品牛牛| 国产精品第七影院| 欧美三级小说| 国产精品综合激情| 亚洲精品美女久久久| 国产激情综合| 日本熟妇人妻中出|