精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用自洽性提升大模型推理能力,谷歌解答基準(zhǔn)中75%數(shù)學(xué)問題,比GPT-3提升20%

人工智能 新聞
近日,谷歌研究者提出一種名為「self-consistency」(自洽性)的簡單策略,不需要額外的人工注釋、訓(xùn)練、輔助模型或微調(diào),可直接用于大規(guī)模預(yù)訓(xùn)練模型。

?盡管語言模型在一系列 NLP 任務(wù)中取得了顯著的成功,但它們的推理能力往往不足,僅靠擴(kuò)大模型規(guī)模不能解決這個問題。基于此,Wei et al. (2022) 提出了思維提示鏈(chain of thought prompting),提示語言模型生成一系列短句,這些短句模仿一個人在解決推理任務(wù)時可能采用的推理過程。

現(xiàn)在來自 Google Research 的研究者們提出了一種稱為「自洽性(self-consistency)」的簡單策略,它顯著提高了大型語言模型的推理準(zhǔn)確率。

論文地址:https://arxiv.org/pdf/2203.11171.pdf

該論文的作者之一、Google Brain 的創(chuàng)始成員 Quoc Le 今天在推特上發(fā)文表示:這種自洽方法能夠解決 GSM8K 基準(zhǔn)中 75% 的數(shù)學(xué)問題,大幅超越現(xiàn)有方法。

圖源:https://twitter.com/quocleix/status/1513632492124663808

簡單來說,復(fù)雜的推理任務(wù)通常有多個能得到正確答案的推理路徑,自洽方法通過思維提示鏈從語言模型中采樣一組不同的推理路徑,然后返回其中最自洽的答案。

該方法在一系列算術(shù)和常識推理基準(zhǔn)上評估自洽性,可以穩(wěn)健地提高各種語言模型的準(zhǔn)確性,而無需額外的訓(xùn)練或輔助模型。當(dāng)與最近的大型語言模型 PaLM-540B 結(jié)合使用時,自洽方法將多個基準(zhǔn)推理任務(wù)的性能提高到 SOTA 水平。

該方法是完全無監(jiān)督的,預(yù)訓(xùn)練語言模型直接可用,不需要額外的人工注釋,也不需要任何額外的訓(xùn)練、輔助模型或微調(diào)。

該研究在三種大型語言模型上評估一系列算術(shù)推理和常識推理任務(wù)的自洽性,包括 LaMDA-137B (Thoppilan et al., 2022)、PaLM-540B (Chowdhery et al., 2022) 和 GPT-3 175B (Brown et al., 2020)。研究者發(fā)現(xiàn),對于這幾種規(guī)模不同的語言模型,自洽方法都能顯著提高其推理能力。與通過貪心解碼(Wei et al., 2022)生成單一思維鏈相比,自洽方法有助于在所有推理任務(wù)中顯著提高準(zhǔn)確性,如下圖 2 所示。

多樣化推理路徑上的自洽

人類的一個突出特征是思維方式不同。人們會很自然地假設(shè),在需要深思熟慮的任務(wù)中,可能有幾種解決方法,所有這些方法都會得出相同的正確答案。因此,研究者建議可以通過從語言模型解碼器采樣以在語言模型中模擬這一過程。

如下表 1 所示,一個模型可以為一個數(shù)學(xué)問題生成多個可能的回答,這些回答最終得出相同的正確答案(如輸出 2、4 和 5)。由于語言模型不是完美的推理器,模型也可能產(chǎn)生錯誤的推理路徑或者在某一個推理步驟中出錯(例如輸出 1 和 3 中),這種解決方案不太可能得出相同的答案( 表 1 中的 26 和 14)。 

也就是說,當(dāng)假設(shè)推理過程正確,即使它們是多樣化的,在最終答案中往往比不正確的推理過程具有更高的一致性。

研究者提出通過一種自洽(self-consistency)方法來利用這種直覺。具體步驟如下:

  • 首先,使用一組手動編寫的思維鏈?zhǔn)纠龑φZ言模型進(jìn)行提示;
  • 接著,從語言模型的解碼器中采樣一組候選輸出,生成一組不同的候選推理路徑;
  • 最后,通過在生成的答案中選擇最自洽的答案來集成結(jié)果。

在實驗調(diào)查中,研究者發(fā)現(xiàn)思維鏈提示與相結(jié)合,會比單獨使用僅考慮單一生成路徑的思維鏈產(chǎn)生好得多的結(jié)果。

實驗結(jié)果

研究者進(jìn)行了一系列實驗,以在不同的算術(shù)和常識推理基準(zhǔn)上將提出的自洽方法與現(xiàn)有方法進(jìn)行比較。結(jié)果發(fā)現(xiàn),該方法極大地提高了每種語言模型的推理準(zhǔn)確性,涵蓋了廣泛的模型尺度。

具體地,他們評估了不同推理路徑上的自洽性,即自洽性(多路徑)(Multipath)。結(jié)果取 10 次運行的平均值,在每次運行中獨立于解碼器對 40 個輸出進(jìn)行采樣。比較的基線是貪心解碼單個思想鏈,稱為貪心解碼(Single-path),之前已被用于大型語言模型中的解碼。

算術(shù)推理結(jié)果如下表 2 所示。對于 LaMDA-137B,自洽性策略在每個任務(wù)上較貪心解碼(Single-path)均實現(xiàn)了顯著的性能提升,在 AddSub、ASDiv、AQuA 和 GSM8K 任務(wù)上獲得接近 10% 絕對準(zhǔn)確率提升,在 MultiArith 和 SVAMP 任務(wù)上分別提升了 23.9% 和 14.4%。

對于更大的 PaLM540B 模型,自洽性策略顯著提升性能,在 ASDiv、AQuA、SVAMP 和 GSM8K 上實現(xiàn)了 7.9%、12.5%、7.6% 和 17.9% 的顯著增益。

常識推理結(jié)果如下表 3 所示。對于 LaMDA-137B 模型,自洽性策略顯著提升所有任務(wù)的準(zhǔn)確率,其中 StrategyQA 和 CommonsenseQA 的絕對準(zhǔn)確率提升了 2%-5%,ARC easy set 和 ARC challenge set 的絕對準(zhǔn)確率分別提升了 4.0% 和 4.7%。

同樣地,更大的 PaLM540B 模型也實現(xiàn)了持續(xù)收益,StrategyQA 上提升了 6.3%,ARC-challenge 上提升了 3.5%。

下圖 3 中通過對來自解碼器的不同數(shù)量的推理路徑進(jìn)行采樣,展示了自洽性與貪心解碼(Single-path)的性能比較。可以看到,采樣更多數(shù)量(如 40 個)的推理路徑始終會產(chǎn)生更好的性能,再次強調(diào)了在推理路徑中引入多樣性的重要性。

該研究將自洽方法和基于集成的方法進(jìn)行小樣本學(xué)習(xí)來比較二者的性能。結(jié)果如下表 5 所示,與自洽方法相比,基于集成的方法獲得的增益要小得多。

另一種提高生成質(zhì)量的常用方法是采樣排序(sample-and-rank),其中從解碼器中采樣多個序列,然后根據(jù)每個序列的對數(shù)概率或基于額外訓(xùn)練的重排序器進(jìn)行排序。

該研究使用 GPT-3 模型得到了如下圖 4 所示的結(jié)果。雖然采樣排序方法通過額外的采樣序列和排序提高了準(zhǔn)確性,但與自洽方法相比,增益要小得多。

更多細(xì)節(jié)內(nèi)容請參閱論文原文。?

責(zé)任編輯:張燕妮 來源: 機(jī)器學(xué)習(xí)
相關(guān)推薦

2025-04-08 00:40:00

谷歌合成數(shù)據(jù)大模型

2024-08-27 09:35:47

2023-11-15 14:17:23

微軟語言模型AI 模型

2022-06-01 16:47:53

AI模型開源

2025-09-15 09:43:33

分層推理模型循環(huán)網(wǎng)絡(luò)推理

2025-06-09 09:32:35

2021-11-02 09:36:04

AI 數(shù)據(jù)人工智能

2023-11-03 13:07:00

AI模型

2025-02-13 08:51:23

DeepSeek大模型

2023-05-15 15:38:59

AI模型

2023-06-20 13:44:49

清華推理

2025-02-17 14:43:51

2023-09-15 13:32:00

AI模型

2025-06-18 08:51:00

數(shù)據(jù)生成AI模型

2022-06-08 08:48:04

Chrome瀏覽器macOS

2025-09-23 09:06:00

AILLM系統(tǒng)

2025-08-07 13:57:38

GPT-5AI模型

2021-09-08 17:23:33

谷歌模型開發(fā)

2025-03-26 10:38:40

2024-07-05 15:06:00

點贊
收藏

51CTO技術(shù)棧公眾號

亚洲精品免费一二三区| 国际精品欧美精品| 亚洲一区欧美一区| 激情欧美一区二区三区中文字幕| 亚洲伊人成人网| 精品国产a一区二区三区v免费| 欧美日韩精品久久久| 热久久最新网址| 欧美成人片在线| 狠狠色综合日日| 喷水一区二区三区| 一本大道综合伊人精品热热 | 久久精品人人做人人综合 | 丰满少妇久久久| 北岛玲一区二区三区| 国产乱一区二区| 欧美整片在线观看| 久久久久亚洲AV成人| 国产欧美日韩视频在线| 精品蜜桃在线看| 国产精品v日韩精品v在线观看| 国产调教在线| 亚洲美女视频一区| 亚洲国产精品一区二区第四页av| 欧美熟女一区二区| 精品一区二区三区影院在线午夜| 97视频在线观看视频免费视频 | 色8久久人人97超碰香蕉987| 欧美a级免费视频| 日本天堂在线观看| 久久久久9999亚洲精品| 国产精品免费一区二区三区在线观看 | 色先锋资源久久综合5566| eeuss中文| 国产在线自天天| 91麻豆免费观看| av成人免费观看| 国产又爽又黄又嫩又猛又粗| 老司机精品导航| 97成人精品视频在线观看| 妺妺窝人体色www在线下载| 97在线精品| 中文字幕少妇一区二区三区| 男人操女人动态图| 亚洲美女久久| 亚洲欧美日韩精品久久亚洲区 | 国产午夜精品一区二区三区视频| 国产另类第一区| 后进极品白嫩翘臀在线视频| 国产成人精品免费在线| 99久久99久久| 亚洲xxxx天美| 成人手机在线视频| 国产三区二区一区久久| 六月丁香综合网| 粉嫩绯色av一区二区在线观看| 91视频在线免费观看| 99热这里只有精品5| 国产精品白丝jk黑袜喷水| 91老司机在线| 成人黄色免费视频| 成人自拍视频在线| 国产在线欧美日韩| 人人九九精品| 国产亚洲精品7777| 亚洲高清资源综合久久精品| 欧美成年黄网站色视频| 中文字幕日本不卡| 日本高清xxxx| av影片在线| 欧美日韩亚洲激情| 久久久精品三级| 日韩美女一级片| 二区三区在线观看| 亚洲欧美另类久久久精品2019 | 亚洲天堂久久| 91福利视频在线观看| 五月婷婷色丁香| 日韩精品国产精品| 成人久久一区二区| 亚洲av无码一区二区三区性色| 99国产精品久久| 手机在线观看国产精品| 性欧美videoshd高清| 午夜伦欧美伦电影理论片| 一区二区三区不卡在线| 三级网站视频在在线播放| 精品久久久久久国产91| 热久久精品免费视频| 97久久中文字幕| 亚洲国产精久久久久久| 一级特黄曰皮片视频| 欧美黄色aaaa| 国产成人一区二| 国产激情久久久久久熟女老人av| 99精品久久免费看蜜臀剧情介绍| 日韩欧美一区二区三区四区五区| 在线视频国产区| 欧美午夜激情在线| 国产成人强伦免费视频网站| 日本中文字幕在线一区| 最近2019中文字幕第三页视频| 免费网站看av| 免费av网站大全久久| 国产66精品久久久久999小说| 日韩a在线观看| 亚洲人成精品久久久久久| 逼特逼视频在线| 国产一区二区三区精品在线观看| 日韩经典一区二区三区| 亚洲欧美精品aaaaaa片| 国产视频久久| 99re在线观看| 天堂а√在线资源在线| 欧美视频免费在线| 成人三级做爰av| 日韩免费一区| 欧美一区视频在线| 亚洲av无码乱码国产精品久久| 国产亚洲午夜高清国产拍精品 | aaa在线观看| 久久国产精品99精品国产| 精品国产日本| 羞羞视频在线免费国产| 欧美日本乱大交xxxxx| 免费无码一区二区三区| 欧美在线黄色| 国产精品自拍视频| 日韩精品视频无播放器在线看 | 特大黑人娇小亚洲女mp4| 美女写真久久影院| 亚洲第五色综合网| 久草网站在线观看| 国内精品自线一区二区三区视频| 日本精品一区二区| www.综合| 亚洲成人动漫在线播放| 91在线播放观看| 极品美女销魂一区二区三区| 欧美中日韩免费视频| 日韩理论视频| 亚洲精品www| 免费一级特黄特色大片| 亚洲国产福利| 亚洲精品成人在线| 欧美丝袜在线观看| 日韩一区二区在线免费| 国产不卡视频在线| 嫩草在线播放| 欧洲一区二区三区在线| 在线不卡av电影| 天堂午夜影视日韩欧美一区二区| 久久爱av电影| 欧美xxxxxx| 亚洲人线精品午夜| 欧美一级做a爰片免费视频| 久久综合九色欧美综合狠狠 | 蜜桃精品在线观看| 亚洲欧洲精品在线观看| 国产欧美自拍| 久久成人免费视频| 成人av无码一区二区三区| 一区二区三区久久久| 日本精品一二三区| 国产精品美女久久久浪潮软件| 久久久福利视频| 欧美极品免费| 色偷偷偷亚洲综合网另类| 一本一道人人妻人人妻αv | 欧美精品亚洲精品日韩精品| 人妻无码中文字幕| 一区二区三区不卡视频在线观看| 成人欧美精品一区二区| 99视频+国产日韩欧美| 欧美福利一区二区三区| 国产精品videossex撒尿| 久久手机精品视频| 丰满人妻一区二区三区免费视频| 欧美性高潮床叫视频| 黄免费在线观看| 极品少妇xxxx偷拍精品少妇| 国产精品入口芒果| 国产欧美日韩| caoporen国产精品| 中文在线资源| 日韩中文字幕在线免费观看| 亚洲毛片在线播放| 色综合久久九月婷婷色综合| 国产天堂av在线| 成人的网站免费观看| av在线无限看| 国产精品草草| 日韩精品国内| xxxx日韩| 国产美女精品视频免费观看| 成人影音在线| 中文字幕一精品亚洲无线一区| 精品国产亚洲av麻豆| 欧美日韩性视频在线| 亚洲波多野结衣| 91污片在线观看| www.日本久久| 久久精品盗摄| 国产 欧美 日韩 一区| 国产成人三级| 国产精品国产三级国产专区53 | 欧美午夜宅男影院在线观看| 中文字幕无码日韩专区免费| av成人动漫在线观看| 亚洲在线观看网站| 久久性天堂网| 欧美 丝袜 自拍 制服 另类| 91精品91| 亚洲国产精品毛片| 综合亚洲自拍| 国产主播一区二区三区四区| 精品国产一区二区三区2021| 国产精品高精视频免费| 狠狠操一区二区三区| 久久成人在线视频| 成人av毛片| 日韩在线a电影| 国产精品一区在线播放| 少妇精品视频在线观看| 国产91色在线| 亚洲色图官网| 91禁国产网站| 丁香高清在线观看完整电影视频| 久久精品最新地址| seseavlu视频在线| 亚洲片在线观看| 污污网站免费在线观看| 日韩精品一区二区在线观看| 国产精品自偷自拍| 欧美另类z0zxhd电影| 亚洲精品91天天久久人人| 日韩欧美在线视频日韩欧美在线视频| 1级黄色大片儿| 亚洲一区二区在线播放相泽| 欧美日韩中文字幕在线观看| 亚洲日本中文字幕区| 国产麻豆a毛片| 国产精品久久777777| 中文字幕美女视频| 成人免费在线播放视频| 久久精品在线观看视频| 国产精品系列在线| 亚洲色图 激情小说| 中文字幕乱码久久午夜不卡| 精品一区二区三区蜜桃在线| 中文字幕国产一区二区| 中文字幕有码在线播放| 中文字幕欧美国产| 亚洲波多野结衣| 亚洲一区二区在线视频| 全部毛片永久免费看| 色综合久久中文综合久久牛| 黄色片中文字幕| 欧美日韩一本到| 国产又粗又长视频| 日韩精品中午字幕| 国精产品一品二品国精品69xx| 亚洲国产99精品国自产| 台湾av在线二三区观看| 一本色道久久综合狠狠躁篇的优点 | 亚洲国产精品久久精品怡红院| 天天干天天摸天天操| 日韩精品免费在线观看| 国产三级视频在线| 自拍偷拍免费精品| 97影院秋霞午夜在线观看| 久久久久久久香蕉网| 亚洲性受xxx喷奶水| 国产日韩av高清| 成人爽a毛片| 欧美一区二区三区在线播放| 首页国产精品| 成人免费看片'免费看| 成人在线观看黄色| 欧美主播一区二区三区| 一级成人免费视频| 日韩一区二区视频在线观看| 天堂在线中文网| 中日韩美女免费视频网站在线观看| 蜜桃视频在线观看www社区| 欧美激情综合色| 欧美××××黑人××性爽| 91精品视频免费| 美国一区二区| 亚洲国内在线| 一区在线视频| 欧美婷婷精品激情| 成人精品视频一区二区三区尤物| 妺妺窝人体色WWW精品| 亚洲视频图片小说| 国产99久久久| 欧美一区二区免费观在线| 亚欧在线观看视频| 久久精品电影网站| 久久久男人天堂| 亚洲一区二区久久久久久| 欧洲vs亚洲vs国产| 中文字幕中文字幕99| 国产亚洲欧洲| 天天操夜夜操很很操| 久久久久国产成人精品亚洲午夜| 久久久久久久久精| 精品视频一区二区不卡| 四虎影视精品成人| 欧美高清视频免费观看| 成人在线免费电影网站| 精品久久蜜桃| 国产综合欧美| 日韩av福利在线观看| 欧美极品xxx| 日本精品免费在线观看| 欧美不卡在线观看| 天天综合色天天综合色hd| 1024成人| 亚洲高清视频免费| 国产欧美精品一区二区色综合 | 欧美国产精品| 免费成年人高清视频| 国产日韩欧美精品综合| 日韩不卡在线播放| 亚洲精美色品网站| 丝袜综合欧美| 成人中文字幕+乱码+中文字幕| 精品一区三区| 久色视频在线播放| 成人免费毛片a| 九九热视频精品| 日韩一区二区在线观看| 欧美激情午夜| 成人免费看吃奶视频网站| 日韩一级毛片| 亚洲激情在线观看视频| 久久婷婷成人综合色| 久久国产黄色片| 日韩av影视综合网| 日韩欧美一中文字暮专区| 国产精品免费一区二区三区观看 | 卡通动漫国产精品| 青青青在线视频播放| 国产一二精品视频| 四虎免费在线视频| 日韩欧美不卡一区| 视频在线这里都是精品| 99porn视频在线| 欧美日韩国产高清| xfplay5566色资源网站| 一区二区国产视频| 欧美一区二区三区黄片| 91精品国产一区| 色综合久久中文| 国产v亚洲v天堂无码久久久 | 国产乱子伦视频一区二区三区 | 3d动漫精品啪啪一区二区三区免费 | 最近中文字幕在线观看视频| 中文字幕久热精品在线视频| 欧美久久久网站| 91大学生片黄在线观看| 国产91在线观看丝袜| www.av视频在线观看| 日韩av综合中文字幕| 日韩精品99| 亚洲在线欧美| 成人一区二区在线观看| 97久久久久久久| 在线播放精品一区二区三区| 99久久99九九99九九九| 高清无码一区二区在线观看吞精| 成人小视频在线| 亚洲黄网在线观看| 日韩一区二区欧美| 成人h动漫精品一区二区器材| 六月丁香激情网| 国产精品国产自产拍高清av| www.五月激情| 日本国产一区二区三区| 久久精品国产大片免费观看| 九色91porny| 一本久道中文字幕精品亚洲嫩| 中国日本在线视频中文字幕| 99视频在线| 久久国产精品亚洲77777| 极品美妇后花庭翘臀娇吟小说| 亚洲电影av在线| 成人1区2区| 青青草国产精品视频| 中文字幕电影一区| 人妻一区二区三区| 国产精品精品视频一区二区三区| 国模 一区 二区 三区| 亚洲一区视频在线播放| 日韩欧美激情一区| 日日夜夜天天综合| 97中文字幕在线| 亚洲欧洲另类国产综合| 天天操天天爱天天干|