精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

人會逆向思維,LLM也可以?DeepMind研究表明還能提升推理能力

人工智能
近日,北卡羅來納大學教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一個聯(lián)合團隊。他們發(fā)布的論文表明,逆向思維可以顯著 LLM 的推理能力,并且不限于數(shù)學任務。他們還提出了一個名叫 RevThink 的框架,可將逆向思維「灌輸」給語言模型。

人能逆向思維,LLM 也可以嗎?北卡羅來納大學教堂山分校與谷歌最近的一項研究表明,LLM 確實可以,并且逆向思維還能幫助提升 LLM 的正向推理能力!

圖片

論文一作 Justin Chih-Yao Chen 的推文

簡單來說,正向思維就是從問題開始,一步步地得出答案;而逆向思維則是先從一個預測答案開始,逆推到原始問題。

組合使用正向和逆向思維可讓我們驗證解答的正確性并找到可能的錯誤。

舉個簡單例子,如果小明有 2 個蘋果,小紅有 3 個蘋果,那么他們一共有多少個蘋果?

使用正向推理,我們可以得出 2 + 3 = 5。再使用逆向推理,我們可以從共有 5 個蘋果的結論開始,然后根據(jù)小明有 2 個來逆向得知小紅有 3 個。這些數(shù)值與原始問題相符,故此可以驗證 5 這個答案的正確性。如果正向推理出錯了,比如答案是 6 個,那么逆向推理時就會得到與原始問題不一樣的數(shù)值:小紅有 4 個蘋果。這種矛盾可讓我們重新檢視自己的推理過程哪里有誤。

大型語言模型(LLM)的數(shù)學能力也能通過正向 - 逆向推理得到提升,原因有二:

  • 數(shù)學本身是高度結構化的,因此正向和逆向推理之間存在明確的逆反關系;
  • 只需替換名稱或數(shù)值等變量,就可以創(chuàng)建出新的數(shù)學問題。

那么問題來了:逆向思維能否應用于更廣泛、結構性較差的領域?

此外,這些方法通常是測試時使用,目的是驗證:給定一個解,讓 LLM 逆向思考并查看正向推理是否正確。雖然它們比其它測試時方法(例如自我一致性)的表現(xiàn)稍微好一點,但還是存在未解的疑問:我們能否訓練一個本身就能逆向思維的模型,從而提升其正向推理效果,而不是在測試時使用逆向推理進行驗證?

近日,北卡羅來納大學教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一個聯(lián)合團隊為上面兩個問題提供了解答。他們發(fā)布的論文表明,逆向思維可以顯著 LLM 的推理能力,并且不限于數(shù)學任務。他們還提出了一個名叫 RevThink 的框架,可將逆向思維「灌輸」給語言模型。

圖片

  • 論文標題:Reverse Thinking Makes LLMs Stronger Reasoners
  • 論文地址:https://arxiv.org/pdf/2411.19865

論文發(fā)布后,吸引來不少稱贊之聲。

圖片

圖片

方法

RevThink 主要包含兩個階段:數(shù)據(jù)增強和全新的學習目標。

圖片

數(shù)據(jù)增強

首先,對于推理數(shù)據(jù)集,該團隊使用了一個更大、能力更強的教師模型來對其進行增強。

我們知道,一般來說,推理基準數(shù)據(jù)由一個問題和一個答案構成。那么該如何增強它呢?該團隊的方法是通過對教師模式使用少樣本提示來(few-shot prompting)生成三種新數(shù)據(jù):正向推理、逆向問題、逆向推理。其中正向和逆向推理都會使用思維鏈。

只有當數(shù)據(jù)點的正向推理準確(與 ground truth 相符)且逆向推理與原始問題一致(通過提示教師模型進行驗證)時,該數(shù)據(jù)點才會被保留下來。

學習目標

完成數(shù)據(jù)集增強之后,該團隊還提出了三個用于訓練更小的學生模型的關鍵目標。

圖片

具體來說,學生模型需要學會:

  • 基于問題生成正確的正向推理;
  • 基于原始問題生成逆向問題;
  • 基于逆向問題生成逆向推理。

之所以要設置這三個目標,該團隊說明了三點原因:

  • 基于問題生成正確的正向推理是知識蒸餾的標準方法;
  • 生成逆向問題會促使學生模型「思考」如何逆向一個問題并確定要問的正確問題;
  • 最后,解決這個逆向問題可以增強學生模型逆向推理的能力。

在測試時,首先會使用問題來詢問該學生模型,而它只會生成前向推理 —— 類似于標準的零樣本推理。

本質上講,這個流程是在訓練過程中內化了逆向推理的能力,同時還能保證測試時間計算與零樣本方法一樣高效。

如圖 1 傳統(tǒng)的監(jiān)督式微調側重于從問題到答案的單向推理。相比之下,RevThink 基于新提出的數(shù)據(jù)增強方法和目標,通過學習兩個方向的推理而引入了雙向思維。這能為模型帶來更大的提升。

圖片

實驗和評估

該團隊通過實驗驗證了 RevThink 的有效性。具體來說,他們使用的教師模型是 Gemini-1.5-Pro-001,學生模型是 Mistral-7B-Instruct-v0.3 和 Gemma-7B-Instruct。訓練中,他們使用了 LoRA 微調,秩設為 32。所有比較方法都使用了 vllm 和貪婪解碼。

他們也選擇了多種任務進行評估,包括常識推理(StrategyQA、CommonsenseQA、ARCchallenge),數(shù)學推理(MATH、GSM8K),表格數(shù)據(jù)推理(TabMWP)、自然語言推理(ANLI),邏輯推理(Date Understanding)。

參與比較的方法大致可分為三類:零樣本方法、知識蒸餾(包含符號知識蒸餾和逐步蒸餾)和數(shù)據(jù)增強(包含問題重新表述、問題增強、答案增強)。更多實驗設置請參閱原論文。

主要結果

表 1 給出了主要結果。

圖片

首先,RevThink 的平均性能表現(xiàn)很好,在不同數(shù)據(jù)集和模型上都優(yōu)于基線。與學生模型的零樣本性能相比,RevThink 使用 Mistral 時實現(xiàn)了 12.68% 的平均提升,使用 Gemma 時實現(xiàn)了 14.37% 的平均提升。

圖片

此外,相比于符號知識蒸餾(SKD)和逐步蒸餾(Distill Step-by-Step)—— 依賴于使用來自教師模型的正確推理鏈來執(zhí)行監(jiān)督式微調,RevThink 有 6.44% 至 7.15% 的顯著提升。

與基于數(shù)據(jù)增強的基線方法相比,RevThink 帶來的增益也更為顯著,特別是在常識推理、表格推理和日期理解方面。雖然其中一些增強方法(例如答案增強 (AnsAug))對于數(shù)學推理很有效,但它們?yōu)槠渌I域帶來的改進較少。這表明數(shù)學是一個更結構化的領域,會隨著數(shù)據(jù)的增加而更好地擴展。

相比之下,RevThink 在各種推理任務上都能帶來穩(wěn)定的提升。并且表 3 表明,在留存數(shù)據(jù)集上進行評估時,RevThink 在領域外數(shù)學數(shù)據(jù)集上也能帶來更大的增益,表現(xiàn)出了更好的泛化能力。

圖片

下面還列出了 RevThink 的更多優(yōu)勢,相關詳情請訪問原論文:

  • RevThink 表現(xiàn)出了很好的樣本效率。
  • 逆向問題生成可提高性能,但充分利用新的數(shù)據(jù)集可獲得最佳性能。
  • RevThink 的目標比使用指令調整的單獨實例更有效。
  • 只需稍多一點 token,RevThink 就能獲得更大提升。
  • RevThink 與模型大小呈正相關。
  • RevThink 可泛化至 OOD 數(shù)據(jù)集。
  • RevThink 可作為現(xiàn)有方法的補充。
  • RevThink 在可逆問題和中等難度問題上表現(xiàn)出了更大的提升。
責任編輯:姜華 來源: 機器之心
相關推薦

2024-07-05 15:06:00

2024-06-17 13:34:54

2025-02-10 13:00:00

模型訓練AI

2021-04-02 09:40:06

量子計算芯片超算

2024-11-11 11:05:00

大語言模型系統(tǒng)

2025-11-05 07:51:14

2024-10-22 18:44:48

2025-06-04 08:35:00

2025-01-14 13:52:56

2022-12-01 08:00:00

2025-04-08 00:40:00

谷歌合成數(shù)據(jù)大模型

2025-02-17 14:43:51

2023-05-22 15:17:02

谷歌AI

2023-11-03 13:07:00

AI模型

2025-05-30 04:00:00

IBMRLVRGRPO

2025-09-15 09:43:33

分層推理模型循環(huán)網(wǎng)絡推理

2025-04-07 09:23:00

大模型LLM推理

2023-11-15 14:17:23

微軟語言模型AI 模型

2025-05-21 09:02:20

2025-07-08 08:38:09

推理錨點LLM大模型
點贊
收藏

51CTO技術棧公眾號

欧美美女搞黄| 欧美成人手机视频| 视频在线日韩| 中文字幕五月欧美| 国产精品日韩一区二区免费视频 | 亚洲免费高清视频在线| 成人欧美一区二区三区在线观看| 尤物视频在线观看国产| 欧美成人精品一区二区三区在线看| 欧美一级片免费看| 免费欧美一级视频| 国产在线观看a视频| va亚洲va日韩不卡在线观看| 国产精品稀缺呦系列在线| 九九九久久久久| 欧美一二区在线观看| 精品国产乱码久久久久久久久| 欧美性猛交久久久乱大交小说| 羞羞污视频在线观看| 国产欧美精品日韩区二区麻豆天美| 99精品欧美一区二区三区| 日本成人一级片| 亚洲高清资源| 久久久国产精品视频| 波多野结衣 在线| 69精品国产久热在线观看| 欧美欧美欧美欧美| 妞干网在线免费视频| 好看的中文字幕在线播放| 最新国产の精品合集bt伙计| 欧美性色黄大片人与善| 狠狠人妻久久久久久综合麻豆| 九色|91porny| 国产精品入口尤物| 欧美精品韩国精品| 亚洲二区在线| 久久久久久尹人网香蕉| 久久国产高清视频| 凹凸成人精品亚洲精品密奴| 亚洲男人第一网站| 国产精品无码在线| 国产劲爆久久| 精品国产成人在线影院 | 日韩电影精品| 欧美亚洲一区二区三区四区| 欧美三级午夜理伦三级| 高端美女服务在线视频播放| 亚洲第一狼人社区| 国产美女在线一区| 日韩伦理av| 亚洲一二三区不卡| 阿v天堂2018| 97天天综合网| 欧美日韩在线影院| 各处沟厕大尺度偷拍女厕嘘嘘| 国产在线88av| 黑丝美女久久久| 成人观看免费完整观看| 午夜影院在线观看国产主播| 色综合久久久久综合体桃花网| 波多野结衣家庭教师在线播放| 九色porny视频在线观看| 亚洲五码中文字幕| 久久综合九色综合88i| 一区二区精品伦理...| 欧美性生交xxxxxdddd| 欧美两根一起进3p做受视频| 亚洲四虎影院| 91精品国产综合久久小美女| 中文字幕一二三| 99久热这里只有精品视频免费观看| 精品区一区二区| 日韩网站在线播放| 国产一区二区三区四区五区传媒| 一区二区三区动漫| 成人做爰视频网站| 黄色成人av网站| 奇米4444一区二区三区| 欧美男人天堂网| 激情综合色综合久久综合| 亚洲自拍小视频| 性高潮久久久久久久久久| 久久久久久久久99精品| 中文字幕一区二区中文字幕| 特级毛片在线| 色哟哟精品一区| www.污网站| 欧美三级自拍| 色老头一区二区三区| 青春草免费视频| 天堂成人国产精品一区| 91九色视频导航| 五十路在线视频| 国产精品久久久久毛片软件| 中文字幕日韩精品无码内射| 婷婷激情一区| 欧美mv日韩mv| 亚洲综合第一区| 在线观看一区| 91精品久久久久久久| 手机在线精品视频| 亚洲天堂网中文字| 国产极品尤物在线| 久久伦理中文字幕| 精品香蕉在线观看视频一| 日韩精品一区二区三区在线视频| 中文亚洲字幕| 亚洲精品日韩激情在线电影| 撸视在线观看免费视频| 亚洲精品老司机| 天天综合网日韩| 日韩欧美国产大片| 欧美老女人性视频| 中文字幕在线观看第二页| 成人午夜激情在线| 中文字幕一区二区中文字幕| 亚洲成人人体| 亚洲国产日韩欧美在线动漫| 三上悠亚在线观看视频| 久久精品一本| 久久久久久久有限公司| 日韩少妇视频| 欧美一级日韩免费不卡| 色噜噜噜噜噜噜| 亚洲永久视频| 激情久久av| 日本无删减在线| 欧美一区二区视频在线观看| 女人十八毛片嫩草av| 一区二区国产精品| 国产精品三区在线| 污污影院在线观看| 欧美一级片免费看| 精品人妻伦九区久久aaa片| 日本欧美久久久久免费播放网| 精品国产一二| av影视在线| 日韩亚洲欧美成人一区| 香蕉成人在线视频| 免费美女久久99| 亚洲精品影院| 99久久久国产| 欧美精品手机在线| 国产富婆一级全黄大片| 亚洲精品视频自拍| 中文字幕第17页| 四虎成人av| 成人av.网址在线网站| 免费网站成人| 欧美一区二视频| 国产少妇在线观看| 国产高清久久久| 日本大胆人体视频| 99re6热只有精品免费观看| 欧美二区乱c黑人| 黄色片网站免费在线观看| 亚洲成人久久影院| 一区二区不卡免费视频| 老牛影视一区二区三区| 日本在线一区| 成人在线啊v| 九九热99久久久国产盗摄| 午夜久久久久久噜噜噜噜| 亚洲福中文字幕伊人影院| 免费的av网站| 日本v片在线高清不卡在线观看| 色之综合天天综合色天天棕色| 韩国精品视频在线观看| 欧美精品日韩三级| 色资源在线观看| 欧亚洲嫩模精品一区三区| 久久精品色妇熟妇丰满人妻| 国产一区二区不卡在线 | 亚洲影院免费| 视频在线一区二区三区| 亚洲aⅴ网站| 欧美精品福利在线| 欧美成人综合在线| 欧美美女视频在线观看| 久久亚洲av午夜福利精品一区| 97久久人人超碰| 激情五月俺来也| 欧美韩日精品| 欧美国产视频在线观看| 日韩成人综合网站| 98精品国产高清在线xxxx天堂| 国产免费视频在线| 日韩精品一区在线观看| 四虎精品永久在线| 亚洲乱码日产精品bd| 97人妻天天摸天天爽天天| 久久国产三级精品| 毛片在线视频播放| 国产精品传媒精东影业在线| 国产在线欧美日韩| 亚洲狼人综合| 欧洲美女7788成人免费视频| 成人黄视频在线观看| 亚洲欧美另类中文字幕| 国产熟女一区二区三区四区| 欧美网站在线观看| 婷婷在线精品视频| 久久精品视频免费观看| avtt中文字幕| 看国产成人h片视频| 六月丁香婷婷激情| 午夜国产精品视频免费体验区| 欧美一区1区三区3区公司| 日韩欧美中文在线观看| 国产精品久久久久久久7电影| 日韩av激情| 久久精品久久久久| 国产精品无码2021在线观看| 亚洲成人黄色在线| 国产绿帽刺激高潮对白| 在线视频欧美精品| 亚洲精品国产精品乱码| 一区二区三区国产豹纹内裤在线| 欧美黄色一级生活片| 97精品国产露脸对白| 国产人妖在线观看| 国产一区二三区| 中文字幕在线综合| 久久一区中文字幕| 日本欧美黄色片| 亚洲性视频h| 国产精品自拍合集| 欧美91精品| 日韩精品第1页| 99精品全国免费观看视频软件| 日韩精品无码一区二区三区| 亚洲日本三级| 久久久久无码国产精品一区| 久久动漫网址| 国产一区二区不卡视频在线观看| 日韩精品成人| 91精品久久香蕉国产线看观看| 伊人国产精品| 亚洲伊人久久综合| 国产aa精品| 亚洲伊人成综合成人网| 日韩精品三级| 99国产盗摄| xxxx日韩| 久久96国产精品久久99软件| 日韩精品a在线观看91| 久久99精品久久久久子伦| 里番精品3d一二三区| 久久66热这里只有精品| 国产成人影院| 亚洲欧洲一区二区福利| 成人免费电影网址| 亚洲欧美日韩精品久久久 | 中文字幕视频一区二区| 欧美视频一区二区在线观看| 在线免费观看高清视频| 717成人午夜免费福利电影| 91麻豆国产在线| 日韩欧美一区二区久久婷婷| 亚洲欧美激情在线观看| 日韩成人在线视频网站| 黄色国产在线| 丝袜美腿亚洲一区二区| caopo在线| 97热精品视频官网| 成人在线爆射| 成人免费看黄网站| 国产suv精品一区| 欧美一区二区三区电影在线观看 | 九九精品在线视频| 国产在线美女| 国产精品高清在线观看| 国产高清日韩| 精品伦精品一区二区三区视频| 亚洲警察之高压线| 在线看视频不卡| 精品av久久久久电影| av天堂永久资源网| 麻豆久久久久久久| 亚洲欧美高清在线| 国产视频一区在线观看| 欧美黑人猛猛猛| 日韩欧美在线看| 国产精品久久久久久免费免熟 | 欧美91精品久久久久国产性生爱| 在线视频精品一| 999精品网| 国产欧美一区二区白浆黑人| 国产毛片精品| 天天爱天天做天天操| 国产日韩欧美一区在线 | 国产精品51麻豆cm传媒| 欧美一级二级在线观看| 欧美人体大胆444www| 久久精品亚洲94久久精品| 日韩大片免费观看| 91亚洲国产精品| 蜜桃一区二区三区| 国产av熟女一区二区三区| 免费成人在线视频观看| a级一a一级在线观看| 国产精品乱码妇女bbbb| 欧美精品一二三四区| 日韩欧美一二三四区| 成年人在线看| 97视频com| 欧美欧美在线| 天堂资源在线亚洲视频| 国产欧美日韩一级| wwwww在线观看| 中文字幕在线一区| 日韩 国产 欧美| 欧美精品一区二区蜜臀亚洲| 黄色网在线免费观看| 国产精品电影网| 亚洲婷婷伊人| 日韩黄色短视频| 国产二区国产一区在线观看| 999久久久国产| 日本韩国欧美三级| 神马久久高清| 性欧美视频videos6一9| 亚洲一区二区三区日本久久九| 中文字幕剧情在线观看一区| 久久一区激情| 免费看黄色的视频| 欧美日韩国产丝袜美女| 蜜桃91麻豆精品一二三区| 久久精品国产视频| 久久精品资源| 先锋影音一区二区三区| 日韩电影一区二区三区四区| 成人午夜福利一区二区| 欧美天天综合色影久久精品| 亚洲av成人无码久久精品老人 | 一区二区三区在线影院| 国产精品毛片一区二区在线看舒淇| 伊人男人综合视频网| 欧美亚洲大片| 日韩精品最新在线观看| 久久狠狠一本精品综合网| 免费在线观看你懂的| 色综合网站在线| 巨骚激情综合| 国产精品igao视频| 成人毛片免费看| 欧美日韩一区二区三区69堂| 国产精品嫩草影院com| 亚洲综合精品在线| 久久久国产精品x99av| 韩国三级大全久久网站| av 日韩 人妻 黑人 综合 无码| 国产伦精品一区二区三区视频青涩| 波多野结衣家庭教师| 日韩精品自拍偷拍| bl在线肉h视频大尺度| 久久综合伊人77777麻豆| 老司机精品福利视频| 久久av红桃一区二区禁漫| 欧美一级生活片| 成入视频在线观看| 欧美污视频久久久| 久久99精品一区二区三区三区| 小早川怜子一区二区的演员表| 日韩欧美成人一区| 成人免费图片免费观看| 欧美最大成人综合网| 经典一区二区三区| 国产一级特黄毛片| 亚洲男人的天堂在线| 亚洲一区有码| 国产av麻豆mag剧集| 亚洲国产精品成人综合 | 在线能看的av| 色偷偷88888欧美精品久久久| 国产精品3区| 日本免费黄视频| 国产精品久久久久久久久图文区 | 亚洲一区二区三区久久久| 精品国产一区二区三区无码| 91色在线porny| 亚洲天堂网视频| 久久久亚洲福利精品午夜| 国产精品一区二区av交换| 免费网站在线观看黄| 精品久久久精品| 日本在线观看免费| 国内精品视频在线播放| 精品一区二区三区av| 久久久久久久久久免费视频| 中文字幕国产日韩| 黄色成人美女网站| 黄大色黄女片18第一次| 午夜成人在线视频| 日韩理伦片在线| 九九九热999| 国产精品996| 小泽玛利亚一区二区三区视频| 欧美日韩xxx| 欧美aaaa视频|