精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

新聞 人工智能
北大博士生沈劍豪領銜的一篇關于「用語言模型來解決數學應用題」(Generate & rank: A multi-task framework for math word problems)的EMNLP投稿在綜合評審時被認為不夠重要,最終收錄于Findings而沒有被主會接收。

 [[433838]]

最近,EMNLP 2021開獎了!華人作者包攬了最佳長、短論文。

然而,有人歡喜有人憂。

北大博士生沈劍豪領銜的一篇關于「用語言模型來解決數學應用題」(Generate & rank: A multi-task framework for math word problems)的EMNLP投稿在綜合評審時被認為不夠重要,最終收錄于Findings而沒有被主會接收。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

「審稿人普遍喜歡這篇論文,但這看起來是一篇邊緣的論文。鑒于這是BART在數學問題上的應用,而數學問題的解決對于NLP來說并不是一個真正重要的任務,我懷疑這個任務的高度工程化解決方案的價值。」

[[433839]]

根據官方的文件來看,一般被列為Findings的論文得分會更低一些,或者被認為不怎么「新穎」。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

拓展了特定任務的SOTA,但是對EMNLP社區而言,沒有新的見解或更廣泛的適用性;

有良好的、新穎的實驗,并提出了全面的分析和結論,但使用的方法不夠「新穎」。

雖然,但是OpenAI覺得這個論文很重要

有趣的是,就在10月29號,OpenAI提出了一個新方法「驗證」(verification),聲稱可以解決小學數學問題。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

論文地址:https://arxiv.org/pdf/2110.14168.pdf

GSM8K數據集地址:https://github.com/openai/grade-school-math

OpenAI要解決的數學應用題是長這個樣子滴:

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

OpenAI的GSM8K數據集中的三個問題示例,紅色為計算的注釋

而且,OpenAI發現「驗證」可以讓60億參數的GPT-3,解數學應用題的準確率直接翻倍,甚至追平了1750億參數,采用微調方法的GPT-3模型。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

更重要的是,一個9-12歲的小孩子在測試中得分為60分,而OpenAI的方法在同樣的問題上可以拿到55分,已經達到了人類小學生90%左右的水平!

都是解決數學應用題,那會不會這兩篇文章是「異曲同工」呢?

巧了,還真是!

不僅如此,OpenAI這個最新工作《Training Verifiers to Solve Math Word Problems》文中還引用了北大博士生沈劍豪在9月7號提交的《Generate & Rank: A Multi-task Framework for Math Word Problems》這篇論文。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

沈劍豪,尹伊淳,李琳,尚利峰,蔣欣,張銘, 劉群,《生成&排序:一種數學文字問題的多任務框架》,EMNLP 2020 Findings。該工作由北大計算機學院和華為諾亞方舟實驗室合作完成。

論文地址:https://arxiv.org/abs/2109.03034

再看看沈同學文中要解決的數學應用題長啥樣。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

兩者確實很像啊!

深入OpenAI的論文的Introduction部分,可以找到下面這句話。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

OpenAI在論文中表示其思路和沈劍豪的論文相似

在Related Methods中,還可以看到下面這句。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

我們的工作與他們的方法有許多基本相似之處,盡管我們在幾個關鍵方面有所不同。

在文末,OpenAI也對沈博士的文章注明了引用。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

也就是說,OpenAI認可了沈同學文中的方法的價值,而且沈劍豪的論文其實比OpenAI還要早發一個月!

值得一說的是,這篇論文的一作沈劍豪是2014年浙江省高考狀元,同時也曾是北大數學學院數據方向的第一名,目前是北大計算機學院在讀博士研究生,導師為張銘教授。

[[433840]]

語言模型能解數學題嗎?

OpenAI的GPT-3「文采出眾」,上知天文,下知地理。模仿名家的寫作風格,展示一下廣博的知識,這都不在話下。

然而,GPT-3這種「語言」模型卻是典型的偏科生,擅長文,但不擅理,沒法完成精確的多步推理,比如,解決小學數學應用題。

其問題就在于,語言模型只能模仿正確解決方法的規律,但它卻并不理解「邏輯」。

所以,人類要想教會大語言模型理解復雜的邏輯,就必須得讓模型學會識別它們的錯誤,并仔細選擇他們的解題步驟。

從這個角度出發,OpenAI和博士生沈劍豪都提出了一種「先生成,后排序」的方法來幫助語言模型掌握數學推理能力,知道自己推理是否有誤。

兩者內容對比

核心框架是:生成器+重排序/驗證器。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

北大與華為諾亞的生成與重排序框架

沈同學文中的模型由一個生成器和一個排序器組成,并通過生成任務和排序任務進行聯合訓練。

生成器的目標是生成給定數學應用題的解答表達式。排序器則需要從一組候選者中選擇一個正確的表達式。

兩者共享同一個的BART模型進行編碼-解碼,排序器在此基礎上增加了一個評分函數為表達式打分。

此外,他們還構建了一個表達式庫,為排序器提供訓練實例。其中使用了兩種不同的策略:基于模型的生成和基于樹的干擾。

基于模型的生成是利用生成器通過線束搜索方法,得到前K個表達式加入到表達式庫中。

基于樹的干擾則首先將正確表達式轉化成一棵二叉樹,然后采用擴展、編輯、刪除、交換四種操作得到新的表達式,作為前一種方法的補充。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

基于樹的干擾

訓練過程包括多任務訓練和表達式在線更新。首先為生成任務對預訓練的BART進行微調。之后,使用經過微調的BART和基于樹的干擾來生成表達式,作為排序器的訓練樣本。然后,進行生成和排序的聯合訓練。

這個過程是以迭代的方式進行的,兩個模塊(即生成器和排序器)繼續相互促進。同時,用于排序器的訓練實例在每輪迭代后會被更新。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

Generate & Rank的訓練過程

而OpenAI的方法中是包含一個生成器和一個驗證器。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

OpenAI的驗證器

驗證器(verifier)可以判斷模型生成的解決方案正不正確,所以在測試時,驗證器會以問題和候選解答為輸入,輸出每個解答正確的概率。驗證器(verifier)訓練時,只訓練解決方案是否達到正確的最終答案,將其標記為正確或不正確。

驗證器具體訓練方法分「三步」:

  1. 先把模型的「生成器」在訓練集上進行2個epoch的微調。
  2. 從生成器中為每個訓練問題抽取100個解答,并將每個解答標記為正確或不正確。
  3. 在數據集上,驗證器再訓練單個epoch。

測試時,解決一個新問題,首先要生成100個候選解決方案,然后由「驗證器」打分,排名最高的解決方案會被最后選中。

思路上確實是相近的,不過有幾處細節并不相同。

一、OpenAI在文中表示他們的生成器和驗證器是分開單獨訓練的,目的是限制生成器的訓練并防止過度擬合,但原則上,他們認為應該可以組合這些模型進行聯合訓練,而沈同學則確實是使用了聯合訓練方法,實驗結果也表明聯合訓練對最終的效果有提升。

二、沈同學提出了一種幫助訓練重排器的方法:Tree-based Disturbance,其實就是設計了一系列比較難的負樣本,在正確的表達式基礎上增加了一點小擾動作為新的負樣本。而OpenAI并沒有提到類似的過程。

三、OpenAI為了評估「驗證器」的表現,收集了全新的「GSM8K數據集」并將其開源以方便研究。

GSM8K由8500個高質量、高多樣性、中等難度的小學數學問題組成。數據集中的每個問題都需要計算2到8個步驟來得出最終答案,涉及到「加減乘除」四則運算。

而沈同學最終是在兩個常用的數據集上進行了實驗:Math23K和MAWPS。

其中,Math23K是一個大規模的中文數據集,包含23162個數學應用題及其對應的表達式求解。MAWPS是一個包含2373個問題的英語數據集,所有的問題都是一個未知變量的線性問題,可以用一個表達式來解決。

當然,最明顯的就是用的語言模型不同了。沈同學用的是預訓練模型BART,而OpenAI用的則是60億和1750億參數的GPT-3。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2021-12-06 10:48:20

計算機博士 技術

2025-10-29 02:11:00

2025-09-15 09:05:00

AI數學模型

2024-03-11 16:33:26

機器狗訓練

2025-07-08 09:07:00

2017-06-06 17:03:59

機器學習模型算法

2025-10-08 10:19:29

2017-04-12 09:00:53

機器學習發生框架

2024-01-02 09:30:13

模型AI

2019-07-03 09:01:29

博士生頂會計算機

2023-03-20 10:19:25

ChatGPT數學

2013-02-22 16:08:30

易語言語言

2012-04-19 11:15:50

人腦計算機

2020-03-03 14:42:40

AI 數據人工智能

2025-03-31 09:35:00

GPT-4oAI模型

2025-02-10 08:52:00

2024-10-28 10:20:00

OpenAIGPT-4o

2022-04-08 07:54:40

人工智能核算結果Python

2022-06-24 14:52:34

AI模型

2021-07-19 15:02:48

機器人人工智能算法
點贊
收藏

51CTO技術棧公眾號

天天色综合天天| 国产黄色91视频| 在线一区二区日韩| 亚洲一二区在线观看| 成年网站在线视频网站| 91色|porny| 国产精品视频网站| 久久久久久久久99| 日韩极品在线| 欧美挠脚心视频网站| 欧美乱大交xxxxx潮喷l头像| 福利视频在线看| 国产一区二区不卡| 日韩免费在线免费观看| 夫妻性生活毛片| 牲欧美videos精品| 91精品国产欧美一区二区成人| 老司机激情视频| 国产视频三级在线观看播放| 国产在线播放一区三区四| 2019中文字幕在线观看| 人人澡人人澡人人看| 乱亲女h秽乱长久久久| 欧美日韩dvd在线观看| 丰满爆乳一区二区三区| 男女啪啪在线观看| 91欧美一区二区| 91在线|亚洲| 无码人妻精品一区二区蜜桃色欲 | 亚洲校园激情春色| 亚洲欧美日韩精品久久久久| 日本一区免费看| 人妻视频一区二区三区| 久草这里只有精品视频| 秋霞av国产精品一区| 国产亚洲精品码| 欧美激情成人| 亚洲一级免费视频| 亚洲一区二区三区四区五区六区| 国产欧美日韩电影| 欧美色图免费看| 18禁男女爽爽爽午夜网站免费| 中文字幕在线观看网站| 欧美激情在线看| 欧美午夜精品久久久久免费视 | 劲爆欧美第一页| 欧美成人精品一区二区三区在线看| 精品偷拍各种wc美女嘘嘘| 特黄特色免费视频| 久久中文字幕一区二区| 欧美精品成人一区二区三区四区| 成人免费无码av| 亚洲妇女成熟| 欧美午夜精品久久久久久久| www.av中文字幕| 精精国产xxxx视频在线中文版| 综合av第一页| 懂色av粉嫩av蜜臀av| 免费在线观看av| 成人免费在线播放视频| 一本一道久久a久久综合精品 | 久久五月婷婷丁香社区| 精品综合在线| 亚洲欧美日本在线观看| 久久伊人中文字幕| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 中文字幕精品影院| 中文字幕国内精品| 波多野结衣家庭教师在线观看| 成人羞羞网站| 久久人人爽人人爽爽久久| 91久久久久久久久久久久久久| 天天射综合网视频| 欧美精品在线观看91| 激情综合五月网| 一本久道久久综合婷婷鲸鱼| 啪一啪鲁一鲁2019在线视频| 一级黄色av片| 麻豆精品在线观看| 91沈先生作品| 午夜精品久久久久久久99| 北条麻妃一区二区三区| 欧美12av| 麻豆网站在线观看| 亚洲一区二区成人在线观看| 六月丁香激情网| av在线一区不卡| 777亚洲妇女| 精品国产乱码久久久久夜深人妻| 欧美sss在线视频| 国产亚洲人成a一在线v站| 亚洲女同二女同志奶水| 欧美日韩调教| 欧洲亚洲女同hd| 91精品在线视频观看| 国产凹凸在线观看一区二区| 蜜桃成人在线| а√天堂在线官网| 一本在线高清不卡dvd| www.国产福利| 日韩精品导航| 久久综合网hezyo| 在线观看黄网站| 国产中文一区二区三区| 久久资源av| 国产精品一卡二卡三卡| 欧美日韩在线免费| 色黄视频免费看| 国产精品一区二区三区av麻| 九九热精品在线| 国产黄网在线观看| 丰满白嫩尤物一区二区| 亚洲精品视频一二三| 岛国av在线网站| 欧美美女黄视频| 五级黄高潮片90分钟视频| 一本到12不卡视频在线dvd| 欧美最猛性xxxxx(亚洲精品)| 国产乱淫a∨片免费观看| 26uuu国产一区二区三区| 九九久久九九久久| 久久青草视频| 亚洲精品中文字幕av| 久久这里只有精品免费| 国内精品久久久久影院色| 日本精品免费| 欧美少妇精品| 亚洲成色www8888| avtt天堂在线| 九九热在线视频观看这里只有精品 | 最近免费中文字幕大全免费版视频| 国产成a人亚洲| 国产又黄又爽免费视频| 久久亚洲精品爱爱| 亚洲欧美激情视频| 成年人午夜视频| 国产成人午夜99999| 99热一区二区三区| 久久99国产精品二区高清软件| 亚洲欧美日韩国产中文专区| 日韩特黄一级片| 成人听书哪个软件好| 嫩草影院中文字幕| 在线精品视频一区| 久久91亚洲精品中文字幕| 国产乱码精品一区二区三区精东| 亚洲欧美一区二区在线观看| 99re精彩视频| 日韩一区二区在线| 国产综合在线观看视频| 日本a在线播放| 精品1区2区3区| 99国产精品无码| 久久激情五月婷婷| 久久亚洲国产精品日日av夜夜| 波多野一区二区| 日韩精品在线免费播放| 国语对白永久免费| 久久综合久久99| 成人性视频欧美一区二区三区| 免费欧美一区| 国产精品视频精品| 精品国产99久久久久久| 欧美一卡2卡三卡4卡5免费| 极品颜值美女露脸啪啪| 风间由美一区二区三区在线观看| 东北少妇不带套对白| 欧美毛片免费观看| 国产精品高潮粉嫩av| av网站在线播放| 51精品秘密在线观看| 九九热精品在线观看| caoporn国产一区二区| 欧美极品欧美精品欧美图片| 国产日产精品一区二区三区四区的观看方式| 日本高清视频精品| 日本三级在线播放完整版| 日韩一级高清毛片| 中文字幕亚洲精品在线| 国产免费成人在线视频| 99九九精品视频| 亚洲少妇自拍| 亚洲国产欧洲综合997久久| 国产精品一区二区美女视频免费看 | 亚洲第一黄网| 欧美婷婷久久| 精品视频一区二区三区| 97精品国产97久久久久久免费| 美女欧美视频在线观看免费| 欧美日韩高清一区| 国产在线成人精品午夜| 国产夜色精品一区二区av| 五月天婷婷影视| 亚洲精品三级| 偷拍盗摄高潮叫床对白清晰| 国产ts一区| 国产欧美一区二区三区久久人妖 | 国产精品国产三级国产普通话三级| 欧美体内she精高潮| 国产亚洲精品v| 亚洲 欧洲 日韩| 日韩电影不卡一区| 成人伊人精品色xxxx视频| 黄色视屏在线免费观看| 久久精品国产一区二区电影| 日本高清视频在线| 欧美军同video69gay| 丰满人妻老熟妇伦人精品| 亚洲柠檬福利资源导航| 蜜桃av乱码一区二区三区| 成人性色生活片| xxxx在线免费观看| 国产精品亚洲产品| 欧美在线观看黄| 清纯唯美综合亚洲| 欧美日韩一区二| 国产欧美自拍一区| 91在线视频免费| 国产一区一一区高清不卡| 亚洲**2019国产| av在线看片| 日韩在线国产精品| 美女欧美视频在线观看免费| 亚洲精品福利视频| 人人妻人人澡人人爽精品日本| 欧美日韩精品福利| 看黄色一级大片| 欧美日韩激情网| 国产午夜福利片| 亚洲精品国产a久久久久久| аⅴ天堂中文在线网| 久久蜜桃香蕉精品一区二区三区| 精人妻一区二区三区| 国产一区二区三区综合| 一个色综合久久| 美女视频一区在线观看| 欧美一级裸体视频| 日韩制服丝袜av| 日日碰狠狠躁久久躁婷婷| 国产精品久久久久久久久久妞妞 | 人与嘼交av免费| 91老师片黄在线观看| 亚洲熟女一区二区| 成人av在线播放网址| 激情小说欧美色图| 国产91精品免费| wwwxxxx在线观看| 国产一区二区在线看| 欧美午夜精品理论片| 狠狠色狠狠色综合| 亚洲高清视频免费| 国产一二精品视频| 一级黄色免费毛片| 国产成人在线免费观看| 无码人妻aⅴ一区二区三区玉蒲团| 国产乱人伦偷精品视频不卡| 性色av浪潮av| 成人免费视频一区二区| 一女三黑人理论片在线| 97久久超碰精品国产| 泷泽萝拉在线播放| 国产偷国产偷亚洲高清人白洁 | 日韩av手机版| 久久成人免费日本黄色| 日本高清免费在线视频| 国内精品在线播放| 日本不卡视频一区| 91蝌蚪porny九色| 国产美女永久免费无遮挡| 国产欧美精品一区二区三区四区| 五月天婷婷丁香网| 亚洲欧美国产三级| 国产一级在线观看视频| 欧美日韩中文在线| 中文字幕乱码在线观看| 欧美电影一区二区三区| 亚洲av无码国产精品永久一区| 亚洲激情视频网| www.在线视频.com| 久久天天躁日日躁| a国产在线视频| 国产精品国产亚洲伊人久久 | 国产在线高清视频| 久久久影视精品| 免费成人动漫| 91久久久久久久久久| 国产精品丝袜在线播放| 欧美精品一区三区在线观看| 日韩欧美三级| 免费看欧美黑人毛片| 视频一区中文字幕| 国产精品探花在线播放| 久久久噜噜噜久噜久久综合| 婷婷社区五月天| 天天爽夜夜爽夜夜爽精品视频| 中文字幕av在线免费观看| 精品久久99ma| av在线播放免费| 8x拔播拔播x8国产精品| 综合久久伊人| 日本欧美色综合网站免费| 欧美日本一区| 校园春色 亚洲色图| 成人福利视频在线看| 精品在线观看一区| 欧美日韩激情小视频| 国产精品毛片一区视频播| 日韩av一区二区在线| 成视频免费观看在线看| 日本精品视频在线| 超碰成人97| 偷拍盗摄高潮叫床对白清晰| 久久一日本道色综合久久| 国产乱国产乱老熟300部视频| 国产精品日韩成人| 日本一级淫片色费放| 欧美一区二区三区爱爱| 福利在线视频导航| 欧美在线视频在线播放完整版免费观看| 香蕉久久一区| 日韩区国产区| 午夜在线一区二区| 91丨porny丨对白| 伊人一区二区三区| 一二区在线观看| 国产午夜精品一区理论片飘花| h片在线观看视频免费| 成人网址在线观看| 日韩国产一区| 国产精彩免费视频| 91蜜桃在线观看| 日本在线视频免费| 精品国产髙清在线看国产毛片 | 亚洲黄页网站| 国产一级爱c视频| 国产91在线|亚洲| 91嫩草|国产丨精品入口| 欧美欧美欧美欧美| 在线观看美女网站大全免费| 国产精品久久久精品| 国产精品一区二区av日韩在线| 大j8黑人w巨大888a片| k8久久久一区二区三区| 精品在线视频免费观看| 精品久久人人做人人爰| 最新av在线播放| 91亚洲精品丁香在线观看| 午夜视频一区| 曰本三级日本三级日本三级| 伊人色综合久久天天| 国产丰满美女做爰| 欧美大片欧美激情性色a∨久久| 日韩精品一区二区三区中文字幕| 裸体裸乳免费看| 国产麻豆视频一区| 免费一级a毛片夜夜看| 日韩欧美国产综合在线一区二区三区| 在线黄色网页| 国产精品久久久久久久久婷婷| 亚洲小说欧美另类婷婷| 久久人人妻人人人人妻性色av| 狠狠爱在线视频一区| 国产福利小视频在线观看| 国产精品私拍pans大尺度在线| 日韩欧美精品综合| 熟妇女人妻丰满少妇中文字幕| 洋洋av久久久久久久一区| 少妇人妻一区二区| 亲子乱一区二区三区电影 | 国产又粗又硬又长| 国产激情91久久精品导航 | 欧美日韩亚洲另类| 超碰公开在线| 精品视频一区二区| 日韩中文字幕1| 岛国毛片在线观看| 亚洲精品久久久久久久久久久久久 | 亚洲免费资源在线播放| 风流老熟女一区二区三区| 欧美怡红院视频一区二区三区| 精品久久久久中文字幕小说| 三区视频在线观看| 午夜精品影院在线观看| 91亚洲欧美| 动漫美女被爆操久久久| 首页国产欧美日韩丝袜| 美国黄色片视频| 亚洲国产成人在线视频| 精品日本视频| 日韩一区二区高清视频| 国产亚洲综合av| 性一交一乱一伧老太| 欧洲中文字幕国产精品| 欧美影院一区| 亚洲精品视频久久久| 欧美一区二区三区免费观看视频| 自拍视频在线看| 无码人妻aⅴ一区二区三区日本| 久久夜色精品国产噜噜av| 国产黄色免费大片|