精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

新聞 人工智能
近日,來自 OpenAI 的研究者利用人類反饋優化了文本摘要生成模型,該模型生成的摘要質量顯著提升,并且可以遷移至 CNN/DM 的文章生成新聞摘要。

  隨著語言模型越來越強大,用于特定任務的數據和度量標準越來越成為訓練和評估的瓶頸。例如,摘要模型通常被訓練用來預測人類參考摘要,并使用 ROUGE 進行評估,但是這些度量指標都沒有觸及真正的關注點——摘要質量。

近日,OpenAI 的一項研究表明,人們可以通過訓練模型來優化人類偏好,進而顯著提升摘要質量。具體而言,研究者收集了一個人類摘要比較的大型、高質量數據集,訓練了一種模型來預測人類偏好的摘要,并使用該模型作為獎勵函數通過強化學習來微調摘要策略。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

論文鏈接:https://arxiv.org/pdf/2009.01325.pdf

項目地址:https://github.com/openai/summarize-from-feedback

研究者將該方法應用于 Reddit 帖子的摘要生成,結果顯示該研究的模型顯著優于人類參考摘要,以及僅通過監督學習進行微調的更大規模的模型。

研究中的模型還可以遷移至 CNN/DM 新聞文章,在不進行任何特定新聞微調的情況下生成幾乎和人類參考摘要一樣好的結果。

最后,研究者進行了擴展分析,以理解人類反饋數據集和微調模型。該研究確保獎勵模型能夠泛化到新數據集上,并且優化獎勵模型的結果要比根據人類要求優化的 ROUGE 更佳。

該研究的主要貢獻有:

研究表明,在英文摘要生成上,基于人類反饋的訓練顯著優于強大的基準訓練;

人類反饋模型相較于監督模型能夠更好地泛化到新的領域;

對其策略和獎勵模型進行了擴展實驗分析。

接下來詳細解讀 OpenAI 采用的研究方法以及相應的實驗細節和結果。

方法與實驗細節

高階方法

研究者采用的方法適用于批處理設置。從一個初始策略開始,該策略通過對所需數據集(以 Reddit TL;DR 摘要數據集為示例)的監督學習進行微調。整個過程(如下圖 2 所示)由可以迭代重復的三個步驟組成:

基于現有策略中收集樣本,并將比較結果發送給人類;

從人類比較中學習獎勵模型;

針對獎勵模型優化策略。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

人類反饋、獎勵模型訓練和策略訓練整體流程圖。

數據集和任務

研究者使用 TL;DR 摘要數據集,它包含來自 reddit.com 上涉及各種主題(subreddit)約 300 萬個帖子,以及原始發帖人(TL; DR)撰寫的帖子摘要。

此外,研究者還對該數據集進行了過濾(請參閱附錄 A)以確保數據集質量,包括使用一般人群可以理解的 subreddit 白名單。

研究者將 ground-truth 任務定義為生成一個模型,其中該模型生成長度少于 48 個 token 且盡可能好的摘要。此外,判斷摘要質量的標準是:摘要如何忠實地將原文傳達給一個只能閱讀摘要而不閱讀文章的讀者

收集人類反饋

先前根據人類反饋對語言模型進行微調的研究表明[66]:我們希望自身模型學習的質量與人類標簽者實際評估的質量之間存在不匹配。這導致了模型生成摘要在標簽者看來質量是好的,但在研究人員看來,質量卻很低。

與 [66] 相比,研究者實現了兩個改進來提高人類數據質量。首先,完全過渡到離線設置,在這里交替發送大量的比較數據給人工標簽者,然后根據累積收集的數據重新訓練模型;其次,與標簽者保持親密關系:給他們詳細的指導,在共享的聊天室中回答他們的問題,并定期對他們的表現提供反饋。

模型

研究者使用的所有模型都是 GPT-3 風格的 Transformer 解碼器,并對具有 13 億(1.3B)和 67 億(6.7B)參數的模型進行人類反饋實驗。與 [12,44] 類似,研究者從預訓練模型開始,以自動回歸預測大型文本語料庫中的下一個 token。

接著,通過監督學習對這些模型進行微調,根據過濾后的 TL; DR 數據集預測摘要(詳細信息參見附錄 B)。使用這些監督模型對初始摘要進行抽樣,以收集比較結果,初始化策略和獎勵模型,并作為評估基準。

最后,為了訓練獎勵模型,研究者從一個監督基準開始,然后添加一個隨機初始化線性頭(linear head)輸出一個標量值。

研究者想要利用訓練得到的獎勵模型,來訓練一個能夠生成基于人類判斷的高質量輸出的策略。

實驗

根據人類反饋生成 Reddit 帖子的摘要

與規模更大的監督策略相比,基于人工反饋訓練的策略更可取。在 TL;DR 數據集上評估人工反饋策略的主要結果如下圖 1 所示:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

研究者衡量策略質量采用的指標是該數據集中由該策略生成的人們偏好的參考摘要所占的百分比。從圖中可以看到,基于人工反饋訓練的策略顯著優于監督基準策略,并且 1.3B 的人工反饋模型也顯著優于其 10 倍規模的監督模型(兩者相對于參考摘要的原始偏好得分為 61% vs 43%)。

控制摘要長度

在判斷摘要質量時,摘要長度是一個混淆因子(confounding factor)。摘要的目標長度是摘要生成任務的隱式部分,并且根據簡潔性與涵蓋性之間的預期權衡來判斷生成長摘要還是短摘要。

該研究中的模型學會了生成更長的摘要,因此長度在質量改進中起到了很大的作用。

策略如何在基準上實現提升?

為了更好地了解該模型生成摘要與參考摘要和監督基準摘要三者之間的質量比較,研究者進行了一項補充分析,其中人類標簽員使用 7-point 李克特量表(Likert scale)從四個指標(整體表現、涵蓋性、連貫性和準確性)對摘要質量進行了評估。評估結果如下圖 3 所示,表明從所有指標,特別是涵蓋性來看,人類反饋模型優于監督基準模型。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

具備生成新聞文章摘要的遷移性

如下圖 4 所示,人類反饋模型還可以在沒有任何進一步訓練的情況下,生成優秀的 CNN/DM 新聞文章摘要。

具體來講,人類反饋模型在 TL;DR 數據集上顯著優于通過監督學習訓練的模型,以及僅在預訓練語料庫上訓練的模型。盡管生成的摘要更短,6.7B 人類反饋模型的效果幾乎相當于在 CNN/DM 參考摘要上進行微調的 6.7B 模型。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

理解獎勵模型

優化獎勵模型

根據該研究的獎勵模型進行優化應該使該研究的策略和人的偏好保持一致。但是獎勵模型并不能完美地代表標簽偏好。雖然該研究希望獎勵模型能夠泛化到訓練期間不可見的摘要,但尚不清楚在獎勵模型開始進行無用的評估之前,獎勵模型能夠優化多少。

為了回答這個問題,研究者創建了一系列針對獎勵模型的早期版本進行優化的策略,這些策略都具有不同程度的優化強度,并要求標簽者對將其樣本與參考摘要進行比較。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

獎勵模型如何隨著模型和數據量的增加進行擴展?

研究者進行了控制變量實驗以確定數據量和模型大小如何影響獎勵模型的性能。研究者訓練了 7 個獎勵模型,從 160M 到 13B 參數,從 8k 到 64k 的人類比較數據。

該研究發現,訓練數據量增加一倍會導致獎勵模型驗證集準確率增加大約 1.1%,而模型大小增加一倍則會導致增加大約 1.8%。具體如下圖 6 所示:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

獎勵模型學到了什么?

研究者在幾個驗證集中評估了該獎勵模型,在下表 17 中給出了完整結果:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

研究者發現該獎勵模型泛化到評估 CNN/DM 摘要,具體如下表 18 所示:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

分析用于摘要的自動度量指標

研究者研究了各種自動度量指標如何很好地預測人類的偏好,并將其與 RM 進行比較。具體來講,研究者在基線監督模型下檢查了 ROUGE、摘要長度、從帖子中復制的數量以及對數概率。

如下圖 7 所示,使用簡單的優化方案優化 ROGUE 并不能持續提高質量,與針對獎勵模型的優化相比,針對 ROGUE 的優化不僅可以更快達到峰值,而且質量比率也大大降低。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2020-06-15 10:42:42

谷歌Android開發者

2023-02-27 14:55:54

技術研究

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2024-11-14 09:59:23

2023-09-20 15:21:48

2024-12-05 10:57:24

2024-04-10 08:40:18

2023-08-22 13:21:07

AI算法

2023-01-01 13:42:11

AI學項目預測

2020-08-26 13:18:19

AI 數據人工智能

2009-11-19 15:44:22

Oracle Chec

2022-07-04 23:29:56

人工智能語言模型數據

2012-11-20 10:29:26

數據中心供電微軟

2025-03-17 13:51:06

2025-01-06 10:23:00

AI模型訓練

2025-03-21 08:13:29

2025-05-14 10:09:12

2024-04-07 08:50:00

谷歌框架

2023-07-28 08:13:30

2017-10-17 14:35:50

谷歌
點贊
收藏

51CTO技術棧公眾號

182tv在线播放| 曰批又黄又爽免费视频| 国产伦乱精品| 色女孩综合影院| 一区二区三区的久久的视频| 黄色av中文字幕| 日韩高清中文字幕一区| 欧美成人免费在线视频| 日本护士做爰视频| 欧美特黄色片| 欧美日韩中文字幕综合视频| 中文字幕中文字幕在线中一区高清| www.com欧美| 日韩二区三区四区| 久久久久久久久久国产| 在线免费看视频| 欧美亚洲色图校园春色| 6080日韩午夜伦伦午夜伦| 免费成人在线视频网站| 黄色的网站在线观看| 91欧美激情一区二区三区成人| 91网站免费看| 亚洲午夜在线播放| 国产视频欧美| 欧美大片免费观看| 51精品免费网站| 国产精品亚洲二区| 亚洲第一视频在线观看| 午夜一级免费视频| 高清av不卡| 亚洲成人一区在线| 免费的一级黄色片| 婷婷成人激情| 国产农村妇女精品| 日本亚洲自拍| 日本中文字幕电影在线观看| 福利91精品一区二区三区| 成人日韩在线电影| 正在播放亚洲精品| 视频一区在线播放| 国产91精品黑色丝袜高跟鞋| 国产性一乱一性一伧一色| 91精品婷婷色在线观看| 社区色欧美激情 | 东方伊人免费在线观看| 美女毛片一区二区三区四区最新中文字幕亚洲 | 国产伦精品一区二区三区照片 | 日韩在线中文字幕视频 | 波多野结衣 作品| 尤物在线视频| 国产精品国产三级国产a| 日韩精品欧美一区二区三区| 久久精品a一级国产免视看成人| 2023国产精品自拍| 精品国产乱码久久久久久88av | 中文字幕亚洲一区| 国产人妻大战黑人20p| 日本妇女一区| 亚洲免费视频观看| 久久精品国产亚洲av麻豆| 婷婷精品在线观看| 亚洲乱码国产乱码精品精| 国产精品久久久久久亚洲av| 老司机aⅴ在线精品导航| 亚洲福利小视频| 国产精品无码在线| 国产欧美一区二区精品久久久| 亚洲人成网站色ww在线| 日本少妇xxxxx| 我不卡伦不卡影院| 欧美福利在线观看| 久久夜色精品亚洲| 鲁大师影院一区二区三区| 国产精品久久久久久久7电影| 中文字幕福利视频| 国产一区在线观看麻豆| 国产精品日韩一区二区三区| 污视频网站免费观看| 久久蜜桃香蕉精品一区二区三区| 麻豆91av| 日本在线人成| 亚洲妇熟xx妇色黄| 亚洲五月天综合| 高清一区二区三区av| 精品免费一区二区三区| 成人h动漫精品一区| 成人激情开心网| 欧美成人精品一区| 四虎成人永久免费视频| 美国欧美日韩国产在线播放| dy888夜精品国产专区| 丝袜视频国产在线播放| 中文字幕乱码日本亚洲一区二区| 欧美少妇在线观看| 青青在线视频| 在线观看不卡视频| 毛茸茸free性熟hd| 成人嫩草影院| 午夜欧美不卡精品aaaaa| 亚洲国产无线乱码在线观看| 国产成人精品在线看| 欧美日韩一区二区三区在线观看免| 欧美jizzhd69巨大| 岛国精品视频在线播放| av噜噜在线观看| 羞羞色国产精品网站| 久久久成人精品视频| 台湾佬中文在线| 国产a视频精品免费观看| 日韩欧美亚洲日产国| 欧美videossex| 欧美日韩一本到| 国产ts丝袜人妖系列视频| 91精品1区| 国产精品va在线| 午夜在线视频免费| 一区二区三区在线免费视频| 亚洲国产日韩欧美在线观看| 人妖一区二区三区| 欧美黄色片视频| 国产伦一区二区| 国产精品福利影院| caoporn超碰97| 日韩电影在线观看完整免费观看| 欧美成人精品在线| 夜夜爽8888| 欧美激情一区二区在线| 精品99在线视频| 极品尤物一区| 欧美激情xxxxx| 国产农村老头老太视频| 中文欧美字幕免费| 凹凸日日摸日日碰夜夜爽1| 国产精品xxx在线观看| 欧美另类交人妖| 91麻豆成人精品国产| 91麻豆国产在线观看| 欧美二区在线视频| 国产在线播放精品| 久久免费国产精品1| 亚洲AV无码精品色毛片浪潮| 久久网这里都是精品| 欧美日韩黄色一级片| 久久a爱视频| 97婷婷涩涩精品一区| 神马一区二区三区| 偷偷要91色婷婷| 亚洲av无码一区二区三区观看| 亚洲国产国产亚洲一二三| av色综合网| 激情网站在线| 欧美精品一区二区三区蜜臀| 九九九国产视频| 不卡的看片网站| 中国丰满人妻videoshd| 杨幂一区二区三区免费看视频| 992tv成人免费影院| 少妇激情av一区二区| 日韩欧美国产网站| 91在线无精精品白丝| 另类欧美日韩国产在线| 制服诱惑一区| 视频二区欧美| 欧美精品精品精品精品免费| 婷婷五月综合激情| 色94色欧美sute亚洲线路二 | 亚洲精品成人精品456| 年下总裁被打光屁股sp | 91精品国产高清久久久久久| 婷婷亚洲一区二区三区| 色婷婷久久久久swag精品| 欧美激情久久久久久久| 国产一区视频导航| 丝袜人妻一区二区三区| 中文字幕亚洲影视| 国产欧美一区二区三区四区| 日韩成人伦理| 亚洲精品中文字幕有码专区| 中文字幕在线视频免费| 亚洲精品中文在线观看| 久久久久国产精品无码免费看| 三级在线观看一区二区 | 在线免费观看污| 日韩精品在线播放| 国产精品传媒在线观看| 亚洲欧美日韩国产另类专区| 成人性生活免费看| 日日欢夜夜爽一区| 黄色成人在线免费观看| 中文字幕av一区二区三区人| 亚洲最大福利视频网| 日本不卡免费高清视频在线| 深夜福利日韩在线看| 色一情一乱一乱一区91av| 欧美性一级生活| 久艹视频在线观看| 国产欧美视频在线观看| 国产亚洲精品成人a| 日韩电影在线观看网站| 996这里只有精品| 大片网站久久| 国产视频在线观看一区| 日韩亚洲国产免费| 亲子乱一区二区三区电影| 黄色成人影院| 亚洲全黄一级网站| 亚洲高清在线观看视频| 欧美色偷偷大香| 中文字幕日韩一级| 亚洲天堂2016| 中文天堂资源在线| 91麻豆6部合集magnet| 91亚洲一区二区| 奇米四色…亚洲| 欧美a在线视频| 黑丝一区二区三区| 中文视频一区视频二区视频三区| 婷婷成人综合| 国产美女精品久久久| 国产高清亚洲| 国产日韩在线视频| 自拍偷自拍亚洲精品被多人伦好爽 | 粉嫩精品一区二区三区在线观看| 国产亚洲精彩久久| 日韩免费观看高清| 黄频免费在线观看| 欧美精品videos| 亚洲按摩av| 久久精品视频在线观看| 在线中文资源天堂| 在线观看亚洲区| 国产爆初菊在线观看免费视频网站| 日韩精品高清在线| 欧美少妇bbw| 日韩精品一区二区三区三区免费| 91丨九色丨蝌蚪丨对白| 欧美三级日韩三级| 怡红院男人天堂| 欧美亚洲日本一区| 中国a一片一级一片| 日本高清不卡视频| 中文字幕免费高清网站| 日本韩国精品一区二区在线观看| 日本视频在线观看免费| 欧美日韩精品在线视频| 91蜜桃视频在线观看| 亚洲丰满少妇videoshd| 一级aaa毛片| 午夜精品国产更新| 国产香蕉视频在线| 精品久久久久久亚洲精品| 日韩精品一区二区三区国语自制| 婷婷中文字幕综合| 国产成人综合欧美精品久久| 色婷婷综合久久| 一二三区免费视频| 欧美色电影在线| 国产区精品在线| 欧美不卡123| 特黄视频在线观看| 国产丝袜一区二区| 3d成人动漫在线| 久久视频在线播放| 国产理论电影在线| 国产98色在线| 狠狠久久综合| aa日韩免费精品视频一| 欧美精品国产白浆久久久久| 欧美日韩综合另类| 久久中文字幕av一区二区不卡| 宅男av一区二区三区| 国产精品99一区二区| 国产精品沙发午睡系列| 全部av―极品视觉盛宴亚洲| 污污视频在线免费| 91色porny在线视频| 你懂得视频在线观看| 亚洲免费在线看| 好吊妞视频一区二区三区| 欧美亚洲国产一区二区三区| 99久久精品国产一区色| 亚洲成人精品久久| 成年人在线免费观看| 欧美人与性动交a欧美精品| 神马午夜在线视频| 国产日韩综合一区二区性色av| 97青娱国产盛宴精品视频| 日本不卡高清视频一区| 欧美国产专区| 久久久精品在线视频| 国产曰批免费观看久久久| 国产精品无码网站| 亚洲欧美一区二区三区国产精品| 亚洲精品国产精品乱码| 91精品国产综合久久久久久久 | 久久久精品天堂| 欧美卡一卡二卡三| 91福利资源站| 免费的黄色av| 久久精品人人做人人爽| 色资源二区在线视频| 5566中文字幕一区二区| 精品国产欧美日韩| www.av毛片| 精品在线免费观看| 欧洲女同同性吃奶| 亚洲一区二三区| 国产一区二区三区中文字幕| 国产丝袜精品第一页| xxxcom在线观看| 成人免费视频网址| 国产精品一区高清| www国产精品内射老熟女| 国产精品一区久久久久| 国产欧美小视频| 欧美性猛交xxxx久久久| 欧美 日韩 国产 成人 在线| 麻豆国产精品va在线观看不卡| 播放一区二区| 欧美日韩亚洲在线| 日韩视频精品在线观看| 日韩女优在线视频| 亚洲精品日韩专区silk| 6—12呦国产精品| 一本色道久久综合狠狠躁篇怎么玩| 咪咪网在线视频| 高清日韩一区| 国产精品成人一区二区网站软件| 久久久福利影院| 亚洲欧美区自拍先锋| 92久久精品一区二区| 色播久久人人爽人人爽人人片视av| 美女福利一区二区三区| 九九九九九九精品| 在线亚洲观看| 久久人人妻人人人人妻性色av| 午夜精品久久久久久久久久久| 亚洲第一页综合| 久久久亚洲精选| 国内精品麻豆美女在线播放视频| 免费人成自慰网站| 床上的激情91.| 国产精品第二十页| 亚洲黄色在线看| 小草在线视频免费播放| 久久手机视频| 日韩中文欧美在线| 天天干天天舔天天操| 欧美日高清视频| 自由的xxxx在线视频| julia一区二区中文久久94| 91久久视频| 国产jk精品白丝av在线观看| 欧亚一区二区三区| 日本视频在线观看| 91免费综合在线| 黄色日韩在线| asian性开放少妇pics| 在线免费观看日韩欧美| 免费在线观看黄| 成人黄动漫网站免费| 日韩午夜黄色| 日本少妇高潮喷水xxxxxxx| 欧美三区在线视频| a免费在线观看| 国产九色精品| 日韩高清一区在线| 小向美奈子av| 亚洲成人久久久久| 国产高清不卡| 久久最新免费视频| 99re这里只有精品首页| 免费在线不卡av| 九九热99久久久国产盗摄| 欧美三级午夜理伦三级小说| 日本爱爱免费视频| 亚洲精品网站在线观看| 亚洲三级中文字幕| 国产区精品在线观看| 国产综合久久| 国产毛片欧美毛片久久久| 91精品在线一区二区| sm捆绑调教国产免费网站在线观看| 日韩av不卡在线播放| 国产精品77777| 中文字幕一区二区人妻视频| 免费成人高清视频| 九九精品久久| 色姑娘综合天天| 在线精品视频一区二区三四 | 一区二区成人在线| 午夜影院免费视频| 91在线直播亚洲| 久久精品日产第一区二区| 欧美xxxx黑人xyx性爽| 亚洲天堂视频在线观看| 日韩国产在线不卡视频| 日本久久精品一区二区| 亚洲国产成人tv| 免费a级在线播放|