精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4批評GPT-4實現「自我提升」!OpenAI前超級對齊團隊又一力作被公開

人工智能 新聞
今天,OpenAI悄悄在博客上發布了一篇新論文——CriticGPT,而這也是前任超級對齊團隊的「遺作」之一。CriticGPT同樣基于GPT-4訓練,但目的卻是用來指正GPT-4的輸出錯誤,實現「自我批評」。

OpenAI最近的拖延癥狀逐漸嚴重,不僅GPT-5遙遙無期,前幾天還宣布GPG-4o的語音功能將推遲一個月發布。

或許是為了緩解廣大網友的熱切期待,OpenAI在今天放出了新模型CriticGPT,相當于GPT-4的「拐杖」。

圖片

我們訓練了一個模型CriticGPT,來捕獲GPT-4生成代碼中的錯誤。我們開始將此類模型集成到RLHF對齊管道中,以幫助人類監督AI執行困難的任務。

值得注意的是,CriticGPT依舊是用GPT-4模型訓練的,但被用于給GPT-4生成的代碼「捉蟲」,這似乎有點「自我閉環」的意思?

推特網友迅速質疑,「我用石頭摧毀石頭」,矛盾得有點好笑。

圖片

但也有人從另一個角度發現了華點:這難道就是模型自我提升的開始?

圖片

官方發布的推文和博客中還沒有提及CriticGPT何時會集成到ChatGPT中,但技術文章已經發布,而且又是一篇離職人員的遺留作品——由超級對齊的scalable oversight團隊共同完成,作者署名包含Jan Leike。

圖片

論文地址:https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf

那就來仔細看看,讓GPT-4「自我提升」的結果究竟如何?

GPT-4自己批自己

RLHF全稱為Reinforcement Learning from Human Feedback,是包括ChatGPT在內的很多LLM常用的對齊方法。人類AI訓練師們會收集模型對同一個問題的不同響應并進行評分,以此改進模型。

隨著ChatGPT的響應變得更加準確,它犯的錯誤也會更微妙、讓人類訓練師更難察覺,因而降低了RLHF的有效性。

事實上,這也是RLHF的根本限制,隨著模型逐漸進化到比任何提供反饋的專家都更有知識,基于人類的評價來調整模型就會越來越困難。

因此,OpenAI的「可擴展監督」團隊想到了跳出RLHF的框架,干脆訓練模型為ChatGPT撰寫評論,糾正輸出結果中不準確的地方。

圖片

這種方法似乎取代了RLHF,但好像又沒取代——因為訓練CriticGPT的過程,仍然采用了RLHF。

核心思想非常簡潔:CriticGPT依舊是自回歸模型。標注者先向ChatGPT的響應輸出中人為注入一些微妙的錯誤,CriticGPT針對這些有錯誤的答案生成批評意見,之后再由人類訓練師為批評意見進行打分排名。

圖片

CriticGPT訓練流程

RLHF的訓練過程與ChatGPT類似,具體如下:

  1. 為數據集中每個問題和答案采樣CriticGPT生成的批評意見
  2. 人類評估者對其各個屬性及總體質量進行評分
  3. 訓練獎勵模型用于預測人類對模型輸出的整體質量排名
  4. 使用PPO優化獎勵模型
  5. 應用一種創新的推理時采樣策略:強制采樣束搜索(FSBS)

大部分的訓練數據都來自人類篡改GPT答案的這個過程,但也包含少部分未經修飾的原始答案。

為什么一定要人為向ChatGPT的響應輸出中注入bug?不能直接篩選出有bug的答案嗎?

論文中提出,使用原始、未經修飾的答案會存在如下幾個問題:

  • 許多答案不會包含嚴重問題,進而降低了數據對于改進批評意見的價值
  • 如果無法控制錯誤類型,CriticGPT會輸出自由形式且模糊不清的批評意見,難以驗證其正確性
  • 人類也很難發現CriticGPT遺漏的重要問題
  • 偏好率可能受到許多風格因素的影響,并會高估模型性能

需要注意的是,人類已經檢測到有bug的模型輸出,本身就說明它們更容易被人發現!

篡改方法最重要的優點是制造出了高質量、難以發現的錯誤,而且平均而言更嚴重。知道了哪里有預先插入的bug,人類訓練師也更容易區分出那些不夠全面、遺漏bug的批評。

團隊有意地保證了這些人為篡改的復雜和微妙。他們訓練了一個二元判別器預測代碼是否被篡改,發現較小的模型并沒有較好的分辨能力(圖13),以此驗證了篡改代碼的質量。

圖片

人類評估CriticGPT的批評意見時,從以下幾個維度給出評分和排名:

  • 是否全面 ,即沒有遺漏任何明顯或嚴重的問題
  • 是否捕獲到了之前插入的特定bug,即CBI(critique-bug inclusion)
  • 有沒有出現幻覺或者挑剔現象,指出了不存在的問題
  • 對整體有用性的主觀評級,包含上述內容并考慮風格和整體的實用性

在訓練CriticGPT的過程中,除了RLHF方法,團隊將獎勵模型與搜索結合,提出了一種名為強制采樣束搜索的方法(Forced Sampling Beam Seach,FSBS)。

一般來說,模型產生的批評意見更長時,也更容易出現幻覺。這有點類似于「準確率」和「召回率」之間的權衡。

FSBS能夠激勵CriticGPT在產生更長、更全面的批評時,減少「無中生有」或者「雞蛋里挑骨頭」的發生率。

之后進行的消融實驗也證明了FSBS方法的有效性(圖12)。

圖片

當然,OpenAI還是忘不了他們最喜歡的Scaling Law。他們用RLHF訓練并評估了一系列模型,來描述模型規模對bug檢測效果的影響(圖5)。

直觀來看,要達到CriticGPT(只進行了RL)的同等水平,在沒有額外數據或修改pipeline的情況下,需要將ChatGPT的預訓練計算量擴大30×。

圖片

評估結果

首先,團隊把人類和CriticGPT撰寫的批評意見混雜在一起,再交給人類進行評估。

標注者們會更喜歡自己同行們的產出嗎?并沒有。

ChatGPT和CriticGPT都超過了人類表現(圖1b),而且63%的情況下,CriticGPT撰寫的批評意見比人類的更受青睞(圖1a)。

要知道,研究團隊招來寫批評意見的不是編程門外漢,而是有平均5年Python研發經驗的技術人員。他們在每個例子上大約會花費50分鐘,并能執行代碼或查找參考手冊,結果也只能發現25%左右的人為注入的bug。

圖片

論文認為,這些評估者在沒有LLM幫助下撰寫的批評意見相對較短,而且可能缺乏所需的領域知識(比如特定的Python庫),并且有些篡改行為確實難以發現,這三個原因導致了人類和模型之間如此明顯的差異。

從圖6中可以看到,CriticGPT的檢測錯誤能力比較全面,對于人為篡改的錯誤以及原始輸出中就存在的錯誤,都達到了最高的全面性百分比。

更令人驚訝的是,ChatGPT在這兩個方面的表現也都超過人類獨立撰寫的批評意見。人類評估者要借助CriticGPT,才能與ChatGPT水平相當。

圖片

但是下面的圖7又開啟了一輪反轉。團隊發現,雖然人類容易遺漏錯誤,但人類也最不容易產生幻覺或者「雞蛋里挑骨頭」的問題。

在產生幻覺這方面,ChatGPT的表現最不如人意,CriticGPT稍有提升。

圖片

考慮到批評意見的全面性與減少幻覺之間的權衡,作者提出了團隊中「人機合作」模式的好處。如圖8所示,人類+CriticGPT的團隊表現能夠超越模型或人類分別單獨工作時的Pareto邊界。

圖片總結

可擴展監督(scalabel oversight)的終極目標是幫助人類評估模型,來訓練出更好、更安全的策略。

從長期來看,我們應該找到一種泛化性更強的批評模型訓練方法,適用于沒有groung truth和獎勵函數的長形式、開放式任務。

在現實場景中,模型輸出的錯誤可能分布在答案的很多部分。CriticGPT的工作重點是指出一處的重要錯誤,但未來依舊需要探索,如何識別出分散在答案中各處的錯誤。

CriticGPT依舊存在幻覺問題,且幫助有限。如果編碼任務或者原模型的輸出過于復雜,即使是有模型協助的專家也可能無法做出很好的評估。

但這篇文章的方法為今后的RLHF訓練帶來了一種新鮮思路:將RLHF應用到GPT-4中,訓練出CriticGPT這樣的模型,可以合成出更多的高質量RLHF數據。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-06-19 08:19:50

2025-04-16 09:35:03

2023-12-16 09:45:56

論文GPT-4AI

2025-05-30 07:40:56

2023-04-04 11:20:40

GPT-4OpenAI

2023-07-07 09:32:57

GPT-4OpenAI

2024-05-21 12:23:17

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2023-04-09 16:17:05

ChatGPT人工智能

2023-12-15 12:52:17

AI模型

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-03-16 17:28:59

技術AI

2024-04-25 16:56:14

GPT-4大模型人工智能

2024-06-07 16:40:53

2023-12-17 22:04:04

微軟GPT-4

2023-03-16 19:17:57

2023-03-28 13:01:20

GPT-4開發OpenAI

2023-05-03 20:53:48

2023-08-15 10:33:06

微軟必應人工智能

2023-03-16 08:13:56

人工智能?OpenAI
點贊
收藏

51CTO技術棧公眾號

性日韩欧美在线视频| 欧美丰满嫩嫩电影| 色一情一乱一伦一区二区三区| 狠狠躁夜夜躁人人爽视频| 精品国产中文字幕第一页| 欧美日韩亚洲综合在线 | 国产美女亚洲精品7777| 亚洲一区二区av电影| 欧美不卡三区| 一级爱爱免费视频| 亚洲激情亚洲| 日韩在线视频国产| 日韩精品视频一区二区| 福利一区二区三区视频在线观看| 国产精品每日更新在线播放网址| 97超碰人人看人人| 亚洲大尺度在线观看| 欧美精品97| 这里只有精品丝袜| 五月天激情小说| 亚洲欧洲日韩精品在线| 欧美日韩一区二区免费视频| 懂色av一区二区三区四区五区| 天堂av网在线| 国产v综合v亚洲欧| 国产精品视频久久| 日韩精品在线免费视频| 综合国产在线| 色七七影院综合| 中国黄色a级片| av在线亚洲色图| 欧美久久久久久久久久| 国产激情在线观看视频| 国产在线观看www| 中文字幕在线不卡| 欧美一区二区三区在线播放| 国内爆初菊对白视频| 激情综合网av| 国产精品最新在线观看| 国产成人无码av| 日韩一级欧洲| 国语自产偷拍精品视频偷 | 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 精品国产av无码| 美女视频亚洲色图| 精品国产污污免费网站入口 | 国产乱对白刺激视频不卡| 国产精品成人播放| 超碰在线观看91| 欧美综合二区| 日本sm极度另类视频| 99热在线观看免费精品| 日韩一级欧洲| 136fldh精品导航福利| 国产无码精品一区二区| 亚洲国产美女| 国自产精品手机在线观看视频| 国产免费无码一区二区视频| 午夜精品国产| 欧美精品video| 麻豆成人在线视频| 激情另类综合| 7m精品福利视频导航| 天天插天天操天天干| 国产欧美短视频| 欧美在线视频网站| 久久亚洲精品石原莉奈| 日韩福利电影在线观看| 国产日韩在线观看av| 在线观看国产一区二区三区| 久久黄色级2电影| 成人激情视频在线| www.精品久久| 99免费精品在线| 免费久久久一本精品久久区| 国产午夜在线观看| 国产精品毛片大码女人| 天堂а√在线中文在线| 3344国产永久在线观看视频| 欧美性猛交xxxxx免费看| 激情婷婷综合网| 在线免费成人| 亚洲精品在线三区| 久久久精品人妻无码专区| jizzjizz欧美69巨大| 久久天天躁日日躁| 日韩精品在线免费视频| 久久se这里有精品| 国产精品免费观看高清| 免费一级在线观看播放网址| 国产精品高清亚洲| 日韩xxxx视频| 91大神在线观看线路一区| 日韩一区二区三区免费观看| 极品白嫩丰满美女无套| 久久大综合网| 97超碰蝌蚪网人人做人人爽| 精品国产www| 成人免费视频一区二区| 欧洲精品码一区二区三区免费看| 男人的天堂在线视频免费观看| 亚洲一区二区三区在线播放| 国产偷人视频免费| 精品久久亚洲| 亚洲色图第三页| 欧美日韩精品一区二区三区视频播放| 国产亚洲一级| 3d动漫精品啪啪一区二区三区免费| 污视频在线免费| 亚洲视频网在线直播| 国产主播在线看| 欧美日韩黄色| 这里只有视频精品| 日韩欧美一区二区一幕| 狠狠色狠狠色综合| 蜜桃视频在线观看91| av在线麻豆| 欧美网站一区二区| 亚洲色图14p| 午夜久久黄色| 成人国产精品一区二区| 国产区高清在线| 午夜影院久久久| 91精品999| 精品国产一区探花在线观看| 国内精品模特av私拍在线观看| 国产精品永久久久久久久久久| 久久久91精品国产一区二区精品 | 欧美在线观看视频一区二区三区| 高清中文字幕mv的电影| 欧美激情欧美| 国产精品免费看久久久香蕉| 免费观看成年在线视频网站| 午夜成人免费电影| 精品无码av一区二区三区不卡| 99精品网站| 国产精品久在线观看| 你懂的视频在线| 欧美日韩黄色大片| 中国极品少妇videossexhd| 国产精品videosex极品| 亚洲在线视频福利| 99在线播放| 日韩一级二级三级| 欧美三级日本三级| 国产精品综合一区二区三区| 一区二区三区偷拍| 日韩精品第二页| 日韩在线小视频| 亚洲天堂视频网| **性色生活片久久毛片| 亚洲天堂av一区二区| 999精品色在线播放| 国产区亚洲区欧美区| 欧美被日视频| 在线观看91精品国产麻豆| 黄色录像二级片| 国产在线精品一区二区三区不卡| 男人天堂成人网| 精品一区二区三区中文字幕在线 | 日韩欧美一级片| 久久精品久久国产| 91伊人久久大香线蕉| 亚洲国产精品久久久久爰色欲| 婷婷亚洲成人| 国产精品久久二区| 天天在线视频色| 欧美一级爆毛片| 日本熟妇毛耸耸xxxxxx| 972aa.com艺术欧美| 中国丰满人妻videoshd| 欧美日韩国产免费观看视频| 国产精品自产拍在线观| av在线免费播放| 日韩成人激情在线| 免费黄色一级大片| 一区二区在线看| 日韩网站在线播放| 欧美aaa在线| 久久综合亚洲精品| 天堂av一区二区三区在线播放 | 精品一区91| 韩剧1988在线观看免费完整版| 香港一级纯黄大片| 欧美怡红院视频| 成年人av电影| 久久精品夜色噜噜亚洲a∨| 中文字幕av不卡在线| 极品av少妇一区二区| 久久伦理网站| 国产精品va视频| 欧美亚洲成人网| 黄色网在线免费看| 日韩福利视频在线观看| 亚洲自拍第二页| 五月天亚洲婷婷| 永久免费看片直接| www.亚洲精品| 五月天视频在线观看| 国产情侣一区| 性做爰过程免费播放| 怕怕欧美视频免费大全| 97人人澡人人爽| 国产极品久久久久久久久波多结野| 欧美高清视频免费观看| wwwxxx在线观看| 日韩成人xxxx| 亚洲国产精品久久久久久久| 欧美视频一二三区| 免费观看一区二区三区毛片| 亚洲人成电影网站色mp4| 瑟瑟视频在线观看| 成人免费高清视频| 日本77777| 日韩国产欧美在线观看| 日本在线xxx| 亚洲乱码精品| 亚洲日本精品| 免费av一区| 国产精品入口免费| 精品一区二区三区中文字幕在线| 国产精品免费小视频| 爱搞国产精品| 久久久久久久久久久av| 大地资源网3页在线观看| 原创国产精品91| 牛牛影视精品影视| 亚洲国产精品小视频| www夜片内射视频日韩精品成人| 91福利在线免费观看| 毛片毛片女人毛片毛片| 亚洲黄色免费网站| 精品国产视频一区二区三区| 国产精品午夜在线观看| 亚洲精品国产一区黑色丝袜| 99久久er热在这里只有精品15| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 午夜精品一区二| 婷婷丁香久久五月婷婷| 久久婷婷综合国产| 亚洲精品菠萝久久久久久久| 中日韩一级黄色片| 国产精品久久久久久久久快鸭 | 污污视频网站免费观看| 国产视频一区三区| 国产精品va无码一区二区| 亚洲精品一二| 1024av视频| 久久久精品午夜少妇| 日韩av片在线看| 久久婷婷激情| 欧美一级裸体视频| 美女性感视频久久| 日韩精品视频一二三| 久久丁香综合五月国产三级网站| 色婷婷.com| 国产精品一卡二卡| 男男一级淫片免费播放| av日韩在线网站| 美国黄色一级毛片| 亚洲国产精品国自产拍av| ass极品国模人体欣赏| 亚洲欧洲精品成人久久奇米网| 国产精品 欧美激情| 亚洲一本大道在线| 国产成人亚洲欧洲在线| 在线一区二区三区做爰视频网站| 成人免费视频国产免费| 欧美久久婷婷综合色| 亚洲国产成人一区二区| 日韩大片免费观看视频播放| 欧美日韩国产亚洲沙发| 中文字幕精品av| 青春草在线视频| 欧美一区二区三区免费视| 亚洲精品国产嫩草在线观看| 成人免费激情视频| 精品国产一区二区三区不卡蜜臂| 看欧美日韩国产| 色琪琪久久se色| 欧美日韩福利在线| 日韩高清在线观看| 亚洲一级片免费观看| caoporm超碰国产精品| 中文字幕av久久爽一区| 亚洲精品免费电影| 免费无码国产精品| 欧美一区二区日韩| 人操人视频在线观看| 日韩在线免费高清视频| 不卡av免费观看| 国产精品久久久久秋霞鲁丝| 伊人精品综合| 日韩成人在线资源| 欧美一区影院| 四季av一区二区| 成人性生交大片免费看中文网站| 男女做爰猛烈刺激| 亚洲国产一区二区a毛片| 最新在线中文字幕| 精品国产一区二区三区不卡| 国产福利电影在线| 久久久中精品2020中文| 日韩福利影视| 农村寡妇一区二区三区| 欧美日本一区| 狠狠操狠狠干视频| 久久婷婷国产综合精品青草| 老妇女50岁三级| 欧美日韩精品欧美日韩精品一 | 国产精品亲子伦av一区二区三区 | 免费的黄色av| 日韩性生活视频| 亚洲播播91| 久久66热这里只有精品| 国产精品vip| 一级黄色大片儿| 欧美激情在线一区二区三区| 青青操免费在线视频| 欧美一级xxx| 麻豆传媒在线免费看| 国产精品999| 亚洲欧洲av| 成年人网站免费视频| 国产精品白丝jk白祙喷水网站| 国产欧美一区二区三区在线观看视频| 亚洲国产日产av| 国产a级免费视频| 日韩中文字幕av| www.成人在线视频| 欧美一区二区三区成人久久片 | www.色就是色.com| 国产精品午夜电影| 波多野结衣黄色| 亚洲视频在线看| 日韩在线短视频| 欧美在线视频二区| 久久国产成人| 魔女鞋交玉足榨精调教| 欧美日韩日本国产| 午夜激情小视频| 91国产美女视频| 久久精品论坛| www在线观看免费| 不卡在线观看av| 91香蕉在线视频| 亚洲精品一区二三区不卡| 一级毛片久久久| 日本一区免费看| 可以看av的网站久久看| 久久精品成人av| 欧美影片第一页| 麻豆影视在线观看_| 91免费综合在线| 欧美福利视频| 91超薄肉色丝袜交足高跟凉鞋| 一区二区三区在线影院| 欧美熟妇另类久久久久久不卡| 国产+人+亚洲| 神马香蕉久久| 动漫av免费观看| 国产精品嫩草影院com| 国产精品免费无遮挡| 欧美疯狂性受xxxxx另类| 福利电影一区| 爆乳熟妇一区二区三区霸乳| 亚洲国产高清aⅴ视频| 91中文字幕在线视频| 欧美成人激情视频免费观看| 伊人久久亚洲| 国产亚洲精品网站| 国产精品久久网站| 99精品视频免费看| 午夜精品久久久久久久白皮肤| 亚洲免费专区| 免费精品99久久国产综合精品应用| 亚洲视频一区二区在线| 天天干天天草天天射| 国产精品久久久久不卡| 亚欧美无遮挡hd高清在线视频| 伊人影院在线观看视频| 欧美性猛交xxxxx水多| 麻豆视频免费在线观看| 国产一区在线免费观看| 日韩电影网1区2区| 青草影院在线观看| 亚洲精品视频播放| av成人在线网站| 男人操女人逼免费视频| 国产精品乱码久久久久久| 亚洲精华国产精华精华液网站| 日产精品99久久久久久| 五月天久久777| 国产高清自拍视频| 3d动漫精品啪啪1区2区免费| h片在线观看视频免费| 永久免费精品视频网站| 97se亚洲国产综合自在线 | 狠狠色丁香久久婷婷综| 日本午夜视频在线观看|