精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-2能監督GPT-4,Ilya帶頭OpenAI超級對齊首篇論文來了:AI對齊AI取得實證結果

人工智能 新聞
人類無法監督超級人工智能,但人工智能可以。在近日的一次訪談中,OpenAI 首席科學家 Ilya Sutskever 大膽預言,如果模型能夠很好地預測下一個詞,那么意味著它能夠理解導致這個詞產生的深刻現實。

過去一年,以「預測下一個 Token」為本質的大模型已經橫掃人類世界的多項任務,展現了人工智能的巨大潛力。

在近日的一次訪談中,OpenAI 首席科學家 Ilya Sutskever 大膽預言,如果模型能夠很好地預測下一個詞,那么意味著它能夠理解導致這個詞產生的深刻現實。這意味著,如果 AI 按照現有路徑發展下去,也許在不久的將來,一個超越人類的人工智能系統就會誕生。

但更加令人擔心的是,「超級人工智能」可能會帶來一些意想不到的負面后果。這也是「對齊」的意義。

此前的對齊方法依賴于人類的監督,如在 ChatGPT 訓練中起到關鍵作用的人類反饋的強化學習(RLHF)。但未來的人工智能系統或許能夠做出極其復雜和富有創造性的行為,使人類難以對其進行可靠的監督。例如,超人類模型可能會編寫出數百萬行新奇的、具有潛在危險的計算機代碼,即使是人類專家也很難理解這些代碼。

一旦人工智能的水平超過人類,我們又該如何監督比自己聰明得多的人工智能系統?人類文明最終會被顛覆甚至摧毀嗎?

即使是 Hinton 這樣的學界巨佬,對這個問題同樣持悲觀態度 —— 他表示自己「從沒見過更高智能水平的東西被遠遠更低智能水平的東西控制的案例」。

剛剛,OpenAI「超級對齊」團隊發布了成立以來的首篇論文,聲稱開辟了對超人類模型進行實證對齊的新研究方向。

論文鏈接:https://cdn.openai.com/papers/weak-to-strong-generalization.pdf

OpenAI「超級對齊」團隊成立于今年 7 月,目標是在四年內解決超智能 AI 的對齊問題,即搞清楚如何構建一種值得信任的人類水平的研究器,然后將其用于解決對齊問題。據說這個團隊投入了公司 20% 的算力。

在這篇論文中,OpenAI 對「人類監督超級人工智能」這個問題做了一個簡單的類比:讓小模型監督大模型。

研究表明,15 億參數的 GPT-2 模型可以被用來激發 GPT-4 的大部分能力,使其達到接近 GPT-3.5 級別的性能,甚至可以正確地泛化到小模型失敗的難題上。

OpenAI 將這種現象稱為「弱到強泛化」(Weak-to-strong generalization),這表明強大的模型具備如何執行任務的隱含知識,并且即使在給出粗制濫造的指令時也可以在其自身中找到這些知識。

圖片

但研究同時指出,用弱監督訓練的強模型和用真實標簽訓練的強模型之間仍然存在很大的差距。這表明在沒有額外工作的情況下,諸如基于人類反饋的強化學習(RLHF)之類的技術可能無法很好地擴展到超人類模型。對于 ChatGPT 獎勵建模任務來說,性能差距尤其大。

幾種簡單的方法可以顯著提高弱到強的泛化能力,比如使用中間模型大小進行引導監督,在微調時添加輔助置信度損失以鼓勵模型即使在與弱標簽相矛盾時也能保持自信,或者通過額外的無監督預訓練改進表征學習。

為了鼓勵其他研究人員解決此類問題,OpenAI 今天還宣布將提供 1000 萬美元的資助,用于各種比對方法的研究。

以下是論文細節。

研究方法

本文主要通過人類反饋 (RLHF) 的強化學習來指導或對齊模型,他們是這樣做的:強化評估人員評價高的行為,懲罰評估人員評價低的行為。假如說人類評估者能夠準確判斷模型行為是好是壞,這種做法非常有效,并且這種方式還是訓練如 ChatGPT 等大語言模型的核心部分。

然而問題來了,超級模型可能做出人類無法完全理解的復雜行為和創造性行為。例如,一個超級助手模型生成的代碼達到一百萬行,那么人類將無法為關鍵對齊相關任務提供可靠的監督,包括代碼是否遵循用戶的意圖,助手模型是否如實地回答有關代碼的問題,代碼執行是否安全或危險,等等。

因此,如果我們在人類的監督下微調超級模型,我們無法確定這個模型將如何泛化到那些人類自己也難以可靠監督的復雜行為。換句話說,這意味著即使在人類的指導下,這些超級模型在處理一些復雜或未知情況時的表現仍然是不確定的。

這就為對齊超級模型帶來了挑戰:不那么聰明的監督者怎么能控制比他們聰明得多的模型呢?盡管這個問題很重要,但目前很難進行實證研究。

一般來講,超級對齊的一個核心挑戰是人類需要監督比自己更聰明地模型。這是一個弱 - 強(weak-to-strong)的學習問題:一個弱監督者如何監督一個比它聰明得多的模型?為了解決這個問題,本文提出了一個簡單的類比,用弱模型作為監督者來代替較弱的人類監督者。

一般來講,傳統的機器學習側重于這種設置,即人類監督的模型比人類弱。但對于最終的超級對齊問題,人類監督的模型比他們聰明。因而本文研究了一個類似的問題:使用弱模型來監督強模型。

他們是這樣實現的,對于一個給定的任務:

  1. 構建弱監督者。本文通過在真值標簽上微調較小的預訓練模型來構造弱監督者,他們把弱監督者的表現稱為弱表現,并通過弱模型的預測來生成弱標簽。
  2. 通過弱監督訓練強學生模型。本文使用生成的弱標簽微調強模型,并將該模型稱為強學生模型,將其產生的性能稱為從弱到強的性能。
  3. 訓練一個以真值標簽為上限的強模型。為了比較,本文使用真值標簽對強模型進行了微調。將此模型的最終性能稱為強大的上限性能。

通常,弱到強的表現將介于弱表現和強上限表現(strong ceiling)之間。本文將 PGR(performance gap recovered)定義為上述三種性能(弱、弱到強和強上限)的函數,如下圖所示。

圖片

如果實現完美的弱到強泛化,則 PGR 為 1。如果弱到強模型的表現并不比弱監督者更好,則 PGR 為 0。

實驗結果

在 NLP 任務、國際象棋和獎勵建模任務中,本文評估了強學生模型的表現,結果如下。總的來說,在所有的設置中,本文觀察到從弱到強的泛化:強學生模型始終勝過他們的弱監督者。

圖片

本文發現可以使用簡單的方法來大大提高弱到強的泛化,如圖 4 所示。

圖片

圖 5 表明,對于較小的強學生來說,雖然它的表現比 naive 基線稍差,但提高泛化能力還是很明顯的。

圖片

圖 7 (a) 顯示了 ChatGPT RM 任務訓練過程中的真值測試準確度曲線,圖 7 (b) 和 (c) 比較了最佳和最終真值測試的準確度。

圖片

圖 9a 考慮了 7 個有代表性的 NLP 任務,并比較了微調、零樣本提示和 5-shot 提示;對于零樣本和 5-shot 基線,本文使用表 2 中總結的特定于任務的提示。

圖片

了解更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-16 09:45:56

論文GPT-4AI

2024-06-28 13:40:03

2023-08-11 13:41:42

2023-06-19 08:19:50

2023-08-17 08:00:00

2023-05-10 17:33:56

2023-08-15 15:03:00

AI工具

2023-03-16 19:17:57

2023-03-28 08:23:38

2024-06-07 16:40:53

2023-05-10 14:54:23

AI

2023-08-02 10:45:43

2024-06-07 18:14:53

2023-03-17 22:10:53

ChatGPTOpenAIGPT-4

2025-04-16 09:35:03

2023-07-07 09:32:57

GPT-4OpenAI

2022-04-20 10:47:46

AIGPT-4

2023-11-02 12:10:00

AI訓練

2023-03-31 15:11:26

OpenAIAI

2024-05-15 09:28:01

點贊
收藏

51CTO技術棧公眾號

日韩精品极品在线观看| 亚洲综合久久av| 国产精品美女久久久免费| 极品尤物一区二区| 欧洲精品99毛片免费高清观看 | 色综合999| 26uuu精品一区二区| 国产欧美欧洲在线观看| 久久久精品人妻一区二区三区四| 蜜桃tv一区二区三区| 91精品久久久久久久久99蜜臂| 自慰无码一区二区三区| 日本成人网址| www国产成人| 91夜夜未满十八勿入爽爽影院 | 国产盗摄在线观看| 久久综合九色综合久久久精品综合 | 麻豆亚洲一区| 国内精品国产成人国产三级| 奶水喷射视频一区| 色中色综合影院手机版在线观看| 成人午夜剧场视频网站| 91精品入口| 欧美三级在线看| 每日在线更新av| 黄色网在线免费看| 国产亚洲欧美色| 国产精品一区视频| 国产喷水福利在线视频| 日日骚欧美日韩| 午夜精品三级视频福利| 91人妻一区二区三区蜜臀| 国内黄色精品| 精品亚洲一区二区三区| 中文字幕18页| 麻豆一区在线| 欧美精品乱码久久久久久| 国产精品涩涩涩视频网站| 丁香花在线观看完整版电影| 日韩美女视频一区| 午夜精品一区二区在线观看的| 污视频软件在线观看| 国产mv日韩mv欧美| 91久久综合亚洲鲁鲁五月天| 亚洲天堂中文网| 日产国产高清一区二区三区| 日韩av电影国产| 精品国产免费观看| 9国产精品视频| 久久久亚洲成人| 久久精品视频国产| 狠狠综合久久av一区二区老牛| 久久精品国产亚洲精品| 91香蕉国产视频| 欧美wwwww| 色系列之999| 99热99这里只有精品| 日韩黄色大片网站| 日日骚av一区| 男女性高潮免费网站| 亚洲二区三区不卡| 欧美成人一区在线| 免费看一级一片| 1024成人| 日韩av成人在线观看| 涩涩视频在线观看| 麻豆国产精品一区二区三区| 国产日韩av在线播放| 国产又粗又猛视频免费| 韩日欧美一区二区三区| 成人av免费在线看| 婷婷五月综合久久中文字幕| 91亚洲国产成人精品一区二区三| 欧美第一黄网| 日本综合在线| 一区二区三区免费在线观看| 可以在线看的av网站| 老司机成人影院| 欧美人xxxx| 国产精品一区二区无码对白| 日韩高清电影免费| 尤物九九久久国产精品的特点 | 在线精品国产| 高清视频欧美一级| www.国产一区二区| 理论电影国产精品| 99影视tv| 国产精品一区二区婷婷| 亚洲免费av高清| 日日橹狠狠爱欧美超碰| 日韩精品第二页| 精品国产一区二区亚洲人成毛片| 玖玖爱在线观看| 亚洲91中文字幕无线码三区| 97久久精品人人澡人人爽缅北| 极品国产91在线网站| 国产又黄又大久久| 久久国产精品久久| av黄色在线| 色婷婷一区二区| 台湾佬美性中文| 精品国产午夜| 久久久久久国产免费| 秋霞精品一区二区三区| 国产精品夜夜嗨| 日韩女优中文字幕| 俺来俺也去www色在线观看| 欧美色视频一区| 亚洲精品乱码久久久久久蜜桃欧美| 国际精品欧美精品| 久久久久久久久久久成人| 亚洲天堂网在线视频| 91丨porny丨蝌蚪视频| 最新视频 - x88av| 亚洲成人人体| 337p日本欧洲亚洲大胆精品 | 水蜜桃久久夜色精品一区| 97视频在线播放| 国产黄色高清视频| 国产精品色婷婷久久58| 女人和拘做爰正片视频| 亚洲一区二区三区中文字幕在线观看| 亚洲日本欧美日韩高观看| 国语对白一区二区| 加勒比av一区二区| 日韩av一级大片| 亚洲黄色免费看| 精品国产污网站| 动漫性做爰视频| 美腿丝袜亚洲色图| 欧美在线一二三区| 热三久草你在线| 亚洲电影av在线| 青青草偷拍视频| 国产在线精品视频| 亚洲乱码一区二区三区三上悠亚| 人人视频精品| 亚洲精品一区二区久| 日本中文字幕网| 成人精品鲁一区一区二区| 干日本少妇视频| 国产高清亚洲| 另类色图亚洲色图| 国产精品老熟女视频一区二区| 中文字幕国产一区| 麻豆一区二区三区视频| 精品国产乱码| 国产精品日韩av| 丁香婷婷在线| 欧美性生交片4| 毛片视频免费播放| 免费观看在线色综合| 翔田千里亚洲一二三区| 国产一区高清| www国产精品视频| 国产成人精品无码高潮| 亚洲精品欧美激情| 国偷自产av一区二区三区麻豆| 欧美一区国产在线| 97人摸人人澡人人人超一碰| 国产亚av手机在线观看| 亚洲黄色在线看| youjizz在线视频| 国产三级一区二区| 亚洲国产成人va在线观看麻豆| 日韩欧美电影| 91久久在线视频| 草草影院在线| 亚洲免费精彩视频| 欧美特级黄色片| 国产精品妹子av| 巨乳女教师的诱惑| 最新日韩在线| 日韩国产精品一区二区| 9999在线精品视频| 久久久久久久999精品视频| 亚洲av成人精品毛片| 欧美性猛交xxxx乱大交退制版| 国产免费美女视频| 福利一区二区在线| 欧美成人精品欧美一级乱| 日本成人小视频| 不卡视频一区| 欧美日韩大片| 欧美成人免费观看| 青草久久伊人| 91麻豆精品91久久久久同性| 久久精品视频国产| 中文字幕乱码亚洲精品一区| 色欲无码人妻久久精品| 欧美亚洲一区| 好吊色这里只有精品| 亚洲小说图片| 91在线高清视频| 成人欧美大片| 精品中文字幕乱| 成人亚洲综合天堂| 精品日韩一区二区| 97人妻精品视频一区| 一区二区三区影院| 永久免费av无码网站性色av| 高清在线成人网| 日韩大片一区二区| 夜夜嗨一区二区三区| 日本特级黄色大片| 国产成人ay| 国产成人精品自拍| 婷婷成人av| 欧美重口另类videos人妖| 伊人影院蕉久影院在线播放| 亚洲一级免费视频| 理论片中文字幕| 欧美精品九九99久久| 欧美日韩一级黄色片| 亚洲一区二区三区四区在线| 中文字幕第69页| 91在线云播放| 风韵丰满熟妇啪啪区老熟熟女| 美女视频黄 久久| 国产中文字幕免费观看| 国产综合色产| 免费观看国产视频在线| 国语产色综合| 蜜桃视频成人| 欧美三级电影在线| 国产伦精品一区二区三区视频黑人| 国内欧美日韩| 国产精品久久久久av| 在线天堂资源www在线污| 欧美国产日韩精品| 搞黄网站在线观看| 日韩中文字幕网站| 992tv免费直播在线观看| 亚洲视频在线观看网站| 天天操天天干天天干| 精品国产一二三| 亚洲精品久久久狠狠狠爱 | 免费在线观看日韩av| 韩国v欧美v亚洲v日本v| 日本不卡一区在线| 日本三级亚洲精品| 成人3d动漫一区二区三区| 美女爽到呻吟久久久久| 69堂免费视频| 国产日韩一区二区三区在线| 日韩视频在线视频| 亚洲特色特黄| 久久亚洲国产成人精品无码区| 午夜激情一区| 黄色三级中文字幕| 精品动漫av| 欧美牲交a欧美牲交| 国产精品婷婷| 欧美牲交a欧美牲交aⅴ免费真| 免费看的黄色欧美网站| 虎白女粉嫩尤物福利视频| 久久亚洲不卡| 91小视频网站| 国产传媒日韩欧美成人| 国产国语老龄妇女a片| 99久久精品国产麻豆演员表| 五月婷婷综合在线观看| 欧美国产乱子伦 | 成人啪啪免费看| 日韩成人视屏| 国产精品视频500部| 日韩av黄色在线| 日韩精品不卡| 91精品国产乱码久久久久久| 欧美成人精品免费| 老鸭窝亚洲一区二区三区| 少妇网站在线观看| 国产精品一区专区| 无码精品一区二区三区在线播放 | 亚洲第一视频网站| 麻豆app在线观看| 日韩在线观看视频免费| 日本一本在线免费福利| 欧美在线视频一区| 欧美在线se| 国产精品久久久久免费| 欧美猛男同性videos| 亚洲一区二区三区免费看| 欧美在线播放| 无码人妻h动漫| 经典三级在线一区| 韩国无码一区二区三区精品| 欧美国产在线观看| 久久久久免费看| 在线免费av一区| www.激情五月| 亚洲天堂免费视频| 91蜜桃在线视频| 日韩美女在线观看一区| 精品午夜视频| 久久伦理网站| 重囗味另类老妇506070| 国产1区2区在线| 国产精品香蕉一区二区三区| 日韩av在线看免费观看| 伊人夜夜躁av伊人久久| 国产精品xxxxxx| 欧美变态凌虐bdsm| 草碰在线视频| 68精品久久久久久欧美| 国产欧美视频在线| 奇米精品在线| 亚洲欧洲日本一区二区三区| 爱豆国产剧免费观看大全剧苏畅| 99精品在线免费| 久草福利资源在线观看| 欧美日韩一区二区在线观看视频| 欧性猛交ⅹxxx乱大交| 久久久国产影院| 日本h片久久| 久久精品女人的天堂av| 欧美午夜影院| 亚洲国产欧美91| 中文字幕欧美区| 日本中文字幕第一页| 精品少妇一区二区三区视频免付费| jizz在线观看中文| 日本亚洲欧洲色| 日韩福利视频一区| 日韩欧美国产综合在线| 国产大陆a不卡| 丰满少妇高潮久久三区| 欧美日韩久久一区| 国产在线网站| 国产91网红主播在线观看| 欧美三级自拍| jizzjizz国产精品喷水| 岛国av在线一区| 妺妺窝人体色www婷婷| 91精品国产综合久久精品图片| 国产福利在线观看| 日韩av日韩在线观看| 偷拍自拍亚洲色图| 国产精品无码av在线播放| 波多野洁衣一区| 久久久久无码国产精品不卡| 日韩欧美国产综合一区| 羞羞网站在线免费观看| 91在线观看欧美日韩| 一区二区中文字| 欧美高清精品一区二区| 亚洲欧美日韩国产综合在线| 国产精品欧美久久久久天天影视| 精品国产一区二区三区久久久| 久久亚洲精品人成综合网| 亚洲永久一区二区三区在线| 久久精品国产亚洲高清剧情介绍| 国产aaaaaaaaa| 欧美精品一二三| av在线播放观看| 成人黄动漫网站免费| 亚洲国产三级| 香蕉网在线播放| 在线国产亚洲欧美| 无遮挡的视频在线观看| 91深夜福利视频| 国内精品福利| a视频免费观看| 欧美午夜精品一区二区三区 | 78m国产成人精品视频| 色婷婷久久久| av在线无限看| 亚洲人成网站色在线观看| www.久久精品.com| 97精品视频在线观看| 精品中文一区| av在线免费看片| 亚洲国产一区视频| 欧美69xxxxx| 91精品国产综合久久香蕉的用户体验 | 国产亚洲美女精品久久久| 日韩毛片一区| 亚洲精品天堂成人片av在线播放 | 日韩免费电影一区二区| 精品系列免费在线观看| 国产一级一级片| 亚洲最新av在线| 亚洲午夜免费| 国产免费人做人爱午夜视频| 亚洲日本在线天堂| 色婷婷激情五月| 国产日产久久高清欧美一区| 欧美日韩一区二区国产| 中日韩精品一区二区三区| 欧美一区二区三区视频| 色网在线免费观看| 最新欧美日韩亚洲| 久久影院视频免费| 国产又粗又长视频| 欧美做爰性生交视频| 久久久久国产精品| 永久免费成人代码| 精品美女一区二区| 久久久加勒比| 免费无遮挡无码永久视频|