精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM超越人類時該如何對齊?谷歌用新RLHF框架解決了這個問題

人工智能 新聞
對基于 LLM 的 AI 來說,高質量的人類數據非常關鍵,但已有研究預計這些高質量數據將在未來幾年耗盡。

我們這個世界是不斷變化的開放世界。人工智能要在這個世界長久立足,就需要突破許多限制,包括可用數據和規模和質量以及有用新信息的增長率。

對基于 LLM 的 AI 來說,高質量的人類數據非常關鍵,但已有研究預計這些高質量數據將在未來幾年耗盡。

圖片

如果 LLM 保持現在的發展勢頭,預計在 2028 年(中位數)左右,已有的數據儲量將被全部利用完,來自論文《Will we run out of data? Limits of LLM scaling based on human-generated data》

此后,這類數據的質量也將停滯不前:隨著 LLM 能力越來越強,它們將能解決越來越復雜和越來越多的難題,而這些難題所需的訓練數據已經超出了人類的能力。

因此,我們就需要為 LLM 構建一種能使其實現自我提升的基本機制,讓模型可以持續地自我生成和自我求解更困難的問題。

于是,問題就來了:語言模型能否自我創建可學習的新任務,從而實現自我改進以更好地泛化用于人類偏好對齊?

為了提升語言模型的對齊能力,人們已經提出了許多偏好優化算法,但它們都默認使用固定的提示詞訓練分布。這種固定的訓練范式缺乏可擴展性,并不可避免地導致泛化問題和效率問題。

基于這些考慮,谷歌 DeepMind 和芝加哥大學一個研究團隊開發了一種可擴展的開放式 RLHF 框架 eva,即 Evolving Alignment via Asymmetric Self-Play,也就是「通過非對稱自博弈實現的演進式對齊」

  • 論文標題:Evolving Alignment via Asymmetric Self-Play
  • 論文地址:https://arxiv.org/pdf/2411.00062

eva 能讓自我提升式語言模型的訓練分布自動演進,如圖 1 所示。

圖片

eva 的核心方法

在介紹 eva 的核心方法之前,我們需要先了解一些前提設置,這里截圖如下:

圖片

概述地講,eva 可通過一個創建器(creator)將經典 RLHF 擴展成開放式 RLHF,該創建器使用易于實現的估計、采樣、進化程序來調整提示詞的分布,模仿不對稱自博弈的最小最大遺憾(minimax-regret)策略。

圖片

圖片

原理:用于聯合自我提升的開放式 RLHF

直觀說明

經典 RLHF 是在一個靜態提示詞分布上執行優化,這意味著智能體僅與固定的參考點對齊,這使得它難以對應不斷變化的現實世界中的新問題。

新提出的開放式 RLHF 框架 eva 則打破了這個靜態設置,其目標是開發出一種能很好地泛化到未曾見過的新環境的智能體。為此,該團隊必須設計一個新的目標,而不僅僅是在一個固定數據集上執行優化。

形式化描述

π_φ (x) 是可優化的提示詞生成策略,其會與響應策略 π_θ (y | x) 一起被聯合優化,如下所示:

圖片

其中,p_ref (x) 表示所有可能任務(通過提示詞實例化)的理想化的可能很難處理的概率,其可作為智能體可能遇到的任務的全部多樣性和復雜性的概念參考,同時用作對齊的指導目標。此外,聯合優化可確保任務分配和智能體的響應策略同步更新,從而適應日益復雜的任務,進而促進泛化。

機制:通過創建器和求解器博弈實現非對稱自博弈

直觀說明

由于未指定的參考很難處理以及聯合微分存在不穩定問題,因此 (7) 式很難直接優化。為此,該團隊提出了一種交替式的優化方案,其做法是將該問題表述成一個非對稱的創建器 - 求解器博弈。

  • 直觀地講,創建器可以通過復雜度不斷增加的提示詞例程來指導求解器,從而實現高效和一般性的學習,以處理現實任務的多樣性。
  • 從數學上看,這類似于通過期望最大化進行的 RL 優化,其中提示詞分布的 φ 在每個步驟中都是固定的。

形式化描述

該團隊將這種交替優化表述成了一種非對稱博弈,如下所示:

  • 創建器(Creator:提示詞博弈者 π_X,其作用是策略性地為求解器生成提示詞。 
  • 求解器(Solver:響應博弈者 π_{Y|X}(或 π),其作用是學習生成更符合偏好的響應。

該團隊采用了 minimax regret 策略,其中求解器的目標是最小化后悔值,而創建器則是為了最大化這個值,即當前策略和最優策略之間的獎勵之差為:

圖片

在納什均衡下,之前已有研究表明:

圖片

然而,如果無法獲得真正的最優策略,就必須近似后悔值。利用隨機策略和獎勵信號,該團隊設計了基于優勢的代理函數:

圖片

總之,eva 允許創建一個不斷演進的提示詞分布,其難度會隨智能體的演進而逐步提升。新引入的 minimax regret 可進一步增加這種不斷發展的例程的穩健性,其做法是激勵智能體在所有情況下都表現良好。他們使用了信息量代理來指導學習。

總之,eva 是將對齊視為一種非對稱博弈,其機制是創建器不斷挑戰求解器,而求解器則不斷學習提升。

實際的算法

下面說明如何實際實現算法 1 中的 eva。

1. 創建器步驟:估計,采樣,然后演進

顯然,創建器會找到最有用的提示詞并生成它們的變體,并將這些變體用于偏好優化。創建器的實現分為 3 步。

  • 第 1 步:info (?)—— 估計信息量。對于提示集 X) t 中的每個 x,生成響應、注釋獎勵并通過 (10) 式估計 x 的信息量指標。
  • 第 2 步:sample (?)—— 對富含信息的子集進行加權采樣。使用信息量指標作為權重,對富含信息的提示詞子集 X^info_t 進行采樣,以便稍后執行演進。
  • 第 3 步:evolve (?)—— 為高優勢提示詞執行近端區域演進。具體來說,迭代 X^info_t 中的每個提示詞,讓它們各自都演化為多個變體,然后(可選)將新生成的提示詞與對 X_t 的均勻采樣的緩存混合以創建 X′_t。

2. 求解器步驟:求解然后優化

此步驟是經典的偏好優化,其中生成響應并執行梯度下降。以逐點獎勵模型設置為例,對于每個提示,采樣 n 個響應,每個響應都帶有獎勵注釋;這里采用最大和最小獎勵的響應來構建偏好對,然后進行優化。

總之,eva 可以使用新的創建器模塊統一現有的迭代優化工作流程,該模塊可以與求解器策略共享相同的網絡,也可獨立運行。

實驗結果

這里我們僅關注實驗的主要結果,實驗設置請參看原論文。

總體而言,eva 在對齊方面取得了顯著的進步,同時無需依賴任何人工數據,因此更具效率。圖片是基礎設置,即一次迭代微調后的模型,eva 則會在此基礎上添加一個創建器,以實現初始迭代的提示詞集的自我演進,并使用一個偏好優化算法進行額外的開放式 RLHF 迭代,這會得到圖片

圖片

eva 能實現自我提升

如表 1 紅色標記所示,eva 在不同優化算法中的表現顯著優于基礎設置,尤其是在更難的 Arena-Hard 基準上,該基準由于其提示詞的復雜性和更公平的評分系統而被認為更具挑戰性。

具體來說,eva 使用 SimPO 作為求解器時增益為 8.4%,使用 DPO 作為求解器時增益為 8.5%,超越了其 27B 版本并與 Arena-Hard 排行榜上報告的 claude-3-opus-240229 相當,同時還使用了全自動的提示詞生成進行對齊。

圖片

eva 可以超越人工編寫的提示詞

實驗進一步表明,使用 eva 提示詞訓練的模型圖片的表現能夠比肩甚至超越那些使用了來自 UltraFeedback 的額外新提示詞訓練的模型圖片,這可被視為是人類提示詞。同時,前者還能做到成本更低,速度更快。

此外,在 MT-Bench 上,使用新的人類提示詞進行訓練通常會在第一輪中表現出性能下降,在第二輪中也只會有適度的提升。相比之下,eva 能顯著提高第二輪的表現。

針對此現象,該團隊給出了自己的假設:eva 可演化出全新的可學習的提示詞,并且其中包含第二輪問題的特征,這表明 eva 涌現出了處理后續互動等新技能。

消融研究

為了驗證 eva 各組件的有效性,該團隊也執行了消融研究,下面我們簡單給出其發現,詳細實驗過程請訪問原論文:

  • 信息量指標:新提出的基于后悔值的指標優于其它替代指標;
  • 采樣之后執行演化的流程:新方法優于貪婪選擇方法;
  • 使用獎勵模型進行擴展:eva 的對齊增益會隨獎勵模型而擴展;
  • 持續訓練:新提出的方法可通過增量訓練獲得單調增益;eva 演化得到的數據和調度可用作隱式正則化器,從而實現更好的局部最小值。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-07-11 15:38:51

模型方案

2023-12-06 13:20:00

AI模型

2023-08-22 13:21:07

AI算法

2023-09-05 12:59:33

模型數據

2024-08-05 13:00:00

2024-02-26 08:21:51

CPUkafka死循環

2023-09-06 13:17:00

AI數據

2017-05-10 11:42:27

人工智能

2024-07-22 08:22:00

2024-04-25 07:00:00

2024-06-28 13:39:15

2023-12-13 13:36:40

模型算力

2025-04-02 04:55:00

2023-04-28 15:24:06

模型研究

2025-02-13 09:00:00

2024-09-23 14:46:27

2024-10-09 16:00:00

AI模型數據

2024-01-24 13:37:36

大型語言模型人工智能

2023-10-20 12:53:00

模型訓練

2015-09-09 09:44:22

谷歌圖標
點贊
收藏

51CTO技術棧公眾號

www.国产.com| 日本少妇高清视频| 99精品在免费线偷拍| 国产精品天美传媒| 97se在线视频| 亚洲综合久久网| 国产精品久久久久久久久妇女| 日韩一卡二卡三卡四卡| 又粗又黑又大的吊av| 在线视频91p| 成人动漫一区二区| 国产精品igao视频| 国产亚洲精品久久久久久打不开| 久久综合欧美| 日韩久久久精品| 污污视频网站免费观看| www红色一片_亚洲成a人片在线观看_| 99精品在线免费| 91精品久久久久久久久不口人| 国产精品99无码一区二区| sdde在线播放一区二区| 亚洲国产精品小视频| 色婷婷成人在线| 不卡视频观看| 亚洲欧美另类小说| 先锋影音网一区| 天天干免费视频| 国产乱淫av一区二区三区| 国产精品大片wwwwww| 国产无遮挡免费视频| 婷婷激情综合| 在线播放日韩av| 国产美女视频免费观看下载软件| 精品国产鲁一鲁****| 欧美综合欧美视频| 日韩毛片在线免费看| 2018av在线| 亚洲中国最大av网站| 特级黄色录像片| 在线观看免费黄色| 国产日本亚洲高清| 久久综合久久久| 天堂在线资源库| 不卡的电视剧免费网站有什么| 亚洲free嫩bbb| 亚洲无码精品在线播放| 蜜臀精品一区二区三区在线观看| 日本久久精品视频| aaaaaa毛片| 久久深夜福利| 国产精品成熟老女人| 久草视频在线免费| 人人狠狠综合久久亚洲| 国产成人aa精品一区在线播放| 在线观看黄网站| 99伊人成综合| 91极品视频在线| 亚洲精品1区2区3区| 国产精品亚洲欧美| 国产不卡在线观看| 最新中文字幕免费| 精品在线免费观看| 成人欧美一区二区三区在线湿哒哒| 亚洲熟妇av乱码在线观看| 久久er精品视频| 亚洲一区亚洲二区| 亚洲精品久久久狠狠狠爱| 丁香啪啪综合成人亚洲小说| 国偷自产av一区二区三区小尤奈| 亚洲av片在线观看| 国产午夜亚洲精品午夜鲁丝片| 日本视频精品一区| √新版天堂资源在线资源| 中文字幕日韩一区| 青春草国产视频| jizz内谢中国亚洲jizz| 欧洲精品一区二区| 一级片黄色免费| 电影一区二区在线观看| 精品无人国产偷自产在线| 熟女少妇内射日韩亚洲| 97欧美在线视频| 欧美激情国产精品| 国产专区第一页| 久久国产精品免费| 国产精品播放| www 日韩| 亚洲香肠在线观看| 日本www高清视频| 亚洲伦理网站| 亚洲精品乱码久久久久久按摩观| 五月天精品视频| 91精品亚洲| 2018中文字幕一区二区三区| 亚洲视频在线观看一区二区 | 亚洲视频网在线直播| 黄色一级片av| 桃花岛tv亚洲品质| 欧美成人伊人久久综合网| 尤物视频最新网址| 午夜久久黄色| 国产精品久久久久福利| 国产高清视频免费| 欧美国产精品久久| 男的插女的下面视频| 日韩一区精品| 日韩av在线免播放器| 久草视频手机在线| 久久一区亚洲| 国产精品久久7| 蜜桃视频在线观看免费视频网站www| 亚洲国产视频一区| 加勒比av中文字幕| 国际精品欧美精品| 91精品国产91久久久久久久久| 一级黄色片免费看| 久久精品一区二区三区四区| 男人添女人荫蒂免费视频| 疯狂欧洲av久久成人av电影 | 国产精品成人一区二区三区电影毛片 | 91精品国产色综合久久ai换脸 | 羞羞答答一区二区| 欧美另类第一页| 中文字幕日本人妻久久久免费| eeuss鲁片一区二区三区在线观看| 一区二区三区四区免费视频| 日本电影欧美片| 亚洲精品xxx| www.av视频在线观看| 国产一区二区三区美女| 亚洲精品白虎| 蜜桃视频成人m3u8| 亚洲欧洲一区二区三区在线观看| 国产精品99精品无码视| 丁香天五香天堂综合| 日产精品久久久久久久蜜臀| 国产精品1区在线| www国产亚洲精品久久网站| 国内自拍视频在线播放| aaa亚洲精品| 秋霞无码一区二区| 高清一区二区三区| 国内精品400部情侣激情| 亚洲av永久纯肉无码精品动漫| 亚洲欧美日韩国产综合在线| 亚洲一级片av| 欧美jjzz| av成人午夜| 国产蜜臀在线| 亚洲国产精品网站| 九九热精品视频在线| 久久免费的精品国产v∧| 六月丁香激情网| 欧美黑人巨大videos精品| 性色av一区二区三区在线观看 | 久久久久伊人| 日韩中文字幕网| 国产视频在线观看视频| 亚洲女人的天堂| 少妇献身老头系列| 亚洲精品黄色| 欧美日韩国产精品一区二区| 欧美国产大片| 久久久国产在线视频| 国产av一区二区三区精品| 亚洲国产精品嫩草影院| 国产精品九九九九九| 日本va欧美va欧美va精品| 在线观看亚洲视频啊啊啊啊| 视频二区欧美毛片免费观看| 国模极品一区二区三区| 黄网在线观看| 91精品蜜臀在线一区尤物| 国产 日韩 欧美 成人| 2021国产精品久久精品| 亚洲欧美视频二区| 在线免费观看日本欧美爱情大片| 国产女主播一区二区三区| 日韩电影大全网站| 欧美大胆在线视频| 肉丝一区二区| 欧美日韩视频在线第一区 | 天天躁日日躁aaaa视频| 精品一区二区三区日韩| 男人添女荫道口女人有什么感觉| 成人av地址| 国产精品国模在线| 青草影视电视剧免费播放在线观看| 亚洲第一精品电影| 日本一区二区三区久久| 亚洲一区二区三区四区中文字幕| 国产精品无码网站| 经典三级在线一区| 欧美精品一区免费| 亚洲五月综合| 欧美综合激情| 99国产精品免费网站| 国产精品精品视频| 爱搞国产精品| 久久色精品视频| 精品久久久久一区二区三区| 欧美一区二区在线不卡| 无码人妻丰满熟妇精品| 一区二区三区不卡视频| 国产大屁股喷水视频在线观看| 成人激情免费网站| 午夜xxxxx| 热久久一区二区| 免费无码国产v片在线观看| 一区二区免费不卡在线| 日韩av在线一区二区三区| 高潮按摩久久久久久av免费| 成人欧美一区二区三区在线湿哒哒| 欧美电影网站| 91a在线视频| 亚洲淫性视频| 最近2019年手机中文字幕 | 大陆精大陆国产国语精品| 国产九九精品视频| 日韩视频网站在线观看| 91av视频在线观看| 成人性生交大片免费看网站 | 欧美韩国亚洲| 69视频在线免费观看| 在线电影福利片| www.日韩.com| 91在线观看| 夜夜嗨av一区二区三区免费区 | 欧美在线观看成人| 激情自拍一区| 国产自产在线视频| 激情综合激情| 国产a级片网站| 黄色亚洲在线| www.日本少妇| 狠狠88综合久久久久综合网| 91精品国产毛片武则天| 亚洲人体av| 国产大尺度在线观看| 久久精品国产68国产精品亚洲| 特级西西444www大精品视频| 激情五月色综合国产精品| 欧美日本亚洲| 日本大胆欧美| 中文字幕av日韩精品| 欧美高清视频手机在在线| 中文字幕一区二区三区最新| 天天影视综合| 69精品丰满人妻无码视频a片| 伊人久久大香线| 久久av高潮av| 一区二区三区导航| 久久精品免费一区二区| 久久黄色网页| 天天插天天操天天射| 蜜臀av一区二区在线免费观看| 国产野外作爱视频播放| 精品一区二区综合| 天堂av.com| 成人免费三级在线| 在线免费观看黄色小视频| 国产欧美精品一区二区色综合朱莉| 成人性视频免费看| 亚洲精品福利视频网站| 亚洲一区 视频| 日韩欧美亚洲成人| 中文字幕日产av| 欧美一区二区三区在线观看| 好吊色一区二区三区| 国产婷婷97碰碰久久人人蜜臀| 国产在线视频资源| 久久精品电影网站| 91豆花视频在线播放| 日韩免费视频在线观看| 91麻豆精品国产91久久久更新资源速度超快| 亚洲伊人久久大香线蕉av| 精品福利一区| 亚洲bbw性色大片| 欧美日本不卡高清| 人妻熟女一二三区夜夜爱| 另类专区欧美蜜桃臀第一页| 少妇熟女视频一区二区三区| 久久久久久影视| 欧美 日韩 国产 一区二区三区| 亚洲成人1区2区| 糖心vlog精品一区二区| 欧美mv日韩mv国产网站| 国产日本在线| 欧美激情在线观看| 久久xxx视频| 国内一区二区三区在线视频| 欧美激情成人| 黄色国产精品视频| 国产高清精品在线| 午夜精产品一区二区在线观看的| 亚洲精品中文字幕乱码三区| 五月天婷婷导航| 欧美成人精精品一区二区频| 成人亚洲性情网站www在线观看| 欧美第一黄网免费网站| 亚洲不卡系列| 国产欧美欧洲| 亚洲啊v在线观看| 精品99在线视频| 国产91丝袜在线播放| 成人性视频免费看| 一道本成人在线| 色欲av永久无码精品无码蜜桃 | 精品福利av导航| 三级外国片在线观看视频| 欧美亚洲成人xxx| 一级毛片精品毛片| 一级全黄肉体裸体全过程| 毛片一区二区| 污污污www精品国产网站| 亚洲色欲色欲www在线观看| www.com亚洲| 日韩精品中文字幕久久臀| av电影免费在线看| 99高清视频有精品视频| 一区二区影视| 在线视频日韩欧美| 亚洲视频资源在线| 亚洲视频在线观看免费视频| 在线播放日韩专区| 777午夜精品电影免费看| 欧美理论一区二区| 99在线|亚洲一区二区| 国产精品入口麻豆| 亚洲一区二区影院| 国产高中女学生第一次| 操人视频在线观看欧美| 亚洲电影二区| 亚洲精品中文综合第一页| 日本系列欧美系列| 国产免费无遮挡吸奶头视频| 日韩欧美在线视频免费观看| 午夜黄色小视频| 国语自产偷拍精品视频偷| 日韩精品一区国产| 国产激情在线看| 国产成人午夜99999| 一区二区视频免费看| 欧美一区二区三区免费在线看 | 欧美在线激情视频| 免费成人av| 久久精品99国产| 国产午夜精品一区二区三区视频| av毛片在线免费观看| 国产亚洲综合久久| 成人毛片免费| 一区二区三区日韩视频| 国产麻豆精品theporn| 欧美日韩国产精品综合| 亚洲国产精品福利| 成人欧美magnet| 亚洲人成网站在线播放2019| 精品一区二区久久| 中文字幕在线观看成人| 精品黑人一区二区三区久久| аⅴ资源天堂资源库在线| 日本日本精品二区免费| 久久国产综合精品| 青青草精品在线视频| 亚洲成人av在线播放| 国产高清不卡| 青青草原国产免费| 成人精品视频一区二区三区尤物| 91av在线免费视频| 中文欧美日本在线资源| 日韩在线网址| 日韩中文字幕三区| 国产精品午夜电影| 亚洲精品成人区在线观看| 国产aaa精品| 亚洲成人日韩| 加勒比精品视频| 欧洲国内综合视频| 在线不卡日本v二区707| 裸模一区二区三区免费| 久久99热这里只有精品| 老妇女50岁三级| 亚洲欧美在线看| 豆花视频一区| 女人扒开屁股爽桶30分钟| 自拍偷拍亚洲欧美日韩| 天堂av在线资源| 91午夜在线播放| 亚洲综合欧美| 国产人妻精品一区二区三区不卡| 日韩精品久久久久久久玫瑰园| 久久69成人| 国产成人黄色片| 亚洲人一二三区| 久久精品蜜桃| 999在线观看免费大全电视剧| 日韩福利电影在线观看| 久久久久亚洲av无码专区| 中文字幕久精品免费视频| 精品精品国产三级a∨在线|