精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無需訓練實現價值觀實時動態對齊:上交開源價值觀對齊方法OPO,閉源與開源大模型均適用

人工智能 新聞
上海交通大學生成式人工智能實驗室 GAIR 迅速采取行動,推出了一種全新的價值對齊方法:OPO (On-the-fly Preference Optimization,實時偏好優化)。

隨著人工智能技術的發展,以 GPT-4 為代表的大語言模型依靠其強大的能力正在對社會產生深遠的影響。與此同時,大模型本身的安全性問題也變得尤為重要。如何確保大語言模型可以和人類的價值、真實的意圖相一致,防止模型被濫用、輸出有害的信息,這是大模型安全治理的核心問題。之前的大多數對齊方法需要收集新數據重新訓練模型,然而對訓練數據質量要求高以及優化模型參數耗時耗力是對齊中的痛點。除此之外,待對齊的價值觀可能是動態變化的,這進一步給大模型價值觀對齊帶來了挑戰。

有鑒于此,上海交通大學生成式人工智能實驗室 GAIR 迅速采取行動,推出了一種全新的價值對齊方法:OPO (On-the-fly Preference Optimization,實時偏好優化)。OPO 無需訓練即可實現實時動態對齊,而且因其即插即用的特性,適用于所有的開源與閉源大模型。研究者透過 OPO 實現了大模型對于法律與道德標準的對齊,展示了 OPO 的動態性以及優越性。

相比于之前工作中的對齊方法(i.e., SFT、PPO 和 DPO),OPO 方法有如下優勢:

  • 無需訓練即可實現價值觀對齊;
  • 舍棄獎勵模型,并對任意大模型均適用,包括開源與閉源大模型;
  • 容易更新待對齊的價值觀。考慮到價值觀可能會隨著時間發生變化(比如法律),OPO 能方便快捷地通過替換相應的準則完成價值觀的更新,而其他對齊方法則需要收集數據重新訓練模型。

圖片

表 1:OPO 與 SFT、PPO、DPO 等對齊方法的對比。

目前,該項目開源了大量資源,包括:

  • OPO 代碼(使用方法和測試流程也已經在 GitHub 上給出);
  • 5 種類型的測試數據集,包括人出的法考題目、《道德與法治》考試題目(只保留了道德相關的題目)和從 NormBank 數據的測試集中隨機采樣的題目,以及利用大模型自動生成的法律題目和職業道德題目;
  • 2 大類價值觀準則,分別是法律準則和道德準則。法律準則包括截止到 2023 年 7 月中國現行有效的所有法律法規(約 95 萬條)。道德準則:①從中學的《道德與法治》教材里收集的基礎道德準則;②從網上收集多家不同公司 / 行業的職業道德準則;③從 NormBank 訓練集數據中隨機抽取得到的社會道德規則;
  • 用于自動生成測試數據的 prompt 以及評估生成的測試數據質量的 prompt;
  • 用 OpenAI embedding 模型提取的法律和道德準則文本對應的向量。

圖片


  • 論文:Align on the Fly: Adapting Chatbot Behavior to Established Norms
  • 論文地址:https://arxiv.org/abs/2312.15907
  • 項目地址:https://gair-nlp.github.io/OPO/
  • 代碼地址:https://github.com/GAIR-NLP/OPO

方法

OPO 框架包含 3 部分,準則構建模塊、對齊模塊和評估模塊。

圖片

圖 1:OPO 框架。

準則構建模塊:

收集原始的準則文檔,清洗文本數據,統一準則的格式,分別得到一個法律準則語料庫和道德準則語料庫。具體而言,對于法律準則,研究者從國家法律法規數據庫中收集憲法、行政法規、地方性法規等法律法規,從國家規章庫中收集部門規章與地方政府規章。這 2 個數據庫涵蓋了中國現行有效的所有法律。對于道德準則,研究者從中學的《道德與法治》教材里收集剔除法治內容后的文本作為基礎道德準則,從網上收集了 57 家不同公司 / 行業的職業道德準則。除了收集顯式的道德準則外,研究者也嘗試從人標注好的道德數據里提取道德準則。從 NormBank 的訓練集里隨機選了 1000 條數據,每一條數據均是一個結構化的社會道德場景,之后研究者利用 ChatGPT 從每條數據里提取一條社會道德準則。

圖片

表 2:收集的道德準則與法律準則的分析。

圖片

表 3:收集的法律準則、基礎道德準則、職業道德準則和社會道德準則的示例。

對齊模塊:

對齊模塊基于檢索增強生成(RAG),旨在通過提供相應的準則,引導大模型在遵守準則的前提下更好地回答用戶的問題。研究者利用 OpenAI 的 text-embedding-ada-002 embedding 模型將每條準則都表征為稠密向量并存儲在一個向量庫里。給定一個提問,首先也將問詢轉換為一個稠密向量,然后利用 Faiss 作為檢索器在向量庫里檢索和問詢最相關的 k 條準則,接下來,大模型會通過設計的 prompt 利用檢索回來的準則作為行為規范回答問詢。

圖片

圖 2:利用檢索信息回答問詢的 prompt。

評估模塊:

評估模塊是一個通用可擴展的問題自動生成工具,能夠輕松擴展評測范圍、擴大評測數據數量,還能緩解測試數據泄露的問題。大模型在預訓練和有監督微調階段通常會涉及大量的非公開文本,之前的一些研究表明這可能會造成測試數據泄露的問題,進而影響大模型性能對比的公平性。此外,研究者觀察到人出的法考題目只涵蓋一小部分法律,很多法律尤其是地方性法律沒有被覆蓋到,而對于這部分法律又很難收集到相應的測試題目。并且,職業道德作為道德的一個重要組成部分,目前沒有對應的測試基準。為了解決上述問題,研究者提出了一個評估模塊,該模塊利用 GPT-4 自動生成帶有答案的單項選擇題。評估模塊共包含 3 步:

1. 自動出題:收集人出的單項選擇題并從中隨機抽取一道題作為 seed quesiton,同時從收集的準則庫里隨機選擇準則,要求 GPT-4 參考 seed quesiton 并依據準則和出題要求生成一道合理的包含題目、備選項、選項分析和答案的單項選擇題;

2. 自動檢測題目質量:將第一步的準則和生成的題目輸入到 GPT-4,對單項選擇題的 4 個部分(題目、備選項、選項分析和答案)依次核驗,篩掉任意一部分不符合要求的題目;

3. 人工檢測題目質量:研究者發現利用 GPT-4 并不能去掉所有質量差的自動生成的題目。為了確保評估的可靠性,研究者邀請了 3 個人類標注者,對第二步保留的題目作進一步的篩選。如果 2 個及以上的標注者都認為某道題不合理,則去掉這道題。

實驗和結果

為了驗證 OPO 的有效性,研究者構建了三個由人類標注的測試基準,以及兩個由模型自動生成的測試基準。這些基準涵蓋了法律和道德兩大類別,包括中文和英文基準。測試基準中的每一條數據均為單項選擇題。

圖片

表4:測試基準的分析。

在 H-Law 和 A-Law 測試基準上,OPO 能顯著提高大多數模型的準確率。尤其值得一提的是,OPO 能在 A-Law 測試基準上為許多大型模型帶來 10 個百分點的準確率提升。例如,經過 OPO 優化后,GPT-4 的準確度從 84.83% 提升至 94.65%。此外,國產大模型 Qwen-Chat-14B 和 XuanYuan-70B 在應用 OPO 后的表現不僅與 GPT-4 不相上下,而且略微優勝。

圖片

表5:各個大模型在 H-Law 與 A-Law 上的原始準確率(Base)、應用 OPO 后的準確率(OPO)、將生成題目用到的準則替換 OPO 中檢索得到的準則后的準確率(Oracle)。圖片 表示 OPO 相比 Base 的絕對提升,而 圖片 表示 Oracle 相比 Base 的絕對提升。

在 H-Basic-Morality、H-Social-Morality 和 A-Professional-Morality 等 3 個道德測試基準上,能觀察到類似的現象。OPO 能提升所有模型在 A-Professional-Morality 上的表現,提升大部分模型在 H-Basic-Morality 和 H-Social-Morality 上的分數。

圖片

表6:各個大模型在 H-Basic-Morality、H-Social-Morality 和 A-Professional-Morality 上的原始準確率(Base)、應用 OPO 后的準確率(OPO)、將生成選擇題用到的準則替換 OPO 中檢索得到的準則后的準確率(Oracle)。圖片 表示 OPO 相比 Base 的絕對提升,而 圖片 表示 Oracle 相比 Base 的絕對提升。

同時,研究者還探索了不同檢索長度對 OPO 方法的影響。檢索回來的文本長度最大值分別設置成 200、500、1000、1500、2000,發現大部分模型在不同的測試基準上均具有相似的趨勢:隨著檢索長度的增加,模型的性能先上升后下降。可能得原因是,較短的文本提供了有益信息,而更長的檢索內容引入了噪聲。

圖片

圖 3:在 H-law 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 4:在 A-law 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 5:在 H-Basic-Morality 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 6:在 H-Social-Morality 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 7:在 A-Professional-morality 基準上,改變檢索長度對 OPO 效果的影響。

總結

總結來說,GAIR 研究組提出了一個無需訓練實現價值觀實時動態對齊的方法 OPO,能夠作用于開源模型與閉源模型。同時,為了緩解測試數據泄露的問題并擴大測試數據的數量與覆蓋范圍,研究者介紹了一個可擴展的評估模塊用于根據準則自動生成測試問題。實驗證明 OPO 能夠顯著提升不同大模型在 5 個測試基準上的性能。此外,也公開了收集的所有法律準則與道德準則,以及 5 個測試基準中所使用的所有數據。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-30 10:41:48

比特幣加密貨幣貨幣

2024-12-19 17:52:27

2020-07-24 09:39:40

大數據信息價值觀技術

2021-09-08 14:38:34

開放式社會規范環境

2011-06-19 09:15:25

搜索引擎

2021-08-30 11:30:47

互聯網數據技術

2012-11-20 16:53:43

白永祥

2009-02-04 18:07:04

服務器虛擬化戴爾

2023-06-14 15:20:37

模型訓練

2015-06-01 15:00:22

程序員

2023-01-13 15:37:27

團隊軟件開發集成

2023-10-16 12:32:00

OpenAI價值觀AGI

2018-07-06 10:47:26

數據

2015-05-27 13:35:34

程序員無價之寶

2023-07-14 14:14:07

模型開源

2019-06-20 09:38:04

谷歌Android開發者

2015-12-02 18:20:36

華為

2019-05-17 10:08:55

大數據IT人工智能

2016-09-24 23:21:57

2023-10-16 13:36:36

點贊
收藏

51CTO技術棧公眾號

久久久一二三区| 亚洲一级免费在线观看| 手机在线观看毛片| 亚洲国产免费看| 亚洲精品v天堂中文字幕| 久久视频免费在线| 亚洲国产精品二区| 一本色道久久综合一区 | 99久久夜色精品国产亚洲| 亚洲成av人片一区二区密柚| 精品国产区一区| 欧美在线观看www| 成人精品一区| 国产成人一区在线| 国产精品第一第二| 日韩欧美国产成人精品免费| 精品少妇3p| 欧美日韩一区视频| 久久综合久久久久| 国产一级在线观看| 成人黄色av电影| 国产精品777| 激情综合五月网| 欧美亚洲国产精品久久| 欧美一级艳片视频免费观看| 日韩精品 欧美| 国产一二区在线| 99re在线视频这里只有精品| 国产精品亚洲第一区| 影音先锋亚洲天堂| 伊人久久大香线| 精品伊人久久| 久久久另类综合| 91影视免费在线观看| 国产一级av毛片| 国产精品7m凸凹视频分类| 亚洲第一av网站| 日本黄大片一区二区三区| 女海盗2成人h版中文字幕| ...xxx性欧美| 日韩精品久久久| 香蕉视频成人在线| 国产麻豆成人精品| 国产精品久久一区主播| 1级黄色大片儿| 欧美婷婷在线| 日韩中文字幕在线精品| 国产高潮呻吟久久| 小嫩嫩12欧美| 亚洲国产成人爱av在线播放| 中文字幕1区2区| 欧美黄页在线免费观看| 日韩欧美在线观看视频| 国产96在线 | 亚洲| 黄色的网站在线观看| 久久久久久久电影| 欧美亚洲爱爱另类综合| 丁香花免费高清完整在线播放| 久久精品国产99国产精品| 国产第一区电影| 免费看毛片网站| 99国产精品99久久久久久粉嫩| 久久99亚洲精品| 在线观看免费黄色网址| 激情五月色综合国产精品| 亚洲视频综合网| 少妇精品一区二区三区| 青青草原在线亚洲| 亚洲欧美精品一区| 全黄一级裸体片| 亚洲综合图色| 国产亚洲欧洲高清一区| 国产真实乱人偷精品人妻| 麻豆精品少妇| 亚洲天堂av综合网| 久久精品国产亚洲AV熟女| 亚洲精品无吗| 中文字幕日韩欧美精品在线观看| 午夜在线观看一区| 精品久久久久久久| 久久精品国产96久久久香蕉| 国产乱子轮xxx农村| 婷婷激情综合| 欧美黑人视频一区| 日韩免费一级片| 欧美91大片| 91精品国产99久久久久久| 日韩av黄色片| 亚洲欧美日韩综合国产aⅴ| 热久久美女精品天天吊色| 亚洲免费在线视频观看| 日本欧美加勒比视频| 国产日产欧美a一级在线| 国产高中女学生第一次| 成人爱爱电影网址| 欧美精品七区| 久久久久免费看黄a片app| av网站在线观看免费| 国产成人免费视频网站 | 久久久久亚洲视频| 免费看黄色91| 成人福利免费观看| www.国产.com| 99riav一区二区三区| 日韩电影大全在线观看| 黄网站免费在线播放| 亚洲一区在线播放| 国产a级一级片| 蜜桃麻豆影像在线观看| 欧美日韩第一区日日骚| 69久久精品无码一区二区| 国产精品网站在线看| 亚洲系列中文字幕| 青青草免费av| 蜜桃一区二区三区四区| 91日韩久久| 日韩欧美在线番号| 一区二区三区高清在线| 亚洲国产精品国自产拍av秋霞| 久久国产精品网| caoprom在线| 欧美日韩一区成人| 欧美肉大捧一进一出免费视频 | 欧美成人激情免费网| 制服丝袜第二页| 国产高清一区二区| 日韩暖暖在线视频| 亚洲精品国产精品乱码不卡| av动漫一区二区| 欧美精品一区二区性色a+v| 国产精品一区二区av影院萌芽| 亚洲精品伦理在线| 一区二区三区 欧美| 欧美黄色录像| 久久精品久久精品亚洲人| 久久99精品波多结衣一区| 国产片在线观看| 国产精品99久久久| 一区二区三区偷拍| 亚洲高清黄色| 精品视频在线观看日韩| 日本熟妇毛耸耸xxxxxx| 精品无码三级在线观看视频| 国产视色精品亚洲一区二区| www在线免费观看视频| 在线观看一区二区精品视频| 国产三级视频网站| 亚洲视屏一区| 亚洲伊人久久大香线蕉av| 日本中文在线观看| 欧美专区亚洲专区| 美女脱光内衣内裤| 玖玖在线精品| 久久精品99久久| aaa在线播放视频| 亚洲国产精彩中文乱码av| 日本高清一二三区| 精品综合久久久久久8888| 一区二区不卡在线| 国产精品99| 中文字幕日韩高清| 亚洲国产成人精品女人久久| 91免费视频网| 97在线播放视频| 婷婷综合成人| 国产成人aa精品一区在线播放| 水莓100国产免费av在线播放| 亚洲国产精品久久人人爱蜜臀| 中国xxxx性xxxx产国| 一区二区视频在线免费观看| 中文高清一区| 国产精品theporn88| 好看的中文字幕在线播放| 日韩一级二级三级| 国产性猛交普通话对白| 成人久久18免费网站麻豆| av网站手机在线观看| 日韩高清在线免费观看| 欧洲精品在线视频| 免费看国产片在线观看| 欧美日韩一区二区三区| 91视频在线网站| 奇米777欧美一区二区| 亚洲欧洲三级| 欧美三级一区| 51精品国产黑色丝袜高跟鞋| 欧美亚洲日本| 欧美中文字幕一区| h色网站在线观看| 成人美女视频在线看| 日本www在线播放| 欧美美乳视频| 91精品中文在线| 中国av在线播放| 亚洲精品电影网| 久草视频在线观| 国产精品久久久久久久久果冻传媒 | 91黄色精品| 麻豆视频在线看| 中文字幕av一区中文字幕天堂 | 国产精品一区二区三区免费| 欧美大片免费高清观看| 精品国产欧美成人夜夜嗨| 亚洲男女视频在线观看| 色播五月激情综合网| 国产精品www爽爽爽| 成人免费毛片aaaaa**| 成熟老妇女视频| 亚洲国产精品久久久天堂| 国内精品二区| 国产超碰精品| 久久精品国产亚洲一区二区| 色播色播色播色播色播在线| 欧美巨大另类极品videosbest | 日本不卡一区二区三区视频| 99re久久| 91精品国产沙发| 日本福利在线| 日韩高清免费在线| av免费在线观看不卡| 黑人欧美xxxx| 亚洲成人生活片| 亚洲国产成人一区二区三区| 免费在线观看日韩av| 亚洲视频观看| 一区二区三区四区五区视频| 牛牛视频精品一区二区不卡| 国产精品黄视频| 中文在线а√天堂| 欧美xxxx14xxxxx性爽| 一本一道波多野毛片中文在线 | 中文字幕亚洲乱码| 最新日韩欧美| 91成人综合网| 久久精品亚洲人成影院| 欧美不卡三区| 久久久久观看| 91最新在线免费观看| 少妇欧美激情一区二区三区| 日韩精品福利一区二区三区| 成人激情综合网| 日韩一区二区三区在线免费观看 | 国模大胆一区二区三区| 日韩啊v在线| 欧美精品久久久久久| 黄色91av| 伊色综合久久之综合久久| 亚洲xxxxx电影| 成人影院在线免费观看| 97在线视频一区| 91精品国产黑色瑜伽裤| 美女视频黄免费的亚洲男人天堂| 亚洲色图狠狠干| 精品日本一线二线三线不卡| 国产精品国产三级国产普通话对白| 91久久奴性调教| 无码aⅴ精品一区二区三区| 精品国产乱码久久久久久虫虫漫画| 91网站免费视频| 久久综合九色综合97婷婷| 国产又爽又黄无码无遮挡在线观看| www.欧美.com| 欧美夫妇交换xxx| 成人免费电影视频| 在线xxxxx| 久久综合九色综合欧美98| 久久人人爽人人爽人人片av高请 | 日本在线观看大片免费视频| 久久天天躁狠狠躁夜夜爽蜜月| 亚州av在线播放| 亚洲欧美激情精品一区二区| 免费av在线电影| 中文字幕成人在线| 日本中文在线观看| 久久久精品美女| sm在线观看| 欧美性视频网站| 久久人体大尺度| 国产精品一区二区三| 亚洲午夜剧场| 日本精品视频在线播放| 久久久久久久性潮| 成人情趣片在线观看免费| 日韩精品一级| 国产一区二区三区四区五区在线| 久久人人爽人人爽人人片av不| 欧美日韩日本网| 日韩大片在线| 米仓穗香在线观看| 国产精品久久久久久久免费软件| 欧美牲交a欧美牲交aⅴ免费真| 日本亚洲一区二区| 无码国产精品一区二区高潮| 国产99久久久精品| 中文字幕日韩一区二区三区 | 麻豆网站在线免费观看| 久久精品国产欧美激情| 羞羞污视频在线观看| 欧洲精品久久久| 亚洲ww精品| 国产精品免费一区二区三区| 菠萝蜜一区二区| 无颜之月在线看| 亚洲黄色一区| 免费成人黄色大片| 成人av在线影院| 色欲人妻综合网| 色中色一区二区| 国产wwwxxx| 最近免费中文字幕视频2019| 日韩三级电影视频| 国产精品美女在线观看| 91麻豆精品激情在线观看最新| 免费毛片一区二区三区久久久| 性xxxx欧美老肥妇牲乱| av之家在线观看| 国精产品一区一区三区mba桃花 | 九色porny丨国产首页在线| 国产精品免费网站| 精品中文字幕一区二区三区四区 | 中文字幕av一区二区三区高| 国产乱人伦精品一区二区三区| 欧美日一区二区在线观看| 任你操这里只有精品| 国产成人h网站| 欧美xxxx精品| 欧美午夜激情小视频| 国产精品色综合| 在线观看日韩视频| 极品在线视频| 国产一区二区在线播放| 精品久久久久久久久久久下田| 日本wwwcom| 国精品**一区二区三区在线蜜桃| 久久久精品人妻无码专区| 一区二区在线观看视频| 亚洲视频在线观看一区二区| 亚洲激情在线观看视频免费| 国产视频在线播放| 国产欧美日韩中文字幕| 蜜桃一区二区三区| 妞干网这里只有精品| 麻豆国产精品777777在线| 国产xxxx视频| 一区二区三区免费| 91久久精品国产91性色69| 国产性色av一区二区| av电影院在线看| 精品蜜桃传媒| 亚洲手机视频| yy6080午夜| 一区二区三区国产精品| 国产又粗又猛又爽又黄的| 日韩一区二区久久久| 日韩电影免费观| 一区国产精品视频| 免费观看成人毛片| 日韩一区二区免费在线观看| sese在线视频| 国产精品福利在线观看网址| 免费看日本一区二区| 黄色片免费在线观看视频| 国产精品夜夜爽| √天堂中文官网8在线| 91精品国产91久久综合桃花| 美女羞羞视频在线观看| 成人久久精品视频| 一区二区三区在线电影| 无码人妻一区二区三区在线视频| 亚洲日本成人在线观看| 国产99对白在线播放| 伊是香蕉大人久久| 国产精品一区二区三区av| 色爽爽爽爽爽爽爽爽| 懂色av中文一区二区三区| 在线看成人av| 亚洲欧美国产制服动漫| 国产精品久久久久久妇女| 亚洲国产欧美日韩| 国产精品一级片| 国产无码精品在线观看| 亚洲精品久久久久久久久| 日韩精品三区| 亚洲春色综合另类校园电影| 国产精品一区二区男女羞羞无遮挡| 欧美日韩免费做爰视频| 精品久久久久久久人人人人传媒| 色在线中文字幕| 色99中文字幕| 奇米精品一区二区三区四区| 青娱乐免费在线视频| 亚洲精品国精品久久99热一| 国产精品黄色片| 国产情侣第一页| 免费动漫网站在线观看| 欧美在线性爱视频| 不卡一区2区| 午夜免费视频网站| 欧美日韩精品在线| 91caoporn在线|