精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

學習ChatGPT,AI繪畫引入人類反饋會怎樣?

人工智能 新聞
NLP 領域使用的技術不斷地向其他領域擴展,如 CV 和多模態,鴻溝正在被打破。本文中谷歌研究院和加州伯克利的研究人員在文本到圖像模型中引入人類反饋,微調后的模型生成見過和未見過對象的效果得到了顯著提升。

最近,深度生成模型在根據文本 prompt 生成高質量圖像方面取得了顯著成功,部分原因在于深度生成模型擴展到了大規模網絡數據集(如 LAION)。但是,一些重大挑戰依然存在,因而大規模文本到圖像模型無法生成與文本 prompt 完全對齊的圖像。舉例而言,當前的文本到圖像模型往往無法生成可靠的視覺文本,并在組合式圖像生成方面存在困難。

回到語言建模領域,從人類反饋中學習已經成為一種用來「對齊模型行為與人類意圖」的強大解決方案。這類方法通過人類對模型輸出的反饋,首先學習一個旨在反映人類在任務中所關心內容的獎勵函數,然后通過一種強化學習算法(如近端策略優化 PPO)使用學得的獎勵函數來優化語言模型。這種帶有人類反饋框架的強化學習(RLHF)已經成功地將大規模語言模型(例如 GPT-3)與復雜的人類質量評估結合起來。

近日,受 RLHF 在語言領域的成功,谷歌研究院和加州伯克利的研究者提出了使用人類反饋來對齊文本到圖像模型的微調方法。

圖片

論文地址:https://arxiv.org/pdf/2302.12192v1.pdf

本文方法如下圖 1 所示,主要分為 3 個步驟。

第一步:首先從「設計用來測試文本到圖像模型輸出對齊的」一組文本 prompt 中生成不同的圖像。具體地,檢查預訓練模型更容易出錯的 prompt—— 生成具有特定顏色、數量和背景的對象,然后收集用于評估模型輸出的二元人類反饋。

第二步:使用了人工標記的數據集,訓練一個獎勵函數來預測給定圖像和文本 prompt 的人類反饋。研究者提出了一項輔助任務,在一組擾動文本 prompt 中識別原始文本 prompt,以更有效地將人類反饋用于獎勵學習。這一技術改進了獎勵函數對未見過圖像和文本 prompt 的泛化表現。

第三步:通過獎勵加權似然最大化更新文本到圖像模型,以更好地使它與人類反饋保持一致。與之前使用強化學習進行優化的工作不同,研究者使用半監督學習來更新模型,以測量模型輸出質量即學得的獎勵函數。

圖片

研究者使用帶有人類反饋的 27000 個圖像 - 文本對來微調 Stable Diffusion 模型,結果顯示微調后的模型在生成具有特定顏色、數量和背景的對象方面實現顯著提升。圖像 - 文本對齊方面實現了高達 47% 的改進,但圖像保真度略有下降。

此外,組合式生成結果也得到了改進,即在給定未見過顏色、數量和背景 prompt 組合時可以更好地生成未見過的對象。他們還觀察到,學得的獎勵函數比測試文本 prompt 上的 CLIP 分數更符合人類對對齊的評估。

不過,論文一作 Kimin Lee 也表示,本文的結果并沒有解決現有文本到圖像模型中所有的失效模型,仍存在諸多挑戰。他們希望這項工作能夠突出從人類反饋中學習在對齊文生圖模型中的應用潛力。

圖片

方法介紹

為了將生成圖像與文本 prompt 對齊,該研究對預訓練模型進行了一系列微調,過程如上圖 1 所示。首先從一組文本 prompt 中生成相應的圖像,這一過程旨在測試文生圖模型的各種性能;然后是人類評分員對這些生成的圖像提供二進制反饋;接下來,該研究訓練了一個獎勵模型來預測以文本 prompt 和圖像作為輸入的人類反饋;最后,該研究使用獎勵加權對數似然對文生圖模型進行微調,以改善文本 - 圖像對齊。

人類數據收集

為了測試文生圖模型的功能,該研究考慮了三類文本 prompt:指定數量(specified count)、顏色、背景。對于每個類別,該研究對每個描述該物體的單詞或短語兩兩進行組合來生成 prompt,例如將綠色(顏色)與一只狗(數量)組合。此外,該研究還考慮了三個類別的組合(例如,在一個城市中兩只染著綠顏色的狗)。下表 1 更好的闡述了數據集分類。每一個 prompt 會被用來生成 60 張圖像,模型主要為 Stable Diffusion v1.5 。

圖片

人類反饋

接下來對生成的圖像進行人類反饋。由同一個 prompt 生成的 3 張圖像會被呈遞給打標簽人員,并要求他們評估生成的每幅圖像是否與 prompt 保持一致,評價標準為 good 或 bad。由于這項任務比較簡單,用二元反饋就可以了。

獎勵學習

為了更好的評價圖像 - 文本對齊,該研究使用獎勵函數圖片來衡量,該函數可以將圖像 x 的 CLIP 嵌入和文本 prompt z 映射到標量值。之后其被用來預測人類反饋 k_y ∈ {0, 1} (1 = good, 0 = bad) 。

從形式上來講,就是給定人類反饋數據集 D^human = {(x, z, y)},獎勵函數圖片通過最小化均方誤差 (MSE) 來訓練:

圖片

此前,已經有研究表明數據增強方法可以顯著提高數據效率和模型學習性能,為了有效地利用反饋數據集,該研究設計了一個簡單的數據增強方案和獎勵學習的輔助損失(auxiliary loss)。該研究在輔助任務中使用增強 prompt,即對原始 prompt 進行分類獎勵學習。Prompt 分類器使用獎勵函數,如下所示:

圖片

輔助損失為:

圖片

最后是更新文生圖模型。由于模型生成的數據集多樣性是有限的,可能導致過擬合。為了緩解這一點,該研究還最小化了預訓練損失,如下所示:

實驗結果 

實驗部分旨在測試人類反饋參與模型微調的有效性。實驗用到的模型為 Stable Diffusion v1.5 ;數據集信息如表 1(參見上文)和表 2 所示,表 2 顯示了由多個人類標簽者提供的反饋分布。

圖片

人類對文本 - 圖像對齊的評分(評估指標為顏色、物體數量)。如圖 4 所示,本文方法顯著提高了圖像 - 文本對齊,具體來說,模型生成的圖像中有 50% 的樣本獲得至少三分之二的贊成票(投票數量為 7 票或更多贊成票),然而,微調會稍微降低圖像保真度(15% 比 10%)。 

圖片

圖 2 顯示了來自原始模型和本文經過微調的對應模型的圖像示例。可以看到原始模型生成了缺少細節(例如,顏色、背景或計數)的圖像(圖 2 (a)),本文模型生成的圖像符合 prompt 指定的顏色、計數和背景。值得注意的是,本文模型還能生成沒有見過的文本 prompt 圖像,并且質量非常高(圖 2 (b))。

圖片

獎勵學習的結果。圖 3 (a) 為模型在見過的文本 prompt 和未見文本 prompt 中的評分。有獎勵(綠色)比 CLIP 分數(紅色)更符合典型的人類意圖。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-06 08:23:36

ChatGPT自然語言技術

2023-04-29 00:00:00

Chatgpt人工智能系統

2023-08-11 17:42:35

ChatGPT人工智能

2023-10-23 15:27:09

OpenAIChatGPT

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2023-05-22 09:38:38

2025-11-20 12:54:43

2022-09-08 08:08:16

AI模態圖像Transforme

2023-09-06 13:17:00

AI數據

2015-11-19 14:47:33

富蘭克林編程

2024-08-06 14:07:40

2023-09-21 10:38:00

繪畫AI

2020-06-10 10:32:10

人工智能技術編輯

2020-09-07 14:15:16

AI 數據人工智能

2025-08-29 04:00:00

2023-02-27 13:57:43

ChatGPTAI繪畫

2023-11-13 07:51:58

ChatGPT研究

2023-03-15 10:38:24

2023-11-02 13:35:00

訓練模型

2023-09-05 19:43:05

模型RLHFAI
點贊
收藏

51CTO技術棧公眾號

风间由美性色一区二区三区四区 | 亚洲天堂网站在线| h片在线免费观看| 高清国产午夜精品久久久久久| 欧美精品九九久久| 久久精品无码一区| 91精品一区| 精品久久久国产精品999| 亚洲不卡1区| 国产精品久久久久久久久久久久久久久久久久 | 久久精品国产福利| 亚洲午夜久久久| 亚洲高清视频在线观看| 欧美特级特黄aaaaaa在线看| 日本欧美一区二区| 性欧美xxxx交| 日本中文在线视频| 美女一区2区| 91精品国产91综合久久蜜臀| 国产精品第12页| 国产精品刘玥久久一区| 久久免费视频一区| 亚洲一区二区三| 国产成人麻豆免费观看| 91久久中文| 欧美成人激情在线| 娇妻被老王脔到高潮失禁视频| 视频国产精品| 欧美日韩国产三级| 69堂免费视频| 亚洲婷婷噜噜| 成人欧美一区二区三区白人 | 天堂美国久久| 一本一道久久a久久精品逆3p| 国内精品免费视频| 免费看日产一区二区三区| 欧美色倩网站大全免费| 又粗又黑又大的吊av| 久久亚洲导航| 亚洲精品国产无天堂网2021| 艳母动漫在线观看| 欧美尤物美女在线| 国产精品日韩成人| 神马一区二区影院| 成人精品福利| 亚洲国产精品精华液2区45| 九九99久久| 人人妻人人澡人人爽人人欧美一区| 国产尤物一区二区| 91沈先生在线观看| 国产欧美综合视频| 国产美女娇喘av呻吟久久| 91香蕉电影院| 国产女人高潮毛片| 国产福利一区在线| 97人摸人人澡人人人超一碰| 精品人妻一区二区三区三区四区 | 人妻 丝袜美腿 中文字幕| 日韩精品视频一区二区三区| 欧美一级在线观看| 又黄又色的网站| 国产成人tv| 精品视频偷偷看在线观看| 中国黄色a级片| 神马电影久久| 综合网中文字幕| 一级免费黄色录像| 欧美精品一卡| 97久久伊人激情网| 极品国产91在线网站| 天堂成人免费av电影一区| 国产精品久久久久久久7电影| 中文字幕一区二区久久人妻| 久久超级碰视频| 5g影院天天爽成人免费下载| 成人午夜视频一区二区播放| 91麻豆.com| 丝袜足脚交91精品| 国产午夜精品久久久久免费视| 曰韩精品一区二区| 成人在线免费观看av| 国产经典一区| 亚洲电影一二三区| 天堂av手机版| 久久久综合网站| 亚洲欧洲日本国产| 手机av在线播放| 懂色av影视一区二区三区| 日本999视频| 精品国产一区二区三区2021| 亚洲成人网av| 毛片久久久久久| 激情综合电影网| 国产精品久久激情| 亚洲av无码一区二区三区性色| 99免费精品视频| 视频在线精品一区| 91九色在线看| 欧美日韩国产小视频在线观看| 中文字幕18页| 日韩系列欧美系列| 午夜精品一区二区三区在线视频| 国产精品成人久久久| 国产91精品欧美| 日韩欧美99| aa级大片免费在线观看| 欧美色综合网站| 影音先锋黄色资源| 亚洲精品小说| 国产成人在线亚洲欧美| 风流老熟女一区二区三区| 中文字幕不卡在线播放| 人妻久久久一区二区三区| 婷婷激情成人| 亚洲性生活视频| 男人天堂中文字幕| 国产一区二区不卡| 亚洲国产精品久久久久婷婷老年| 日本片在线看| 7777女厕盗摄久久久| 国产女主播喷水高潮网红在线| 日本激情一区| 日韩**中文字幕毛片| 国模私拍一区二区| 麻豆极品一区二区三区| 日韩av高清在线播放| 1024在线看片你懂得| 91精品国产综合久久蜜臀| 亚洲图片第一页| 翔田千里一区二区| 激情视频在线观看一区二区三区| 国产素人视频在线观看| 欧美日韩精品专区| 特一级黄色大片| 日韩美女毛片| 久久久久久国产精品| 国产一区二区视频免费观看| 国产日产欧美一区| 日av中文字幕| 亚洲动漫精品| 欧美一级片一区| 色偷偷在线观看| 亚洲美女屁股眼交| 精品国产乱码久久久久久1区二区 91网址在线观看精品 | 欧美激情影院| 国模精品视频一区二区| 亚洲精品字幕在线观看| 亚洲精品国产视频| 免费看三级黄色片| 欧美三级网页| av一区二区在线看| 俺来也官网欧美久久精品| 精品日韩在线观看| 久久久久久久久久综合| 不卡视频一二三| 四虎永久国产精品| 久久青青视频| 亚洲无亚洲人成网站77777| 久久青青草原亚洲av无码麻豆| 99久久久精品免费观看国产蜜| 国产特级淫片高清视频| 日韩理论电影中文字幕| 国产精品电影观看| av亚洲在线| 国产一区二区三区精品视频| 亚洲国产精品一区二区第一页 | 欧美图片第一页| 亚洲欧美日本视频在线观看| 欧美久久电影| 亚洲mmav| 亚洲色图欧美偷拍| 在线视频精品一区| 日韩免费在线电影| 久久国产精品电影| 可以免费观看的毛片| 亚洲高清免费一级二级三级| 欧美深性狂猛ⅹxxx深喉| 久久婷婷影院| 亚洲精品一区二区三区精华液 | 久久亚洲一区二区三区明星换脸 | 亚洲精品av在线播放| 999视频在线| 亚洲欧洲av另类| 稀缺呦国内精品呦| 日韩高清一区在线| 在线观看a视频| 国产精品久久久久久久岛一牛影视| 国产九九在线观看| 亚洲国产精品久久久久蝴蝶传媒| 国产精品swag| 精品国产第一福利网站| 久久综合免费视频| 天天综合在线视频| 欧美日韩在线亚洲一区蜜芽| 国产一级一级片| 91啪亚洲精品| 欧美性大战久久久久| 亚洲成人一区在线观看| 久久不射电影网| 97人人爽人人| 五月精品视频| 久久久精彩视频| 四虎国产精品免费久久| 韩日精品中文字幕| 激情视频在线观看| 亚洲欧美成人在线| 欧美亚洲日本在线观看| 日韩av二区| 国产精品久久久久久久免费大片| 在线亚洲人成| 精品不卡在线视频| 亚洲人人夜夜澡人人爽| 美女久久久精品| 给我免费播放片在线观看| 不卡视频在线| 精品国产二区在线| 亚洲综合网站| 成人激情春色网| 日本综合久久| 97久久超碰精品国产| 久久综合狠狠综合久久综青草| 播放一区二区| 国语自产精品视频在免费| av免费观看一区二区| 久久久综合视频| 美女被艹视频网站| 国产亚洲精品bv在线观看| 中国黄色录像片| 久久视频国产| 日韩免费中文专区| 国产精品最新| 久久综合中文色婷婷| 亚洲网一区二区三区| 亚洲一区二区视频| 潘金莲一级黄色片| 中文乱码免费一区二区 | 成人免费视频视频| 三级网站免费看| 国产麻豆91精品| www激情五月| 国产中文字幕一区| 夜夜夜夜夜夜操| 国内不卡的二区三区中文字幕| 中文av一区二区三区| 免费观看成人鲁鲁鲁鲁鲁视频| 亚洲乱码国产一区三区| 性欧美暴力猛交另类hd| 欧美黄色免费影院| 久久久久99| 日韩中文字幕二区| 青青草国产成人av片免费| 欧美日韩亚洲第一| 日韩电影在线看| www午夜视频| 九九久久精品视频| 国产黄色一区二区三区| 国产传媒久久文化传媒| 日韩黄色一区二区| 91在线观看下载| www.av天天| 国产精品国产自产拍高清av | 亚洲成人一区二区| 亚洲视频免费播放| 一本大道综合伊人精品热热| 亚洲中文无码av在线| 欧美肥妇毛茸茸| 亚洲风情第一页| 亚洲女在线观看| 精品51国产黑色丝袜高跟鞋| 欧美成人中文字幕| 爱啪啪综合导航| 国产精品久久久久久久久久| 99久久久国产| 国产尤物99| 色综合久久一区二区三区| 日韩人妻精品一区二区三区| 精品99视频| 亚洲精品一二三四五区| 国产精品影视在线| 亚洲天堂资源在线| 国产精品嫩草影院com| 欧美精品99久久久| 色av成人天堂桃色av| 国产偷拍一区二区| 日韩av在线播放资源| 婷婷在线视频观看| 韩国美女主播一区| 四虎地址8848精品| 久久精品日产第一区二区三区精品版| 成人6969www免费视频| 免费看日b视频| 免费国产亚洲视频| 好吊色视频一区二区三区| 国产精品三级久久久久三级| 国产一级二级毛片| 欧美日韩美少妇| 婷婷亚洲一区二区三区| 日韩中文娱乐网| 国产免费拔擦拔擦8x高清在线人| 国产成人精品综合久久久| 日本在线一区二区三区| 日韩精品一区二区三区色偷偷| 欧美全黄视频| 邪恶网站在线观看| 91免费国产在线| 国产高潮国产高潮久久久91| 疯狂蹂躏欧美一区二区精品| 国产不卡精品视频| 中文字幕少妇一区二区三区| 阿v视频在线观看| 成人自拍性视频| 国产一区日韩| 草草久久久无码国产专区| 国产91精品一区二区| 青花影视在线观看免费高清| 欧美中文字幕亚洲一区二区va在线 | 精品久久久久久一区| 欧美在线看片| 尤物国产在线观看| 国产亚洲精品资源在线26u| 亚洲一区欧美在线| 日韩美一区二区三区| 男人在线资源站| 国产精品入口尤物| 国产欧美一区二区三区精品观看| 激情深爱综合网| 99久久精品99国产精品| 久久艹精品视频| 日韩一区二区精品葵司在线 | 最新国产成人在线观看| 99久久久无码国产精品免费蜜柚| 亚洲精品电影网在线观看| 欧美人与性动交α欧美精品济南到| 国产区精品视频| 日韩精品一卡| 一道本视频在线观看| 国产亚洲欧洲一区高清在线观看| 亚洲免费黄色网址| 亚洲精品久久久久中文字幕欢迎你| 精品精品导航| 国内精品视频免费| 国产精品普通话对白| 你懂得在线视频| 欧美日韩久久久久| 色在线免费视频| 国产精品∨欧美精品v日韩精品| 亚州av日韩av| 国产免费视频传媒| 国产精品乱码妇女bbbb| 91麻豆成人精品国产| 久久精品人人爽| 欧美久久一区二区三区| 无码人妻aⅴ一区二区三区日本| 国产麻豆欧美日韩一区| 国产在线观看免费av| 亚洲第一视频网| 伊人久久综合一区二区| 日韩一区二区电影在线观看| 日本不卡高清视频| 少妇人妻丰满做爰xxx| 欧美成人a视频| 亚洲私拍视频| 手机在线观看国产精品| 国内成人免费视频| 久久久久久福利| 国产婷婷色综合av蜜臀av| 亚洲四虎影院| 中国一级黄色录像| 成人黄色在线网站| 无码人妻丰满熟妇精品| 尤物99国产成人精品视频| 99热这里有精品| 亚洲熟妇无码一区二区三区| 久久久噜噜噜久噜久久综合| 在线播放成人av| 欧美国产日韩xxxxx| 嫩草影视亚洲| 91热视频在线观看| 精品久久久久久国产91| 成人高清免费在线播放| 51国产成人精品午夜福中文下载| 免费亚洲视频| 亚洲不卡在线播放| 精品一区二区三区三区| 四虎视频在线精品免费网址| 欧美啪啪免费视频| 国产精品成人一区二区三区夜夜夜| 亚洲国产www| 国产精品男人爽免费视频1| 欧美在线免费一级片| 在线观看日本中文字幕| 日韩欧美色综合| 免费污视频在线一区| 日韩精品一区二区在线视频| 国产欧美精品一区二区三区四区| 国产黄色一区二区| 国产精品第三页| 一区二区三区四区五区在线| 欧美视频一区二区在线| 亚洲精品中文字幕有码专区|