精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌復用30年前經(jīng)典算法,CV引入強化學習,網(wǎng)友:視覺RLHF要來了?

人工智能 新聞
模型預測和預期使用之間存在錯位,不利于 CV 模型的部署,來自谷歌等機構(gòu)的研究者用強化學習技術(shù)的獎勵函數(shù),從而改善了計算機視覺任務。

ChatGPT 的火爆有目共睹,而對于支撐其成功背后的技術(shù),監(jiān)督式的指令微調(diào)以及基于人類反饋的強化學習至關(guān)重要。這些技術(shù)也在逐漸擴展到其他 AI 領(lǐng)域,包括計算機視覺(CV)。?

我們知道,在處理計算機視覺中的復雜輸出時,成功的主要標準不在于模型對訓練目標的優(yōu)化程度,而在于預測能力與任務的吻合程度,即模型在預期用途上的表現(xiàn)效果。

為了追求這種一致性,有研究者在模型架構(gòu)、數(shù)據(jù)、優(yōu)化、采樣、后處理等方面進行了一些改進。例如,在物體檢測任務中,研究人員使用了 NMS(non-maximum suppression )、基于集合的全局損失(set-based global loss)以及改變輸入數(shù)據(jù)來獲得在測試時具有改進行為的模型。雖然這些方法帶來了顯著的收益,但它們往往只對特定任務有用,僅僅是間接地對任務風險進行了優(yōu)化。?

不僅 CV,包括自然語言處理(NLP)、強化學習(RL)等領(lǐng)域也在廣泛研究這一現(xiàn)象。在這些領(lǐng)域中,對于目標不太明確的任務,如翻譯或生成摘要,制定優(yōu)化目標非常困難。在處理這類問題時,一種流行的方法是學習模仿例子的輸出,然后進行強化學習,使模型與獎勵函數(shù)保持一致。使用這種方法,NLP 領(lǐng)域產(chǎn)生了令人興奮的結(jié)果,該方法使用大型預訓練語言模型和由人類反饋定義的獎勵來處理原本難以指定的任務。

此外,同樣的方法被廣泛用于圖像字幕任務中,其中 CIDEr(Vedantam 等人 2015 年提出)被用來作為獎勵。盡管如此,據(jù)了解,獎勵優(yōu)化以前還沒有在(非文本)計算機視覺任務中進行過探索。

近日,谷歌大腦團隊的研究者在論文《Tuning computer vision models with task rewards》中證明了,使用 REINFORCE 算法(Williams 于 1992 提出)來調(diào)整(Tuning)具有獎勵函數(shù)的預訓練模型可以開箱即用地用于各種計算機視覺任務

其實許多關(guān)于強化學習任務的研究都會提及 Williams 的 REINFORCE 算法,可見這個算法的重要性。可以說 REINFORCE 算法是策略梯度乃至強化學習的典型代表。

論文地址:https://arxiv.org/pdf/2302.08242v1.pdf?

圖 1 展示了一些關(guān)鍵結(jié)果,主要包括目標檢測、全景分割和圖像著色的獎勵優(yōu)化帶來的定量和定性改進。該研究所提出的方法在處理各種 CV 任務上簡單而有效,證明了它的多功能性和適應性。盡管本文主要采用評估指標形式的獎勵,但這些初步結(jié)果顯示了該方法用來優(yōu)化計算機視覺模型也不失為一種有效途徑,這些模型具有更復雜和更難指定的獎勵,例如人的反饋或整體系統(tǒng)性能。

圖片

推特網(wǎng)友對這篇文章給了一個比較全面的總結(jié),即本文實現(xiàn)的功能是使用 RL 調(diào)整預訓練視覺模型。研究的動因是受到 LLM 強化學習成功的啟發(fā);其效果是在目標檢測、全景分割等方面性能大幅提升。并表示,這項研究可能是實現(xiàn)視覺 RLHF (Reinforcement Learning from Human Feedback)的有效途徑。

圖片

圖源:https://twitter.com/johnjnay/status/1627009121378598912

獎勵?

在不喪失泛化性的情況下,該研究將 CV 任務描述為學習一個函數(shù)的過程,該函數(shù)將輸入 x(即圖像)映射到輸出 y = [y_1, y_1,……, y_n](文本 token 序列、bounding box 序列等)。該研究旨在學習以 θ 為參數(shù)的條件分布 P (y|x, θ),使獎勵函數(shù) R 最大化。用抽象的公式來形容,就是本文要解決以下優(yōu)化問題。

圖片

問題有了,接下來就是怎么解決了,本文分兩步走:首先用最大似然估計對模型進行預訓練;然后使用 REINFORCE 算法對模型進行 Tuning 。下面我們看看這兩步的具體過程:

最大似然預訓練?

首先使用最大似然原理估計參數(shù) θ 并捕獲訓練數(shù)據(jù)的分布。實現(xiàn)這一目標可采用梯度下降算法,該算法通過最大化訓練數(shù)據(jù)的 log-likelihood

圖片來實現(xiàn)。算法 1 和圖 2 描述了 MLE(最大似然估計)優(yōu)化步驟,這是訓練模型最常用的方法。完成這一步將得到 MLE 模型。

圖片

REINFORC 算法將獎勵最大化 ?

為了更好的優(yōu)化 MLE 模型以適應任務風險,還需要最大化獎勵函數(shù)。對于給定輸入 x,該研究利用 REINFORCE 算法來估計對給定 x 期望獎勵的梯度,公式如下所述:

圖片

算法 2 提供了偽代碼,圖 3 說明了該過程:

圖片


圖片

實驗結(jié)果

接下來我們看看本文提出的方法在視覺任務上的表現(xiàn)。

全景分割

如下表 1 所示,Tuning 過程顯著改善了 MLE 模型。視覺檢查(visual inspection)后的結(jié)果表明,Tuning 后的模型在避免不連貫預測方面更好,特別是對于小尺度物體,可參見圖 1。

圖片

目標檢測

表 2 顯示,通過優(yōu)化,該研究將原始 MLE 模型的 mAP 分數(shù)從 39.2% 大幅提高到 54.3%。在 Pix2seq 中,具有稍大的 1333×1333 分辨率和許多啟發(fā)式的相同大小的 ViT-B 模型達到了 47.1%。當使用更大的 ViT-L 主干時,Pix2seq 報告的最佳目標檢測結(jié)果為 50.0%。

圖片

上色?

圖 4 給出的定性結(jié)果清楚地表明,新模型始終能產(chǎn)生更豐富多彩的圖像。

圖片

圖像描述

圖片

表 3 結(jié)果表明,應用所提出的方法可以改進 MLE 模型,這與先前文獻中的觀察結(jié)果一致,證明了該方法針對特定任務風險進行 tuning 的有效性。

圖片

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2024-08-09 14:51:00

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2024-07-22 08:22:00

2025-05-15 09:04:00

2024-08-06 14:07:40

2024-12-23 14:40:00

AI模型訓練

2023-06-25 11:30:47

可視化

2018-08-29 08:13:22

Google 學習框架技術(shù)

2023-02-27 13:57:43

ChatGPTAI繪畫

2022-11-02 14:02:02

強化學習訓練

2020-01-23 15:33:07

AI 數(shù)據(jù)人工智能

2024-03-19 00:15:00

機器學習強化學習人工智能

2023-08-05 12:50:18

AI技術(shù)

2024-08-09 12:46:04

2025-04-18 10:01:41

2021-04-29 14:53:14

谷歌強化學習開發(fā)

2020-02-21 15:33:44

人工智能機器學習技術(shù)

2022-12-21 17:27:30

強化學習AI

2024-10-12 17:14:12

2021-01-28 16:58:12

數(shù)字貨幣加密貨幣區(qū)塊鏈
點贊
收藏

51CTO技術(shù)棧公眾號

邻居大乳一区二区三区| 中文字幕日韩免费| 加勒比视频一区| 色欧美片视频在线观看| 一区二区免费在线观看| 日本美女一级片| 蜜臀av亚洲一区中文字幕| 欧美激情xxxxx| 一级肉体全黄裸片| 国产成人一二片| 欧美视频日韩视频| 久在线观看视频| 久草资源在线| 久久精品亚洲乱码伦伦中文| 成人在线资源网址| 国产精品永久久久久久久久久| 亚洲免费激情| 欧美疯狂性受xxxxx另类| 日韩福利在线视频| 青青草原在线亚洲| 精品久久久久久最新网址| 亚洲欧美日韩一级| 亚洲最大网站| 午夜久久久久久| 99视频精品全部免费看| 自拍视频在线播放| 国产色综合一区| 精品国产乱码久久久久软件| 精品久久在线观看| 国产精品99久| 成人亲热视频网站| 在线观看免费高清视频| 日韩影院在线观看| 日本精品视频在线| 国产一级精品视频| 亚洲精品九九| 亚洲欧洲一二区| 亚洲成人免费电影| 亚洲av综合色区| 一级毛片视频在线观看| 欧美国产精品一区| 欧洲成人一区二区| 激情小视频在线| 久久只精品国产| 精品欧美一区二区久久久伦| 欧美少妇bbw| www.色综合.com| 国产麻豆一区二区三区在线观看| 午夜精品久久久久久久99 | 51色欧美片视频在线观看| 国产一级在线播放| 日韩亚洲在线| 欧美中文字幕视频在线观看| 台湾佬中文在线| 水蜜桃久久夜色精品一区的特点| 国产精品高精视频免费| 亚洲天堂狠狠干| 韩国av一区二区三区在线观看| 91久久精品日日躁夜夜躁国产| 国产三级自拍视频| 国产精品影视网| 国产一区二区不卡视频| 日韩a在线观看| 国产欧美一区二区三区网站 | www.久久国产| 精品久久网站| 另类色图亚洲色图| 日本三级欧美三级| 天堂一区二区在线| 91久久久精品| 天堂网av在线播放| 国产午夜精品一区二区三区嫩草 | 7777精品伊人久久久大香线蕉| 青青草精品在线| 久久精品福利| 在线a欧美视频| 午夜精品一区二区三区视频| 精品99视频| 国产精品久久91| 国内老熟妇对白hdxxxx| www亚洲一区| 亚洲美女自拍偷拍| 免费在线小视频| 精品1区2区3区| 久久久久亚洲av成人网人人软件| 一本色道久久综合亚洲精品酒店| 色吧影院999| 国产成人一区二区三区影院在线| 奇米精品一区二区三区四区| 成人欧美一区二区三区视频 | 亚洲免费观看高清完整版在线观| 日韩在线观看免费av| 日本一级淫片色费放| 美国三级日本三级久久99| 国产精品国产三级国产专区53| 三级视频网站在线| 亚洲精品视频免费看| 欧美牲交a欧美牲交aⅴ免费真| 99综合久久| 亚洲色图校园春色| 久久香蕉精品视频| 久久99精品视频| 美女主播视频一区| 香蕉成人app免费看片| 欧美自拍偷拍一区| 精品人妻一区二区三区日产| 91精品国产91久久久久久密臀| 欧美在线激情网| www.成人在线观看| 国产精品婷婷午夜在线观看| 男人日女人bb视频| 综合激情五月婷婷| 久久久999精品免费| 99久久久无码国产精品免费蜜柚| 丰满放荡岳乱妇91ww| 亚洲最大免费| 天然素人一区二区视频| 亚洲国产精品成人精品| 九九热精品在线观看| 另类专区欧美蜜桃臀第一页| 日韩区国产区| 伊人久久av| 亚洲精品视频免费在线观看| 国产第一页第二页| 成人av资源在线观看| 中文字幕在线中文| 国产精品亚洲欧美一级在线| 中文精品99久久国产香蕉| av网站中文字幕| 99精品国产91久久久久久 | 日本aⅴ在线观看| 麻豆国产精品官网| 亚洲欧美国产不卡| 韩国理伦片久久电影网| 色偷偷亚洲男人天堂| 国产精品成人久久久| 久久蜜桃一区二区| 日本熟妇人妻xxxxx| 亚洲系列另类av| 欧美一级淫片aaaaaaa视频| 天堂在线中文| 欧美性猛交xxxx| 亚洲综合色一区| 久久亚洲风情| 日本精品视频一区| 欧美日韩亚洲国产| 日韩在线高清视频| www.国产黄色| 亚洲一二三专区| 中文成人无字幕乱码精品区| 亚洲一区图片| 日韩在线电影一区| 日韩午夜视频在线| 欧美成人免费观看| 少妇高潮一区二区三区69| 亚洲成人高清在线| 谁有免费的黄色网址| 喷白浆一区二区| 一区二区三视频| 亚洲一区电影| 欧美孕妇性xx| 国产高清在线看| 在线播放视频一区| 天堂资源在线播放| 久久久精品日韩欧美| gai在线观看免费高清| 中国精品18videos性欧美| 高清一区二区三区视频| 波多野结衣亚洲一二三| 视频直播国产精品| www.污视频| 欧美三级免费观看| 娇小11一12╳yⅹ╳毛片| 国产盗摄精品一区二区三区在线| 性欧美大战久久久久久久| 久久97视频| 亚洲一区精品电影| 英国三级经典在线观看| 中文字幕日韩av电影| 亚洲AV午夜精品| 色av成人天堂桃色av| 精品国产欧美日韩不卡在线观看| 不卡av在线网| 99sesese| 国产精品一级| 成年丰满熟妇午夜免费视频| 免费精品国产的网站免费观看| 国产玖玖精品视频| 超碰在线cao| 日韩在线免费av| 无码精品黑人一区二区三区| 7777精品伊人久久久大香线蕉| √资源天堂中文在线| 亚洲乱码国产乱码精品精可以看| 成人乱码一区二区三区av| 国产精品综合av一区二区国产馆| 日本a级片免费观看| 中文字幕日韩欧美精品高清在线| 奇米精品在线| 国产精品久久久久久久久久白浆| 国产日韩在线看片| 成人影院网站| 久久久久久12| 成人av福利| 视频在线一区二区| 激情在线视频| 日韩激情在线视频| 亚洲精品97久久中文字幕无码| 欧美日韩一区 二区 三区 久久精品| 日本亚洲色大成网站www久久| 亚洲乱码国产乱码精品精可以看| 国产美女永久免费无遮挡| 波多野结衣在线aⅴ中文字幕不卡| 182午夜在线观看| 日本视频在线一区| 六月丁香婷婷在线| 午夜影院日韩| 国产3p露脸普通话对白| 黄色成人在线网址| 日韩video| 亚洲欧美日韩高清在线| 亚洲国产另类久久久精品极度| 自拍亚洲一区| 久久99精品久久久久久秒播放器 | 亚洲成人生活片| 亚洲欧洲精品一区二区精品久久久 | 成年人免费高清视频| 亚洲成人免费视| 国产性生活网站| 一二三四区精品视频| 强乱中文字幕av一区乱码| 日韩美女久久久| 亚洲 欧美 国产 另类| 亚洲国产精品av| 四虎国产成人精品免费一女五男| 欧美极品aⅴ影院| 中文字幕黄色网址| 国产精品视频免费| 自拍偷拍你懂的| 国产精品美女久久久久久久网站| 成年人视频软件| 18成人在线观看| 久久精品黄色片| 亚洲一区二区四区蜜桃| 国产精品第108页| 五月天中文字幕一区二区| 天堂资源在线播放| 欧美视频在线观看 亚洲欧| 免费黄色网址在线| 日本高清不卡视频| 中文字幕日韩第一页| 7777精品伊人久久久大香线蕉超级流畅| 国产精品视频a| 日韩美一区二区三区| 少妇av一区二区| 亚洲天堂男人的天堂| 在线观看h片| 欧美成人性色生活仑片| 精品精品导航| 日韩av男人的天堂| 成人黄色毛片| 92看片淫黄大片欧美看国产片| 日韩欧美中文在线观看| 狠狠色噜噜狠狠色综合久 | av电影天堂一区二区在线| aaaaa一级片| 中文字幕一区二| 精品视频久久久久| 色狠狠一区二区三区香蕉| 国产又粗又黄又爽的视频| 欧美成人三级在线| 韩国三级在线观看久| 美日韩精品免费视频| 欧产日产国产精品视频| 国产欧美亚洲精品| 国产精品15p| 亚洲国产精品久久久久久女王| 欧美日韩国产欧| 熟女人妇 成熟妇女系列视频| 久久97超碰国产精品超碰| 极品白嫩的小少妇| 国产免费观看久久| 久久成人在线观看| 欧美性极品少妇| 亚洲女人18毛片水真多| 尤物九九久久国产精品的特点 | 一边摸一边做爽的视频17国产 | 亚洲一区影院| 亚洲精品系列| 热久久久久久久久| 久久综合久色欧美综合狠狠| 日韩高清dvd碟片| 色天使久久综合网天天| 国产视频在线免费观看| 亚洲色图激情小说| 888av在线视频| 成人综合国产精品| 欧美伦理影院| 国产极品粉嫩福利姬萌白酱| 国产在线一区观看| 日本少妇xxxxx| 天天色天天操综合| www.com欧美| 色悠悠久久久久| 亚洲黄色网址| 国产呦系列欧美呦日韩呦| 午夜精品视频一区二区三区在线看| 男人和女人啪啪网站| 国产成人在线色| 三级黄色在线观看| 欧美性受xxxx黑人xyx性爽| 日韩中文字幕免费在线观看| 久久影院资源网| 国产精品第一| 欧美亚洲另类久久综合| 99日韩精品| 黄色激情在线观看| 一区二区三区在线免费观看 | 日韩av在线资源| 国产精品69xx| 99re6热在线精品视频播放速度| 欧美xxxx中国| 污色网站在线观看| 国产精品人妖ts系列视频| 亚洲 国产 日韩 欧美| 亚洲免费高清视频| 原纱央莉成人av片| 久久大片网站| 亚洲一区日韩在线| 在线 丝袜 欧美 日韩 制服| 婷婷久久综合九色综合伊人色| 成人免费观看在线视频| 久久久久久国产| www.久久东京| 无码人妻少妇伦在线电影| 高清久久久久久| 国产精品18p| 日韩成人免费视频| 日本在线影院| 欧美一区二区三区成人久久片| 午夜在线一区| 受虐m奴xxx在线观看| 欧美三级韩国三级日本三斤| av在线电影免费观看| 国产欧美日韩最新| 91国语精品自产拍| 肉丝美足丝袜一区二区三区四| 亚洲综合在线视频| 无码国产精品一区二区色情男同| 欧美最顶级的aⅴ艳星| 国产一区三区在线播放| 日本888xxxx| 成人免费在线播放视频| 国产激情久久久久久熟女老人av| 久久久久久亚洲精品| 婷婷五月色综合香五月| 成人免费xxxxx在线视频| 国产精品女主播av| jizz国产视频| 2019中文字幕在线免费观看| 国产中文精品久高清在线不| 一本色道久久亚洲综合精品蜜桃| 亚洲久本草在线中文字幕| 天天干天天操av| 国产精品永久免费观看| 中文字幕亚洲精品乱码| 亚洲av成人片无码| 欧美羞羞免费网站| 污污网站在线看| 美脚丝袜一区二区三区在线观看| 男人的天堂亚洲一区| 久热这里只有精品在线| 亚洲精品中文字| 国产欧美视频在线| 乱妇乱女熟妇熟女网站| 国产精品免费看片| 可以免费观看的毛片| 国产精品吊钟奶在线| 综合色一区二区| 在线免费看黄视频| 欧美一区二区三区免费观看视频 | 女~淫辱の触手3d动漫| 欧美三级日韩在线| 91美女主播在线视频| 色综合电影网| 成人av在线电影| 国产精品久久久久毛片| 91av在线网站| 91精品综合| 级毛片内射视频| 精品少妇一区二区三区在线播放 | 欧美午夜精品久久久久免费视| 亚洲天堂男人av| 国产日产欧美一区| 国产三级自拍视频| 日韩美女写真福利在线观看| 欧美精品成人| 日韩av片在线| 日韩精品一区二| www.九色在线|