精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

零成本突破多模態(tài)大模型瓶頸!多所美國頂尖高校華人團(tuán)隊(duì),聯(lián)合推出自增強(qiáng)技術(shù)CSR

人工智能 新聞
現(xiàn)有多模態(tài)大模型在對(duì)齊不同模態(tài)時(shí)面臨幻覺和細(xì)粒度感知不足等問題,傳統(tǒng)偏好學(xué)習(xí)方法依賴可能不適配的外源數(shù)據(jù),存在成本和質(zhì)量問題。Calibrated Self-Rewarding(CSR)框架通過自我增強(qiáng)學(xué)習(xí),利用模型自身輸出構(gòu)造更可靠的偏好數(shù)據(jù),結(jié)合視覺約束提高學(xué)習(xí)效率和準(zhǔn)確性。

多模態(tài)大模型展現(xiàn)出了多種多樣的能力,這些能力都通過SFT和預(yù)訓(xùn)練從龐大的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)。

但是模態(tài)之間的簡單對(duì)齊可能會(huì)使得模型存在幻覺,細(xì)粒度圖像感知能力差等各種問題。

已有的多模態(tài)大模型對(duì)齊方案一般采用DPO,POVID等偏好優(yōu)化方法,或是蒸餾 GPT-4等昂貴閉源模型的方式來提升模型能力。

這些方法大多需要外源模型數(shù)據(jù),這些數(shù)據(jù)構(gòu)造存在很多問題,一是需要昂貴的價(jià)格,二是缺乏質(zhì)量和多樣性的保證。

再者說,這真的適合需要提升模型本身的分布偏好嗎?

在Calibrated Self-Rewarding Vision Language Models文中,通過模型自身輸出概率證明了,外來模型構(gòu)造的偏好數(shù)據(jù)可能不適合用于模型的偏好學(xué)習(xí),相較于模型自身的response,外源模型所構(gòu)造的數(shù)據(jù)模型自己說出的概率很小,簡單來說對(duì)于偏好數(shù)據(jù)中的負(fù)樣本模型并不會(huì)犯一樣的錯(cuò)誤,對(duì)于偏好數(shù)據(jù)中的正樣本模型也不會(huì)講出那么好的response。

這種偏好數(shù)據(jù)用于偏好學(xué)習(xí)可能會(huì)引入模型自身分布的偏差導(dǎo)致其他錯(cuò)誤,同時(shí)因?yàn)槟P妥陨碚f同樣話的概率低,用這樣的數(shù)據(jù)來偏好學(xué)習(xí)增強(qiáng)模型收益很小。

圖片

同時(shí)傳統(tǒng)純文本大模型領(lǐng)域的Self-rewarding范式存在一定缺陷。

圖片

在此前self rewarding提供reward的模型是模型自身,當(dāng)模型自身無法準(zhǔn)確分辨偏好、所具有的知識(shí)不夠強(qiáng)大的時(shí)候,它所提供的反饋可能不夠精準(zhǔn)或者沒用導(dǎo)致所更新的模型的分布無法向著目標(biāo)分布更新。

為了解決上述問題,來自UNC ,芝加哥大學(xué),UMD和羅格斯大學(xué)的研究團(tuán)隊(duì)提出了Calibrated Self-Rewarding(CSR),多模態(tài)大模型的自我增強(qiáng)因?yàn)闀?huì)存在一個(gè)真實(shí)圖像的參照,這會(huì)使得self-rewarding的過程更加可靠。

論文地址: https://arxiv.org/pdf/2405.14622

項(xiàng)目地址:https://github.com/YiyangZhou/CSR

項(xiàng)目頁面:https://dongjie-cheng.github.io/CSR.html

整個(gè)Calibrated Self-Rewarding(CSR)框架如下:

1. 通過模型本身在beam search過程中的輸出構(gòu)造偏好數(shù)據(jù)對(duì),過程中的獎(jiǎng)勵(lì)來自于校準(zhǔn)的自我獎(jiǎng)勵(lì):LVLM對(duì)于每句話的自我生成概率 + 結(jié)合視覺約束獎(jiǎng)勵(lì),用于獎(jiǎng)勵(lì)校準(zhǔn)。

2. 基于每一輪構(gòu)造的偏好數(shù)據(jù)在線通過DPO迭代學(xué)習(xí)。

實(shí)驗(yàn)

CSR相較于數(shù)據(jù)驅(qū)動(dòng)的偏好學(xué)習(xí)對(duì)齊方法和模型自我反饋的方法均有較大提升。

更值得注意的是,在CSR多輪在線迭代過程中,模型能逐步提升自我能力!可以看到在多個(gè)輪次中以LLaVA-1.5為例,模型在多個(gè)benchmark上的均分逐步提升。

同時(shí)也可以看到特別是幻覺,在多輪迭代中是逐步減少的:

同時(shí)CSR也適用于其他模型,例如Vila:

 圖片

那么在Calibrated Self-Rewarding(CSR)的過程中究竟發(fā)生了什么呢?通過可視化經(jīng)過CSR迭代前后模型自身的正樣本和負(fù)樣本輸出可以發(fā)現(xiàn),經(jīng)過多輪CSR學(xué)習(xí)后,模型自身說出的回復(fù)會(huì)有更高的分?jǐn)?shù):這代表模型的response更加符合圖像信息;同時(shí)負(fù)樣本和正樣本的gap更小:這說明模型所輸出的負(fù)樣本傾向于正樣本,模型的誤差和性能下界提升。

圖片

通過可視化attention可以看到,CSR能使得LVLM更加偏重于視覺模型,同時(shí)能緩解文本attention中存在的上下文依賴問題。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-10-13 08:50:00

2024-10-25 14:30:00

模型AI

2024-10-21 13:20:00

視頻數(shù)據(jù)集

2024-01-22 13:59:00

模型訓(xùn)練

2023-09-19 13:48:02

2024-05-27 12:39:32

2024-06-03 08:48:16

2025-01-08 08:21:16

2010-05-13 09:24:39

2024-06-12 11:50:23

2023-12-04 13:23:00

數(shù)據(jù)訓(xùn)練

2025-08-21 09:10:00

2025-03-07 08:40:00

模型數(shù)據(jù)AI

2024-05-21 07:54:30

視頻多模態(tài)語義檢索算法

2023-06-05 10:01:18

模型測(cè)評(píng)

2025-10-16 18:07:47

AI模型訓(xùn)練

2025-03-10 07:00:00

模型數(shù)據(jù)訓(xùn)練

2025-05-21 08:35:00

2024-01-11 09:37:58

模型AI

2024-11-11 15:11:23

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

最新黄色av网址| 青青青在线视频免费观看| 亚洲精品无码专区| 国产视频一区免费看| 国产一区二区黄| 亚洲欧美激情一区二区三区| 国产夫妻在线播放| 国产精品天干天干在观线| 亚洲a级在线观看| 啦啦啦免费高清视频在线观看| 成人羞羞网站入口| 精品欧美乱码久久久久久1区2区| 六月丁香激情网| 久久精品视频免费看| 91麻豆精品视频| 成人性教育视频在线观看| 女人十八岁毛片| 在线一区电影| 色一情一乱一区二区| 白嫩情侣偷拍呻吟刺激 | 台湾色综合娱乐中文网| 欧美日韩国产影片| 无码人妻h动漫| caoporn免费在线| 国产拍欧美日韩视频二区| 国产精品国色综合久久| 亚洲综合五月天婷婷丁香| 18成人免费观看视频| 色老头一区二区三区在线观看| 佐佐木明希电影| 六九午夜精品视频| 日韩欧美在线观看视频| 欧美视频在线第一页| 香蕉视频在线播放| 久久久午夜电影| 亚洲va电影大全| 中文在线最新版天堂| 先锋影音久久久| 欧美国产日韩在线| 日韩一区二区三区四区在线| 日韩国产一区二区三区| 亚洲一区av在线播放| 少妇一级淫免费观看| 一区二区三区自拍视频| 在线综合亚洲欧美在线视频| 91极品视频在线观看| 成人性生活视频| 精品日本高清在线播放| 国产乱子伦精品无码专区| 久久五月精品| 亚洲日韩欧美一区二区在线| 一区二区三区四区五区精品 | 日韩视频免费看| 婷婷综合在线视频| 色小子综合网| 久久精品国产69国产精品亚洲| 亚洲色图第四色| 欧美一级精品| 久久精品国产成人精品| 亚洲综合久久av一区二区三区| 成人3d精品动漫精品一二三| 国产一区二区三区毛片| 国产传媒在线看| 欧美a级成人淫片免费看| 最近中文字幕2019免费| 波多野结衣欲乱| 91精品1区| 欧美日韩第一视频| 日本一级淫片色费放| 亚洲伊人观看| 国产精品96久久久久久| 中文字幕人妻精品一区| 国内久久精品视频| 高清av免费一区中文字幕| 好吊色一区二区| 97se狠狠狠综合亚洲狠狠| 蜜桃成人在线| 成人在线免费电影| 亚洲天堂2016| 国产精品专区在线| 校园春色亚洲色图| 欧美老女人第四色| 制服丝袜av在线| 久久99视频| 日韩亚洲在线观看| 亚洲国产精品成人无久久精品| 9国产精品视频| 国产精品久久久久久久电影| 国产美女主播在线观看| 99视频国产精品| 日韩偷拍一区二区| 午夜伦理大片视频在线观看| 欧美日韩一区二区在线播放| 天天视频天天爽| 51精品国产| 亚洲欧洲成视频免费观看| 三级黄色录像视频| 91久久午夜| 91精品久久久久久综合乱菊 | 97超碰欧美中文字幕| 亚洲mv在线看| 国产资源在线观看入口av| 色综合久久天天| 一级黄色高清视频| 久久爱www成人| 欧美人与性动交a欧美精品| 91video| 国产毛片精品视频| 日本一区二区三区视频在线观看| 亚洲夜夜综合| 91国偷自产一区二区三区成为亚洲经典 | 精品国产网站在线观看| 亚洲午夜精品久久久久久高潮| 一区二区三区午夜视频| 日本中文字幕成人| 国产综合视频在线| 最好看的中文字幕久久| 久久久久久久久久久久久久国产| 涩涩屋成人免费视频软件| 伊人一区二区三区久久精品| 精品成人久久久| 国产麻豆精品视频| 伊人天天久久大香线蕉av色| japanese23hdxxxx日韩| 亚洲激情免费观看| 欧美成人精品欧美一级私黄| 美女性感视频久久| 欧美在线一二三区| 最新中文字幕在线播放| 精品免费视频一区二区| 久久久精品视频免费观看| 日本美女视频一区二区| 女同一区二区| 91青青草视频| 亚洲乱码一区| 日韩在线一区二区三区免费视频| 国产精品一区二区三区四| 国产成人午夜电影网| 伊人情人网综合| yy6080久久伦理一区二区| 亚洲男人天堂久| 青青国产在线观看| av成人免费在线观看| 91黄色在线看| 成人高潮视频| 国内精品400部情侣激情| 国产激情无套内精对白视频| 亚洲手机成人高清视频| 在线观看免费的av| 久久免费av| 国产欧美在线视频| 欧美成人三区| 91精品国产综合久久婷婷香蕉 | 中文字幕av一区二区三区人妻少妇 | 亚洲人成网站在线观看播放| 外国成人直播| 最近2019好看的中文字幕免费| 日批视频免费观看| 国产精品国产三级国产a| 制服丝袜综合网| 婷婷六月综合| 99精品在线直播| www555久久| 精品视频在线播放色网色视频| 国产福利拍拍拍| 久久久久久久久久久久久女国产乱| 国产一区二区三区精彩视频| 蜜桃一区二区三区| 国产精品一区二区三区毛片淫片 | 青青草一区二区| 国产精品一区二区三区四区色| 在线看一区二区| 蜜桃av.com| 丁香婷婷综合网| 亚洲 高清 成人 动漫| 国产成人一区| 成人黄色av播放免费| 啪啪免费视频一区| 日韩h在线观看| 最近中文字幕在线观看视频| 亚洲精品中文字幕在线观看| 97精品人妻一区二区三区蜜桃| 亚洲欧美日韩国产综合精品二区| 五月婷婷综合色| 蜜桃精品一区二区三区| 91精品国产电影| 3d成人动漫在线| 精品国产一区二区三区不卡| 亚洲精品中文字幕乱码三区91| 中文字幕精品—区二区四季| a级大片免费看| 久久视频一区| 神马午夜伦理影院| 久草精品在线| 91黄在线观看| 先锋欧美三级| 欧美激情手机在线视频| 搞黄视频免费在线观看| 日韩你懂的电影在线观看| 特黄视频免费看| 亚洲精品视频在线看| 精品人妻一区二区三区视频| 国产在线播放一区三区四| 欧美黄网站在线观看| 亚洲91精品| 日韩成人av网站| 国产精品自在线拍| 国产免费一区二区三区在线能观看| a级片免费在线观看| xxav国产精品美女主播| 青青草观看免费视频在线| 日韩一区二区麻豆国产| 亚洲成人av网址| 天天综合网天天综合色| 草视频在线观看| 欧美韩国一区二区| 黄色在线观看av| 国产69精品久久777的优势| 激情 小说 亚洲 图片: 伦| 国产精品入口66mio| 欧美一级黄色录像片| 超碰成人久久| 欧美日韩精品不卡| 欧美毛片免费观看| 福利视频一区二区三区| 99精品美女视频在线观看热舞| 国产91色在线|免| 国产一二三在线| 欧美激情手机在线视频| 性欧美video高清bbw| 久久精品99久久久久久久久| 成年人在线观看| 亚洲视频免费一区| 神马久久久久| 国产偷国产偷亚洲清高网站| 日日夜夜精品免费| 精品美女在线观看| 亚洲乱码在线观看| 日韩免费电影网站| 精品毛片在线观看| 日韩一区二区三区免费观看| 国产精品女同一区二区| 欧美精品v国产精品v日韩精品| 国产无遮挡又黄又爽又色视频| 欧美三级免费观看| www.久久久久久久| 91黄色小视频| 在线播放精品视频| 欧美日本不卡视频| 亚洲图片视频小说| 欧美高清性hdvideosex| 91中文字幕在线播放| 欧美日本一区二区三区四区| 亚洲影视一区二区| 欧美日韩国产高清一区| 国产精品国产一区二区三区四区| 欧美日韩亚洲综合在线 | 345成人影院| 欧美最顶级丰满的aⅴ艳星| 国产日韩电影| 国产精品一区二区久久国产| 日韩久久99| 超碰97人人在线| 久久久伦理片| 品久久久久久久久久96高清| 精品视频黄色| 麻豆md0077饥渴少妇| 午夜精品电影| 能在线观看的av| 免费观看久久久4p| 中文字幕第66页| 成人在线视频一区二区| 欧洲女同同性吃奶| 一区在线观看视频| 久久精品一区二区三| 亚洲成人免费在线| 中文字幕在线播| 欧美日本在线播放| 免费观看国产视频| 一区二区三区天堂av| av在线app| 欧美一区亚洲一区| 欧美黄色a视频| 成人欧美一区二区三区视频xxx| 欧美午夜18电影| 小说区图片区图片区另类灬| 欧美日韩一卡| 农村妇女精品一二区| 国产乱人伦偷精品视频免下载| 亚洲啪av永久无码精品放毛片| 久久久久9999亚洲精品| 国产女人18水真多毛片18精品| 图片区小说区区亚洲影院| 在线播放精品视频| 亚洲精品国产综合久久| 精品国产白色丝袜高跟鞋| 992tv成人免费影院| 日韩黄色三级| 欧美日韩在线观看一区| 国产精品vip| 亚洲老女人av| 99精品视频在线播放观看| 男人晚上看的视频| 狠狠色狠狠色综合日日小说| 国产美女精品视频国产| 国产一区二区三区视频| av在线不卡免费| 成人黄色片网站| 国产成人精品三级高清久久91| 亚洲一区 在线播放| 日日摸夜夜添夜夜添国产精品| 麻豆tv在线观看| 日韩毛片在线免费观看| 国产一区二区视频网站| 亚洲第一综合天堂另类专| 国产一二区在线| 国产精品欧美日韩| 日韩免费电影在线观看| 日韩 欧美 视频| 国产在线精品一区二区三区不卡| 精品国产成人亚洲午夜福利| 亚洲www啪成人一区二区麻豆| 一级黄色大片网站| 亚洲欧美一区二区三区情侣bbw| 超黄网站在线观看| 亚洲综合中文字幕在线| 欧美国产一区二区三区激情无套| 亚洲精品中文字幕无码蜜桃| 99久久精品国产精品久久| 久草免费新视频| 日韩欧美一区二区免费| 欧美另类极品| 国产一区红桃视频| 日韩精品1区| 国产真人无码作爱视频免费| 久久久精品影视| 在线精品免费视| 精品视频www| 深夜成人影院| 日本在线播放一区| 久久夜色精品| 黄免费在线观看| 在线观看亚洲精品| 成人高清免费观看mv| 国产97在线观看| 九一国产精品| 国产成人手机视频| 欧美激情一区二区三区全黄| 欧美一级黄视频| 日韩一区二区三区在线播放| 男人亚洲天堂| 欧美性受黑人性爽| 国产精品夜夜爽| 久热这里只有精品在线| 精品99999| 二区三区不卡| 午夜精品短视频| 国产麻豆日韩欧美久久| 久久婷婷一区二区| 亚洲国产精品嫩草影院久久| 男女羞羞在线观看| 青青草久久网络| 毛片av一区二区| 欧美爱爱小视频| 亚洲精品大尺度| 日韩中文视频| 亚洲小说欧美另类激情| 成人免费不卡视频| 亚洲成人第一网站| 中文字幕综合一区| 日韩免费一级| 亚欧无线一线二线三线区别| 国产亚洲欧洲997久久综合| 中文在线资源天堂| 欧美精品电影免费在线观看| 日本国产精品| 91亚洲免费视频| 亚洲mv在线观看| 成av人电影在线观看| 亚洲伊人第一页| 亚欧成人精品| 亚洲精品卡一卡二| 亚洲第一级黄色片| 国产乱子精品一区二区在线观看| 中文字幕精品在线播放| 91在线你懂得| 国产又粗又长又黄| 国内精品在线一区| 日韩在线综合| 精品一区二区视频在线观看 | 亚洲黄色a v| 亚洲欧美福利一区二区| 日韩毛片在线一区二区毛片| 成人国产精品一区二区| 在线亚洲欧美| 欧美日韩国产精品一区二区三区| 精品无码久久久久久国产| 国产日韩欧美中文在线| 92看片淫黄大片一级| 亚洲精品国产精华液|