精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上

發(fā)布于 2025-3-12 00:43
瀏覽
0收藏

Unified Reward Model for Multimodal Understanding and Generation

2025-03-07|FDU, SII, Shanghai AI Lab, Shanghai Academy of Artificial Intelligence for Science|??75

??http://arxiv.org/abs/2503.05236v1???
???https://huggingface.co/papers/2503.05236???
???https://codegoat24.github.io/UnifiedReward/??

研究背景與意義

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

本文提出了一種名為UNIFIEDREWARD的統(tǒng)一獎勵模型,旨在解決多模態(tài)理解和生成任務(wù)中的偏好對齊問題。現(xiàn)有模型通常針對特定任務(wù)設(shè)計(jì),限制了其在不同視覺應(yīng)用中的適應(yīng)性。作者認(rèn)為,通過聯(lián)合學(xué)習(xí)多個視覺任務(wù),可以產(chǎn)生協(xié)同效應(yīng),增強(qiáng)圖像理解、視頻評估等任務(wù)的表現(xiàn)。

  • 研究背景:近年來,人類偏好對齊技術(shù)顯著推動了多模態(tài)生成和理解的進(jìn)步。然而,大規(guī)模收集人類反饋既耗時又耗費(fèi)資源。
  • 研究意義:本研究通過構(gòu)建大規(guī)模的人類偏好數(shù)據(jù)集,并開發(fā)出首個能夠同時進(jìn)行成對排名和點(diǎn)評分的統(tǒng)一獎勵模型,解決了現(xiàn)有模型的局限性,提升了跨域視覺任務(wù)的性能。

研究方法與創(chuàng)新

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

UNIFIEDREWARD的核心在于其獨(dú)特的訓(xùn)練流程和數(shù)據(jù)構(gòu)建方式。該模型基于一個涵蓋圖像和視頻生成/理解任務(wù)的大規(guī)模人類偏好數(shù)據(jù)集進(jìn)行訓(xùn)練,隨后用于自動構(gòu)建高質(zhì)量的偏好對數(shù)據(jù)。

  • 技術(shù)創(chuàng)新

a.大規(guī)模數(shù)據(jù)集:首次構(gòu)建了一個包含236K條記錄的數(shù)據(jù)集,覆蓋了圖像和視頻的理解與生成任務(wù)。

b.聯(lián)合學(xué)習(xí)框架:通過將視覺任務(wù)視為相互關(guān)聯(lián)的整體,實(shí)現(xiàn)了更高效的模型訓(xùn)練。

c.細(xì)粒度篩選機(jī)制:采用成對排名和點(diǎn)評分相結(jié)合的方法,確保了偏好數(shù)據(jù)的質(zhì)量。

  • 優(yōu)勢對比

a.相比于僅能處理單一任務(wù)的現(xiàn)有模型,UNIFIEDREWARD展示了更強(qiáng)的泛化能力和更高的效率。

b.實(shí)驗(yàn)結(jié)果顯示,在多種基準(zhǔn)測試中,該模型均取得了顯著優(yōu)于基線模型的成績。

實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

為了驗(yàn)證UNIFIEDREWARD的有效性,研究人員進(jìn)行了廣泛的實(shí)驗(yàn),包括圖像和視頻生成及理解任務(wù)。實(shí)驗(yàn)結(jié)果表明,聯(lián)合學(xué)習(xí)多個視覺任務(wù)不僅能緩解數(shù)據(jù)不足的問題,還能顯著提高學(xué)習(xí)效果。

  • 圖像生成:使用Pick-a-Pic數(shù)據(jù)集進(jìn)行偏好數(shù)據(jù)構(gòu)建,結(jié)果顯示,基于UNIFIEDREWARD的DPO方法在多個指標(biāo)上均優(yōu)于直接訓(xùn)練。
  • 視頻生成:通過T2V-Turbo模型進(jìn)行對比實(shí)驗(yàn),發(fā)現(xiàn)UNIFIEDREWARD在質(zhì)量、語義一致性等方面均有明顯提升。
  • 多任務(wù)學(xué)習(xí):實(shí)驗(yàn)還證明了聯(lián)合訓(xùn)練圖像和視頻理解任務(wù)可以帶來額外的性能增益,例如整體準(zhǔn)確率提高了5.3%,宏觀準(zhǔn)確率提高了8.3%。

結(jié)論與展望

綜上所述,UNIFIEDREWARD不僅為多模態(tài)理解和生成任務(wù)提供了一種全新的解決方案,而且通過聯(lián)合學(xué)習(xí)多個視覺任務(wù),展現(xiàn)了強(qiáng)大的泛化能力和實(shí)際應(yīng)用潛力。未來的研究方向可能包括進(jìn)一步優(yōu)化模型架構(gòu)、探索更多類型的視覺任務(wù)以及擴(kuò)展到其他領(lǐng)域如自然語言處理等。

  • 總結(jié)貢獻(xiàn):提出了首個統(tǒng)一獎勵模型,解決了現(xiàn)有模型的局限性,顯著提升了跨域視覺任務(wù)的性能。
  • 方法展望:建議繼續(xù)探索如何更好地整合不同類型的任務(wù),以實(shí)現(xiàn)更加通用和高效的獎勵模型。

R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcing Learning

2025-03-07|Alibaba Group|??9

??http://arxiv.org/abs/2503.05379v1???
???https://huggingface.co/papers/2503.05379???
???https://github.com/HumanMLLM/R1-Omni??

研究背景與意義

本研究聚焦于情感識別任務(wù),特別是結(jié)合視覺和音頻信息的多模態(tài)大模型。當(dāng)前,強(qiáng)化學(xué)習(xí)(RL)在提升大模型性能方面展現(xiàn)出巨大潛力,尤其是通過可驗(yàn)證獎勵機(jī)制(RLVR)。然而,現(xiàn)有的RLVR應(yīng)用主要集中在圖像-文本模態(tài)上,尚未探索視頻中更豐富的信息源,如動態(tài)視覺內(nèi)容和音頻。

本文首次將RLVR應(yīng)用于視頻多模態(tài)大模型(Omni-model),旨在優(yōu)化其推理能力、情感識別準(zhǔn)確性和泛化能力。研究不僅顯著提升了模型在分布內(nèi)數(shù)據(jù)上的表現(xiàn),還在分布外數(shù)據(jù)上展示了更強(qiáng)的魯棒性。此外,改進(jìn)后的推理能力使得不同模態(tài)(視覺和音頻)對情感識別的貢獻(xiàn)更加清晰,為多模態(tài)大模型的優(yōu)化提供了寶貴見解。

研究方法與創(chuàng)新

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

本研究采用了一種新穎的訓(xùn)練范式——強(qiáng)化學(xué)習(xí)與可驗(yàn)證獎勵(RLVR),并結(jié)合了組相對策略優(yōu)化(GRPO)。RLVR簡化了獎勵機(jī)制,確保模型輸出與任務(wù)的正確性標(biāo)準(zhǔn)對齊,而GRPO則通過比較生成響應(yīng)的質(zhì)量來優(yōu)化策略,無需額外的批評模型。

具體而言,我們擴(kuò)展了RLVR的應(yīng)用范圍,從傳統(tǒng)的數(shù)學(xué)和編程領(lǐng)域轉(zhuǎn)向多模態(tài)情感識別。通過使用MAFW和DFEW數(shù)據(jù)集中的15,306個視頻樣本進(jìn)行訓(xùn)練,盡管這些數(shù)據(jù)集僅提供情感類別標(biāo)注,但通過RLVR,我們成功增強(qiáng)了模型的推理、性能和泛化能力。

創(chuàng)新點(diǎn):

  1. 首次應(yīng)用:首次將RLVR應(yīng)用于視頻多模態(tài)大模型,特別是在情感識別任務(wù)中。
  2. 增強(qiáng)推理能力:通過RLVR,模型能夠更清晰地理解視覺和音頻信息如何共同作用于情感識別。
  3. 魯棒性提升:模型在分布外數(shù)據(jù)上的表現(xiàn)顯著優(yōu)于監(jiān)督微調(diào)(SFT)模型。
  4. 結(jié)構(gòu)化輸出:引入了嚴(yán)格的格式獎勵,確保模型生成的解釋符合預(yù)定義的HTML標(biāo)簽格式,便于后續(xù)分析和評估。

實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

實(shí)驗(yàn)分為冷啟動階段和RLVR訓(xùn)練階段。冷啟動階段使用EMER數(shù)據(jù)集中的580個視頻樣本進(jìn)行預(yù)訓(xùn)練,以賦予模型初步的推理能力。隨后,通過RLVR進(jìn)一步優(yōu)化模型。

實(shí)驗(yàn)結(jié)果:

  1. 推理能力增強(qiáng):R1-Omni在多個數(shù)據(jù)集上表現(xiàn)出更強(qiáng)的推理能力和更高的解釋一致性。
  2. 理解能力提升:在MAFW和DFEW數(shù)據(jù)集上,R1-Omni的無權(quán)重平均召回率(UAR)和加權(quán)平均召回率(WAR)均顯著高于其他模型。
  3. 泛化能力更強(qiáng):在RAVDESS數(shù)據(jù)集(作為分布外測試集)上,R1-Omni同樣表現(xiàn)出色,UAR和WAR分別達(dá)到43.00%和44.69%,遠(yuǎn)超SFT模型的表現(xiàn)。

結(jié)論與展望

本研究表明,RLVR在多模態(tài)情感識別任務(wù)中具有顯著優(yōu)勢,不僅提升了模型的推理和理解能力,還增強(qiáng)了其在未見過的數(shù)據(jù)上的泛化能力。未來的研究方向包括:

  1. 加強(qiáng)基礎(chǔ)模型能力:通過更大規(guī)模的預(yù)訓(xùn)練或更多樣化的數(shù)據(jù)集來進(jìn)一步提升基礎(chǔ)模型的性能。
  2. 減少推理幻覺:開發(fā)機(jī)制以檢測和減輕模型在推理過程中可能出現(xiàn)的幻覺現(xiàn)象。
  3. 充分利用音頻線索:改進(jìn)模型對音頻特征(如語調(diào)和抑揚(yáng)頓挫)的提取和整合能力。
  4. 深化情感智能:引導(dǎo)模型探索更深層次的心理活動和情感驅(qū)動因素,提升其捕捉復(fù)雜情感動態(tài)的能力。

盡管R1-Omni取得了顯著進(jìn)展,但在字幕識別、推理幻覺和音頻利用等方面仍存在局限性,需要進(jìn)一步研究和改進(jìn)。

本文轉(zhuǎn)載自??AI研究前瞻??,作者:胡耀淇



已于2025-3-13 16:00:59修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
亚洲天堂开心观看| 亚洲在线视频网站| 91久久久久久| 日韩av一二三区| 久久99久久人婷婷精品综合| 欧美在线制服丝袜| 日韩在线视频在线| 国产香蕉在线| 国产91精品一区二区麻豆网站| 26uuu另类亚洲欧美日本一 | 韩国精品视频在线观看| 亚洲美腿欧美偷拍| 激情成人在线视频| 国产精品久久久久桃色tv| 91免费福利视频| 日韩成人免费在线视频| 日韩高清欧美| 精品视频在线播放免| 亚洲天堂av一区二区| 川上优av中文字幕一区二区| 亚洲欧洲精品天堂一级| 久久免费一区| 精品人妻久久久久一区二区三区| 美女爽到呻吟久久久久| 欧美另类极品videosbestfree| 午夜理伦三级做爰电影| 91精品导航| 欧美年轻男男videosbes| 日本日本19xxxⅹhd乱影响| 黄色在线播放网站| 国产日韩欧美精品在线| 国产欧美欧洲| av网站免费播放| 青青草国产成人99久久| 欧美亚洲第一页| 国产一级在线免费观看| 亚洲人成免费网站| 色妞久久福利网| 久久久久久国产精品无码| 精品国内亚洲2022精品成人| 欧美一区二区性放荡片| 男人添女人下面免费视频| 午夜激情电影在线播放| 精品成人av一区| 国产乱子伦精品无码专区| 精品国产白色丝袜高跟鞋| 国产精品欧美经典| 神马影院午夜我不卡| 丝袜+亚洲+另类+欧美+变态| 99麻豆久久久国产精品免费| 国产精品对白一区二区三区| 不卡视频免费在线观看| 国产原创一区二区三区| 91精品视频专区| 国产又粗又猛又黄又爽无遮挡| 日本成人中文字幕| 国产精品专区一| 中文字幕乱码视频| 免费xxxx性欧美18vr| 国产精品免费一区二区三区都可以| 九九热在线免费观看| 亚洲伦伦在线| 2019中文字幕免费视频| 国产免费av一区| 视频一区中文字幕国产| 国产精品黄色av| 怡春院在线视频| 激情丁香综合五月| 亚洲最大的av网站| 亚洲成人第一区| av高清久久久| 久久精品中文字幕一区二区三区| 天堂а在线中文在线无限看推荐| 久久久九九九九| 视频一区三区| 成人短视频在线| 亚洲国产综合视频在线观看| 又粗又黑又大的吊av| 在线一区视频观看| 久久久久久青草| 美女一区二区久久| 91精品免费| 婷婷在线免费视频| 91美女福利视频| 日本一区二区精品视频| 日本在线免费看| 夜夜精品浪潮av一区二区三区| 丰满少妇久久久| 视频一区在线免费看| 正在播放亚洲一区| 任你躁av一区二区三区| 国产欧美日韩在线观看视频| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 18禁免费无码无遮挡不卡网站| 欧美极品免费| 91精品国产综合久久久久久漫画| 亚洲午夜精品在线观看| 亚洲欧洲av| 另类图片亚洲另类| 91视频免费网址| 久久福利资源站| 国产精品中出一区二区三区| 高清在线观看av| 亚洲一区二区在线视频| 狠狠热免费视频| 欧美.com| 在线观看国产精品91| 久久精品99国产精| 日韩电影在线一区二区| 国产91亚洲精品一区二区三区| 欧美孕妇孕交| 夜夜嗨av一区二区三区中文字幕| 88av.com| 国内自拍欧美| 俺去了亚洲欧美日韩| 国产精品免费精品一区| 国产一区二区三区在线观看免费| 欧美国产综合视频| 污片视频在线免费观看| 欧美三级在线看| 最近日本中文字幕| 一区二区三区四区日韩| 国产成人久久久| 六月婷婷综合网| 亚洲免费观看在线视频| 国产wwwxx| 丝袜连裤袜欧美激情日韩| 不卡av在线网站| 97精品人妻一区二区三区香蕉| 91视频www| 人妻av中文系列| 日韩免费一级| 日韩在线观看网站| 亚洲成人av网址| 91视视频在线直接观看在线看网页在线看 | 欧美性猛交xxx乱久交| 老司机成人在线| 欧美高清不卡在线| 国产男男gay体育生网站| 欧美国产精品v| 亚洲婷婷在线视频| 波多野结衣家庭教师视频| 大奶在线精品| 欧美极品少妇xxxxⅹ喷水| 国产乱淫av免费| 国产精品美女一区二区三区 | missav|免费高清av在线看| 欧美一区二区三区视频免费| 久久久久久久麻豆| 久久国产人妖系列| 制服丝袜综合日韩欧美| 国产精品99| 中国日韩欧美久久久久久久久| 99re这里只有精品在线| 久久久久久影视| 国产成人综合一区| 精品国精品国产自在久国产应用| 日本一本a高清免费不卡| 欧洲伦理片一区 二区 三区| 一本色道综合亚洲| 人妻一区二区视频| 欧美aaaaaa午夜精品| 亚洲欧洲精品在线| 亚州精品国产| 九九热在线精品视频| 精品人妻一区二区三区麻豆91 | 中文字幕自拍vr一区二区三区| 精品人妻一区二区三区潮喷在线 | 成人亚洲综合| 久久亚洲精品一区二区| 精品毛片在线观看| 亚洲成人tv网| 丝袜美腿中文字幕| 日本不卡在线视频| 国产精品久久成人免费观看| 日韩精品一级| 清纯唯美日韩制服另类| 日本中文字幕电影在线免费观看| 91麻豆精品国产自产在线| 久青草免费视频| 2020国产精品久久精品美国| 狠狠热免费视频| 欧美一区精品| 精品伊人久久大线蕉色首页| 国产成人久久精品麻豆二区| 久久久久99精品久久久久| 内射无码专区久久亚洲| 色哟哟国产精品| 欧美大片xxxx| 久久这里只有精品6| 在线观看免费不卡av| 欧美日本国产| 午夜精品亚洲一区二区三区嫩草| 国产欧美日韩电影| 91豆花精品一区| 免费黄网在线观看| 精品无人区乱码1区2区3区在线| 中文字幕精品无码亚| 亚洲大尺度视频在线观看| 一级黄色录像毛片| 岛国一区二区在线观看| 成人午夜激情av| 1024日韩| 欧美性受xxxx黑人猛交88| 女同久久另类99精品国产| 成人免费看黄网站| 在线成人av观看| 九九九久久久久久| 成人在线免费公开观看视频| 欧美xxxx老人做受| 亚洲图片视频小说| 黑人欧美xxxx| 久久婷婷一区二区| 中文字幕欧美日韩一区| 极品白嫩丰满美女无套| 国产精品一区二区三区乱码| 人妻有码中文字幕| 亚洲一级影院| 国产又粗又爽又黄的视频| 精品免费在线| 欧美精品久久| 林ゆな中文字幕一区二区| 91亚洲精华国产精华| 午夜无码国产理论在线| 久久久亚洲天堂| 一区二区三区伦理| 久久精品亚洲精品| 91视频在线观看| 亚洲色图25p| 色视频在线观看| 精品粉嫩aⅴ一区二区三区四区| 136福利视频导航| 欧美视频一区二区在线观看| 中文字字幕在线中文| 亚洲成人av电影在线| 麻豆精品一区二区三区视频| 国产精品国产三级国产三级人妇 | 精品成人国产在线观看男人呻吟| 日韩视频中文字幕在线观看| 国产精品国产精品国产专区不片| 免费看91的网站| 久久精品视频免费| 国产一二三四五区| 久久久久99精品一区| 亚洲人成人无码网www国产| 久久这里只精品最新地址| 亚洲av片不卡无码久久| 99九九99九九九视频精品| japanese在线观看| av欧美精品.com| 极品人妻一区二区三区| 久久久综合视频| 中国毛片在线观看| 国产欧美日韩另类一区| 欧美激情亚洲色图| 国产精品视频一二三区| 日本不卡一区视频| 亚洲色大成网站www久久九九| 午夜剧场免费在线观看| 亚洲一区中文在线| 日本三级2019| 色综合视频在线观看| 欧美超碰在线观看| 欧美高清视频不卡网| 99热这里只有精品1| 精品国产亚洲一区二区三区在线观看| 黄色三级网站在线观看| 亚洲欧美资源在线| av中文字幕一区二区三区| 久久久精品电影| 免费在线播放电影| 国产91精品久| 国产91欧美| julia一区二区中文久久94| 凹凸av导航大全精品| 明星裸体视频一区二区| 日韩久久综合| 日本手机在线视频| 首页国产欧美日韩丝袜| 色婷婷激情视频| 99精品视频一区二区三区| 免费一级特黄3大片视频| 亚洲视频你懂的| 国产成人亚洲精品自产在线| 欧美色综合影院| www日本在线| 亚洲午夜精品视频| 在线观看三级视频| 日本韩国欧美精品大片卡二| 91麻豆精品国产综合久久久 | www.国产福利| 91在线丨porny丨国产| 国产免费嫩草影院| 婷婷综合另类小说色区| 国产精品久久777777换脸| 亚洲精品xxxx| 黄色免费网站在线观看| 欧美最猛性xxxxx免费| 国产精品99久久免费| 日本欧美色综合网站免费| 好看的av在线不卡观看| 校园春色 亚洲色图| av欧美精品.com| 东方av正在进入| 日本电影亚洲天堂一区| 亚洲国产精品国自产拍久久| 在线观看免费高清视频97| av手机在线观看| 成人久久久久久久| 国内精品视频在线观看 | av在线中出| 亚洲自拍偷拍网址| 成人羞羞网站入口免费| 日日摸夜夜添一区| av中文字幕在线观看| 日韩美女视频中文字幕| 成人av地址| 男人的天堂成人| 日韩av一级电影| 男男做爰猛烈叫床爽爽小说| 亚洲精品成人少妇| 中文字幕人妻互换av久久| 日韩精品视频在线观看网址 | 免费短视频成人日韩| 91麻豆天美传媒在线| 免费观看成人鲁鲁鲁鲁鲁视频| 一本色道综合久久欧美日韩精品| 亚洲综合精品自拍| 国产美女自慰在线观看| 在线日韩欧美视频| 韩国成人动漫| 久久婷婷开心| 亚洲欧美日韩国产一区| 老司机免费视频| 亚洲一级二级在线| 国产高清第一页| 久久精品国产精品| 伊人久久一区| 亚洲综合首页| 久久机这里只有精品| 国产三级黄色片| 欧美亚洲禁片免费| jizz在线观看| 国产精品视频播放| 日韩精品一区二区久久| 欧美日韩中文不卡| 国产精品免费看片| 亚洲一区二区三区网站| 最近日韩中文字幕中文| 成人国产精品一区二区免费麻豆| 日韩欧美亚洲日产国产| 日本伊人精品一区二区三区观看方式| b站大片免费直播| 在线视频你懂得一区| 福利片在线观看| 国产日韩一区在线| 亚洲精品久久久| 国产人妖在线观看| 午夜成人免费电影| 日本一区视频| 国产精品久久一| 97精品视频| 国产大片一区二区三区| 亚洲黄色性网站| 天天操天天射天天舔| 国产91露脸中文字幕在线| 欧美一级本道电影免费专区| 91av视频免费观看| 一区二区三区日韩在线观看| 人妻精品无码一区二区| 国产成人精品日本亚洲专区61| 波多野结衣在线观看一区二区三区| 一区二区三区 日韩| 亚洲欧美色图小说| 日本美女一级片| 国产ts人妖一区二区三区| 日韩大片在线播放| 美女被爆操网站| 欧美性高潮床叫视频| 视频三区在线| 好吊妞www.84com只有这里才有精品 | 91玉足脚交白嫩脚丫在线播放| 亚洲精品成人在线视频| 日韩在线视频免费观看高清中文 | 精品国产1区二区| 欧美一级大片| 大桥未久一区二区三区| 99riav久久精品riav| 91久久国语露脸精品国产高跟| 久久久最新网址| 成人羞羞视频播放网站| 波多野结衣办公室双飞| 欧美综合久久久| 国产丝袜视频在线播放| 日韩一二三区不卡在线视频| 国产91高潮流白浆在线麻豆| 波多野结衣理论片| 国内揄拍国内精品| 久久久久久久久国产一区| 亚洲天堂网一区二区|