精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

細粒度對齊無需仔細標注了!淘天提出視覺錨定獎勵,自我校準實現多模態對齊

人工智能 新聞
為有效緩解 LVLMs 中的幻覺現象,團隊提出了一種創新的令牌級偏好對齊方法(Token Preference Optimization,TPO),針對性設計了一個能夠自我校準的視覺錨定獎勵信號。

核心作者包括顧紀豪,王瑛瑤。工作由淘天集團算法技術 - 未來生活實驗室團隊主要完成。為了建設面向未來的生活和消費方式,進一步提升用戶體驗和商家經營效果,淘天集團集中算力、數據和頂尖的技術人才,成立未來生活實驗室。實驗室聚焦大模型、多模態等 AI 技術方向,致力于打造大模型相關基礎算法、模型能力和各類 AI Native 應用,引領 AI 在生活消費領域的技術創新。

近年來,視覺大模型(Large Vision Language Models, LVLMs)領域經歷了迅猛的發展,這些模型在圖像理解、視覺對話以及其他跨模態任務中展現出了卓越的能力。然而,隨著 LVLMs 復雜性和能力的增長,「幻覺現象」的挑戰也日益凸顯。

為有效緩解 LVLMs 中的幻覺現象,團隊提出了一種創新的令牌級偏好對齊方法(Token Preference Optimization,TPO),針對性設計了一個能夠自我校準的視覺錨定獎勵信號

該方法首次在多模態偏好對齊領域實現了自動校準獎勵,優化每個令牌生成時與視覺信息的相關性。同時,它也是多模態領域首個無需人工細粒度標注的令牌級偏好優化方法,從而提升了模型的優化效率和自動化水平。

圖片

  • 論文標題:Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation
  • 作者單位:阿里巴巴淘天集團 & MBZUAI
  • 論文鏈接:https://arxiv.org/pdf/2412.14487

背景

現如今的 DPO 方法通過直接對齊人類偏好,在緩解大型視覺語言模型幻覺問題方面取得了顯著成效。然而它仍然面臨兩個問題:

  • 缺少高效和可擴展的 token-level 的獎勵信號:如圖 1 所示,現有的多模態偏好對齊方法要么使用 sequence-level 的獎勵,要么需要通過細粒度標注獲得 token- level 的監督信號。因此,設計一個高效且可擴展的 token-level 的監督信號非常重要。
  • 在訓練的過程中忽略了視覺錨定的 tokens(visual-anchored tokens)對所有 token 分配相同的獎勵是低效的,依賴視覺信息生成的 tokens 更容易產生幻覺并需要重點對待(如圖 2 中的 glass)。

圖片

圖 1:TPO 方法和其它消除幻覺的 DPO 改進方法的對比。比較了是否關注視覺錨定信息,是否生成 token-level 的監督信號和是否需要細粒度標注。比較的方法包括 DPO、POVID、CSR、RLHF-V、V-DPO 和論文中的方法 TPO。

為了解決上述問題,TPO 具有如下特點:

  • 自動識別偏好數據中的視覺錨定 token,無需人工細粒度標注。
  • 在每個訓練步自動地分配 token-level 的獎勵,該獎勵可以反映當前 token 對圖片信息的依賴程度。

圖 2 可視化了 TPO 訓練前后的 ground truth 及模型回復的視覺錨定獎勵。可以看到,我們的方法有效地找到了視覺錨定的 tokens,并能夠在訓練之后增強模型對視覺信息的關聯。

圖片

圖 2:一個視覺 QA 對的例子以及 TPO 對視覺信息錨定程度的打分可視化,上面的框是 GT_answer,下面的框是 LVLM 在使用 TPO 訓練前后的回復。在每一個框中,上方是 TPO 訓練前的打分,下方則是訓練后的打分。

方法

圖片

圖 3:TPO 的整體流程

TPO 整體流程

(以下步驟中的數據包含輸入 x,圖像 v 和正負樣本 y_w,y_l。當不強調正樣本或負樣本時,統稱為 y.)

1. 自校準的視覺錨定獎勵生成

TPO 通過捕捉在圖像是否加噪時每個生成 token 的生成概率差的變化來衡量其視覺錨定程度,首先對輸入圖像進行加噪處理

圖片

這里 ε ∈ N(0,1),圖片 圖片是提前設置好的噪聲參數,是含有 1000 個元素呈等差數列的列表。k 代表加噪步數。

在獲得了加噪圖像之后計算圖片,用來反映每個 token 的視覺錨定程度。它可以在每個訓練步中的自動更新,對于 y 中的每一個 token圖片

圖片

進一步地,在此引入自我校準的過程獲得最終的監督信號。這一步的目的是為正負樣本分配相應獎勵的同時,能夠對二者中所有視覺錨定 token 進行視覺信息關聯度的優化。最終的視覺監督信號被定義為:

圖片

通過 sigmoid 歸一化,圖片。可以看出,對于正樣本,監督信號 c 隨 s 的增大而增大,對于負樣本則相反。由于當 圖片 時,該 token 沒有錨定視覺信息,無監督信號,此時設置 a=0.5, s=0,則 c=1,監督信號將不發揮作用。

TPO 訓練

在獲得了自校準的視覺錨定信號圖片之后,可以根據 DPO 方式定義新的視覺錨定分布

圖片

則反饋函數為:

圖片

其中圖片圖片分別代表來自 policy 模型和 reference 模型的反饋信號。可以看到,相對于原始的 DPO,該團隊在此基礎上為每一個 token 加入了監督信號圖片,而且圖片可以在訓練過程中的每一個 step 中迭代,達到自我校準的目的。

TPO 在反饋函數中引入了圖片,該項可以推導出合理的上下界。由于正負樣本不同的圖片計算方法,在訓練過程中會讓圖片不斷增大,讓模型輸出錨定更多的視覺信息。

最終得到 TPO 的優化目標為:

圖片

實驗結果

實驗設置

  • 基礎模型:LLaVA-1.5(7B)/(13B)。
  • 數據:RLHF-V(5k)。
  • Benchmark:幻覺評測集 AMBER、MMHal、HallusionBench,通用評測集 SeedBench、MMBench、LLaVA-Bench 及 MM-Vet。

主實驗結果

圖片

圖 4:各種強化學習方法在 LLaVA-1.5 上測試的在幻覺和通用 benchmarks 上的實驗效果,其中 POVID 和 CSR 方法的結果是根據開源的模型權重測試的效果,V-DPO 的結果來自該文章的結果。

  • TPO 在 LLaVA-1.5(7B)/(13B)模型上均帶來非常顯著的幻覺緩解效果,在大部分幻覺指標上超越了現有的偏好對齊幻覺緩解方法。
  • 在 HallusionBench 中,easy 代表基于原圖問答,hard 代表基于人工編輯的反事實圖片問答。我們的方相較于初始模型在 hard 問題上取得了更顯著的提高,說明在 TPO 后,答案生成更依賴于視覺信息而非語言模型先驗知識。

消融實驗

  • 圖像加噪的 steps 數量:如圖 5 顯示,加噪步數設置為 500 最優。
  • 獎勵自校準中的 a: a=0.5 最優,即當 s=0 時,c=1 時,不分配獎勵信號。

圖片

圖 5: 各指標隨著加入噪聲步數和參數 a 的變化趨勢

  • 獎勵分配方式:只為正樣本或負樣本單獨引入 TPO 的獎勵,也可取得較優的對齊效果,但同時分配獲得最優表現。調換正負樣本中 token 獲取的獎勵和其視覺錨定程度的相關性,TPO 表現變差。

圖片

圖 6: 消融實驗

分析實驗

  • Attention 分析:圖 7 展示了在 TPO 訓練前后,模型回復中每個 token 對圖像 token 的 attention 分數加和的分布。可以看到,TPO 訓練可以拉高模型回復對圖像信息的關聯程度,錨定更多圖像信息,進而緩解幻覺問題。

圖片圖 7:attention weights 對比圖,左邊藍色的是訓練前模型回答錯誤的回復,右邊紅色的是訓練后模型回答正確的回復。

  • 獎勵自校準分析:圖 8 展示了正負樣本的監督信號 c 隨訓練 step 的變換,證明了 TPO 在不斷自我校準獎勵的過程中,讓模型逐漸關注到更多的圖像信息。

圖片

圖 8: 正負樣本的 c 隨訓練 step 得變化過程

淘天集團算法技術 - 未來生活實驗室團隊將持續深耕強化學習領域,為解決多模態幻覺問題貢獻力量。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-29 09:21:00

2025-02-26 13:00:00

2024-06-20 10:49:15

2022-02-28 10:31:22

人工智能視覺檢測

2024-10-28 14:20:00

2025-02-18 09:10:00

2025-03-25 10:13:26

模型AI數據

2023-12-04 13:40:09

AI訓練

2024-06-27 08:00:00

存儲數據庫細粒度

2023-08-15 14:35:48

2010-04-14 11:04:53

Oracle細粒度

2025-03-12 03:00:00

Finer-CAM醫學影像深度學習

2009-10-27 09:31:24

Windows Ser口令策略

2010-04-19 09:35:58

Oracle細粒度

2009-04-16 17:59:25

細粒度權限

2024-11-04 13:30:00

模型AI

2023-11-09 15:10:00

訓練數據

2025-09-01 08:10:09

細粒度圖像分類細粒度視覺分類FGVC

2024-07-31 15:38:00

2025-10-21 12:40:05

點贊
收藏

51CTO技術棧公眾號

国产伦精品一区二区三区视频免费| 在线成人中文字幕| 久久久久久久午夜| 青青操在线视频| 免费观看在线综合| 久久99精品久久久久久青青91| 天天躁日日躁狠狠躁av| 久久精品女人天堂av免费观看| 中文字幕一区二区三区乱码在线 | 黄色成人免费网| 中文字幕一区二区三区不卡在线| 国产日产精品一区二区三区四区| 日韩国产成人在线| 国产字幕视频一区二区| 中文字幕精品网| 国产精品无码在线| 亚洲三级在线| 一本高清dvd不卡在线观看| 一区二区三区视频在线播放| 欧洲精品久久一区二区| 麻豆国产一区二区| 青青在线视频一区二区三区| 可以直接看的黄色网址| 欧美日韩有码| 精品在线观看国产| 无套内谢丰满少妇中文字幕| 欧美黑人粗大| 黄色成人av在线| 欧美日韩视频免费| 美女av在线播放| 国产日韩欧美一区二区三区乱码 | 午夜宅男在线视频| 性欧美18~19sex高清播放| 亚洲伊人伊色伊影伊综合网| 一区二区日本伦理| 国产二区视频在线观看| 91蜜桃在线观看| 国产高清自拍99| 国产夫绿帽单男3p精品视频| 久久福利视频一区二区| 国产精品亚洲激情| 国产精品久久久久久久久夜色| 日韩午夜黄色| 8050国产精品久久久久久| 久久久久久久中文字幕| 中文字幕免费一区二区| 久久精品国产亚洲精品| 羞羞在线观看视频| 日韩精品二区| 日韩亚洲精品电影| 美国精品一区二区| 成人区精品一区二区婷婷| 亚洲天堂av女优| 91精品人妻一区二区三区| 四虎5151久久欧美毛片| 日韩电影在线观看中文字幕| 欧类av怡春院| 一区二区美女| 亚洲视频欧美视频| 人成免费在线视频| 99re6这里只有精品| 色婷婷综合成人| 免费成年人视频在线观看| 婷婷丁香综合| 欧美日产国产成人免费图片| 精品肉丝脚一区二区三区| 伊人激情综合| 日韩免费观看视频| 国产成人精品亚洲| 久久 天天综合| 1区1区3区4区产品乱码芒果精品| 国产极品久久久| 波多野结衣视频一区| 久久久久久国产精品一区| 韩国福利在线| 中文字幕一区二区三区色视频 | 欧美日本视频在线| 精品亚洲视频在线| 五月亚洲婷婷| 日韩精品在线观看一区| 中文字幕第4页| 久久久9色精品国产一区二区三区| 欧美理论电影在线播放| 欧美不卡视频在线观看| 日韩电影在线观看一区| 成人日韩在线电影| 天天舔天天干天天操| 久久精品一级爱片| 免费在线精品视频| 白浆在线视频| 欧美性受xxxx黑人xyx性爽| 欧美国产日韩另类| 日韩欧美美女在线观看| 中文字幕亚洲一区二区三区| 日韩欧美国产成人精品免费| 1024成人| 91亚洲一区精品| 深夜福利视频在线观看| 综合婷婷亚洲小说| 波多野结衣家庭教师在线| 日本免费成人| 亚洲女同性videos| 麻豆亚洲av熟女国产一区二| 三级欧美在线一区| 99在线看视频| 亚洲s色大片| 精品久久久一区| 欧洲美女亚洲激情| 色综合综合色| 久久免费国产视频| 国产视频在线免费观看| 久久久亚洲精品石原莉奈| 黄色片免费在线观看视频| 台湾佬成人网| 亚洲国产一区自拍| 国产精品免费人成网站酒店| 久久久久国产一区二区| 国产伦精品一区二区三区免费视频 | 国产一国产二国产三| 美女网站色91| 欧美日韩一区二区三区在线视频 | 久久综合之合合综合久久| 一本久久精品一区二区| 成年人小视频在线观看| 综合天堂av久久久久久久| 国产精品美女久久| 久久米奇亚洲| 精品国产91久久久久久| 亚洲女则毛耸耸bbw| 欧美在线91| 国产在线观看精品| yw193.com尤物在线| 日韩欧美主播在线| 久久久久久久无码| 亚洲国产欧美国产综合一区| 爱情岛论坛亚洲入口| 国产剧情在线| 欧美久久久久久久久中文字幕| jizz中文字幕| 日韩成人一区二区| 任我爽在线视频精品一| 色综合亚洲图丝熟| 日韩精品视频免费在线观看| 精品成人免费视频| 99国产精品久久| 日本午夜激情视频| 欧美亚洲tv| 欧美诱惑福利视频| 欧美3p视频在线观看| 日韩欧美在线免费| a级在线免费观看| 日日摸夜夜添夜夜添精品视频| 美女精品国产| 女生影院久久| 中文字幕精品国产| 国产一区二区三区四区视频 | 欧美一区二区三区久久久| 久久日一线二线三线suv| 欧美 激情 在线| 蜜臀久久99精品久久一区二区| 欧洲一区二区视频| 成人在线观看免费| 欧美日韩精品三区| 日韩视频中文字幕在线观看| 国产69精品久久久久777| 日韩精品在线观看av| 黄色成人美女网站| 欧美最猛性xxxx| 69av亚洲| 精品精品欲导航| 国产精品男女视频| 国产精品天干天干在线综合| 久久婷婷中文字幕| 一区二区日本视频| 亚洲欧美精品| 日韩综合一区二区三区| 庆余年2免费日韩剧观看大牛| 九色视频成人自拍| 6080午夜不卡| 国产 日韩 欧美 在线| 中文字幕av不卡| 少妇欧美激情一区二区三区| 国产亚洲精品bv在线观看| 日本一区二区三区免费观看| 成人永久在线| 欧美孕妇性xx| aaa大片在线观看| 亚洲精品视频久久| 在线播放精品视频| 亚洲成人777| 美国一级黄色录像| 成人黄页毛片网站| 国产高潮免费视频| 激情久久五月| 成人毛片在线观看| 老司机精品福利在线观看| 国产极品久久久久久久久波多结野| 久久影院模特热| 手机亚洲第一页| 欧美一级日韩一级| 亚洲 欧美 日韩 在线| 亚洲精品国产a久久久久久| 国内精品久久99人妻无码| 国精产品一区一区三区mba视频 | 欧产日产国产v| 久久嫩草精品久久久久| 无码人妻少妇色欲av一区二区| 亚洲欧美日韩专区| 亚洲精品天堂成人片av在线播放 | 免费毛片网站在线观看| 首页国产精品| 欧美成人第一区| 高清日韩中文字幕| 成人欧美在线视频| 欧美日韩女优| 555www成人网| 97人澡人人添人人爽欧美| 麻豆成人在线看| 99re在线视频| 亚洲人在线观看| 同心难改在线观看| 精品国产精品网麻豆系列| 国产精品一品二区三区的使用体验 | 国产欧美自拍视频| 91偷拍一区二区三区精品| 茄子视频成人在线观看| 欧美黄色录像| 国产精品推荐精品| а√中文在线天堂精品| 91美女片黄在线观看游戏| 成人国产网站| 国产精品7m视频| 唐人社导航福利精品| 日本一区二区在线播放| 瑟瑟视频在线看| 26uuu另类亚洲欧美日本一| 1234区中文字幕在线观看| 精品少妇一区二区30p| 国产黄色小视频在线| 久久精品夜夜夜夜夜久久| 91社区在线| 中文字幕精品一区二区精品| 97电影在线看视频| 一本色道久久88综合日韩精品| 国产高清在线| 色偷偷噜噜噜亚洲男人| 午夜在线视频| 久久韩剧网电视剧| 大地资源网3页在线观看| 久久中文久久字幕| 国产一区久久精品| 色综合久综合久久综合久鬼88| 91极品在线| 久久久久久久久久久av| 多野结衣av一区| 2021久久精品国产99国产精品| 一区二区精品伦理...| 欧美在线免费视频| 成人在线爆射| 国产成人av福利| 2019中文字幕全在线观看| 亚洲区一区二区三区| 大奶一区二区三区| 国产伦理一区二区三区| 欧美调教网站| 日本不卡在线播放| 日韩午夜电影网| 中文字幕第50页| 亚洲欧洲一区| 日本成人中文字幕在线| 精品一区二区日韩| 国产精久久久久| 91色九色蝌蚪| 国产精品一区二区亚洲| 一区二区三区日本| 国内免费精品视频| 在线视频亚洲一区| 国产理论片在线观看| 精品国内二区三区| 国产三级视频在线播放线观看| 中文字幕在线日韩 | 一区二区三区欧美日韩| 国产乡下妇女做爰| 欧美四级电影网| 午夜久久久久久久久久| 国产视频精品自拍| 日本不卡不卡| 18一19gay欧美视频网站| 久久久久黄色| 国产精品一级久久久| 精品免费视频| 免费拍拍拍网站| 男女男精品视频网| 无码成人精品区在线观看| 国产拍揄自揄精品视频麻豆| 精国产品一区二区三区a片| 欧美特级www| av一级黄色片| 在线观看久久久久久| 搞黄网站在线看| 国产精品视频免费观看www| 红杏成人性视频免费看| 伊人久久大香线蕉精品| 国产精品日韩久久久| 日韩精品视频网址| 国产色一区二区| 精品亚洲永久免费| 欧美日韩一区二区在线观看视频 | 99视频一区二区三区| 肉色超薄丝袜脚交69xx图片| 欧美午夜电影在线| 丰满岳乱妇国产精品一区| 中文字幕日韩欧美精品在线观看| 成人黄色动漫| 风间由美一区二区三区| 欧美独立站高清久久| 不要播放器的av网站| 国产精品18久久久久久久久久久久| av男人的天堂av| 精品久久久久久国产91| 亚洲va天堂va欧美ⅴa在线| 正在播放欧美一区| 97成人资源| 韩国一区二区三区美女美女秀| 亚洲精品一二三区区别| www.色偷偷.com| 久久久久久亚洲综合| 特一级黄色大片| 亚洲成在人线av| 四虎av在线| 97在线电影| 午夜久久99| 免费看的av网站| 亚洲视频免费在线| 国产精品久久久久久久久久久久久久久久久久 | 色阁综合av| 日韩福利电影在线观看| 亚洲精品乱码久久久久久久久久久久| 亚洲mv在线观看| 无码精品人妻一区二区三区影院 | 亚洲精品77777| 亚洲国产免费av| 国产盗摄——sm在线视频| 国内不卡一区二区三区| 在线日韩欧美| 国产呦小j女精品视频| 欧美日韩在线视频一区| 亚洲 另类 春色 国产| 欧美一级片在线播放| 精品中文字幕一区二区三区av| av免费在线播放网站| 欧美国产在线观看| 中文字幕在线网址| xxx一区二区| 日韩一二三区在线观看| 日韩精品一区二区在线视频| 高清不卡一区二区| 日本在线视频免费| 国产丝袜视频一区| 成人天堂yy6080亚洲高清| 日韩成人在线资源| 九九在线精品视频| 劲爆欧美第一页| 精品调教chinesegay| 四虎成人在线| 成年人黄色在线观看| 成人午夜免费电影| 日韩黄色在线播放| 中文字幕日韩专区| 免费一级欧美片在线观看网站| 欧美一级爱爱视频| 97久久超碰国产精品电影| 69亚洲精品久久久蜜桃小说| 色999日韩欧美国产| 久久精品免视看国产成人| 国产3p露脸普通话对白| 国产日韩精品视频一区| 国产熟女一区二区三区四区| 97国产精品免费视频| 日韩电影免费网站| 白丝校花扒腿让我c| 色综合视频一区二区三区高清| 日韩伦理在线观看| 国产日韩欧美一区二区| 日本午夜精品一区二区三区电影| 欧美 日韩 国产 一区二区三区| 亚洲国产成人在线视频| 999国产精品亚洲77777| 日韩欧美一级在线| 久久先锋影音av| 999av视频| 国产精品91一区| 欧美激情1区2区| 国产免费一区二区三区网站免费| 日韩一区二区不卡| 91精品韩国| 欧美视频在线观看视频 | 久久久精品99| 一区二区在线免费视频| 国产精品17p|