精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM面經——多模態大模型訓練中”模態懶惰“問題如何解決?

發布于 2025-6-24 06:03
瀏覽
0收藏

MLLM中”模態懶惰“和”模態偏差“問題常見解決方案總結。

本篇繼續說明MLLM中多模態對齊的難點以及現有的解決方法,本系列要說明的主要難點有:

  • 多模態數據構建
  • 跨模態差異影響融合效果
  • 模態對齊評估效率比較低

上一篇中講到了多模態數據構建的難點和解決方法,???大模型面經——MLLM中模態對齊有哪些難點?有什么解決方法???

本篇開始總結跨模態差異影響融合效果部分。具體來說就是不同模態特征分布差異顯著(如圖像與文本的嵌入空間不匹配),會阻礙深度融合從而影響MLLM的效果。

這塊部分在多模態學習中也叫“模態懶惰”問題。在多模態學習中,不同的數據模態(如文本、圖像、音頻等)可能在信息貢獻上存在不平衡,導致一些模態在學習過程中顯得更為主導,而其他模態則被忽視,這種現象就被稱為模態懶惰。這會導致多模態學習系統的性能不佳。

另外除了“模態懶惰”外,“模態偏差”也常常跟著被一起提到,MLLMs在處理多模態數據時,往往會過度依賴于某一模態(如語言或視覺),而忽視其他模態中的關鍵信息,從而導致模型生成不準確或不相關的回答。目前這種模態偏差主要表現為語言偏差(language bias)和視覺偏差(vision bias)。

  • 語言偏差:比如在回答“熊的顏色是什么?”時,模型可能基于大多數熊是棕色的常識,忽略了輸入圖像中顯示的北極熊是白色的。
  • 視覺偏差:指模型過度關注圖像細節,而忽略了文本問題的真正意圖。例如,在回答“房子在左邊嗎?”時,模型可能提供了過多的圖像細節,而沒有準確理解文本問題。體現出來可能覺得模型回答過于冗余但并沒有回答到點上。

下面是具體的解決方法,主要分為訓練方式、算法設計和訓練數據分布優化。

訓練方式這里就不做贅述了,比較常見的是漸進式解凍訓練:先fix住某一模態編碼器權重,再訓練另一模態權重,最后全網絡整體訓練。

本篇主要講述算法細節設計和訓練數據分布優化的詳細內容,下面是一個快捷目錄。

一、算法細節設計

1. 最小化模態間投影誤差

2. 模態間交叉引導融合不同模態特征差異

二、訓練數據分布優化

1. 在不同模態的不同語義層級設計對齊約束

2. 主動學習實現更平衡的數據選擇

3.  引導偏好優化(BPO),懲罰某一模態的依賴行為

注意這里的訓練數據優化相對于于上一篇中的數據構建有所區別,主要強調基于已有數據進行分布優化以及不同模態鏈接,更便于緩解跨模態差異實現深度融合。

算法細節設計

1. 最小化模態間投影誤差(如文本→圖像映射的均方誤差)

結合最優傳輸理論(Optimal Transport)建模分布對齊,解決語義密度差異問題。

這里舉一個ICLR 2024的論文《Multimodal Representation Learning with Alternating Unimodal Adaptation》的例子。這篇論文提出了一種名為MLA(Multimodal Learning with Alternating Unimodal Adaptation)的方法:

LLM面經——多模態大模型訓練中”模態懶惰“問題如何解決?-AI.x社區

主要包括下面四個核心步驟,筆者覺得實際中都很實用。

1) 交替單模態學習:把傳統的多模態聯合優化過程轉變為交替的單模態學習過程。在每個訓練步驟中,只優化一個模態的編碼器,從而減少模態之間的干擾,使每個模態都能獨立地被優化。

2)共享頭部:每個模態獨立優化,但用一個跨所有模態的共享頭部來捕獲跨模態的交互信息。共享頭部在不同模態之間持續優化,有助于整合多模態信息。

3)梯度修改機制:為了防止共享頭部在遇到新模態時丟失之前學習到的信息(即模態遺忘問題),通過正交化梯度方向來減少不同模態之間的干擾。

4)推理階段動態模態融合:在inference階段,基于不確定性的模型融合機制來整合多模態信息;評估每個模態在預測中的重要性,并根據這個評估來分配權重,然后結合所有模態的預測結果。

2. 模態間交叉引導融合不同模態特征差異

比較常見的是跨模態交叉注意力(Cross-modal Cross-Attention)顯式建模不同模態特征的融合,Query來自一模態,Key/Value來自另一模態;或者基于輸入內容自適應調整各模態貢獻權重,抑制低質量模態噪聲。

另外時間與空間交叉引導對齊也開始有一些論文在提到:

CVPR 2025中的論文《Magma: A Foundation Model for Multimodal AI Agents》中的預訓練學習任務SoM和ToM。

Set-of-Mark (SoM) for Action Grounding,在圖像中標注可操作區域(如 GUI 中的可點擊按鈕),幫助模型學習如何定位和識別這些區域;在每個圖像中,提取一組候選區域或點,并在這些位置上標注數字標簽,形成一個新的標記圖像。模型需要從這些標記中選擇正確的標記,從而顯著簡化了行動定位任務。

Trace-of-Mark (ToM) for Action Planning,在視頻中標注動作軌跡,幫助模型學習如何預測未來的動作。在視頻序列中,提取每個幀中的標記位置,并預測這些標記在未來幀中的軌跡。這不僅使模型能夠理解視頻中的時間動態,還能“提前規劃”未來的動作。

訓練數據分布優化 

1. 在不同模態的不同語義層級設計對齊約束

論文《DenseFusion-1M: Fusing Multi-visual Experts for Fine-grained Understanding》提出了一種名為“Perceptual Fusion”的方法,使用低成本但高效的字幕引擎生成詳盡準確的圖像描述,便于生成不同語義粒度的更高質量的圖像-文本數據集。

有一個非常關鍵的視覺專家集成(Mixture of Visual Experts),可以利用多種視覺專家模型來提供圖像理解的中間信息。視覺專家一共包括下面四類:

  • 圖像標注模型(Image Tagging Model):提供場景級別的理解。
  • 目標檢測模型(Object Detection Model):精確檢測圖像中的物體。
  • 文本識別模型(Text Recognition Model):識別圖像中的所有文本元素。
  • 世界知識(World Knowledge):提供背景信息和細節,增強模型的知識密度。

LLM面經——多模態大模型訓練中”模態懶惰“問題如何解決?-AI.x社區

那么在做對齊的時候從局部和全局入手,局部可以對齊圖像區域與文本單詞(如目標檢測框與名詞短語);從全局對齊整體圖像與句子語義,避免細節丟失。

2. 主動學習實現更平衡的數據選擇

LLM面經——多模態大模型訓練中”模態懶惰“問題如何解決?-AI.x社區

這里之前的文章也有提過,使用Shapley值來估計每個模態對最終多模態預測的貢獻,不需要真實標簽。

通過計算模型輸出(即預測概率)在包含和不包含某個模態特征時的變化,來估計該模態特征的邊際貢獻,然后對所有可能的子集選擇取平均值,從而得到該模態的Shapley值。

論文《Towards Balanced Active Learning for Multimodal Classification》  把模態貢獻定義為該模態的Shapley值的絕對值與所有模態的Shapley值絕對值之和的比值。并且提出了三個原則:

1)優先選擇貢獻更平衡的樣本:如果兩個多模態數據樣本的傳統主動學習(CAL)策略的獲取分數相等,那么具有更平衡單模態貢獻的樣本應具有更高的平衡多模態主動學習(BMMAL)策略的獲取分數。

2)減少強模態和弱模態數據樣本平均獲取分數的差距:為了避免偏向強模態的數據選擇,應減少強模態主導的數據樣本和弱模態主導的數據樣本之間的平均獲取分數的差距。

3)保持模態貢獻與獲取分數的正比關系:為了防止偏向弱模態的數據選擇,需要確保每個模態對獲取分數函數的貢獻與其對模型輸出在樣本級別的貢獻成正比。

因此在訓練時結合此原則可以調整訓練方法進行選擇:

1)調整梯度嵌入:首先計算多模態分類器的梯度嵌入,然后根據每個模態的貢獻比例,分別對每個單模態的梯度嵌入進行縮放。具體來說,對于兩個模態的情況,如果一個模態的貢獻大于另一個模態,那么其對應的梯度嵌入會被乘以一個權重,該權重小于1且與模態貢獻的差異成正比。這樣,不平衡的樣本的梯度嵌入的幅度會被抑制,從而降低它們被K-Means++算法選擇的可能性。

2)樣本選擇:最后,使用K-Means++算法對調整后的梯度嵌入進行聚類,選擇具有顯著影響的多樣化多模態數據樣本用于模型訓練。

3.  引導偏好優化(BPO),懲罰某一模態的依賴行為

可以通過引入擾動來減少某些模態的信息內容,迫使模型在生成負面響應時依賴特定模態。比如前面提到的兩個”模態偏差“的例子,棕色的北極熊和對于”房子在左邊嗎?“問題的不精準回答,把這些生成的偏差響應都作為負面樣本,形成了一個新的偏好優化數據集。

論文 《 Debiasing Multimodal Large Language Models via Noise-Aware Preference Optimization》提出了噪聲感知偏好優化算法(NaPO)動態識別噪聲數據并減少對這些樣本的優化權重。具體實現如下:

1)結合MAE和BCE:NaPO通過負Box-Cox變換將DPO中的二元交叉熵(BCE)與噪聲魯棒的平均絕對誤差(MAE)結合起來。BCE收斂速度快但容易過擬合噪聲數據,而MAE具有更好的噪聲魯棒性但收斂速度慢。通過調整噪聲魯棒性系數q,可以在兩者之間取得平衡。

2)動態調整噪聲魯棒性系數:基于數據噪聲水平動態調整q,通過分析數據的獎勵邊際(reward margin),可以評估數據的質量,并據此調整q的值。具體公式為:

LLM面經——多模態大模型訓練中”模態懶惰“問題如何解決?-AI.x社區

其中,ψ(x,yw,yl)是獎勵邊際公式,α是歸一化因子,σ是sigmoid函數。通過這種方式,NaPO能夠根據數據的噪聲水平自適應地調整其噪聲魯棒性。

需要注意的是,不同模態的數據融合的處理方法存在較大差異,比如文本與圖像、圖像與點云、視頻與軌跡等,細分領域的專業性較強;本篇只總結了一些比較常見的方法。


本文轉載自??瓦力算法學研所??,作者:喜歡瓦力的卷卷

已于2025-6-24 06:03:37修改
收藏
回復
舉報
回復
相關推薦
在线观看电影av| 国产区一区二区三| 成人污版视频| 亚洲成人免费影院| 欧美午夜精品久久久久免费视| 免费在线观看毛片网站| 91动漫在线看| 四虎永久在线精品免费网址| 美女视频一区免费观看| 久久精品国产亚洲精品2020| 波多野结衣办公室双飞| 日韩欧美一区二区三区在线观看| 亚洲欧美aⅴ...| 欧美日韩国产一二| 精品国精品国产自在久不卡| 久久精品盗摄| 欧美肥老妇视频| 久久久久无码精品国产sm果冻| 亚洲国产高清在线观看| 在线免费观看日本一区| 精品久久久无码人妻字幂| 毛片免费在线播放| 国产成人日日夜夜| 国产精品久久不能| 久久不卡免费视频| 欧美视频网站| 日韩一区二区三区国产| 亚洲av成人片无码| 二区三区精品| 一本色道综合亚洲| www.国产在线播放| a视频在线观看免费| 亚洲国产高清aⅴ视频| 久久久久久久免费| 性欧美18一19性猛交| 免费观看成人鲁鲁鲁鲁鲁视频| 欧美诱惑福利视频| 国产在线综合网| 欧美1区视频| 久久福利视频网| 国产综合福利在线| 一级黄色高清视频| 成人在线高清| 在线亚洲一区观看| 亚洲人成色77777| 日韩欧美精品一区二区三区| 亚洲香肠在线观看| 黄色录像特级片| 精品视频在线一区二区| 最新日韩在线视频| 免费观看黄色的网站| 五月婷婷在线视频| 中文字幕制服丝袜成人av| 日产中文字幕在线精品一区 | a级大胆欧美人体大胆666| 亚洲精品日日夜夜| 成人污网站在线观看| 成人在线播放| 亚洲女同ⅹxx女同tv| 亚洲欧洲一二三| 成人影视在线播放| 国产亚洲女人久久久久毛片| 精品欧美一区二区在线观看视频 | 日本黄色网址大全| 日韩高清在线观看一区二区| 欧美老女人在线| 污污的网站免费| 日韩一区中文| 欧美日韩美女一区二区| 最新中文字幕免费视频| 日本在线精品| 欧美系列日韩一区| www.亚洲高清| 日本免费一区二区三区等视频| 在线免费观看日本欧美| 亚洲无吗一区二区三区| 精品一区二区三区四区五区| 日韩一卡二卡三卡四卡| 性色av浪潮av| 成人h动漫精品一区二区器材| 91在线看国产| 欧美日韩美女一区二区| 精品人妻一区二区三区四区在线| 成全电影大全在线观看| 亚洲成人黄色影院| 激情综合在线观看| av在线日韩| 欧美午夜精品久久久久久久| 男女爽爽爽视频| 性欧美video另类hd尤物| 日韩欧美久久久| 国产a级黄色片| 一本色道久久综合亚洲精品酒店 | 蜜桃精品wwwmitaows| 亚洲一级片在线看| 91免费在线看片| 欧美深夜福利| 茄子视频成人在线| 一本大道伊人av久久综合| 国产精品一区二区不卡| 久久99精品久久久久子伦 | 日本成人在线网站| 日韩免费福利电影在线观看| 岛国精品资源网站| 欧美精品色图| 久久99精品视频一区97| 中文字幕视频网| 国模一区二区三区白浆| 久久国产日韩欧美| 日本在线www| 亚洲国产成人tv| 国产白丝袜美女久久久久| 色成人综合网| 亚洲精品在线看| 亚洲怡红院在线观看| 亚洲电影在线| 国产精品自在线| 欧美一区二区公司| 国产精品夫妻自拍| 国产在线精品91| 日韩亚洲国产免费| 亚洲欧美国产视频| 久久免费视频精品| 精品亚洲aⅴ乱码一区二区三区| jlzzjlzz国产精品久久| 成人黄色免费看| 欧美一级在线免费观看| 专区另类欧美日韩| 丰满少妇被猛烈进入高清播放| 亚洲三级电影| 亚洲欧美成人在线| 国产在线一二区| 国产一区二区三区久久悠悠色av | 亚洲黄色小说网| 欧美激情资源网| 黄色一级片在线看| 一区中文字幕| 久久精品国产一区二区三区 | 91久久午夜| 成人欧美一区二区三区黑人| 黄色片在线看| 亚洲v精品v日韩v欧美v专区| 99国产精品久久久久久| 狠狠综合久久av一区二区蜜桃| 欧美激情一二三| 国产欧美综合视频| 国产精品久久午夜| 黄色av免费在线播放| 九九综合久久| 日本成人黄色片| 欧美综合视频在线| 亚洲一区二区三区视频在线播放 | 国精品**一区二区三区在线蜜桃| 日韩高清国产一区在线观看| 亚洲一级少妇| 日韩成人高清在线| 久青草免费视频| 国产mv日韩mv欧美| 欧美中文字幕在线观看视频| 成人黄色理论片| 久久精品国产免费观看| 91片黄在线观看喷潮| 中文字幕中文字幕在线一区 | 日韩欧美久久久| 丰满少妇被猛烈进入一区二区| 久久超碰97人人做人人爱| 亚洲欧洲三级| 日韩精品一区二区三区不卡| 操欧美女人视频| 久久久久久亚洲精品不卡| 国产成人自拍一区| 亚洲第一激情av| 成人区人妻精品一区二 | 国产手机免费视频| 欧美日韩另类图片| 青草热久免费精品视频| 日本一二三区在线视频| 色婷婷综合久久久久中文一区二区 | 日韩欧美久久一区| 久久精品国产亚洲AV无码男同| 成人激情文学综合网| 丁香花在线影院观看在线播放| 九九热hot精品视频在线播放| 2019中文字幕免费视频| 黄色电影免费在线看| 天天射综合影视| 日本午夜精品视频| 国产成人综合视频| 国产高清精品在线观看| 青青草国产免费一区二区下载| 国产日韩一区在线| 性爱视频在线播放| 亚洲第一视频网站| 无码人妻av一区二区三区波多野 | 欧美亚洲尤物久久| a一级免费视频| 成人免费看视频| 欧美精品aaaa| 91精品婷婷色在线观看| 91九色在线免费视频| 女厕盗摄一区二区三区| 中文字幕在线观看日韩| 国产人妖一区二区三区| 亚洲福利视频一区| 日韩丰满少妇无码内射| 国产综合色在线| 男人的天堂99| 欧美国产三级| 秋霞毛片久久久久久久久| 老司机精品视频网| 国内精品免费午夜毛片| a天堂中文在线| 亚洲成人av在线| 欧美视频亚洲图片| 久久久久久国产精品免费无遮挡| 欧美一二区视频| 免费无码国产精品| 亚洲午夜av在线| 天堂网中文在线观看| av中文字幕亚洲| www.com黄色片| 久久精品一区二区三区中文字幕 | 先锋资源在线视频| 久久只有精品| 亚洲国产成人精品无码区99| 欧美gay男男猛男无套| 国产精品xxxx| 日韩中文字幕一区二区高清99| 国产精品69久久久久| 高清全集视频免费在线| 深夜福利一区二区| 国产小视频在线| 亚洲精美色品网站| www.日日夜夜| 欧美精品日韩综合在线| 日本黄色中文字幕| 欧美视频13p| 国产一级大片在线观看| 亚洲三级电影全部在线观看高清| 久久人人爽人人人人片| 成人在线视频一区| ass极品水嫩小美女ass| 麻豆精品一区二区| 国产一级特黄a大片免费| 先锋亚洲精品| 国产av麻豆mag剧集| 亚洲私人影院| 国产91沈先生在线播放| 重囗味另类老妇506070| 日韩精品一区二区三区外面| 精品国产91| 日本精品二区| 欧美人与牛zoz0性行为| 欧洲亚洲一区二区三区四区五区| 丝袜av一区| 久久精品欧美| 欧美1区2区3区4区| 91久久精品一区二区别| 国产亚洲精aa在线看| 成人免费黄色网| 经典三级久久| 91青青草免费在线看| 日韩08精品| 成人久久一区二区| 日韩欧美中文在线观看| 97人人模人人爽视频一区二区 | 无码av免费一区二区三区试看| 国产精品一二三在线观看| 亚洲天堂网在线视频| 在线免费观看成人短视频| 中文字幕日本人妻久久久免费| 欧美日韩一区精品| 国产美女www爽爽爽视频| 欧美一二三四区在线| www.天堂在线| 亚洲精品久久久一区二区三区| 天天操天天干天天| 亚洲欧美在线看| aaa在线观看| 久久成人亚洲精品| 日韩av一卡| 国产精品丝袜高跟| 亚洲1区在线| 97人人澡人人爽| 亚洲免费福利一区| 亚洲精品国产精品久久| 亚洲区综合中文字幕日日| 欧美 日韩 国产精品| 国产日韩欧美一区在线| 女人另类性混交zo| 日本午夜精品视频在线观看| 老女人性生活视频| 国产亚洲综合av| 国产精品久久国产精麻豆96堂| 亚洲精品欧美专区| 你懂的国产在线| 欧美日韩高清影院| 国产 日韩 欧美 精品| 亚洲人线精品午夜| 成人在线播放| 性日韩欧美在线视频| 97精品国产99久久久久久免费| 51国产成人精品午夜福中文下载| 卡通动漫国产精品| 自拍偷拍99| 99热在线精品观看| theporn国产精品| 国产成人av网站| av直播在线观看| 国产精品初高中害羞小美女文| 九九九国产视频| 欧美性做爰猛烈叫床潮| 日本精品999| 色噜噜亚洲精品中文字幕| 国产美女高潮在线观看| 国产视频观看一区| 麻豆精品99| 久久久久久久久久久久久国产| 乱人伦精品视频在线观看| 午夜激情视频网| 欧美激情在线观看视频免费| 国产无遮挡又黄又爽又色| 777亚洲妇女| 国产精品久久一区二区三区不卡| 欧美裸体xxxx极品少妇| 天然素人一区二区视频| 好吊色欧美一区二区三区四区| 久久密一区二区三区| 色综合av综合无码综合网站| 国产成人福利片| 日本在线一级片| 日本不卡免费一区| 看欧美日韩国产| 欧美女激情福利| 亚洲精品永久视频| 久久欧美中文字幕| 久久久久久久久影院| 欧美大片日本大片免费观看| 久久bbxx| 国产精品网站入口| 国产欧美日韩精品一区二区免费| 东北少妇不带套对白| 国内精品写真在线观看| 久久嫩草捆绑紧缚| 欧美日韩精品一区视频| 国产高清视频免费最新在线| 欧美一级电影久久| 国产亚洲成av人片在线观黄桃| 天天干天天色天天爽| 精品一区二区三区免费视频| 毛片久久久久久| 91激情五月电影| 精华区一区二区三区| 日本高清视频一区| 久久不见久久见国语| 日韩网址在线观看| 国内精品国产三级国产a久久| 欧美日韩综合一区二区| 日韩欧美不卡在线观看视频| 黄色小网站在线观看| 51蜜桃传媒精品一区二区| 综合一区在线| 国产成人精品综合久久久久99| 一区二区在线观看av| 亚洲成人黄色片| 97精品在线视频| 欧美一区二区三区久久| 日韩精品视频久久| 国产色产综合产在线视频| 无码一区二区三区| 久久国内精品一国内精品| 久久国产精品免费一区二区三区| 欧美日韩视频免费在线观看| 国产一区二区精品久久| 国产精品theporn动漫| 精品在线小视频| 国产精品无码久久久久| 日韩中文字幕亚洲精品欧美| 国产不卡视频在线观看| 91蜜桃视频在线观看| 亚洲欧美日韩在线高清直播| av在线一区不卡| 黄色一级片网址| 成人h精品动漫一区二区三区| 欧美日韩综合一区二区三区| 久久电影一区二区| 精品视频自拍| 黄色av免费在线播放| 国产精品久久久久久一区二区三区 | 大奶一区二区三区| 午夜激情在线观看视频| 亚洲天堂免费看| 日本高清视频免费观看| 国产ts一区二区| 91久久电影| 亚洲调教欧美在线| 欧美一区二区三区四区五区| 日韩深夜视频| 免费久久久久久| 久久这里只精品最新地址|