精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta斯坦福全新多模態Apollo,60分鐘視頻輕松理解!7B性能超越30B

人工智能 新聞
Meta斯坦福大學聯合團隊全面研究多模態大模型(LMM)中驅動視頻理解的機制,擴展了視頻多模態大模型的設計空間,提出新的訓練調度和數據混合方法,并通過語言先驗或單幀輸入解決了已有的評價基準中的低效問題。

雖然語言和圖像語言建模進展迅速,但視頻多模態大模型(LMM)卻難以望其項背。

近日,Meta和斯坦福大學的團隊聯手,從評估基準、模型設計到開源模型, 做出了全方位的探索,創建ApolloBench用于解決視頻理解領域評估效率低下的問題, 提出了模型設計的拓展一致性,發現了驅動LMM性能的關鍵因素,開源了Apollo模型。

值得注意的是,Apollo-3B超越了幾乎所有的7B模型,而Apollo-7B變體則是7B模型中目前最佳的。

圖片

論文鏈接: https://arxiv.org/abs/2412.10360

項目網站: https://apollo-lmms.github.io

示例鏈接: https://huggingface.co/spaces/Apollo-LMMs/Apollo-3B…

模型鏈接: https://huggingface.co/Apollo-LMMs

圖片

現有的視頻問答基準的有效性如何?

視頻大型多模態模型(video-LMMs)的快速發展推動了眾多視頻問答基準的建立,其中包括Video-MME、MLVU、LongVideoBench等。雖然這些基準能夠進行全面評估,但也會帶來大量的資源密集和冗余。

該團隊通過篩選問題,確定了五大時態感知類別:時態OCR、第一視角、空間、感知和推理。

然后,將問題手動歸入這些類別中的每一類。從這些類別中選出了前400個問題,并對每個問題進行人工驗證,以驗證所選問題的正確性。

在ApolloBench上進行評估要快 41 倍,同時與現有基準高度相關(見圖1的右圖 ),并且受視頻感知的影響更大(圖1的左圖 )。

新提出的基準ApolloBench與所有測試過的基準都高度相關,這表明它能提供同樣有效的評估,同時計算效率更高。

圖片

圖1:基準分析。(左圖)當提供不同輸入模式時,開源 LMM 在各種視頻問題解答基準測試中的準確率:完整視頻(綠條)、視頻中的單幀(紅條)和不含任何視覺內容的純文本輸入(藍條)。(右圖)相關矩陣通過說明模型在不同基準上的表現之間的相關系數,顯示了基準之間的冗余度

圖1中的左圖的淺藍色陰影區域表示視頻和文本輸入之間的準確率差異,突出了視頻感知比單純的文本理解在多大程度上提高了性能;黃色陰影區域表示視頻和圖像輸入之間的差異,量化了視頻與靜態圖像相比所帶來的時間信息的額外優勢。

圖1中右圖的矩陣中的每個單元格表示兩個基準在模型性能方面的密切程度。

拓展一致性:在模型設計中能做到多???

通過研究不同規模 LMM 的設計決策之間的相關性,發現規模 (約等于2-4B) 模型的設計決策與更大模型的設計決策高度相關(相關系數大于0.9),將這種現象稱為「規模一致性」(Scaling Consistency)(見下圖 2)。

圖片

圖2:擴展一致性

左圖展示7B和0.5B與其他規模的LLM的相關系數,表明7B模型的相關性隨著LLM規模的增大而增大,而在0.5B模型中沒有看到同樣的趨勢。

右圖展示0.5B\1.5B\4B模型與數據集規模的相關系數。相關系數在500K樣本左右開始趨于穩定。

擴展一致性表明,在中等規模的模型(~ 2-4B)和數據集上做出的設計決策可以可靠地轉移到更大的模型上,即使在不同的模型族中也是如此。

數據集上做出的設計決策可以可靠地轉移到更大的模型上,甚至在不同的模型族中也是如此。這使研究人員無需進行大量的擴展研究就能做出明智的設計選擇。

擴展一致性,即可以在較小的模型和數據集上做出設計決策,并可靠地遷移到較大的模型和數據集上。

探索設計空間:什么影響高效的模型設計

1. 視頻采樣

為了評估幀速率與均勻采樣的影響,訓練了四個模型,分別均勻地8、16、32 或 64 幀采樣。

為了測試性能差異是由于測試還是訓練時的幀采樣不同造成的,對這些模型進行了均勻采樣和fps采樣評估。

與fps采樣相比,均勻幀采樣的性能始終低于fps采樣(圖3中的左圖)??梢钥闯?,這種性能差距并不是由于測試時采樣的幀數。因此得出結論,視頻的均勻幀采樣導致了訓練過程中的性能差距。

在模型訓練和推理過程中,fps采樣比均勻采樣更可取。

圖片

圖3:比較不同的取樣策略及其對性能的影響。(左圖)模型使用均勻采樣進行訓練和測試。(中圖)使用均勻采樣訓練模型,但使用fps采樣進行測試。(右圖)分析每秒幀數(fps) 和每秒token數(tps) 對總體性能的影響

圖3的左圖表明增加幀數可提高整體性能,但達不到fps采樣性能。當以恒定的幀頻進行訓練時,每秒的token數(tps)也可以通過token重采樣器來改變。

如圖3中的右圖所示,在tps 和fps之間似乎存在著一種短視頻和長視頻性能的折衷方法。在不同的幀速率下,每幀8-32個token的性能都很強。

tps和fps之間需要權衡,每幀8-32個token最為理想。

2. 視頻表示

在單編碼器設置中,與其他圖像/視頻編碼器相比,SigLIP-SO400M的性能最佳,這表明必須改進視頻編碼器才能取代圖像編碼器。

視頻編碼器僅在時態感知方面優于圖像編碼器,這表明LLM在細粒度時態集成(如估計運動速度和方向)方面存在困難。

圖片

圖4:視覺編碼器。測試了InternVideo2、LanguageBind-Image/Video、V-JEPA、Video-MAE、SigLIP-SO400M和DINOv2及組合。(左圖)單一編碼器測試,(右圖)雙編碼器配置的性能

在單編碼器測試中,左圖顯示SigLIP-SO-400M 的整體性能最佳;與視頻編碼器相比,圖像編碼器在時態感知方面表現不佳。

右圖顯示語言監督編碼器的表現優于自我監督編碼器;InternVideo2和SigLIP-SO-400M結合使用可獲得最佳的整體性能。

SigLIP-SO400M是用于視頻LMM的最佳單一編碼器。

將視頻編碼器和圖像編碼器結合起來可以抵消它們的局限性,因為圖像編碼器不對時間信息進行編碼,而視頻編碼器的空間表示能力較弱。

組合編碼器的性能始終優于單編碼器的同類產品,其中InternVideo2+SigLIP-SO400M的總體性能最好,在ApolloBench中提高了~7%。可以發現輸入幀數較少的視頻編碼器表現更佳,這可能是由于圖像-視頻傳輸效果更好。

將SigLIP-SO400M與InternVideo2結合使用,整體性能最佳。

3. 視頻token重采樣

相比于其他大模型,token重采樣在視頻 LMM 中更為重要,因為這直接影響到可處理的幀數,限制了視頻的最大長度。視頻token重采樣可以由文本引導(如使用 Q-Former)。

圖片

然而,這種方法并不能很好地適用于多輪對話,因為token會根據第一個問題向下采樣。還有許多人采用某種形式的平均匯聚(average  pooling)。

作者測試了三種token重采樣方法:mlp上投影 + 平均匯聚、2D conv + 平均匯聚和感知器重采樣(perceiver resampling)。

如表1所示,感知重采樣(perceiver resampling)在所有指標上都優于其他方法。

圖片

表1:視頻token重采樣方法。不同token重采樣技術在視頻-LMM 任務中的表現

在所有指標上,感知重采樣(perceiver resampling)都優于其他方法。

在減少token/幀時,感知重采樣(perceiver resampling)出卓越的性能。

4. 視頻token集成

集成視頻和文本token是視頻 LMM 的關鍵設計選擇,因為它直接影響到模型處理和解釋多模態內容的效率。

圖片

為了確定最穩健的集成策略,如表2所示,評估了四種集成策略:直接插入、分離token、文本時間戳以及將分離token與時間戳相結合。

可以看出,我們發現在視頻token之間添加任何文本或學習到的token都會在ApolloBench上帶來2-3%的改進。

圖片

表2:視頻token集成方法。將視頻token集成到文本序列的不同策略的性能

在每個片段前加入文本時間戳的整體性能最佳。

在來自不同幀或片段的視頻token之間添加token(文本、學習到的標簽等),足以實現高效的token集成。

多模態大模型的訓練

1. 訓練調度器

如表3所示, 作者系統地評估了不同訓練計劃對模型性能的影響,比較了單階段、兩階段和三階段訓練方案, 發現分三階段訓練模型的效果最好,緊隨其后的是兩階段的訓練調度策略。對于每種訓練調度策略,測試了三種超參數,并報告了其中最優參數的結果。

圖片

表3:訓練調度器。評估的七種不同訓練計劃概覽,突出顯示了 LLM 和視覺編碼器在每個階段是凍結還是解凍,以及用于訓練的數據類型。

在不同的階段逐步解凍不同的組件,從而獲得卓越的模型訓練動態。

2. 訓練視頻解碼器

作者在表3中比較了在混合數據上訓練視覺編碼器還是完全在視頻數據上訓練視覺編碼器,以及對齊優先的連接器是否能提高性能。

當LLM解凍時,使用文本、圖像、多圖像和視頻數據的混合數據。因此,如果視頻和LLM同時解凍,視覺編碼器將在圖像和視頻數據的組合上進行訓練。

可以發現,這將大大損害LMM性能。訓練編碼器提高了以自我為中心的推理性能,而其他指標則基本不受影響,這很可能是由于視覺-語言的細粒度配準得到了改善。

僅在視頻數據上對視頻編碼器進行微調可進一步提高整體性能,尤其是在推理和特定領域任務上。

3. 數據組合

在圖7中,研究了文本、圖像和視頻混合數據對視頻LMM性能的影響。

可以看出,在訓練組合中包含10~14%的文本數據對性能是必需的。這可能會減輕災難性遺忘。將文本數據的比例從14%提高到25%,或將其降低到7%以下,都會損害性能。

除了包含文本數據外,其余模式的混合比例最好略微偏重于視頻。這種平衡可以讓模型從更高質量、更多樣化的圖像數據中學習。

圖片

圖7:微調數據集的數據統計。(左)數據模式分類,包括文本、圖像、多圖像和視頻,說明微調數據集的構成。(中)視頻注釋類型的分布,突出顯示了對話、推理、第一視角、時態感知、OCR和字幕注釋的比例。(右圖)視頻時長直方圖,顯示了訓練數據集中時長的分布情況

Apollo模型評估

基于新的發現,團隊開發了一系列Apollo模型,其機構圖如下。

圖片


Apollo模型在多個基準數據集上進行了評估,其在視頻語言理解任務中的結果見表4。

此外, Apollo-7B可與參數超過30B的模型(如Oryx-34B和VILA1.5-40B 等)相媲美,甚至超越了參數超過30B的模型,如Oryx-34B和VILA1.5-40B。

例如,在MLVU基準上,Apollo-7B得分為70.9,以微弱優勢超過Oryx-34B的70.8。

這證實了精心選擇的架構和訓練策略可以帶來實質性的改進,而無需求助于更大的模型規模。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-11-04 08:42:27

2024-04-02 09:17:50

AI數據開源

2025-10-24 12:07:12

2024-12-18 15:02:48

2025-08-25 09:03:00

2023-10-13 19:58:33

Mistral7B模型

2011-05-26 09:03:17

JSONjavascript

2023-03-14 13:45:14

模型AI

2023-11-29 13:52:00

模型訓練

2024-07-15 08:58:00

2023-12-06 08:48:36

Kubernetes組件

2024-06-03 10:43:34

2024-09-13 09:14:32

2017-01-10 09:07:53

tcpdumpGET請求

2025-01-17 10:26:19

模型開發ChatGPT

2024-05-13 12:58:30

2023-07-17 09:21:12

Meta模型

2024-02-19 00:09:49

開源模型

2021-04-02 15:02:42

開源技術 工具

2025-04-10 09:26:56

點贊
收藏

51CTO技術棧公眾號

久久国产精品免费| 小说区亚洲自拍另类图片专区| 精品久久久视频| 日韩欧美亚洲区| 国产xxxxxx| 国产精品视频| 久久精品亚洲精品| avtt香蕉久久| 成人日韩视频| 一本大道久久a久久综合| 中文字幕久久综合| 天堂av网在线| 国产一区二区三区免费播放 | 中文字幕一二三四区| 男人天堂久久| 精品久久久国产| 超碰在线免费观看97| 日韩一区av| 国产suv一区二区三区88区| 国产精品成人v| 97久久久久久久| 午夜日韩av| 最近2019好看的中文字幕免费| 国产+高潮+白浆+无码| 91精品在线免费视频| 色丁香久综合在线久综合在线观看| 蜜臀av性久久久久蜜臀av| 国内av一区二区三区| 99热国产精品| 国产精品免费一区二区三区| 91丨九色丨蝌蚪丨对白| 久久精品盗摄| 欧美亚洲视频在线观看| 久久久精品视频在线| 98精品久久久久久久| 亚洲性猛交xxxxwww| 亚洲成人日韩在线| 加勒比久久高清| 欧美精品一区二区久久久| 超碰在线超碰在线| 成人亚洲精品| 在线播放91灌醉迷j高跟美女| 国产情侣av自拍| 在线成人av观看| 欧美日韩国产综合视频在线观看中文| 免费网站在线观看视频| 在线看三级电影| 亚洲永久免费视频| 国产一区 在线播放| 久久不射影院| 五月激情综合色| 欧美三级在线观看视频| 国产资源在线观看入口av| 亚洲国产精品一区二区尤物区| 国产精品视频一二三四区| av观看在线| 亚洲国产日韩a在线播放| 日本五级黄色片| 欧美亚洲天堂| 婷婷开心激情综合| 欧美日韩国产精品激情在线播放| 亚洲黄色中文字幕| 91福利国产精品| 三上悠亚av一区二区三区| 欧美爱爱视频| 日韩一区二区在线免费观看| 国产伦理在线观看| 麻豆精品av| 亚洲人成免费电影| 国产一区二区三区视频播放| 天天色综合色| 欧美国产中文字幕| 日韩精品在线免费视频| 日韩高清在线不卡| 成人久久一区二区| 粉嫩av一区二区夜夜嗨| 26uuu国产日韩综合| 天堂资源在线亚洲资源| 久操视频在线播放| 亚洲国产裸拍裸体视频在线观看乱了| 色综合久久久久无码专区| av有声小说一区二区三区| 欧美理论电影在线| 亚洲香蕉中文网| 精品久久成人| 免费av一区二区| 999这里只有精品| 免费xxxx性欧美18vr| 成人动漫在线观看视频| 欧美扣逼视频| 亚洲免费观看在线视频| 波多野结衣家庭教师在线| 成人午夜在线| 欧美精品一区二区三区很污很色的| 色一情一交一乱一区二区三区| 91成人影院| 欧洲美女7788成人免费视频| ,一级淫片a看免费| 99re热视频精品| 在线看成人av电影| 乱人伦视频在线| 欧美一区二区在线观看| 色婷婷av777| 你懂的国产精品永久在线| 欧美在线视频免费观看| 国产黄a三级三级看三级| 久久久影视传媒| 欧美性潮喷xxxxx免费视频看| abab456成人免费网址| 欧美成人一区二区三区在线观看| 国产精品20p| 亚洲伦理精品| 国产这里只有精品| 日本福利片在线| 亚洲影院免费观看| 一级淫片在线观看| 国产精品欧美在线观看| 久久99久久亚洲国产| 曰批又黄又爽免费视频| 91影院在线观看| 国产成人免费高清视频| 日韩欧美2区| 国产视频久久久久| 日本在线免费观看| 国产精品18久久久久久久网站| 午夜精品视频在线观看一区二区| 国产精品探花在线| 欧美一区二区三区免费视频| 黄色国产在线播放| 日韩综合小视频| 美脚丝袜一区二区三区在线观看| 美女精品视频| 欧美电影精品一区二区| 欧美xxxx黑人xyx性爽| 精品午夜一区二区三区在线观看| 日韩精品资源| 一区二区视频免费完整版观看| 日韩精品黄色网| 四虎永久在线精品| 国产91精品欧美| 激情五月婷婷六月| 91成人午夜| 高清一区二区三区日本久| www.五月激情| 亚洲激情图片小说视频| 1314成人网| 在线看片不卡| 97se视频在线观看| 大黄网站在线观看| 亚洲精品一区在线观看| 国产亚洲色婷婷久久99精品| 国产成人激情av| 精品国产一区二区三区无码| 高潮按摩久久久久久av免费| 久久久在线视频| 五月婷婷激情在线| 精品动漫一区二区| 亚洲精品视频久久久| 久久久久国产精品一区二区| 日韩欧美精品在线不卡| 成人在线免费| 久久成人在线视频| 午夜精品久久久久久久99老熟妇| 亚洲图片有声小说| 欧美精品黑人猛交高潮| 天堂久久一区二区三区| 亚洲国产午夜伦理片大全在线观看网站 | av中文字幕不卡| 国产免费一区二区三区视频| 国产aⅴ精品一区二区三区久久| 国产精品xxx视频| 九义人在线观看完整免费版电视剧| 欧美一区二区久久久| 国产亚洲精品久久777777| 99久久免费视频.com| av免费中文字幕| 99国产精品免费视频观看| 99re国产在线播放| 小黄鸭精品aⅴ导航网站入口| 在线日韩精品视频| 国产aⅴ爽av久久久久成人| 香港成人在线视频| 亚洲v国产v欧美v久久久久久| 精品一区二区三区久久| 日本熟妇人妻xxxx| 国产精品羞羞答答在线观看| 亚洲在线免费观看| 亚洲欧美韩国| 久久五月天综合| 日韩欧美在线番号| 欧美夫妻性生活| 青青草成人av| 亚洲人亚洲人成电影网站色| 97人妻天天摸天天爽天天| 免费观看日韩电影| 成人av在线播放观看| 国产欧美日韩精品高清二区综合区| 成人精品一区二区三区| 自拍视频在线看| 色黄久久久久久| 偷拍自拍在线| 日韩免费看网站| 久草视频在线免费| 亚洲444eee在线观看| 国产又粗又长免费视频| 97久久久精品综合88久久| www.超碰97.com| 亚洲免费网址| 日本wwwcom| 国产精品久久久久久影院8一贰佰| 精品国产第一页| 在线综合色站| 91色精品视频在线| 亚洲电影有码| 青青青国产精品一区二区| 91资源在线观看| 欧美精品做受xxx性少妇| 高h视频在线| 日韩电影中文字幕| 日本wwwxxxx| 日韩欧美区一区二| 一级黄色片在线观看| 91久久精品午夜一区二区| 日本一二三区不卡| 亚洲成人精品一区二区| 五月天av网站| 亚洲视频资源在线| 青青青视频在线免费观看| 久久你懂得1024| 免费的av网站| 99久久婷婷国产综合精品| 亚洲女则毛耸耸bbw| 国产精品一区二区你懂的| 亚洲免费999| 蜜桃视频在线观看一区| 一区二区三区国产免费| 午夜在线视频观看日韩17c| 欧美爱爱视频免费看| 最新成人av网站| 精品少妇在线视频| 99精品国产在热久久| 亚洲色成人www永久在线观看| 欧美激情综合色综合啪啪| 天天干天天色天天爽| 夜间精品视频| 国产爆乳无码一区二区麻豆| 午夜精品视频| 国产aaa免费视频| 精品成人一区| 国产 福利 在线| 久久九九99| 色播五月综合网| 国产一区91精品张津瑜| 99国产精品免费视频| 国产精品18久久久久| www.555国产精品免费| 成人午夜av影视| chinese麻豆新拍video| 91麻豆成人久久精品二区三区| 久久久久亚洲av无码专区桃色| 国产亚洲精品7777| 成年人视频软件| 亚洲精品一卡二卡| 日本三级2019| 色丁香久综合在线久综合在线观看| 国产精品成人无码| 69堂成人精品免费视频| 精品人妻一区二区三区蜜桃| 亚洲精品97久久| 国产h在线观看| 蜜臀久久99精品久久久无需会员 | 亚洲AV成人精品| 成人av影院在线| 国产熟妇久久777777| 国产精品的网站| 日韩精品一区三区| 欧美三级三级三级爽爽爽| jlzzjlzzjlzz亚洲人| 日韩av在线导航| 午夜伦全在线观看| 欧美福利视频网站| 色老太综合网| 99九九电视剧免费观看| 国产欧美日韩| 久久综合亚洲精品| 日一区二区三区| 夜夜爽久久精品91| 2023国产一二三区日本精品2022| 国精产品视频一二二区| 欧美日韩国产影院| 国产女人18毛片水18精| 日韩电影中文字幕在线| 午夜视频成人| 欧美中文字幕在线| 国产激情精品一区二区三区| 好吊色欧美一区二区三区| 欧美高清视频在线观看mv| a级黄色小视频| 老妇喷水一区二区三区| 少妇伦子伦精品无吗| 欧美国产日韩一二三区| 国语对白一区二区| 欧美日韩国产a| 五月婷婷六月色| 久久精品视频网站| www视频在线观看| 91亚洲午夜在线| 国产伦精品一区二区三区视频| 人人妻人人澡人人爽欧美一区| 美腿丝袜亚洲色图| 免费黄色在线视频| 亚洲图片欧美视频| 国产精品久久久久久久久久久久久久久久久久 | 免费黄视频在线观看| 94色蜜桃网一区二区三区| 26uuu成人网| 色哟哟亚洲精品| 天天色综合久久| 久久99青青精品免费观看| 久久亚洲资源中文字| 欧美在线3区| 一区二区三区国产在线| 中文字幕一区二区三区人妻在线视频| 亚洲国产高清在线观看视频| 超碰中文字幕在线| 亚洲国产精彩中文乱码av| av网站在线看| 91香蕉国产在线观看| 日韩欧美1区| 在线观看国产一级片| 国产午夜一区二区三区| 亚洲精品中文字幕乱码三区91| 亚洲第一综合天堂另类专| 性欧美高清come| 97se在线视频| 欧美日韩精品一本二本三本| 国产高清999| 亚洲欧美日韩系列| 国产精品自产拍| 久久视频精品在线| 国产午夜久久av| 久久久久福利视频| 成人小视频免费在线观看| 青青草原国产视频| 欧美α欧美αv大片| 日本h片在线观看| 国产精品免费一区二区三区观看| 国内揄拍国内精品久久| 五月天丁香社区| 天天色天天操综合| 神马精品久久| 日韩免费观看av| 日产午夜精品一线二线三线| 激情黄色小视频| 亚洲精品免费在线| 性一交一乱一伧老太| 97视频在线观看成人| 伊人精品一区| 污视频网站观看| 一区二区三区在线免费观看 | 久久91视频| 熟妇熟女乱妇乱女网站| 国产盗摄一区二区三区| 国产午夜视频在线播放| 亚洲女人天堂网| 性欧美video另类hd尤物| 91成人在线视频观看| 成人黄色综合网站| 色屁屁影院www国产高清麻豆| 国产一区二区久久精品| 自拍偷拍亚洲图片| 99er在线视频| 久久精品综合网| 国产美女免费视频| 久久久久国产视频| 国产一区2区| 日本一区二区三区在线免费观看| 亚洲国产cao| bbbbbbbbbbb在线视频| 91嫩草免费看| 久久欧美肥婆一二区| 国产盗摄一区二区三区在线| 亚洲国产精品99久久| 欧美free嫩15| 成人av在线不卡| 国产精品欧美久久久久无广告| www.久久色| 国产福利视频一区二区| 欧美96在线丨欧| 亚洲性猛交xxxx乱大交| 日韩一区二区在线看片| 国产高清不卡| 欧美这里只有精品| 国产精品美女www爽爽爽| 天堂中文在线资源| 国产在线观看一区二区三区| 性色一区二区| 久久婷婷一区二区| 北条麻妃久久精品| 日韩有码av|