精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限? 原創(chuàng)

發(fā)布于 2025-4-28 09:23
瀏覽
0收藏

在多模態(tài)學(xué)習(xí)領(lǐng)域,視覺-語言模型(VLMs)的飛速發(fā)展讓我們看到了不同模態(tài)之間融合的巨大潛力。然而,盡管取得了顯著的進(jìn)步,這些模型大多集中在短文本任務(wù)上,對于長文本的理解能力卻始終是它們的“軟肋”。尤其是在處理長視頻理解和高分辨率圖像/視頻理解時(shí),如何有效處理擴(kuò)展的視覺上下文,依然是一個(gè)亟待解決的難題。

長文本理解的困境與挑戰(zhàn)

長文本理解的不足,很大程度上是因?yàn)楝F(xiàn)有的視覺-語言模型在數(shù)據(jù)集構(gòu)建、架構(gòu)設(shè)計(jì)、訓(xùn)練策略以及計(jì)算/內(nèi)存瓶頸等方面都面臨著諸多挑戰(zhàn)。雖然之前的研究嘗試過擴(kuò)展上下文長度,但效果并不理想:與專有模型相比,性能提升有限;隨著視覺輸入的增加,改進(jìn)效果也不一致;而且,最優(yōu)的訓(xùn)練策略也尚未明確。

Eagle 2.5:長文本訓(xùn)練的“破局者”

在這樣的背景下,NVIDIA推出的Eagle 2.5模型,就像一顆璀璨的新星,為長文本視覺-語言模型的發(fā)展帶來了新的希望。與那些僅僅為了處理更長多模態(tài)序列而犧牲性能的模型不同,Eagle 2.5在增加輸入長度的同時(shí),能夠?qū)崿F(xiàn)一致的性能提升,而不僅僅是容納更長的輸入。它在上下文覆蓋方面表現(xiàn)出色,并且隨著幀數(shù)的增加,性能呈一致的上升趨勢。與GPT-4o和Qwen2.5-VL-72B等參數(shù)量更大的模型相比,Eagle 2.5在性能上毫不遜色,同時(shí)卻保持著更小的參數(shù)規(guī)模。

圖像和視頻理解的卓越表現(xiàn)

Eagle 2.5在圖像和視頻理解的多個(gè)基準(zhǔn)測試中都展現(xiàn)出了非凡的性能,無論是與開源模型還是專有模型相比,都取得了極具競爭力的結(jié)果。在視頻理解方面,Eagle2.5-8B在多個(gè)視頻基準(zhǔn)測試中都取得了令人矚目的成績:在MVBench上達(dá)到了74.8,在Perception_test上達(dá)到了82.0,在EgoSchema上達(dá)到了72.2,輕松超越了類似規(guī)模的InternVL2.5-8B(72.0)和Qwen2.5-VL-8B(69.6、70.5、65.0)。在長視頻理解方面,Eagle 2.5更是表現(xiàn)出色,在MLVU上達(dá)到了77.6,在LongVideobench上達(dá)到了66.4,甚至超過了InternVL2.5-78B(75.7、63.6)。在VideoMME(無字幕)上,Eagle 2.5達(dá)到了72.4,與擁有72B參數(shù)的模型極為接近,但使用的參數(shù)卻少得多。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

在圖像理解方面,Eagle2.5-8B同樣表現(xiàn)出色,涵蓋了文檔理解(DocVQA上達(dá)到94.1,ChartQA上達(dá)到87.5)、信息提取(InfoVQA上達(dá)到80.4,TextVQA上達(dá)到83.7)以及光學(xué)字符識別(OCRBench上達(dá)到869)等多個(gè)領(lǐng)域。此外,該模型在通用感知和推理任務(wù)(MMstar上達(dá)到66.2,RWQA上達(dá)到76.7,MMB?.?上達(dá)到81.7)、特定領(lǐng)域的知識(MMMU上達(dá)到55.8,AI2D上達(dá)到84.5)、視覺幻覺評估(HallB上達(dá)到54.7)以及數(shù)學(xué)推理(MathVista上達(dá)到67.8)等方面也展現(xiàn)出了均衡的能力。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

獨(dú)特的訓(xùn)練策略:信息優(yōu)先采樣與漸進(jìn)式訓(xùn)練

Eagle 2.5之所以能夠取得如此優(yōu)異的性能,其訓(xùn)練策略功不可沒。該策略包含兩個(gè)關(guān)鍵組成部分:信息優(yōu)先采樣和漸進(jìn)式訓(xùn)練。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

信息優(yōu)先采樣

在多模態(tài)訓(xùn)練中,視覺內(nèi)容的采樣至關(guān)重要。多圖像文檔通常包含數(shù)十頁超高分辨率的圖像,而視頻內(nèi)容的長度則可以從幾秒到幾小時(shí)不等。為了有效管理這種多樣性,Eagle 2.5提出了信息優(yōu)先采樣策略,從視覺和語義兩個(gè)維度促進(jìn)信息的保留。

  • 圖像區(qū)域保護(hù)(IAP):傳統(tǒng)的平鋪方法將大小為W×H的圖像劃分為一個(gè)固定的網(wǎng)格。雖然這種方法在處理高分辨率輸入時(shí)效果不錯(cuò),但往往會(huì)因?yàn)椴磺‘?dāng)?shù)膶捀弑忍幚矶で紙D像的幾何形狀。為了解決這個(gè)問題,Eagle 2.5提出了一種以面積優(yōu)先的平鋪策略,優(yōu)化了兩個(gè)關(guān)鍵目標(biāo):面積保護(hù)和寬高比保真度。
  • 自動(dòng)降級采樣(ADS):視覺-語言模型需要在視覺和文本輸入之間仔細(xì)分配序列長度預(yù)算。Eagle 2.5提出了自動(dòng)降級采樣(ADS),這是一種以全上下文為中心的策略,動(dòng)態(tài)優(yōu)化這種平衡。ADS采用雙階段降級過程:時(shí)間降級首先優(yōu)化幀或頁面的采樣,然后是平鋪降級,以最大化利用可用上下文。

漸進(jìn)式訓(xùn)練

Eagle 2.5還引入了一個(gè)全面的后訓(xùn)練框架,包含兩種互補(bǔ)的策略:

  • 混合后訓(xùn)練:ADS方法根據(jù)最大序列長度自適應(yīng)調(diào)整每個(gè)訓(xùn)練樣本,提供了一種與幀無關(guān)的訓(xùn)練范式。通過實(shí)施混合訓(xùn)練策略和長度平衡打包,Eagle 2.5能夠在整個(gè)上下文長度范圍內(nèi)均勻優(yōu)化性能。
  • 漸進(jìn)式混合后訓(xùn)練:對于最大序列長度值較大的場景,Eagle 2.5提出了一種漸進(jìn)式混合訓(xùn)練方法,逐漸讓模型接觸到越來越長的序列長度,系統(tǒng)地增強(qiáng)其處理擴(kuò)展上下文的能力。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

Eagle-Video-110K:為長文本理解量身定制的多樣化視頻數(shù)據(jù)集

現(xiàn)有的視頻數(shù)據(jù)集往往包含的視頻過短,無法滿足全面長文本理解的需求。Eagle-Video-110K通過從多個(gè)來源(如Vidchapters、MiraData、InternVid-10M、Panda-70M、Vript、Shot2story、ViTT和WebVid-10M)精心策劃一系列較長的視頻,解決了這一局限性。通過采用基于CLIP嵌入和相似性閾值的多樣性驅(qū)動(dòng)策略,Eagle-Video-110K能夠識別并選擇顯著延長訓(xùn)練和評估可用平均時(shí)長的全新視頻。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

Eagle-Video-110K的另一個(gè)亮點(diǎn)是其獨(dú)特的雙注釋管道,結(jié)合了自上而下和自下而上的方法,以實(shí)現(xiàn)全面的視頻理解。在自上而下的方法中,利用人類注釋的章節(jié)作為語義上有意義的視頻片段,通過GPT-4o生成章節(jié)級密集字幕和長形式問答對。與此同時(shí),自下而上的方法則專注于局部時(shí)空細(xì)節(jié),通過GPT-4o生成帶有時(shí)間間隔參考和文本上下文錨點(diǎn)的剪輯級問答對。這種分層方法使得模型能夠同時(shí)實(shí)現(xiàn)細(xì)粒度的時(shí)空理解和高級語義理解,為長文本視頻推理提供了有力支持。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

Eagle-Video-110K對視頻理解性能產(chǎn)生了顯著影響。它不僅在主流的長視頻和短視頻基準(zhǔn)測試中提升了模型性能,還通過提供之前開源訓(xùn)練集中缺失的更長視頻訓(xùn)練數(shù)據(jù),大幅提高了模型處理高幀數(shù)(≥128幀)的能力。這一改進(jìn)在Video-MME基準(zhǔn)測試中尤為明顯,Eagle 2.5在使用Eagle-Video-110K訓(xùn)練時(shí),隨著幀數(shù)的增加,性能呈一致的上升趨勢,而其他模型則會(huì)趨于平穩(wěn)甚至退化。

性能與基準(zhǔn)測試

Eagle 2.5-8B在多個(gè)視頻和圖像理解任務(wù)中展現(xiàn)出了強(qiáng)大的性能。在視頻基準(zhǔn)測試中,它在MVBench上達(dá)到了74.8,在MLVU上達(dá)到了77.6,在LongVideoBench上達(dá)到了66.4。在圖像基準(zhǔn)測試中,該模型在DocVQA上達(dá)到了94.1,在ChartQA上達(dá)到了87.5,在InfoVQA上達(dá)到了80.4等。

NVIDIA發(fā)布Eagle 2.5:長文本理解的“新星”,如何打破視覺-語言模型的局限?-AI.x社區(qū)

消融研究表明了Eagle采樣策略的重要性。移除IAP會(huì)導(dǎo)致在高分辨率基準(zhǔn)測試中性能下降,而省略ADS則會(huì)降低在需要密集監(jiān)督的任務(wù)中的有效性。模型還從漸進(jìn)式訓(xùn)練中受益:逐步增加上下文長度相比一次性長文本訓(xùn)練能夠帶來更穩(wěn)定的性能提升。此外,加入Eagle-Video-110K顯著提高了在高幀數(shù)(≥128幀)下的性能,進(jìn)一步凸顯了專門的長文本數(shù)據(jù)集的價(jià)值。

結(jié)論

Eagle 2.5為長文本視覺-語言建模提供了一種技術(shù)上合理的方法。它強(qiáng)調(diào)保持上下文完整性、逐步訓(xùn)練適應(yīng)以及數(shù)據(jù)集多樣性,使其能夠在保持架構(gòu)通用性的同時(shí)實(shí)現(xiàn)強(qiáng)大的性能。Eagle 2.5證明了,通過精心設(shè)計(jì)的訓(xùn)練策略和數(shù)據(jù)設(shè)計(jì),而非僅僅依賴模型擴(kuò)展,可以打造出高效、有競爭力的復(fù)雜多模態(tài)理解系統(tǒng)。這使得Eagle 2.5成為構(gòu)建更適合現(xiàn)實(shí)世界多媒體應(yīng)用的更具上下文感知能力的AI系統(tǒng)的重要一步。


本文轉(zhuǎn)載自公眾號Halo咯咯    作者:基咯咯

原文鏈接:??https://mp.weixin.qq.com/s/pJECaBj-yRxL9xlDx2fY-A??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2025-4-28 09:23:26修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
高清不卡一区| 888av在线| 一本色道久久综合亚洲精品高清| 69av一区二区三区| 欧美另类videos| 亚洲精品国偷拍自产在线观看蜜桃| 91精品国产91久久久久久黑人| 欧美丰满美乳xxx高潮www| 干日本少妇视频| 日韩一区二区三区在线观看视频| 一本色道久久综合亚洲精品高清| 精品伊人久久97| 小泽玛利亚视频在线观看| 麻豆视频在线| 99re热视频这里只精品| 国产精品网红直播| www.99re7.com| 精品产国自在拍| 欧美一级片免费看| av天堂永久资源网| 3d玉蒲团在线观看| 91丨porny丨户外露出| 国产精品视频yy9099| 久久国产在线观看| 日韩精品1区| 亚洲福利视频二区| 第一区免费在线观看| 九九色在线视频| 91色在线porny| 91视频免费在线| 国产精品男女视频| 欧美激情成人在线| 国产一区二区三区精品久久久| 亚洲欧美自偷自拍另类| 国产精品一二三产区| 1区2区3区精品视频| 蜜桃视频成人| 狠狠躁夜夜躁av无码中文幕| 蜜桃视频一区二区三区| 69久久夜色精品国产69乱青草| 免费成人深夜天涯网站| 麻豆成人入口| 日韩美女视频在线| 日本中文字幕观看| 韩国精品主播一区二区在线观看| 亚洲影视在线播放| 在线免费一区| 97电影在线| 久久欧美一区二区| 国模一区二区三区私拍视频| 99国产精品久久久久久久成人| 国产精品综合色区在线观看| 欧美激情奇米色| 亚洲色图综合区| 国产精品成人a在线观看| 亚洲日本中文字幕| a级在线观看视频| 国产精品玖玖玖在线资源| 日韩一区二区影院| 91视频福利网| 国产精品视频一区二区三区| 欧美色涩在线第一页| 精品久久久久久久无码| 日韩电影大全网站| 日本高清成人免费播放| 欧美日韩中文在线视频| 亚洲天堂资源| 色老汉一区二区三区| 不要播放器的av网站| se01亚洲视频| 欧美影视一区在线| 高清av免费看| 99国内精品久久久久| 欧美高清视频在线高清观看mv色露露十八 | 黑人糟蹋人妻hd中文字幕| 国产淫片在线观看| 亚洲美腿欧美偷拍| 日韩精品一区二区在线视频| 日韩少妇视频| 五月天网站亚洲| 鲁一鲁一鲁一鲁一澡| 欧美色网一区| 欧美午夜不卡视频| 色呦色呦色精品| 亚洲高清在线一区| 亚洲国产婷婷香蕉久久久久久| 国产精品熟妇一区二区三区四区 | 人人干人人干人人| 日日夜夜一区| 日韩欧美电影一二三| 中文字幕免费高清视频| 九九久久电影| 久久精品欧美视频| 麻豆一区二区三区精品视频| 在线一区欧美| 国产精品一区二区3区| 国产绿帽刺激高潮对白| 成人手机电影网| 蜜桃999成人看片在线观看| 成人欧美一区| 一区二区在线观看视频| 国产二区视频在线播放| 欧美激情福利| 亚洲国产精品福利| 久久久久人妻一区精品色| 国产精品多人| 国产精品久久二区| 亚洲精品久久久久久无码色欲四季| 国产成人av电影| 欧美日韩在线一二三| 国产黄网站在线观看| 精品国产91久久久久久| 中文字幕第22页| 午夜精品福利影院| 乱亲女秽乱长久久久| 在线能看的av| 国产传媒久久文化传媒| 日韩av免费电影| 大香伊人中文字幕精品| 在线一区二区视频| 一级黄色免费视频| 欧美wwwww| 高清欧美电影在线| 国产一区二区女内射| 91丨porny丨蝌蚪视频| 女同性恋一区二区| 日韩一区精品| 精品视频www| 久久久久成人精品无码| 久久www免费人成看片高清| 久久久99国产精品免费| 日韩另类在线| 9191久久久久久久久久久| 国产免费看av| 99国产精品私拍| 肥熟一91porny丨九色丨| 日本在线观看网站| 欧美三片在线视频观看| 好吊视频在线观看| 国产美女一区| 国产呦系列欧美呦日韩呦| 91香蕉在线观看| 欧美巨大另类极品videosbest | 日韩高清av在线| 欧美成人精品欧美一级私黄| 视频一区二区三区在线| 久久精品成人一区二区三区蜜臀| 制服丝袜中文字幕在线| 欧美高清视频不卡网| 四季av中文字幕| 免费日韩av| 蜜桃传媒视频麻豆第一区免费观看 | 美国黄色一级视频| 亚洲九九在线| 成人免费xxxxx在线观看| 啊v视频在线| 欧美在线视频全部完| 免费看黄色的视频| 性感少妇一区| 久久爱av电影| 天堂中文在线播放| 亚洲跨种族黑人xxx| 91在线视频在线观看| www激情久久| 欧美成人免费高清视频| 国产精品探花在线观看| 国产成人涩涩涩视频在线观看| 视频二区在线| 亚洲午夜电影在线观看| 中文字幕人妻一区二区三区| 亚洲欧洲综合| 欧美性天天影院| 成人网ww555视频免费看| 中文字幕av一区二区| 伊人久久国产精品| 亚洲免费观看视频| 欧美极品jizzhd欧美仙踪林| 在线亚洲观看| 午夜精品一区二区在线观看的| 日韩三级影视| 最近2019中文字幕mv免费看| 97人妻人人澡人人爽人人精品| 亚洲欧洲三级电影| 人妻av一区二区三区| 国产精品色网| 亚洲mv在线看| 日韩一区免费| 欧美在线观看视频| 91社区在线| 日韩三级免费观看| 日日噜噜噜噜人人爽亚洲精品| 91视频观看视频| 一区二区三区四区毛片| 在线视频观看日韩| 五月天亚洲综合| av毛片精品| 国产精品久久久久秋霞鲁丝| 污污的网站在线看| 亚洲色图狂野欧美| a网站在线观看| 欧美性猛交xxxx| 免费在线观看a级片| 不卡一区二区在线| 一区二区在线免费看| 尹人成人综合网| 婷婷久久伊人| 盗摄系列偷拍视频精品tp| 国产成人avxxxxx在线看 | 99久久国产综合精品色伊| 另类小说色综合| 黄页网站一区| 亚洲福利av| 久久综合五月婷婷| 91久久精品美女高潮| 亚洲欧美电影| 欧美猛交免费看| 成人好色电影| 亚洲精品www久久久久久广东| 中文天堂在线视频| 精品国产成人在线| 欧美国产日韩在线观看成人| 国产日韩成人精品| 精品人妻一区二区三区日产| 国产一区视频网站| 999在线免费视频| 91久久综合| 女女同性女同一区二区三区按摩| 欧美91在线| 成人91视频| 91精品国产一区二区在线观看| 77777少妇光屁股久久一区| a毛片在线看免费观看| 中文字幕亚洲一区在线观看| 视频福利在线| 亚洲精品久久7777777| 精品人妻一区二区三区三区四区 | 久久av中文字幕片| 欧美日韩一区二区在线免费观看| 欧美精品入口| 免费观看黄色大片| 久久在线免费| 神马欧美一区二区| 国产精品嫩模av在线| 国产免费一区二区三区| 一区二区三区四区高清视频| 91精品视频在线播放| 色999韩欧美国产综合俺来也| 2019av中文字幕| a'aaa级片在线观看| 久久久久久久久久久网站| a视频在线观看| 免费不卡欧美自拍视频| 国产1区在线| 久久成人这里只有精品| 成人看片免费| 九九热99久久久国产盗摄| aaa大片在线观看| 欧美成人精品在线| 在线观看h网| 九九热精品视频国产| 在线观看午夜av| 欧美国产激情18| aa视频在线观看| 97香蕉久久超级碰碰高清版| 手机av在线| 国产成人精品最新| 久久福利在线| 成人福利视频网| 日韩一区二区三区精品| 国产在线精品一区二区中文 | 国产欧美日韩一区| 欧美五码在线| 日韩精品另类天天更新| 婷婷综合伊人| 成人av在线播放观看| 亚洲激情成人| 国产成人综合一区| 久久精品99久久久| 色欲欲www成人网站| 波多野结衣亚洲一区| 91精品人妻一区二区三区蜜桃欧美| 久久久久久亚洲综合影院红桃| 97人妻精品一区二区免费| 国产精品网曝门| 美女的奶胸大爽爽大片| 黄色成人av网| 真实新婚偷拍xxxxx| 欧美一区二区三区四区五区 | 亚洲国产精品久久91精品| 亚洲三区在线观看无套内射| 中文字幕av一区| 国内高清免费在线视频| 国产91精品网站| 麻豆精品在线| 蜜桃视频日韩| 亚洲午夜精品一区 二区 三区| 美女av免费观看| 久久精品人人| 中文字幕55页| 国产亚洲精品aa午夜观看| 2018天天弄| 色婷婷综合久久久中文一区二区 | 一二三区精品| 国产美女18xxxx免费视频| 不卡的电视剧免费网站有什么| 久久久亚洲av波多野结衣| 中文字幕一区二区三| 久久综合久久鬼| 欧美私模裸体表演在线观看| wwwav网站| 伊人亚洲福利一区二区三区| 黄色大片在线| 国产精品一区二区三区久久久 | 欧美日韩亚洲另类| 丰满少妇被猛烈进入| 中文字幕久久亚洲| 国产美女高潮在线观看| 成人午夜激情免费视频| 国产精品午夜一区二区三区| 国产精品一线二线三线| 精品无人区卡一卡二卡三乱码免费卡 | 超级砰砰砰97免费观看最新一期| 国产成人综合在线观看| 麻豆一区在线观看| 日韩欧美亚洲一二三区| 亚洲精品久久久久久无码色欲四季| 在线不卡国产精品| 午夜裸体女人视频网站在线观看| 成人黄色在线免费| 不卡中文字幕| 37pao成人国产永久免费视频| 国产精品综合网| 特黄一区二区三区| 色老汉一区二区三区| 日本高清中文字幕二区在线| 久久久亚洲欧洲日产国码aⅴ| 日本欧美在线| 日韩一区国产在线观看| 久久高清一区| 成人网站免费观看| 香蕉成人伊视频在线观看| 成人av一区二区三区在线观看 | 91精品久久久久久久久久入口| 成人激情自拍| 300部国产真实乱| 国产在线观看一区二区| 日本伦理一区二区三区| 欧美日韩一级二级三级| www在线播放| 国产精品高潮呻吟久久av黑人| 欧美a级网站| 免费av手机在线观看| av资源网一区| 日韩精品在线不卡| 亚洲国产一区二区三区四区| 国语对白在线刺激| 国产亚洲福利社区| 野花国产精品入口| 37p粉嫩大胆色噜噜噜| 色综合中文综合网| 丁香婷婷在线| 国产伊人精品在线| 一本一道久久综合狠狠老| 四川一级毛毛片| 亚洲永久免费视频| 色婷婷av一区二区三| 欧美亚州一区二区三区| 亚洲a级精品| 午夜免费精品视频| 国产精品福利在线播放| 99久久久国产精品无码免费| 色中色综合影院手机版在线观看| 九九99久久精品在免费线bt| 992tv快乐视频| 大白屁股一区二区视频| 97免费在线观看视频| 亚洲午夜精品久久久久久久久久久久| 成人影音在线| 欧美大陆一区二区| 麻豆传媒一区二区三区| 久久久久久久久久91| 日韩av影视在线| 亚洲伦乱视频| 26uuu成人| av中文字幕一区| 最新国产中文字幕| 色综合久久精品亚洲国产 | 老司机午夜精品视频| 久久久久无码精品国产sm果冻| 欧美伊人精品成人久久综合97| 婷婷视频在线| av资源一区二区| 久久久久久夜| 乱h高h女3p含苞待放| 亚洲精品mp4| 亚洲日日夜夜| 久久99精品久久只有精品| 色欲一区二区三区精品a片| 精品国产1区二区| 欧美日韩在线精品一区二区三区激情综合|