精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

CVPR2025視頻生成統(tǒng)一評估架構(gòu),上交x斯坦福聯(lián)合提出讓MLLM像人類一樣打分

人工智能 新聞
Video-Bench視頻評估框架,能夠通過模擬人類的認知過程,建立起連接文本指令與視覺內(nèi)容的智能評估體系。

視頻生成技術(shù)正以前所未有的速度革新著當前的視覺內(nèi)容創(chuàng)作方式,從電影制作到廣告設(shè)計,從虛擬現(xiàn)實到社交媒體,高質(zhì)量且符合人類期望的視頻生成模型正變得越來越重要。

那么,要如何評估AI生成的視頻是否符合人類的審美和需求呢?

Video-Bench視頻評估框架,能夠通過模擬人類的認知過程,建立起連接文本指令與視覺內(nèi)容的智能評估體系。

簡單地說,能夠讓多模態(tài)大模型(MLLM)“像人一樣評估視頻”。

實驗結(jié)果表明,Video-Bench不僅能精準識別生成視頻在物體一致性(0.735相關(guān)性)、動作合理性等維度的缺陷,還能穩(wěn)定評估美學(xué)質(zhì)量等傳統(tǒng)難題,顯著優(yōu)于現(xiàn)有的評估方法。

圖片

Video-Bench的研究團隊來自上海交通大學(xué)、斯坦福大學(xué)、卡內(nèi)基梅隆大學(xué)等機構(gòu)。

Video-Bench:基于MLLM的自動化視頻評估框架

Video-Bench團隊在面對已有的視頻評估方法時,發(fā)現(xiàn)了兩個問題:

1.簡單的評分規(guī)則往往無法捕捉視頻流暢度、美學(xué)表現(xiàn)等復(fù)雜維度——

那么,當評判“視頻質(zhì)量”時,如何將人類出于“直覺”的模糊感受轉(zhuǎn)化為可量化的評估指標?

2.現(xiàn)有基于大語言模型(Large Language Model,LLM)的基準雖能更好模擬人類評估邏輯,但在視頻-條件對齊評估中存在跨模態(tài)比較困難,在視頻質(zhì)量評估中則面臨文本評價標準模糊化的局限——

那么,評估”視頻是否符合文字描述”時,評估系統(tǒng)如何實現(xiàn)跨模態(tài)對比?

針對上述的兩個問題,Video-Bench作出了兩點核心創(chuàng)新:

圖片

(1)系統(tǒng)性地構(gòu)建了覆蓋視頻-條件對齊(Video-Condition Alignment)視頻質(zhì)量(Video quality)的雙維度評估框架。

(2)引入了鏈式查詢(Chain-of-Query)少樣本評分(Few-shot scoring)兩項核心技術(shù)。

鏈式查詢通過多輪迭代的”描述-提問-驗證”流程,有效解決了文本與視頻跨模態(tài)對齊的評估難題;少樣本評分則通過多視頻對比建立相對質(zhì)量標尺,將主觀的美學(xué)評判轉(zhuǎn)化為可量化的客觀標準。

這樣的功能設(shè)計使Video-Bench突破了現(xiàn)有視頻質(zhì)量評估方法的限制,能夠更全面、更智能地對視頻進行評分。

更全面、更智能

一方面,Video-Bench將視頻生成質(zhì)量解構(gòu)為“視頻-條件對齊”和“視頻質(zhì)量”兩個正交維度,分別評估生成內(nèi)容與文本指令的符合度以及視頻本身的觀感質(zhì)量。

視頻-條件一致性關(guān)注評估生成的視頻是否準確地反映了文本提示中的內(nèi)容,包括以下幾個關(guān)鍵維度對象類別一致性、動作一致性、顏色一致性、場景一致性、視頻-文本一致性;

視頻質(zhì)量的評估則側(cè)重于視頻本身的視覺保真度和美學(xué)價值。包括成像質(zhì)量、美學(xué)質(zhì)量、時間一致性、運動質(zhì)量。

這種雙維度的評估框架能使Video-Bench全面覆蓋視頻生成的各個要素,在評估視頻是否“保真”的同時,關(guān)注到視頻的美觀程度。

另一方面,Video-Bench的評估框架利用多模態(tài)大語言模型(Multimodal Large Language Model,MLLM)的強大能力,通過鏈式查詢技術(shù)和少樣本評分技術(shù),實現(xiàn)對視頻生成質(zhì)量的高效評估:

圖片

(1)鏈式查詢技術(shù):通過多輪問答的方式,逐步深入地評估視頻與文本提示之間的一致性。

這種方法避免了直接的跨模態(tài)比較,而是先將視頻內(nèi)容轉(zhuǎn)換為文本描述,然后通過一系列精心設(shè)計的問題,逐步檢查視頻內(nèi)容是否與文本提示完全一致,有效解決了跨模態(tài)對比的語義鴻溝問題。

圖片

(2)少樣本評分技術(shù):模仿人類橫向比較的本能,通過同時對比多個同主題視頻,使抽象的美學(xué)評價變得可量化。

例如在評估”電影感”時,Video-Bench會橫向比較不同生成結(jié)果的運鏡流暢度、光影層次感,而非孤立打分。

“像人一樣評估視頻”

圖片

將Video-Bench與當前主流評估方法進行系統(tǒng)性對比,可以看到,在視頻-條件對齊維度,Video-Bench以平均0.733的Spearman相關(guān)系數(shù)顯著優(yōu)于傳統(tǒng)方法CompBench;在視頻質(zhì)量維度,其0.620的平均相關(guān)性同樣領(lǐng)先EvalCrafter。

此外,在對象類別一致性這一關(guān)鍵指標上,Video-Bench達到0.735的相關(guān)性,較基于GRiT的方法提升56.3%。

圖片

為驗證評估結(jié)果的可靠性,Video-Bench還組織了10人專家小組對35,196個視頻樣本進行標注。

對齊結(jié)果顯示,評估者間一致性(Krippendorff’s α)達0.52,與人類自評水平相當。

圖片

通過組件設(shè)計的消融實驗,可以看到,鏈式查詢使視頻-條件對齊評估提升了9.3%,少樣本評分將成像質(zhì)量評估相關(guān)性從46.1%(單樣本)提升至62.4%(7樣本)。

組合使用兩項技術(shù)時,評估穩(wěn)定性(TARA@3)達67%,Krippendorff’s α達0.867,驗證了這些組件設(shè)計的有效性。

圖片

魯棒性測試結(jié)果發(fā)現(xiàn),添加高斯噪聲后,Video-Bench的視頻-文本一致性評估誤差<5%,且三次重復(fù)實驗的評分一致性達87%,對不同復(fù)雜度提示的評估穩(wěn)定性優(yōu)于基線方法32%

現(xiàn)有視頻生成模型的測評結(jié)果

圖片

使用Vedio-Bench對7個主流視頻生成模型進行測評,結(jié)果發(fā)現(xiàn),商業(yè)模型整體優(yōu)于開源模型(Gen3綜合得分4.38v.s.VideoCrafter2綜合得分3.87),不同模型存在顯著特長差異(如CogVideoX在視頻-文本一致性領(lǐng)先,而Gen3在成像質(zhì)量最優(yōu))。

總體來看,當前的模型在動作合理性(平均2.53/3)和動態(tài)模糊(3.11/5)等動態(tài)維度表現(xiàn)較弱。

圖片

對不同基礎(chǔ)模型進行比較,結(jié)果發(fā)現(xiàn),與Gemini1.5pro和Qwen2vl-72b相比,GPT-4o通常在視頻質(zhì)量和一致性評分上表現(xiàn)更優(yōu),特別是在成像質(zhì)量(0.807)和視頻-文本一致性(0.750)方面,GPT-4o-0806表現(xiàn)尤為突出。

然而,性能并不總是隨著GPT-4o版本的更新而持續(xù)提升。例如,GPT-4o-1120在運動效果方面相較于GPT-4o-0806有所下降(0.309vs.0.469),這表明在更新過程中,時間運動檢測可能存在潛在退化。

作者簡介

共同第一作者

韓慧,上海交通大學(xué)碩士生,研究方向為多模態(tài)語言模型

李思遠,上海交通大學(xué)碩士生,研究方向為多模態(tài)語言模型

陳家棋,復(fù)旦大學(xué)碩士,斯坦福訪問學(xué)者,F(xiàn)ellou 研究員,研究方向為 LLM agent

袁怡雯,CMU 本科,xAI 研究員,研究方向為多模態(tài)語言模型和 RAG

通訊作者為倪泳鑫,波士頓大學(xué)博士

代碼鏈接:https://github.com/Video-Bench/Video-Bench.git論文地址:https://arxiv.org/html/2504.04907v1

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-06-13 08:46:00

2024-10-21 12:40:00

視頻生成模型

2024-10-28 10:30:00

AI開源模型

2023-05-30 13:29:25

2023-12-14 12:51:28

LLM3D場景

2022-07-28 14:46:01

人工智能機器人計算機科學(xué)

2020-09-30 17:12:09

人工智能技術(shù)數(shù)據(jù)

2020-01-09 17:03:29

人工智能技術(shù)算法

2023-11-29 14:53:00

AI數(shù)據(jù)

2025-11-11 08:43:00

AI模型視覺

2023-11-13 07:51:58

ChatGPT研究

2022-07-14 15:08:23

AI模型

2023-04-05 14:19:07

FlinkRedisNoSQL

2025-10-13 07:58:56

2024-06-21 09:24:03

2025-03-20 09:20:00

2023-12-26 14:56:59

模型訓(xùn)練

2023-09-22 11:56:57

模型駕駛

2018-10-25 22:34:34

機器人人工智能系統(tǒng)
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲网在线观看| 国产精品乱人伦中文| 97精品国产91久久久久久| 欧美大片免费播放器| 欧美亚洲韩国| 亚洲欧美一区二区三区久本道91 | 亚洲国产另类久久久精品极度| 91欧美日韩麻豆精品| 亚洲国产一区二区三区高清| 亚洲色图第一页| 免费看三级黄色片| 精品国产欧美日韩一区二区三区| 一区二区三区在线看| 鲁丝片一区二区三区| 国产精品女人久久久| 国产亚洲精品v| 欧美日韩国产成人在线观看| 中国女人特级毛片| 成午夜精品一区二区三区软件| 在线区一区二视频| 大伊香蕉精品视频在线| 色哟哟免费在线观看| 国产成人精品在线看| 国产精品国模在线| 国产无码精品在线播放| 亚洲国产不卡| 国产一区二区三区在线| 日本黄色免费观看| 日韩精品视频在线看| 欧美日韩激情一区二区| 久久网站免费视频| 成人性生交大片免费看网站| 国产精品久久久久影院老司| 日本精品一区二区三区视频 | 在线性视频日韩欧美| 精品国产一区在线| 日韩一区二区三区色| 欧美人牲a欧美精品| 北条麻妃在线一区| 瑟瑟视频在线看| 无码av免费一区二区三区试看 | 色婷婷精品国产一区二区三区| 成人午夜免费福利| 国产精品正在播放| 91色p视频在线| 中文字幕乱码人妻无码久久| 老司机久久99久久精品播放免费| 992tv成人免费影院| 久青草视频在线观看| 欧美日本久久| 欧美人与性动交| 欧美黄色一级网站| 午夜精品亚洲| 欧美极品少妇全裸体| 欧美丰满艳妇bbwbbw| 影音先锋成人在线电影| 久热精品视频在线观看一区| 日本黄色免费片| 999国产精品| www.亚洲成人| 神马午夜精品91| 欧美私人啪啪vps| 久久手机免费视频| 久久久久久久中文字幕| 国产在线欧美| 51精品国产黑色丝袜高跟鞋| 91美女免费看| 免费看黄色91| 91性高湖久久久久久久久_久久99| 国产又粗又猛视频| 国产麻豆精品视频| 国产伦精品一区二区三区视频孕妇 | 久久久久99| 国产精品旅馆在线| 国产毛片在线视频| 成人福利视频网站| 欧美日韩综合久久| 视频一区二区三区不卡| 亚洲人被黑人高潮完整版| www.日本三级| 久久人体大尺度| 欧美高清你懂得| 久久久久亚洲av无码专区首jn| av自拍一区| 国产亚洲精品美女| 免费国产羞羞网站美图| 亚洲国产婷婷| 国产精品h在线观看| 国产精品玖玖玖| 99久久婷婷国产| 亚洲一区二区在线看| 色帝国亚洲欧美在线| 日韩欧美亚洲成人| 91aaa精品| 亚洲免费专区| 不卡av电影院| 精品人妻一区二区色欲产成人| 麻豆国产精品官网| 精品国产一区二区三区四区精华 | 色无极亚洲影院| 欧美精品国产精品日韩精品| 久久精品五月天| 丰满亚洲少妇av| 日韩在线电影一区| av资源中文在线| 欧美男男青年gay1069videost| 丰满岳乱妇一区二区| 日韩欧美中字| 欧日韩不卡在线视频| 成人黄色免费视频| 中文字幕免费不卡在线| 天天夜碰日日摸日日澡性色av| 国产成人亚洲一区二区三区| 亚洲国产精品成人一区二区| 人与嘼交av免费| 国产婷婷精品| 97人人澡人人爽| 91精彩视频在线播放| 欧美日韩一二三四五区| 黄色一级片免费播放| 欧美日韩在线播放视频| 7777免费精品视频| 精品人妻少妇AV无码专区| 中文字幕成人网| 国产精品丝袜久久久久久消防器材| 视频亚洲一区二区| 日韩在线免费观看视频| 国产精品无码粉嫩小泬| 97se亚洲国产综合自在线不卡| www婷婷av久久久影片| 免费日韩成人| 在线免费看av不卡| 丰满人妻老熟妇伦人精品| av激情综合网| 日韩网站在线免费观看| eeuss国产一区二区三区四区| 久久天天躁狠狠躁夜夜躁| 国产精品免费无遮挡无码永久视频| 成人av片在线观看| 全黄性性激高免费视频| 91成人福利| 欧美精品www| 日韩中文字幕影院| 亚洲成av人**亚洲成av**| 国产精品日日摸夜夜爽| 午夜久久福利| av免费观看久久| 欧美野外wwwxxx| 欧美va在线播放| 国产精品16p| 99久久精品免费精品国产| 国产a级片网站| 精品视频高潮| 日本欧美精品在线| 久久久久久久久亚洲精品| 色婷婷综合中文久久一本| 成人免费看aa片| 首页亚洲欧美制服丝腿| 视频一区视频二区视频三区视频四区国产 | 丰满肉嫩西川结衣av| 亚洲最新视频在线观看| 国产污在线观看| 亚洲深夜激情| 日本在线成人一区二区| 欧美激情三区| 欧美精品一区在线播放| 性一交一乱一伧老太| 香蕉av福利精品导航| 五月婷婷综合在线观看| 日韩精品久久理论片| 在线免费一区| 成人搞黄视频| 国产91色在线| 黄网站app在线观看| 日韩美女视频在线| 日产精品久久久| 中文字幕成人av| 日韩高清一二三区| 久久九九精品| 四虎影院一区二区| 欧美日韩夜夜| 国产这里只有精品| 成人爽a毛片免费啪啪动漫| 亚洲区在线播放| 97精品久久人人爽人人爽| 亚洲一区国产视频| 久久婷婷五月综合| 国产成人精品免费看| 欧美激情精品久久久久久小说| 久久在线视频免费观看| 韩国精品一区二区三区六区色诱| 性高爱久久久久久久久| 久久777国产线看观看精品| 青青视频在线观| 538在线一区二区精品国产| 日韩av一二三区| 国产精品不卡一区二区三区| 国产精品99精品无码视亚| 久久精品一本| 黄网站色视频免费观看| 神马久久一区二区三区| 91国产在线播放| av一区在线播放| 高清亚洲成在人网站天堂| gogogo高清在线观看免费完整版| 欧美成人精精品一区二区频| 中文字幕+乱码+中文乱码www| 亚洲妇女屁股眼交7| 久久精品日韩无码| 久久亚洲精精品中文字幕早川悠里 | 欲香欲色天天天综合和网| 久久久91精品| 川上优的av在线一区二区| 欧美精品一区男女天堂| 一级黄色大片免费| 一本久久a久久免费精品不卡| 欧美成人精品欧美一级私黄| 欧美激情中文字幕一区二区| yy6080午夜| 国产精品自在在线| 亚洲国产日韩欧美在线观看| 老司机一区二区三区| 国产欧美久久久久| 中文字幕人成人乱码| 亚洲 日韩 国产第一区| 你懂的一区二区三区| 国产一区二区三区无遮挡| 精品视频在线观看免费观看| 国产精品久久久久久久7电影| 日韩欧美一中文字暮专区| 欧美激情第99页| av观看在线| 久久好看免费视频| 天堂资源在线中文| 一区二区三区久久精品| 韩国中文免费在线视频| 亚洲男人天堂手机在线| 色窝窝无码一区二区三区| 精品国产网站在线观看| 国产av一区二区三区精品| 欧美夫妻性生活| 国产精品久久久久久免费| 在线不卡中文字幕播放| 夜夜嗨av禁果av粉嫩avhd| 欧美私人免费视频| 国产精品sm调教免费专区| 欧美在线看片a免费观看| 青青草视频在线观看免费| 色欧美88888久久久久久影院| 国产又黄又猛又粗又爽| 欧美性猛交xxxx乱大交3| 性无码专区无码| 色香色香欲天天天影视综合网| 欧美国产成人精品一区二区三区| 欧美日韩免费看| 欧美黄色一级大片| 欧美专区日韩专区| 在线观看免费中文字幕| 欧美日韩国产另类一区| 国产乱码精品一区二区三区精东| 欧美一区二区精品| 亚洲黄色a级片| 亚洲国产中文字幕久久网| 亚州男人的天堂| 国产一区二区美女视频| 欧美日本高清| 国产精品调教| 九九久久综合网站| 亚洲h片在线看| 欧美黑人xxx| 777一区二区| 天堂在线一区二区| 国产一线二线三线在线观看| 日韩黄色免费网站| 小明看看成人免费视频| 国产成人av资源| 久久一区二区电影| 亚洲国产精品激情在线观看| 国产传媒免费在线观看| 亚洲国产一区视频| 综合网在线观看| 欧美亚洲综合在线| 97人妻人人澡人人爽人人精品| 日韩午夜在线观看| 欧美另类自拍| 欧美成人免费一级人片100| 欧美激情护士| 国产日韩在线看| 欧美丝袜美腿| 日韩视频在线免费播放| 亚洲午夜91| 午夜免费福利在线| 成人精品国产免费网站| 日本高清黄色片| 亚洲小说欧美激情另类| 中文 欧美 日韩| 欧美精品一区二区久久婷婷| 尤物视频在线免费观看| 97在线观看免费| avtt久久| 日本一区二区不卡高清更新| 欧美~级网站不卡| 三级a在线观看| jizz一区二区| 日韩一级片av| 色综合久久久久综合| 精品人妻一区二区三区四区不卡| 日韩高清有码在线| av在线看片| 国产精品久久久久77777| 国产美女撒尿一区二区| 秋霞在线一区二区| 日本美女一区二区| 中日韩精品一区二区三区| 亚洲精品亚洲人成人网 | 麻豆免费在线观看| 日产日韩在线亚洲欧美| 国产精品宾馆| 亚洲国产一二三精品无码| 麻豆精品在线播放| 波多野结衣a v在线| 精品高清美女精品国产区| 成 人 免费 黄 色| 欧美成人自拍视频| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 久久精品一区二区国产| 国产精品嫩草av| 亚洲午夜影视影院在线观看| 国产日韩欧美中文字幕| www.99久久热国产日韩欧美.com| 日韩欧美少妇| 日本成人黄色免费看| 性欧美videos另类喷潮| 亚洲国产精品成人综合久久久| 一二三四社区欧美黄| 国产高中女学生第一次| 伦理中文字幕亚洲| 精品中文视频| 一二三在线视频| 国产成人精品综合在线观看| 免费一级黄色大片| 日韩精品一区二区三区视频播放| 综合久久2019| 成人免费在线一区二区三区| 亚洲色图欧美| 国产黄色一区二区三区| 亚洲精品国产无套在线观| 亚洲精品无码专区| 久久久久久国产精品| 精品三级av在线导航| 男女午夜激情视频| 国产欧美一区二区精品仙草咪| 老熟妇一区二区三区| 在线看片第一页欧美| 四虎国产精品免费久久| 色香蕉在线观看| 国产suv精品一区二区三区| 久久精品国产亚洲av香蕉| 日韩成人av网| 亚洲成人看片| 伊人久久av导航| 国产成人精品一区二区三区四区 | 久久久久亚洲AV成人无在| 在线观看免费视频综合| 日本成人在线播放| 成人性色av| 欧美中文日韩| 久久久久久久久久97| 日韩美女主播在线视频一区二区三区| 成人影音在线| 色播亚洲婷婷| 国产一区二区三区日韩| 日韩av男人天堂| 中文字幕日韩精品在线| 欧美区一区二区| 丰满爆乳一区二区三区| 中文一区在线播放| 精品人妻一区二区三区麻豆91| 7m第一福利500精品视频| 成人影视亚洲图片在线| 性生活一级大片| 日韩欧美在线观看| 九七电影韩国女主播在线观看| 国产成人精品免费视频大全最热| 午夜综合激情| 朝桐光av在线| 国产亚洲欧洲高清一区| 视频一区日韩精品| 能在线观看的av| 亚洲日本成人在线观看| 三区在线观看| 91最新在线免费观看| 久久av最新网址| 三级影片在线看| 亚洲人成啪啪网站| 天堂精品久久久久| 中文字幕在线观看第三页| 亚洲综合另类小说| a√资源在线| 久久久久久九九|