精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假? 精華

發(fā)布于 2025-11-13 09:05
瀏覽
0收藏

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

論文鏈接:https://arxiv.org/pdf/2510.26802v1
項(xiàng)目主頁(yè):https://video-cof.github.io/

引言

近年來(lái),以 Veo、Sora 等為代表的視頻生成模型展現(xiàn)出驚人的生成能力,能夠合成高度逼真、時(shí)間連續(xù)的動(dòng)態(tài)畫(huà)面。這些進(jìn)展暗示,模型在視覺(jué)內(nèi)容生成之外,或許已開(kāi)始具備對(duì)物理世界結(jié)構(gòu)與規(guī)律的潛在理解。

值得注意的是,Google 最新研究指出,諸如 Veo-3 等模型正在顯現(xiàn)出超越純粹生成的“涌現(xiàn)能力”,例如感知建模、動(dòng)態(tài)預(yù)測(cè)以及推理能力。

由此催生出一個(gè)與語(yǔ)言模型“思維鏈”(Chain-of-Thought, CoT)相對(duì)應(yīng)的新概念——幀鏈推理(Chain-of-Frame, CoF)。

其核心思想在于:視頻模型通過(guò)逐幀生成過(guò)程,構(gòu)建連貫的視覺(jué)演化,從而體現(xiàn)思維與推理的過(guò)程。然而,一個(gè)關(guān)鍵問(wèn)題仍懸而未決——這些模型是否真的具備零樣本推理(Zero-Shot Reasoning)能力?還是僅僅在模仿訓(xùn)練數(shù)據(jù)中的表層模式?

為驗(yàn)證這一點(diǎn),來(lái)自香港中文大學(xué)、北京大學(xué)、東北大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)開(kāi)展了系統(tǒng)研究,對(duì) Veo-3 等模型的零樣本推理潛能進(jìn)行全面評(píng)估,并提出了涵蓋空間、幾何、物理、時(shí)間等 12 個(gè)維度的綜合基準(zhǔn)——MME-CoF。

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

什么是 Chain-of-Frame(CoF)?

“幀鏈推理(CoF)”可以視作語(yǔ)言中“思維鏈”(CoT)的視覺(jué)化形式:

  • CoT:通過(guò)逐步生成文本展示思考與推理路徑。
  • CoF:通過(guò)逐幀生成畫(huà)面,以動(dòng)態(tài)演化的方式呈現(xiàn)推理與決策過(guò)程。

這種方式使模型不僅輸出結(jié)果,更在生成的時(shí)間維度上“展示”其思考軌跡。

12 項(xiàng)推理挑戰(zhàn)概覽

研究團(tuán)隊(duì)圍繞 12 個(gè)推理維度構(gòu)建了系統(tǒng)測(cè)試,對(duì) Veo-3 模型進(jìn)行了實(shí)證評(píng)估。以下為部分典型任務(wù)摘要。

視覺(jué)細(xì)節(jié)推理(Visual Detail Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo):檢測(cè)模型保持細(xì)粒度視覺(jué)屬性(顏色、紋理)與空間關(guān)系的能力。
  • 表現(xiàn):對(duì)顯著、易識(shí)別物體表現(xiàn)較好。
  • 局限:當(dāng)目標(biāo)較小、被遮擋或背景復(fù)雜時(shí),模型易偏離任務(wù)目標(biāo)或生成風(fēng)格化偏差。

視覺(jué)追蹤推理(Visual Trace Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo):評(píng)估模型在動(dòng)作序列中維持因果連續(xù)性的能力。
  • 表現(xiàn):在簡(jiǎn)單任務(wù)中能生成連貫的短時(shí)序路徑。
  • 局限:長(zhǎng)時(shí)序或高邏輯依賴任務(wù)中,模型難以保持連貫因果關(guān)系。

物理推理(Physics-based Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo):測(cè)試模型是否理解重力、碰撞、摩擦等物理規(guī)律。
  • 表現(xiàn):能生成短期合理的動(dòng)態(tài)畫(huà)面。
  • 局限:經(jīng)常違反物理約束(如能量守恒),僅在“模仿”物理而非真正推理。

真實(shí)世界空間推理(Real-World Spatial Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo): 測(cè)試模型在視角變化下保持空間一致性的能力。
  • 表現(xiàn): 簡(jiǎn)單場(chǎng)景中能維持基本的方向與空間結(jié)構(gòu)。
  • 局限: 在復(fù)雜多視角任務(wù)中常出現(xiàn)空間錯(cuò)位或漂移。

3D 幾何推理(3D Geometry Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo): 評(píng)估模型在立體折疊、旋轉(zhuǎn)與重構(gòu)任務(wù)中的結(jié)構(gòu)理解。
  • 表現(xiàn): 在單步操作中具備一定三維感知。
  • 局限: 復(fù)雜組合變換時(shí)易崩壞,缺乏穩(wěn)定幾何一致性。

2D 幾何推理(2D Geometry Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo): 檢驗(yàn)?zāi)P驮谄矫鏄?gòu)圖與形狀關(guān)系中的精確度。
  • 表現(xiàn): 能識(shí)別并繪制基礎(chǔ)幾何關(guān)系。
  • 局限: 更傾向生成“好看”的圖形而非“正確”的幾何,易出現(xiàn)邏輯順序錯(cuò)誤。

其他六個(gè)推理維度概覽

除上述6項(xiàng)外,其余6個(gè)維度同樣揭示了 Veo-3 的限制:

  • 旋轉(zhuǎn)推理(Rotation Reasoning):小角度旋轉(zhuǎn)可近似實(shí)現(xiàn),大角度下結(jié)構(gòu)崩壞。
  • 圖表推理(Table & Chart Reasoning):可模仿局部視覺(jué)模式,但缺乏對(duì)數(shù)值關(guān)系的真實(shí)理解。
  • 物體計(jì)數(shù)(Object Counting Reasoning):在靜態(tài)場(chǎng)景下表現(xiàn)良好,但動(dòng)態(tài)環(huán)境中常出現(xiàn)漏數(shù)或重復(fù)。
  • GUI 推理(GUI Reasoning):能生成點(diǎn)擊或拖動(dòng)動(dòng)作,但對(duì)操作目的與邏輯缺乏認(rèn)知。
  • 具身推理(Embodied Reasoning):能識(shí)別物體位置與動(dòng)作,但不遵守環(huán)境規(guī)則,偶有“作弊式”生成。
  • 醫(yī)學(xué)推理(Medical Reasoning):在放大或觀察局部細(xì)節(jié)時(shí)具備表面能力,但無(wú)法保持影像邏輯一致,易出現(xiàn)結(jié)構(gòu)性錯(cuò)誤。

MME-CoF:首個(gè)視頻推理基準(zhǔn)

研究團(tuán)隊(duì)據(jù)此提出 MME-CoF,這是首個(gè)專門(mén)用于量化視頻模型推理能力的標(biāo)準(zhǔn)化評(píng)測(cè)體系。其主要特征包括:

  • 首個(gè)系統(tǒng)化視頻推理評(píng)估框架;
  • 覆蓋 12 個(gè)維度;
  • 將抽象的推理過(guò)程轉(zhuǎn)化為視頻生成挑戰(zhàn),以迫使模型在視覺(jué)上展示“幀鏈思考”。

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

基于 MME-CoF 基準(zhǔn),研究團(tuán)隊(duì)對(duì)多個(gè)主流模型進(jìn)行了量化評(píng)測(cè)(由 Gemini-2.5-Pro 評(píng)分,滿分 4 分)。結(jié)果顯示:

  • 整體表現(xiàn)較低:多數(shù)模型平均得分不足 2 分,推理能力仍有限。
  • 優(yōu)勢(shì)差異顯著:

a.Sora-2 在物理、具身與醫(yī)學(xué)推理中表現(xiàn)相對(duì)突出;

b.Veo-3 在真實(shí)空間推理上具優(yōu)勢(shì);

c.Seedance-1.0-Pro 在旋轉(zhuǎn)與三維幾何任務(wù)中略勝一籌。

  • 總體趨勢(shì):各模型均在特定方向具備偏好性,但仍停留在“模式重現(xiàn)”層面,尚未形成真正的邏輯推理能力。

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

結(jié)論:推理,還是表演?

通過(guò)對(duì) Veo-3 等模型的實(shí)證分析,研究團(tuán)隊(duì)得出如下結(jié)論:

  • 缺乏真正的零樣本推理:當(dāng)前視頻模型更多依賴數(shù)據(jù)模式,而非自主邏輯推演。
  • 生成強(qiáng) ≠ 推理強(qiáng):高質(zhì)量的畫(huà)面并不代表深層理解。
  • 注重表象,忽視因果:生成結(jié)果“看似合理”,但常違背邏輯或物理規(guī)律。
  • 視頻模型可作為視覺(jué)推理系統(tǒng)的重要模塊,與語(yǔ)言或邏輯模型結(jié)合,推動(dòng)多模態(tài)智能邁向真正的“通用理解”。

總體來(lái)看,本研究為學(xué)術(shù)界構(gòu)建了一個(gè)系統(tǒng)且可驗(yàn)證的實(shí)證評(píng)估框架,清晰揭示了視頻生成模型在從“內(nèi)容生成”邁向“邏輯推理”,并邁向真正“通用視覺(jué)智能”過(guò)程中仍需跨越的核心瓶頸。


本文轉(zhuǎn)自AI生成未來(lái) ,作者:AI生成未來(lái)


原文鏈接:??https://mp.weixin.qq.com/s/TshekyfXktEp3Eqm6TVtlg??

標(biāo)簽
已于2025-11-13 10:18:19修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
男插女视频网站| 波多野结衣激情| 精品国产xxx| 日韩电影免费在线观看| 欧美高清dvd| 亚洲精品久久久久久久蜜桃臀| 天堂a中文在线| 免费在线观看一区二区三区| 欧美精品一区二区免费| 亚洲调教欧美在线| 岛国一区二区| 亚洲一卡二卡三卡四卡五卡| 欧美日韩在线观看一区| 国产精品免费无遮挡| 亚洲精品综合| 久久精品一偷一偷国产| 真人bbbbbbbbb毛片| av在线亚洲一区| 欧美性69xxxx肥| 四虎4hu永久免费入口| 毛片在线免费| 高清久久久久久| 国产噜噜噜噜久久久久久久久| 国产无遮挡aaa片爽爽| 清纯唯美综合亚洲| 亚洲国产免费av| 91网址在线观看精品| 欧美成人a交片免费看| 亚洲电影一区二区三区| 免费观看黄色的网站| 日本啊v在线| 国产a区久久久| 国产在线精品播放| 最近中文字幕免费在线观看| 亚洲激情午夜| 欧美成人午夜激情在线| 色噜噜噜噜噜噜| 国产成人ay| 日韩经典中文字幕| 美女伦理水蜜桃4| 成人日韩视频| 欧美午夜精品电影| 免费日韩中文字幕| 午夜影院在线观看国产主播| 亚洲主播在线播放| 男同互操gay射视频在线看| 97人人在线| 国产清纯美女被跳蛋高潮一区二区久久w | 精品国产乱码久久久久久虫虫漫画 | 欧美中文字幕视频在线观看| 国产va在线播放| 忘忧草精品久久久久久久高清| 亚洲天堂成人在线视频| 丰满少妇在线观看资源站| 你懂的在线观看一区二区| 亚洲福利视频久久| 中文字幕三级电影| 国产伦精品一区二区三区在线播放 | 中文在线a天堂| 日韩高清不卡一区二区三区| 国产国语videosex另类| 国产美女www| 青青草国产成人99久久| 国产精品久久久久久av福利软件| 国产一级片免费在线观看| 丝袜国产日韩另类美女| 国产精品99蜜臀久久不卡二区| 亚洲国产精品无码久久久| 久久天堂精品| 国产精品一二区| 国产精品久久久久久免费播放| 韩国v欧美v日本v亚洲v| 7777奇米亚洲综合久久| 风流老熟女一区二区三区| www.在线成人| 日本一区美女| 久草免费在线| 亚洲国产成人精品视频| 国产精品无码av在线播放| 黄色成人免费网| 欧美三日本三级三级在线播放| 亚洲涩涩在线观看| 99re8这里有精品热视频8在线| 久久aⅴ国产欧美74aaa| 国产精品中文字幕在线| 99精品在线看| 99麻豆久久久国产精品免费| 手机成人在线| 最新国产露脸在线观看| 亚洲1区2区3区4区| 97公开免费视频| vam成人资源在线观看| 亚洲成年网站在线观看| 无码人妻精品一区二区中文| 天天av综合| 91国产中文字幕| 最近中文在线观看| 成人三级伦理片| 日韩欧美视频一区二区三区四区| 超碰在线无需免费| 欧美三级免费观看| 蜜桃福利午夜精品一区| 欧美顶级毛片在线播放| 精品国产视频在线| 99热国产在线观看| 精品一区二区三区av| 精品国产一区二区三区四区vr| 韩国中文字幕2020精品| 亚洲九九爱视频| 精品视频无码一区二区三区| 亚洲伊人影院| 中文字幕亚洲欧美| 中文字幕亚洲高清| 黑人巨大精品欧美一区| 免费在线成人av电影| 午夜成年人在线免费视频| 欧美羞羞免费网站| 免费成人深夜夜行p站| 一区二区不卡| 国产精品美女主播在线观看纯欲| 日韩在线观看视频一区二区三区 | 欧美精品九九99久久| 麻豆精品国产传媒av| 久久久久午夜电影| 国产精品国产自产拍高清av水多| 丰满人妻一区二区三区四区53| 国产免费成人在线视频| 欧美日韩在线中文| 国产伦精品一区二区三区免费优势 | 国产亚洲精品成人a| 99精品美女| 国产成人福利网站| 日韩av成人| 午夜精品福利在线| 涩视频在线观看| 中文字幕日韩欧美精品高清在线| 国产精品入口免费视频一| 青青久在线视频| 精品国产老师黑色丝袜高跟鞋| 三级网站免费看| 亚洲h色精品| 成人免费视频在线观看超级碰| 国产免费av在线| 色综合亚洲欧洲| 波多野结衣办公室33分钟| 亚洲欧洲一区二区天堂久久| 国产精品国色综合久久| 神马午夜伦理不卡| 欧美va在线播放| 欧美黄色一级网站| 东方欧美亚洲色图在线| 久久久久久久9| 91精品入口| 久久久久久久久久久91| 国精产品乱码一区一区三区四区| 亚洲精品ww久久久久久p站| 久久出品必属精品| 午夜国产一区| 99在线国产| а√天堂8资源在线| 亚洲精品福利视频| 手机在线看片1024| 日本一二三四高清不卡| 色婷婷狠狠18| 亚洲欧美网站在线观看| 亚洲自拍欧美色图| 日本aa在线| 欧美精品一区二区不卡 | 免费在线观看黄色| 91精品欧美福利在线观看| 亚洲成人生活片| 成人免费视频一区二区| avav在线看| 久久精品国产www456c0m| 亚洲一区二区久久久久久| 色呦呦在线免费观看| 亚洲第一色中文字幕| 国产无遮挡呻吟娇喘视频| 国产亚洲va综合人人澡精品| 一起操在线视频| 欧美性久久久| 欧美久久在线| 亚洲精品第一| 久久久久成人网| 暖暖视频在线免费观看| 欧美日韩免费高清一区色橹橹| 久久久久久久久久久久久女过产乱| 北条麻妃一区二区三区| 国产三级三级三级看三级| 68国产成人综合久久精品| 国内一区在线| 青青久久精品| 韩国国内大量揄拍精品视频| 色中色在线视频| 欧美电影一区二区| 九九热在线视频播放| 国产精品国产三级国产普通话蜜臀 | 日本一区二区三区四区高清视频| 九九九九九九精品任你躁| 9.1国产丝袜在线观看| 欧美日韩xx| 亚洲精品成a人在线观看| 怡红院成永久免费人全部视频| 亚洲自拍欧美精品| 国产传媒在线看| heyzo一本久久综合| 精品久久久99| 亚洲免费一区二区| 国产精品久久成人免费观看| 久久成人av| 国产高清一区视频| 精品乱码一区二区三区四区| 91精品国产91久久久久福利| 黄色免费在线网站| 亚洲欧美视频在线| 狠狠人妻久久久久久综合麻豆| 欧美日韩综合一区| 男人天堂2024| 亚洲二区在线视频| 三级影片在线看| 国产精品免费久久久久| 中文字幕在线观看的网站| 国产精品亚洲成人| 色啦啦av综合| 青娱乐精品视频在线| 国内自拍在线观看| 亚洲午夜极品| 日韩中文字幕亚洲精品欧美| 人人狠狠综合久久亚洲婷婷| 精品视频一区二区| 88久久精品| 91精品久久久久久久久久另类| 亚洲成a人片| 欧美一级淫片aaaaaaa视频| 国模雨婷捆绑高清在线| 欧美精品在线观看| 高清全集视频免费在线| 久久精品99国产精品酒店日本| 成人福利在线| 尤物99国产成人精品视频| 青青草观看免费视频在线| 亚洲国产小视频在线观看| 亚洲经典一区二区三区| 日韩免费一区二区| 亚洲av无码片一区二区三区| 日韩午夜在线播放| 精品女同一区二区三区| 日韩一区二区三区免费看| 国产精品欧美亚洲| 91精品国产一区二区三区蜜臀| 一道本无吗一区| 欧美日韩精品免费| 国产精品伦理一区| 欧美一区二区三区四区视频| 国产人妖一区二区| 欧美一区二区在线播放| 国产激情视频在线播放| 欧美不卡激情三级在线观看| 成人精品在线播放| 亚洲精品国产精品国自产观看浪潮| 黑人操亚洲女人| 日韩精品电影网| 你懂的在线观看| 国产亚洲美女精品久久久| 成人精品福利| 久久精品福利视频| 一色桃子av在线| 国模极品一区二区三区| 在线观看的黄色| 国产精品久久久久久影视| 亚洲网站免费| 成人欧美一区二区| 亚洲三级性片| 亚洲综合第一| 黄色在线一区| 久久久久久香蕉| 韩国毛片一区二区三区| 艳妇乳肉豪妇荡乳xxx| 久久精品一区二区三区av| 国产精品夜夜夜爽阿娇| 亚洲精品高清在线观看| 久久亚洲天堂网| 欧美日韩午夜在线视频| 亚洲av无码一区二区三区性色| 日韩精品在线视频美女| 91在线看黄| 欧美激情一级精品国产| 欧美大片免费高清观看| 91久久精品国产91性色| 女同一区二区三区| 亚洲三区视频| 激情久久五月| 艹b视频在线观看| 不卡高清视频专区| 中日韩一级黄色片| 欧美日韩性视频| 一级aaaa毛片| 亚洲精品美女久久久久| 黄色网在线看| 青草青草久热精品视频在线网站| 国产高清亚洲| 欧美乱偷一区二区三区在线| 综合一区在线| 国产激情在线观看视频| 国产精品综合一区二区| 久久久久无码精品国产sm果冻| 一区二区三区精品| 中文字幕 视频一区| 日韩精品在线第一页| 亚洲性图自拍| 国产精品女人网站| 日韩有码一区| 97碰在线视频| 久久99深爱久久99精品| 亚洲最大成人网站| 亚洲二区在线观看| 国产成人毛毛毛片| 中文字幕视频在线免费欧美日韩综合在线看 | 毛片在线播放视频| 国产老女人精品毛片久久| 欧美激情视频二区| 欧美性xxxxxxxxx| 人妻va精品va欧美va| 欧美精品中文字幕一区| 999国产精品亚洲77777| 久久久久网址| 亚洲三级免费| 久久久久亚洲av无码网站| 成人欧美一区二区三区白人| 国产精华7777777| 亚洲欧美国产精品| 国产高清视频色在线www| 成人3d动漫一区二区三区91| 欧美在线黄色| 日本网站在线看| 亚洲人亚洲人成电影网站色| 中文字幕在线网站| 在线日韩中文字幕| 成人啊v在线| 欧美日韩国产高清视频| 噜噜噜躁狠狠躁狠狠精品视频 | 亚洲精品成人一区| 亚洲一区3d动漫同人无遮挡 | 亚洲最大成人综合| 国产夫妻性生活视频| 欧美成人免费全部| 亚洲一区二区电影| 91午夜在线观看| 成人毛片老司机大片| 妺妺窝人体色www在线下载| 日韩免费性生活视频播放| 欧美xxxx性xxxxx高清| 99re国产视频| 在线不卡视频| 99re久久精品国产| 精品国产福利视频| 国产在线中文字幕| 国产精品视频自在线| 久久精品播放| 夜夜爽久久精品91| 亚洲图片欧美色图| 天天操天天干天天舔| 97久久精品国产| 国产亚洲一卡2卡3卡4卡新区| 久久久久久久少妇| 国产精品日产欧美久久久久| 国产精品无码在线播放| 欧美成人激情在线| 老司机在线精品视频| 国产无套内射久久久国产| 欧美经典一区二区| 国产影视一区二区| 欧美激情综合色| 亚洲涩涩av| 久久久久久久久久久久久久久国产| 亚洲视频综合在线| 少妇人妻精品一区二区三区| 日本高清不卡的在线| 国产精品精品国产一区二区| 99热这里只有精品2| 天天av天天翘天天综合网色鬼国产 | 337p日本欧洲亚洲大胆精品| 欧美亚洲韩国| a级网站在线观看| aaa国产一区| 制服丝袜在线一区| 欧美激情伊人电影| 国产乱码精品一区二区三区四区| 国产一级片自拍| 香蕉成人啪国产精品视频综合网| 成人性爱视频在线观看| 91九色在线观看| 久久久久久久欧美精品| 男女做暖暖视频| 亚洲欧洲日产国产网站| 国产精品亚洲欧美日韩一区在线| 日韩在线一级片| 亚洲女子a中天字幕| 久草在线青青草| aaa级精品久久久国产片|