精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

視頻模型真在推理,還是「表演」推理?港中文等質疑:Chain-of-Frame是真的嗎?

人工智能 新聞
來自香港中文大學、北京大學、東北大學的研究團隊進行了系統性研究,對 Veo 3 等模型的零樣本推理潛力進行了深入評估,并提出了涵蓋空間、幾何、物理、時間等 12 個推理維度的綜合測試基準 ——MME-CoF。

近年來,以 Veo、Sora 為代表的視頻生成模型展現出驚人的合成能力,能夠生成高度逼真且時序連貫的動態畫面。這類模型在視覺內容生成上的進步,表明其內部可能隱含了對世界結構與規律的理解。更令人關注的是,Google 的最新研究指出,諸如 Veo 3 等模型正在逐步顯現出超越單純合成的 “涌現特性”,包括感知、建模和推理等更高層次能力。

這催生出一個與語言模型 “思維鏈”(Chain-of-Thought, CoT)相對應的新概念 ——Chain-of-Frame(CoF)。其核心思想是:模型通過逐幀生成視頻,以連貫的視覺推演方式逐步解決問題。然而,一個關鍵疑問仍未解決:這些模型是否真正具備零樣本推理(Zero-Shot Reasoning)的能力?抑或它們只是在模仿訓練數據中出現過的表面模式?

為探究這一問題,來自香港中文大學、北京大學、東北大學的研究團隊進行了系統性研究,對 Veo 3 等模型的零樣本推理潛力進行了深入評估,并提出了涵蓋空間、幾何、物理、時間等 12 個推理維度的綜合測試基準 ——MME-CoF。

  • 論文題目:Are Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmark
  • 論文鏈接:https://arxiv.org/pdf/2510.26802v1
  • 項目主頁:https://video-cof.github.io/

什么是 Chain-of-Frame(CoF)推理?

“幀鏈推理” 可以視作語言中 “思維鏈”(CoT)的視覺類比:

  • CoT 通過逐步生成文字展現推理路徑。
  • CoF 則通過逐幀生成畫面,使場景在視覺上不斷演化,從而體現推演過程。

深入分析:12 項推理挑戰

為全面揭示視頻模型的推理潛力,研究團隊設計了 12 個維度的測試任務,對 Veo 3 進行了系統的實證分析。以下選取其中三個典型維度進行說明(其余部分可參閱原論文)。

1. 真實世界空間推理(Real-World Spatial Reasoning)

  • 任務: 評估模型在多視角自然場景中保持空間一致性的能力,包括視角變化、方位對齊與參考系穩定性。
  • 發現: 能較好處理簡單場景下的空間布局與視角切換,局部場景保持合理的空間關系與方向一致。
  • 局限: 在復雜視角變化或深度理解任務中表現不穩,常出現空間錯位、視角漂移或方向混亂,難以維持全局坐標一致性。

2. 3D 幾何推理(3D Geometry Reasoning)


  • 任務: 評估模型在三維幾何變換任務中的結構理解與連續性表現,如物體折疊、旋轉與立體重構。
  • 發現: 在單步、簡單幾何變換中可生成結構完整且視覺連貫的結果,具備初步的三維形態理解能力。
  • 局限: 多步或組合性變換中常出現結構錯位、自交或崩塌,無法維持幾何一致與物理合理性,整體三維推理仍脆弱。

3. 2D 幾何推理(2D Geometry Reasoning)


  • 任務: 評估模型在平面幾何構造與圖形操作任務中的準確性與約束保持能力,如點連線、形狀移動和構圖順序理解。
  • 發現: 在簡單幾何連接任務中可識別并正確繪制基本關系,呈現初步幾何構造能力。
  • 局限: 易優先生成視覺上美觀的圖形而非嚴格幾何符合,常出現連線順序錯誤、形狀變形或持續繪制超出任務范圍,缺乏穩定的幾何約束意識。

其他六個推理維度概覽

除上述三項外,其余九個維度同樣揭示了 Veo 3 的限制:

  • 視覺細節推理(Visual Detail Reasoning):對被遮擋或微小目標的識別不穩,生成內容易偏離任務要求。
  • 視覺追蹤推理(Visual Trace Reasoning):長時序依賴和規則驅動的動作鏈容易中斷,因果一致性不足。
  • 物理推理(Physics-Based Reasoning):未能準確遵循能量、力學等物理規律,僅表現為視覺層面的 “模擬”。
  • 旋轉推理(Rotation Reasoning):小角度旋轉可近似實現,大角度下結構崩壞。
  • 圖表推理(Table & Chart Reasoning):可模仿局部視覺模式,但缺乏對數值關系的真實理解。
  • 物體計數(Object Counting Reasoning):在靜態場景下表現良好,但動態環境中常出現漏數或重復。
  • GUI 推理(GUI Reasoning):能生成點擊或拖動動作,但對操作目的與邏輯缺乏認知。
  • 具身推理(Embodied Reasoning):能識別物體位置與動作,但不遵守環境規則,偶有 “作弊式” 生成。
  • 醫學推理(Medical Reasoning):在放大或觀察局部細節時具備表面能力,但無法保持影像邏輯一致,易出現結構性錯誤。

MME-CoF:首個視頻推理基準

研究團隊基于上述實證研究整理了 MME-CoF 基準,以標準化方式評估視頻模型的推理潛能。其主要特征包括:

  • 首個系統量化視頻模型推理能力的框架;
  • 覆蓋 12 個維度、59 個精心設計任務;
  • 提示式設計創新:將抽象推理任務(如物理、幾何、計數)轉化為可視化視頻生成挑戰,迫使模型通過 “幀鏈推理” 展現過程性思考。

下表展示了多種視頻生成模型在 MME-CoF 基準上的評測結果,評分由 Gemini-2.5-Pro 完成,量表范圍為 0–4。研究團隊從五個維度進行評估。整體來看,各模型的平均得分普遍低于 2 分。

結論:推理還是表演?

綜合 Veo 3 的實證分析,基于對眾多視頻模型的定量評估結果,研究者得出以下結論:

1. 尚不具備獨立的零樣本推理能力 —— 模型主要依賴數據模式,而非邏輯推演。

2. 強生成 ≠ 強推理 —— 其表現更多來自模式記憶與視覺一致性,而非概念理解。

3. 注重表象而非因果 —— 模型生成的結果往往 “看起來對”,但邏輯上并不成立。

4. 未來仍具潛力 —— 可作為視覺推理系統的有力補充模塊,與邏輯模型協同構建更完整的多模態智能體系。

總體而言,這項研究為學界提供了清晰系統的實證分析和評估框架,揭示了視頻生成模型在從 “生成” 邁向 “推理”、實現真正的 “通用視覺模型” 的過程中尚需跨越的關鍵鴻溝。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-27 10:33:36

2025-02-24 08:30:00

視覺模型訓練

2025-02-10 14:05:00

訓練模型AI

2025-05-19 08:37:00

2025-06-17 17:19:31

AIOpenAIGoogle

2024-03-04 13:36:00

模型訓練

2025-04-16 15:28:31

模型AI數據

2025-11-03 08:15:00

2021-12-01 10:05:12

模型人工智能計算

2025-11-10 17:07:13

AI模型自動化

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-06-10 03:30:00

2025-07-17 09:21:11

2024-06-11 14:30:18

2025-05-29 09:20:00

模型研究推理

2025-04-11 09:35:34

2025-10-15 00:00:00

2025-06-27 08:40:00

模型推理AI

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2023-05-30 14:17:00

模型推理
點贊
收藏

51CTO技術棧公眾號

国产真实精品久久二三区| 窝窝社区一区二区| 亚洲影视在线观看| 欧美h视频在线| 亚洲精品无码久久久久| 中文字幕一区二区av| 亚洲国产一区二区三区在线观看| 老头吃奶性行交视频| 美女羞羞视频在线观看| 国产一区二区不卡在线| 奇米成人av国产一区二区三区| а天堂中文在线资源| 国产suv精品一区二区四区视频| 日本久久一区二区| www.18av.com| 91伦理视频在线观看| 成人毛片老司机大片| 成人av在线亚洲| 99久久精品国产亚洲| 亚洲经典一区| 国产亚洲视频中文字幕视频| 99riav国产精品视频| 成人免费毛片嘿嘿连载视频…| 亚洲午夜在线观看视频在线| 亚洲国产激情一区二区三区| 日本高清视频免费看| 欧美a一区二区| 午夜精品国产精品大乳美女| 麻豆明星ai换脸视频| 国产伦一区二区三区| 亚洲高清av在线| 青青草原播放器| 成人精品动漫| 欧美性极品xxxx娇小| 777久久精品一区二区三区无码| a中文在线播放| 久久亚洲捆绑美女| 国产在线资源一区| 朝桐光av在线一区二区三区| 国产一区二区三区在线观看免费 | 国内精品二区| a级片免费视频| 国产主播一区二区| 91精品久久久久久久久| 成人黄色片在线观看| 久久性色av| 欧美在线亚洲在线| 黑人一级大毛片| 亚洲国产1区| 欧美精品video| 久久久久久久久久久久国产| 亚洲国产成人精品女人| 久久精品国产亚洲精品| 成人黄色短视频| 日韩欧美二区| 日韩在线视频国产| 99国产精品无码| 欧美成人激情| 久久久精品美女| 日日噜噜夜夜狠狠久久波多野| 999国产精品视频| 久久精品91久久久久久再现| 亚洲伦理一区二区三区| 午夜av一区| 欧美成人激情视频| 久久久久久久久毛片| 欧美日本不卡| 97精品一区二区视频在线观看| 一级片中文字幕| 日韩中文字幕一区二区三区| 国产精品久久久久999| 中文字幕人妻丝袜乱一区三区| 蜜臀久久99精品久久久画质超高清 | brazzers精品成人一区| 精品国产一区二区三区四区| www.99久久热国产日韩欧美.com| 日本精品人妻无码77777| 欧美激情精品久久久六区热门| 欧美精品www| 亚洲日本视频在线观看| 日韩不卡一区二区| 亚洲va码欧洲m码| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 久久亚洲二区三区| 亚洲乱码一区二区三区| 欧美videossex| 欧美性xxxx18| 999久久久精品视频| 成人精品毛片| 国产午夜精品视频免费不卡69堂| 男人av资源站| 国产精品综合| 国产情人节一区| 日本xxxx人| 国产精品久久久久久久裸模| 2018中文字幕第一页| 中文另类视频| 欧美精品一区二区三区一线天视频| 欧美熟妇一区二区| 欧美一二区在线观看| 欧美猛交ⅹxxx乱大交视频| 天天综合网久久综合网| 国产综合色视频| 欧美日韩天天操| 中国av在线播放| 日本道免费精品一区二区三区| 4438x全国最大成人| 国产精品欧美在线观看| 色综合天天综合网国产成人网| 中文字幕日韩免费| 国产不卡视频一区二区三区| 日韩欧美三级电影| 99热99re6国产在线播放| 欧美日韩在线不卡| 欧洲一级黄色片| 欧美 日韩 国产一区二区在线视频| 日韩美女毛茸茸| 亚洲精品一区二区三区区别| 国产精品电影一区二区| 日本成年人网址| 里番精品3d一二三区| 久久成人精品一区二区三区| 日韩中文字幕高清| 99久久伊人精品| 欧美激情亚洲天堂| 国产成人免费av一区二区午夜| 亚洲天堂免费观看| 你懂的国产视频| 国产成人综合亚洲网站| 一区二区冒白浆视频| 日本电影欧美片| 日韩av一区在线| 国产在线观看你懂的| 国产一区免费电影| 一道精品一区二区三区| 国产精品久久亚洲不卡| 亚洲欧洲国产伦综合| 亚州国产精品视频| 成人美女视频在线看| 久久av高潮av| 在线综合色站| 欧美精品电影在线| 狠狠躁夜夜躁av无码中文幕| 樱花草国产18久久久久| 国产男女无遮挡猛进猛出| 91av精品| 日韩欧美中字| 久久亚洲国产精品| 亚洲一区二区影视| 国产精品久久久久aaaa樱花| 久久久久久久少妇| 九九视频精品全部免费播放| 欧美诱惑福利视频| 飘雪影院手机免费高清版在线观看| 图片区小说区区亚洲影院| 亚洲欧美高清在线| 精品99视频| 国产一区免费视频| 第一福利在线视频| 国产视频丨精品|在线观看| 国产精品100| 久久在线观看免费| 冲田杏梨av在线| 日韩国产欧美| 成人黄色免费在线观看| 91一区二区三区在线| 日韩精品一区二| 国产性猛交普通话对白| aaa亚洲精品| 午夜视频在线瓜伦| 日韩欧美午夜| 成人18视频| av色在线观看| 亚洲人成在线免费观看| 中文字幕制服诱惑| 亚洲免费在线观看| 成熟妇人a片免费看网站| 国产精品白丝喷水在线观看| 在线日韩中文| 欧美成熟毛茸茸复古| 免费观看成人性生生活片 | 欧美成人二区| 精品国产髙清在线看国产毛片| 日韩精品成人一区| 久久精品在线观看| а 天堂 在线| 国产一区二区三区的电影 | 亚洲国产精品一区制服丝袜| 美脚丝袜一区二区三区在线观看| 国产a亚洲精品| 久久91精品国产| 免费a在线观看| 欧美一级久久久| 国产又大又黄又粗| 亚洲视频在线观看三级| 亚洲天堂美女视频| 另类综合日韩欧美亚洲| 国产视频一视频二| 91视频久久| 久久久久久亚洲精品不卡4k岛国| 免费成人毛片| 欧美在线一区二区视频| 黄色网址在线免费观看| 亚洲精品国产精品国自产在线 | 欧美手机在线观看| 91美女片黄在线| 久久aaaa片一区二区| 狂野欧美性猛交xxxx巴西| 看一级黄色录像| 国产亚洲一区二区三区啪| aa日韩免费精品视频一| 蜜桃视频成人m3u8| 午夜免费在线观看精品视频| 日本视频不卡| 亚洲午夜性刺激影院| 亚洲精品久久久久久久久久| 欧美日韩一卡二卡| 国产91精品一区| 亚洲国产视频直播| 一区二区国产精品精华液| 国产日韩欧美激情| yy1111111| 成人午夜视频免费看| 国产欧美激情视频| 青青草视频一区| 日本一本二本在线观看| 亚洲精品少妇| av免费看网址| 欧美黄免费看| 一级一片免费播放| 日本一区二区三区视频| 欧美日韩在线精品| 亚瑟一区二区三区四区| 国产伦精品一区二区三区免| 日本一区二区乱| 91老司机精品视频| 日韩免费在线电影| 国产精品自产拍在线观| 亚洲播播91| 国产精品高潮粉嫩av| 三上悠亚亚洲一区| 欧洲精品在线视频| 女人让男人操自己视频在线观看| 久久久久免费视频| 电影k8一区二区三区久久| 欧美精品在线免费| 羞羞电影在线观看www| 久久综合久久八八| 中文字幕伦理免费在线视频 | 精品国内二区三区| 国产高清在线观看视频| 日韩欧美自拍偷拍| 亚洲国产精品久久久久爰性色| 日韩一二三区不卡| 精品人妻少妇嫩草av无码专区| 欧美日韩不卡一区二区| 中文字幕日日夜夜| 欧美日产国产精品| 99久久婷婷国产一区二区三区| 91麻豆精品国产91久久久资源速度| 国产精品久久久久久久一区二区| 欧美日韩视频在线第一区 | 男女免费视频网站| 亚洲一区成人在线| 国产精品老女人| 一本大道久久a久久综合婷婷 | 欧美一区二区在线免费播放| 国产欧美熟妇另类久久久| 日韩三级免费观看| 日韩一级免费视频| 国产亚洲免费的视频看| seseavlu视频在线| 久久影视电视剧免费网站| 日本色护士高潮视频在线观看| 午夜精品在线观看| 韩国成人在线| 成人黄动漫网站免费| 里番精品3d一二三区| 五月婷婷一区| 欧美激情1区2区| jizzjizz国产精品喷水| 蜜桃精品在线观看| 国产精品成人免费一区久久羞羞| 久久一留热品黄| 免费91在线观看| 亚洲一区二区三区影院| 国产婷婷色一区二区在线观看 | 黄色一级二级三级| 国产专区综合网| 成人手机在线免费视频| 国产精品欧美一区喷水| 久久久久久久久艹| 欧美制服丝袜第一页| www天堂在线| 在线精品视频视频中文字幕| 手机av在线播放| 国产精品99久久久久久久久久久久| 亚洲美女色播| 久久久久一区二区三区| 91精品啪在线观看国产18| 国产 日韩 亚洲 欧美| 麻豆视频一区二区| 国产a级黄色片| 一色屋精品亚洲香蕉网站| 中日韩黄色大片| 欧美一区二区三区免费观看视频| 色视频在线观看福利| 欧美猛男性生活免费| 懂色aⅴ精品一区二区三区| 国产精品高清一区二区三区| 日韩精品二区| av动漫免费看| 成人美女视频在线看| 亚洲不卡在线播放| 色偷偷一区二区三区| 黄色av一区二区三区| 久热精品在线视频| 日韩三区免费| 久久av免费观看| 欧美午夜电影在线观看| 手机免费av片| 中文字幕精品一区| 久草手机在线视频| 亚洲国产成人久久综合| 亚洲区欧洲区| 91久久精品国产| 日韩久久综合| 欧美污视频网站| 99re免费视频精品全部| 精品99在线观看| 91精品在线观看入口| 成av人电影在线观看| 日本久久久久久| 中文字幕精品影院| 国产极品在线视频| www.日韩av| 日本一二三区视频| 精品99一区二区| 精品一性一色一乱农村| 91福利入口| 午夜精品亚洲| 日本成人在线免费观看| 亚洲卡通欧美制服中文| 国产精品爽爽久久久久久| 日日狠狠久久偷偷四色综合免费 | 羞羞的网站在线观看| 亚洲wwwav| 欧美日韩一区二区三区四区在线观看 | 亚洲国产精品免费在线观看| 制服丝袜日韩国产| av在线影院| av在线不卡观看| 一区二区自拍| 中文字幕精品久久久| 欧美日韩国产色| 欧美日本网站| 国产精品第三页| 久久一区二区三区喷水| 91亚洲一区二区| 亚洲成人动漫在线观看| 色偷偷在线观看| 日韩av电影在线网| 超碰成人久久| 日韩在线一区视频| 一区二区三区在线观看动漫| 亚洲精品一区二区三区蜜桃| 91国产精品视频在线| 精品在线91| 超碰超碰在线观看| 亚洲免费在线视频一区 二区| 成人乱码一区二区三区| 91超碰中文字幕久久精品| 最近国产精品视频| 五月天激情视频在线观看| 中文字幕在线不卡| 国产小视频一区| 国产成人精品免高潮在线观看| 全球成人免费直播| 日本黄色三级网站| 日韩欧美亚洲范冰冰与中字| 91看片在线观看| 99久re热视频这里只有精品6| 亚洲精品一级| 无码人中文字幕| 日韩精品在线看片z| 暖暖成人免费视频| 色爽爽爽爽爽爽爽爽| aaa欧美色吧激情视频| 中文字幕久久久久| 欧美极品少妇全裸体| 欧美日韩激情| 先锋资源在线视频| 一本大道久久a久久精二百| 蜜桃av在线免费观看| 精品无人区一区二区三区竹菊 | 成人午夜在线影院| 99热精品在线| 久久久久久久久久网站| 亚洲人成欧美中文字幕| 久久精品九色|