精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI能否「圣地巡禮」?多模態大模型全新評估基準VIR-Bench來了

人工智能 新聞
VIR-Bench 不僅是一個新的評測基準,更是為未來諸多應用打開了一扇窗口。通過在旅行視頻中重建行程順序,它逼迫模型同時理解 “地理位置 + 時間順序”,這與機器人如何理解世界、規劃路徑,以及自動駕駛系統如何在動態環境中進行決策高度契合。

大家或許都有過這樣的體驗:

看完一部喜歡的動漫,總會心血來潮地想去 “圣地巡禮”;刷到別人剪輯精美的旅行 vlog,也會忍不住收藏起來,想著哪天親自走一遍同樣的路線。旅行與影像的結合,總是能勾起人們的探索欲望。那么,如果 AI 能自動看懂這些旅行視頻,幫你解析出 “去了哪些地方”“順序是怎樣的”,甚至還能一鍵生成屬于你的旅行計劃,會不會很有趣?這不僅僅是阿宅的想象,更是多模態大模型在真實世界應用中的一個重要場景。

正是在這樣的啟發下,來自日本早稻田大學,CyberAgent 和奈良先端科學技術大學院大學的團隊提出了一個全新的多模態大模型評估基準 VIR-Bench ,旨在評測 AI 是否真的能理解旅行視頻中的地理位置與時間順序,從而支撐更復雜、更實用的應用。用一句話來概括,這項研究就是在追問:“我從哪里來?我要到哪里去?”

  • 論文地址:https://www.arxiv.org/abs/2509.19002
  • GitHub:https://github.com/nlp-waseda/VIR-Bench

VIR-Bench 是什么?任務設計與數據集構建

任務目標:行程還原(Itinerary Reconstruction)

在 VIR-Bench 中,給定一個旅行 vlog(在日本拍攝),模型要輸出訪問順序圖(visiting order graph),也就是 “我去了哪些地點、按什么順序、地點之間有哪些包含關系” 的結構化表示。

更具體地,這個訪問順序圖是一個有向圖,其中:

  • 節點表示被訪問的地點,按層次分為 Prefecture,City,和 POI(Point of Interest)三層級。
  • 包含邊(Inclusion edge) 表示層次上的 “大地理單元包含小地理單元” 關系(例如某 POI 在某個 City 里,某個 City 在某個 Prefecture 里)。
  • 轉移邊(Transition edge) 表示時間順序上的移動:從一個節點移動到下一個節點(同層級)表示旅行順序。

這意味著模型不僅要識別出 “我去過的地點”,還要判斷這些地點之間的時間順序,地理空間關系,進而構建出整個旅行路徑的結構。此外,由于旅行視頻往往是自拍視角 / 行進視角 / 風光視角等交錯出現,模型需要在多樣視角、非連續畫面中 “拼圖式” 理解,這進一步提升了任務難度。

為便于模型訓練與評測,作者將這一復雜任務拆解為兩個子任務:

1. 節點預測:給定視頻,模型列出所有被訪問的 Prefecture、City、POI。

2. 邊緣預測:給定視頻 + 節點集合(節點標簽順序被打亂),模型要判斷哪些節點之間存在包含邊,哪些節點之間存在轉移邊。即預測邊的集合。

通過這種分解方式,我們可以分別評估模型的地理識別能力與時序推理能力,以及它們在實際組合時的協同性。

數據集構建:200 個旅行視頻 + 訪問順序圖

為了支撐上述任務,作者構建了一個規模適中的專用數據集:

  • 視頻數量:200 個旅行 vlog(都在日本拍攝) 。
  • 地點覆蓋:共標注出 3,689 個 POI,分布在日本 43 個都道府縣(幾乎覆蓋全日本) 。
  • 標注方式:每個視頻由人工注釋者識別每個 POI 的起止時間、Google Maps 鏈接,并通過雙人校驗后自動構建最終的訪問順序圖。 

作者在論文中還附上了詳細注釋指南、數據分布統計等信息(可見 Appendix 部分)。

實驗結果與洞察:當前模型面臨的挑戰

在實驗中,作者發現開源模型整體上仍然落后于商用模型,尤其是在 POI 節點識別 和 轉移邊預測 這兩個子任務上差距尤為明顯。進一步的分析顯示,轉移邊預測幾乎是所有模型的 “最難關”:不少模型要么直接誤解了任務要求,要么忽視了層級結構的約束(只有同層級節點之間可以有轉移邊),結果往往接近隨機水平。

另一方面,模型規模的擴展對性能提升具有顯著作用,尤其體現在邊緣預測上;而是否具備地理相關的預訓練,則成為 POI 節點預測精度差異的關鍵因素。值得注意的是,思維鏈推理(Chain-of-Thought) 的效果在不同子任務中差別很大:在節點預測中提升有限,但在邊緣預測中卻能帶來顯著的改善。如果再進一步結合音頻信息(例如 Gemini-2.5-Pro 的多模態輸入),效果提升尤為突出。

Ablation 實驗也為我們揭示了模型性能提升的幾個關鍵方向:增加輸入幀數可以讓模型捕捉更完整的旅行線索,更長的推理過程能幫助模型逐步還原旅行順序,而音頻的利用則能提供額外的語義提示。三者結合,共同推動了模型在復雜時空理解任務上的進步。

然而,即便有這些改進,整體性能仍遠未達到可用水平。即使是當前得分最高的 Gemini-2.5-Pro,在預測結果中依然存在大量錯誤,這進一步凸顯了多模態大模型在長程地理與時間理解上的巨大挑戰。

表1: 節點預測的評估結果

表2: 邊緣預測的評估結果

總而言之,VIR-Bench 不僅是一個新的評測基準,更是為未來諸多應用打開了一扇窗口。通過在旅行視頻中重建行程順序,它逼迫模型同時理解 “地理位置 + 時間順序”,這與機器人如何理解世界、規劃路徑,以及自動駕駛系統如何在動態環境中進行決策高度契合。

這一研究讓我們看清:當前的大模型在長程推理和時空理解上仍有明顯不足,但也指明了進化的方向 —— 更強的地理空間感知、更可靠的時間推理,以及多模態信息的深度融合。當這些能力逐漸成熟,AI 將不再只是 “看視頻”,而是真正具備 “在世界中行動” 的潛力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-06-16 14:39:56

模型開源框架

2025-01-08 08:21:16

2025-05-21 08:47:00

2023-11-05 15:09:35

模型AI

2024-03-25 12:40:19

訓練模型

2025-04-28 14:04:03

Gemini模型AI

2025-11-05 08:51:33

2024-06-17 18:06:17

2023-08-03 10:59:49

人工智能

2025-07-10 08:52:00

2025-07-04 16:50:07

工具AI模型

2025-09-16 09:35:52

2025-11-11 08:45:00

2024-11-15 15:38:00

模型測評

2024-12-18 18:57:58

2024-11-13 09:39:13

2024-12-30 00:01:00

多模態大模型Python

2024-10-22 14:20:00

AI模型

2024-07-15 07:52:00

點贊
收藏

51CTO技術棧公眾號

久久天堂影院| 亚洲 小说区 图片区 都市| 91欧美日韩| 欧美大胆人体bbbb| 中国丰满人妻videoshd| h视频在线免费| 国产裸体歌舞团一区二区| 久久免费视频在线| 先锋影音av在线| 中文字幕一区二区三区日韩精品| 欧美日韩另类视频| 在线视频一区观看| 亚欧在线观看视频| 久久99精品国产麻豆婷婷洗澡| 欧美黑人xxx| 真实乱视频国产免费观看| 久久9999免费视频| 在线观看一区二区视频| 狠狠干视频网站| 国产视频三级在线观看播放| 成人综合婷婷国产精品久久蜜臀| 国产成人久久精品| 国产精品黄色网| 国产高清一区| 夜夜嗨av色综合久久久综合网| xxxx视频在线观看| 欧美日韩伦理一区二区| 欧美视频13p| 青青青在线观看视频| 三区四区在线视频| 久久久亚洲精品一区二区三区| 亚洲综合在线播放| 五月婷婷六月婷婷| 免费在线成人| 97超碰国产精品女人人人爽| 国产成人自拍网站| 欧美好骚综合网| 在线视频欧美性高潮| 国产精品无码一区二区三| 欧一区二区三区| 69av一区二区三区| 亚洲一区日韩精品| 久久亚洲人体| 欧美丝袜丝交足nylons| www黄色在线| 欧美亚洲韩国| 色中色一区二区| 丰满人妻中伦妇伦精品app| 国内老司机av在线| 一区二区三区视频在线看| 色撸撸在线观看| 日本电影全部在线观看网站视频| 国产喂奶挤奶一区二区三区| 欧美日韩国产一二| 免费黄色在线视频网站| 不卡的av中国片| 国产精品制服诱惑| 五月婷婷激情在线| 91视频免费播放| 看欧美日韩国产| 九色视频在线播放| 国产日本欧洲亚洲| 亚洲欧洲精品一区二区| 国产二区视频在线观看| 久久精品欧美一区二区三区不卡| 欧美区高清在线| 国产三级在线免费观看| jizzjizz中国精品麻豆| 国产精品麻豆一区二区| 亚洲国产另类久久久精品极度| 牛牛热在线视频| 久久久久久久免费视频了| 日本中文不卡| 欧美性天天影视| 亚洲欧美经典视频| 国产人妻777人伦精品hd| 日韩伦理在线| 欧美日韩一区高清| 1314成人网| 久久91在线| 在线视频精品一| 九九精品视频免费| 欧美日韩国产在线一区| 26uuu亚洲伊人春色| 最近免费中文字幕大全免费版视频| 日韩中文字幕区一区有砖一区 | 女人裸体性做爰全过| 欧美丰满日韩| 97精品欧美一区二区三区| 国产女主播喷水视频在线观看| 久久精品99国产精品日本| 99re在线国产| 久久久资源网| 亚洲精品久久久蜜桃| 国产精品无码一区二区在线| jizz久久久久久| 精品捆绑美女sm三区| 中文字幕高清视频| 一本一本久久a久久综合精品| 91精品国产免费久久久久久| 中文无码精品一区二区三区| 国产成人免费高清| 日韩国产美国| 爱看av在线入口| 欧美唯美清纯偷拍| 久久久久亚洲av成人网人人软件| 国产日产一区 | 狠狠v欧美v日韩v亚洲ⅴ| 超碰在线97av| av资源种子在线观看| 亚洲无线码一区二区三区| 久久精品影视大全| 美女主播精品视频一二三四| 日韩在线播放一区| 无码人妻精品一区二| 国产高清久久久| 午夜精品一区二区在线观看| 黄色激情在线播放| 日韩一区二区影院| 国产又粗又硬视频| 国产精品久久久久久久免费软件 | 北条麻妃视频在线| eeuss鲁片一区二区三区| 日韩一区二区三区在线播放| 亚洲精品男人的天堂| 大陆成人av片| 路边理发店露脸熟妇泻火| 成人免费一区| 亚洲欧洲在线看| 日本一级片免费看| 国产成人综合在线| 中文字幕一区二区三区四区五区人| 欧美激情喷水| 亚洲精品一区二区在线| 日本天堂网在线观看| 国产大片一区二区| 99热都是精品| 精品国产亚洲日本| 久久精品精品电影网| 中国一级特黄视频| 国产精品视频观看| 亚洲成人福利在线观看| 国产一区国产二区国产三区| 午夜精品久久久久久久久久久久 | **精品中文字幕一区二区三区| 亚洲欧美第一页| 男人午夜免费视频| 99精品视频一区| 噜噜噜久久亚洲精品国产品麻豆| 福利电影一区| 992tv成人免费影院| 四虎在线视频免费观看| 亚洲图片欧美一区| 制服丝袜在线第一页| 狠狠色综合网| 国内一区在线| 色8久久影院午夜场| 在线亚洲国产精品网| 中文字幕观看视频| 最近中文字幕一区二区三区| 午夜精品免费看| 亚洲精品二区三区| 99久久精品无码一区二区毛片| 色网在线观看| 亚洲美女久久久| 91视频在线视频| 一区精品在线播放| 亚洲午夜精品在线观看| 国产一区二区三区四区三区四| 国产精品一区二区三区在线观| 999av小视频在线| 亚洲女人天堂成人av在线| 中文字幕欧美在线观看| 亚洲人成伊人成综合网小说| 亚洲欧美激情一区二区三区| 亚洲日本国产| 日韩三级在线播放| 国产精品毛片无码| 国语自产精品视频在线看| 欧美女子与性| 制服丝袜日韩国产| 国产成人无码精品| 亚洲国产精品激情在线观看| 国产探花在线观看视频| 亚洲高清成人| 午夜视频久久久| 57pao国产一区二区| 国产成人久久久精品一区| 手机亚洲第一页| 欧美群妇大交群中文字幕| 国产精品老熟女一区二区| 91在线精品一区二区| 中文久久久久久| 狠狠色丁香久久综合频道| 日韩av高清| 欧美国产亚洲精品| 国产成人一区二区三区小说| 污污网站在线观看| 国产一区二区久久精品| www.黄色国产| 欧美午夜免费电影| 日本免费在线播放| 国产精品不卡一区二区三区| 日本少妇xxxx| 激情综合网av| 99久久国产宗和精品1上映| 午夜精品999| 亚洲成人自拍| 欧洲vs亚洲vs国产| 亚洲xxxx在线| 成人午夜亚洲| 日本欧美国产在线| av在线网页| 美女福利精品视频| 最新电影电视剧在线观看免费观看| 亚洲福利在线播放| 国产乱淫a∨片免费观看| 色婷婷激情一区二区三区| 久久精品欧美一区二区| 国产精品福利一区| 国产熟女一区二区| 久久先锋影音av鲁色资源网| 乳色吐息在线观看| 蜜臀av亚洲一区中文字幕| 九色在线视频观看| 亚洲国产一区二区三区a毛片| 中文字幕免费在线不卡| 欧美日韩水蜜桃| 蜜桃视频在线观看91| jazzjazz国产精品久久| 91香蕉嫩草影院入口| 99只有精品| 国产精品99久久久久久www| 日韩精品av| 97在线看福利| 国产夫妻在线播放| 午夜精品理论片| 国产经典三级在线| 欧美第一淫aaasss性| 91蜜桃在线视频| 另类色图亚洲色图| xvideos国产在线视频| 色噜噜久久综合伊人一本| 成人性爱视频在线观看| 正在播放欧美视频| 国产日本在线视频| 亚洲最新中文字幕| 一区二区三区视频在线观看视频| 伊人成人开心激情综合网| 九色视频在线观看免费播放| 亚洲色图第一页| 搞黄视频在线观看| 综合网中文字幕| 男人天堂久久久| 久久精品一本久久99精品| 菠萝菠萝蜜在线视频免费观看| 久久视频这里只有精品| h片在线免费观看| 欧美黑人性猛交| 蜜桃视频在线观看播放| 欧美亚洲成人精品| 网友自拍亚洲| 成人精品视频99在线观看免费| 伊人亚洲精品| 国产精品裸体一区二区三区| 精品福利一区| 欧美午夜免费| 国产精品二区不卡| 久久久久久久9| 香蕉精品999视频一区二区| 青青草av网站| 国内精品免费**视频| 美女久久久久久久久| 久久综合一区二区| 免费黄色在线网址| 亚洲激情图片小说视频| 欧美三级午夜理伦| 欧美午夜精品理论片a级按摩| 97人妻一区二区精品免费视频| 欧美成人r级一区二区三区| 亚洲色图 校园春色| 最近2019中文字幕mv免费看| 欧美另类tv| 国产精品1234| 亚洲国产aⅴ精品一区二区| 久久偷窥视频| 伊人青青综合网| 日韩av一二三四区| 九九国产精品视频| 中文字幕乱码在线| 国产精品国产三级国产普通话蜜臀| 久久久精品国产sm调教| 色婷婷精品久久二区二区蜜臀av| av网站免费大全| 亚洲色图35p| 俺来俺也去www色在线观看| 国产精品欧美一区二区三区奶水| 2023国产精华国产精品| 亚洲欧洲国产精品久久| 亚洲美女视频在线免费观看| 婷婷激情5月天| 久久先锋资源网| 国产精品成人久久| 欧美日本视频在线| 日韩在线无毛| 欧美二区在线播放| 久久人体av| 日韩高清国产精品| 亚洲深夜av| 久久久久亚洲av无码网站| 中文字幕不卡在线观看| 久久夜色精品亚洲| 日韩精品影音先锋| 日p在线观看| 国产精品久久久久av| 久久久久高潮毛片免费全部播放| 一区二区免费在线观看| 新67194成人永久网站| 国产无套精品一区二区三区| 国产精品久久久久久一区二区三区| 日韩毛片在线播放| 日韩一区二区三区电影在线观看 | 国产精品亚洲片在线播放| 99色这里只有精品| 国产高清亚洲一区| 日本黄色片免费观看| 欧美日韩美少妇| 成年人在线看| 国产精品福利网站| 亚洲区小说区图片区qvod按摩| 国产不卡一区二区视频| 国产激情一区二区三区四区| 午夜爱爱毛片xxxx视频免费看| 欧美色网站导航| 国产高清视频免费最新在线| 欧美孕妇与黑人孕交| 日韩精品社区| 欧美日韩一道本| 91首页免费视频| 国产无遮挡呻吟娇喘视频| 精品五月天久久| 手机在线观看av网站| 含羞草久久爱69一区| 99热免费精品在线观看| 玖玖爱在线精品视频| 欧美小视频在线| 免费毛片在线| 国产精品第1页| 日韩精品一区二区久久| 国产九九在线视频| 国产精品久久久久一区二区三区共 | 日韩一区av| 国产激情视频一区| 欧美理论电影大全| 欧美午夜aaaaaa免费视频| 欧美韩日一区二区三区四区| 日韩久久久久久久久久| 自拍偷拍亚洲区| 国产日本亚洲| 日韩成人三级视频| 91一区二区三区在线观看| 欧美精品韩国精品| 亚洲网址你懂得| 欧美xxxx性| 日韩精品一区二区三区四| av在线不卡观看免费观看| av一级在线观看| 日韩视频第一页| 国产精品三p一区二区| 一二三四视频社区在线| 久久久久九九视频| 91成人一区二区三区| 欧美另类高清videos| 久久资源综合| 在线观看免费的av| 亚洲一二三区不卡| 久蕉在线视频| 91久久综合亚洲鲁鲁五月天| 国产尤物精品| 国产jjizz一区二区三区视频| 欧美日韩精品电影| sqte在线播放| 日韩精品另类天天更新| 激情成人综合网| 91久久国产视频| 色阁综合伊人av| 岛国精品一区| 中文字幕第36页| 亚洲一区精品在线| 丁香在线视频| 国产a一区二区| 青青草国产精品亚洲专区无| 久久久久久免费观看| 国产小视频国产精品| 综合激情五月婷婷| 久久久久久久久久久久91| 亚洲国产一区视频| 91短视频版在线观看www免费| 国产精品二区在线观看| 美日韩一级片在线观看|