精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

李飛飛謝賽寧新作「空間推理」:多模態大模型性能突破關鍵所在

人工智能
即使是最先進的多模態大模型,在空間認知方面與人類相比仍有顯著差距,測試中約71%的錯誤都源于空間推理方面的缺陷,即空間推理能力是當前主要瓶頸。

李飛飛謝賽寧再發新成果:

直接把o1式思考拉至下一個level——多模態大語言模型的空間思維

這項研究系統評估了多模態大模型的視覺空間智能,結果發現:

當前,即使是最先進的多模態大模型,在空間認知方面與人類相比仍有顯著差距,測試中約71%的錯誤都源于空間推理方面的缺陷,即空間推理能力是當前主要瓶頸

圖片圖片

更為有趣的是,在這種情況下,思維鏈、思維樹等常用的語言提示技術直接失靈了——

不僅沒有提升模型在空間任務上的表現,反而會使性能下降。

而在問答過程中明確生成認知地圖則會增強多模態大模型的空間距離能力。

圖片圖片

這項工作陣容非常豪華,合著作者中不僅有李飛飛,還有紐約大學計算機科學助理教授、CV大牛謝賽寧。

而剩下的四位作者,全部共同一作。

圖片圖片

這項研究吸引了不少網友的關注,大伙兒一邊看論文,一邊已迫不及待搓搓手期待2025年的新進展。

圖片圖片

多模態大模型的空間思維

雖然當前多模態大語言模型在語言理解和一般視覺任務上取得了顯著進展,但在空間認知和理解方面的能力仍未得到充分研究。

反觀人類,面對心理旋轉測試、挑選家具這些任務時,會同時依賴于空間和視覺思考。

圖片圖片

多模態大語言模型能否“進行空間思考”?能否構建一個準確的、隱式的“認知地圖”來幫助它們回答有關空間的問題?使用多模態大語言模型來增強空間智能的優勢和局限性是什么?

為了探索這些問題,團隊研究了視覺空間智能

作者解釋,之所以在“空間智能”前加上“視覺”一詞,是因為空間智能不受感官模式限制,比如盲人也可以通過別的感官感知空間,而該研究專注于視頻輸入,所以討論視覺空間智能。

圖片圖片

VSI-Bench視覺空間智能基準測試集

首先團隊提出了一個名為VSI-Bench的基準測試集。

基于之前的計算機視覺工作,團隊重新利用現有的空間掃描視頻(最初用于3D重建)及其真實標注來自動生成視覺問答(VQA)問題。

具體來說,這個測試集基于ScanNet、ScanNet++和ARKitScenes等數據集中的288個真實室內場景視頻,包括住宅、辦公室、實驗室等各種環境。

團隊設計了超5000個問答對,將評測任務分為三大類:

  • 配置型任務:物體計數、相對距離、相對方向、路線規劃
  • 測量估計:物體尺寸、房間大小、絕對距離
  • 時空任務:物體出現順序等

并采用人工審核確保數據質量,消除歧義和錯誤標注。

圖片圖片

隨后,他們全面評估了15種支持視頻的多模態大語言模型,開源、閉源的都有。

圖片圖片

結果,人類在VSI-Bench上的平均準確率達到79%,在配置型和時空任務上準確率更高,處于94%-100%之間。

相比之下,表現最好的閉源模型是Gemini-1.5 Pro,平均準確率為48.8%,開源模型LLaVA-NeXT-Video-72B和LLaVA-OneVision-72B與之相近。

在需要精確估計絕對距離/大小的三個測量任務上,大模型和人類表現差距相對較小。

團隊還進一步證實了視頻輸入對模型性能的重要性,盲測實驗中,在絕對距離估計等特定任務上,即使是最先進的模型也難以超越隨機基線的表現。

語言視覺兩個層面分析模型思維過程

為了深入理解模型的認知機制,團隊又從語言和視覺兩個層面分析了模型的思維過程。

圖片圖片

圖片圖片

在語言層面,通過讓模型進行自我解釋,發現它們確實具備不錯的視頻理解和語言推理能力。

但詳細的錯誤分析顯示,超70%的錯誤源于其空間推理能力的不足

圖片圖片

圖片圖片

接著,團隊用常用的語言提示技術改進,包括思維鏈、思維樹、自洽性。

結果不僅沒有提升模型在空間任務上的表現,反而導致了性能下降,也就是說純粹的語言推理技術難以解決空間認知問題。

在視覺層面,他們又使用認知地圖來分析模型的空間記憶能力。

結果顯示,模型在理解局部空間關系時表現較好,相鄰物體位置關系的準確率達到64%。但隨著物體之間距離的增加,模型的空間關系理解能力顯著下降。

這說明模型傾向于建立局部空間模型,而不是形成完整的全局空間理解

圖片圖片

圖片圖片

不過,他們研究了一種新思路:

使用認知地圖輔助空間推理。

圖片圖片

加入這種機制,模型在相對距離任務上的準確率提升了10個百分點,這為提升模型空間智能提供了一個潛在的解決方向。

李飛飛謝賽寧領銜,四位共同一作

論文一經公布,幾位作者就激情當起了自個兒的首批自來水(doge)。

謝賽寧表示:

視頻理解是下一個前沿領域,但并非所有視頻都是相同的。

這項研究探索了多模態大語言模型如何觀察、記憶和回憶空間。

圖片圖片

“AI教母”李飛飛也轉發開麥:

這是人類智能中極為重要的一個方面,2025年還有更多值得期待,推動空間智能的邊界!

圖片圖片

這項研究共同一作有四位,正如李飛飛教授透露,多位都是謝賽寧的學生。

Jihan Yang

圖片圖片

Jihan Yang是紐約大學Courant研究所博士后研究員,導師是謝賽寧。在此之前,Jihan Yang于香港大學獲得了博士學位,中山大學獲得了學士學位。

他的研究興趣集中在機器學習和計算機視覺領域,特別關注多模態和具身智能。

Shusheng Yang

圖片圖片

Shusheng Yang目前是紐約大學博士生。

領英顯示,他是華中科技大學校友,曾經在阿里和騰訊有過工作經歷。

圖片圖片

Anjali Gupta

圖片圖片

Anjali Gupta是紐約大學Courant研究所博士生,導師是謝賽寧教授。

她的研究領域是機器學習和計算機視覺,特別是以視覺為中心的多模態大語言模型。

Rilyn Han

圖片圖片

Rilyn Han來自耶魯大學,主修計算機科學和經濟學,研究主要關注探索多模態大語言模型的能力。

論文鏈接:https://arxiv.org/pdf/2412.14171
項目主頁:https://vision-x-nyu.github.io/thinking-in-space.github.io/
參考鏈接:
[1]https://x.com/sainingxie/status/1870877202595958791
[2]https://x.com/drfeifei/status/1870881981703291097
[3]https://vision-x-nyu.github.io/thinking-in-space.github.io/

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-12-23 13:50:00

數據訓練模型

2025-04-08 09:10:00

模型訓練AI

2025-11-10 17:11:13

AI李飛飛模型

2025-11-11 12:16:25

2025-04-14 09:38:00

2023-12-25 09:23:07

模型技術

2023-09-28 08:23:18

AI模型

2024-08-07 13:00:00

2024-06-27 13:10:21

2025-07-04 08:52:00

3D圖像生成AI

2009-10-12 14:00:24

布線測試

2021-06-23 10:26:19

自動化DevSecOps安全防護

2011-04-14 13:26:10

2025-01-08 08:21:16

2025-05-21 08:47:00

2020-06-10 14:00:28

生物識別智慧城市網絡

2016-11-14 16:47:11

Nutanix

2024-10-25 14:30:00

模型AI

2023-12-28 17:31:44

PixelLM性能模型

2025-06-10 03:30:00

點贊
收藏

51CTO技術棧公眾號

视频在线观看99| 亚洲一二三四区| 国产精品高潮呻吟视频| 亚洲精品乱码久久久久久久久久久久| 亚洲天堂手机| 欧美国产丝袜视频| 538国产精品一区二区在线| 国产精品久久久久久亚洲色| 这里有精品可以观看| 久久九九影视网| 国产欧美一区二区| 久视频在线观看| 亚洲动漫精品| 欧美视频中文字幕| 中文字幕色呦呦| 欧美精品少妇| 国产成人精品亚洲日本在线桃色| 国产精品1234| 免费在线一级片| 青青一区二区三区| 日韩大陆欧美高清视频区| 牛夜精品久久久久久久| 123区在线| 亚洲精品视频在线看| 天天久久人人| 天堂a√中文在线| 成人综合在线视频| 91日本在线视频| 中文字幕高清在线免费播放| 精品1区2区3区4区| 日韩视频在线观看免费| 人妻少妇无码精品视频区| 成人自拍在线| 日韩片之四级片| 97人人爽人人| 国产69精品久久| 色婷婷综合在线| 日本在线xxx| 国内高清免费在线视频| 亚洲精品视频自拍| 五月天在线免费视频| 在线观看黄色av| 欧美激情一区二区三区| 欧美三级网色| 日本wwwxxxx| 老司机精品视频导航| 国产精品成久久久久三级| 中文字幕第28页| 亚洲美女视频| 日韩中文字幕久久| 一区二区三区在线观看免费视频| 欧美一区 二区| 精品国产三级a在线观看| 亚洲精品永久视频| 国产成人免费精品| 日韩欧美aⅴ综合网站发布| www.九色.com| av中文字幕在线观看| 国产精品国产精品国产专区不蜜| 欧美亚洲一级二级| 亚洲 欧美 自拍偷拍| 成人h动漫精品| 国产欧美韩日| 午夜精品一二三区| 国产精品18久久久久久久久| 91久久国产综合久久91精品网站| 亚洲中文一区二区三区| 久久精品国产网站| 国产日韩欧美成人| 久久久久久久久久影院| 香蕉精品999视频一区二区 | 成人免费淫片视频软件| 波多野结衣二区三区| 久久青草久久| 国产精品白嫩美女在线观看| 国产精品黄色大片| 日韩一区二区免费看| 91精品国产精品| 国产精品视频久久久久久久| 性伦欧美刺激片在线观看| 欧美一级片在线播放| 国产成人无码av| 亚洲综合社区| 国产精品久久久久久久7电影| 亚洲中文无码av在线| 久久国产精品99久久人人澡| 91色视频在线导航| www.超碰在线.com| 99精品视频在线观看| 欧美三日本三级少妇三99| 成人免费在线电影| 国产欧美日韩综合| 久久99国产精品一区| 国产不卡123| 91久久免费观看| 日日夜夜精品视频免费观看| 激情av综合| 国产亚洲精品久久久| 欧美一区二区三区观看| 欧美黄在线观看| 136fldh精品导航福利| 国产一级精品毛片| 国产精品88888| 欧美日韩国产不卡在线看| 国产精品二线| 一区二区三区高清在线| 国产一区视频免费观看| 亚洲三级在线| 亚洲国产精品免费| 91禁男男在线观看| 欧美jjzz| 日韩av电影手机在线| 亚洲一级黄色大片| 成a人片亚洲日本久久| 日韩欧美三级电影| 黄网站在线观| 欧美日韩国产免费| 久久性爱视频网站| 日韩精品免费一区二区在线观看| www.色综合| 天天操夜夜操视频| 国产做a爰片久久毛片| 国产一区二区三区av在线| 国产69精品久久app免费版| 亚洲黄色录像片| 五月婷婷激情久久| 综合干狼人综合首页| 欧美高清激情视频| 中文字幕一区二区在线视频| av在线这里只有精品| 欧美性视频在线播放| 欧美大胆性生话| 精品国产一区二区三区久久久蜜月| 亚洲av综合一区二区| 欧美一区在线看| 国产精品免费久久久久久| 五月天激情开心网| 亚洲丝袜另类动漫二区| 少妇性l交大片| 欧美色图婷婷| 欧美疯狂做受xxxx高潮| 精品国产亚洲av麻豆| 国产精品久久久久婷婷二区次| 免费在线观看亚洲视频| 2023国产精华国产精品| 久久这里有精品视频| 国产91av在线播放| 91老司机福利 在线| 国产成人永久免费视频| 精品一区二区三区中文字幕视频| 综合国产在线视频| 怡红院男人天堂| 中文字幕乱码日本亚洲一区二区| 欧美成人精品欧美一级乱| 久9久9色综合| 日韩av高清不卡| 外国精品视频在线观看| 一区二区三区在线视频免费| 伊人成人免费视频| 亚洲综合中文| 成人女保姆的销魂服务| 麻豆影视在线观看_| 欧美日韩在线三级| 美女网站视频色| 日本午夜精品视频在线观看| 亚洲电影免费| 校园春色亚洲色图| 亚洲香蕉在线观看| 国产成人自拍偷拍| 国产精品亲子乱子伦xxxx裸| 日韩爱爱小视频| 欧美电影三区| 亚洲淫片在线视频| 免费污视频在线观看| 日韩精品一区二区三区中文不卡| 国产成人久久久久| 成人午夜av影视| 日韩欧美亚洲天堂| 三级小说欧洲区亚洲区| 青青草精品毛片| 高清av在线| 91.com视频| 欧美日韩国产精品一区二区三区| 成人高清视频免费观看| 亚洲 高清 成人 动漫| 精品在线观看入口| 国产精品永久在线| 日本在线视频中文有码| 亚洲电影天堂av| 欧美另类高清videos的特点| 亚洲日本丝袜连裤袜办公室| 丰满少妇xbxb毛片日本| 99精品视频网| 一级一片免费播放| 成人在线视频中文字幕| 国产999在线观看| 免费av在线网址| 亚洲激情在线观看| 亚洲欧美日韩激情| 亚洲色图在线视频| 中文字幕精品视频在线| 日韩高清不卡在线| 第九区2中文字幕| 91麻豆精品激情在线观看最新| 国产精品福利网| 麻豆91在线| 亚洲欧洲国产精品| 国产激情视频在线播放| 欧美视频在线免费看| 5566中文字幕| 99精品国产热久久91蜜凸| 高潮一区二区三区| 一区二区三区国产在线| 视频一区视频二区视频三区视频四区国产| 91亚洲视频| 欧美在线激情网| 91最新在线视频| 在线日韩第一页| 成人午夜福利视频| 欧美日韩亚洲国产综合| 国产成人无码精品亚洲| 综合久久给合久久狠狠狠97色| 国产+高潮+白浆+无码| 久88久久88久久久| 91免费国产精品| 国产剧情在线观看一区| 亚洲一区二区三区在线免费观看| 波多野结衣久久精品| 欧美超级乱淫片喷水| 免费人成黄页在线观看忧物| 日韩经典av| 中文字幕5566| 国产精品资源网站| 国产成人精品无码播放| 欧美激情1区2区3区| 亚洲欧美电影在线观看| 久久91精品| 国产三级精品在线不卡| www一区二区三区| 国产精品久久久久久搜索 | 日本成人在线不卡| 日韩精品一卡| 欧美视频1区| 六月丁香久久丫| 99久久免费国| 超清av在线| 欧美久久精品午夜青青大伊人| av一本在线| 国产婷婷色综合av蜜臀av| 黑人乱码一区二区三区av| 日韩一二三区不卡| 国产精品一二三四五区| 欧美日韩免费不卡视频一区二区三区| 国产婷婷色一区二区在线观看| 婷婷亚洲久悠悠色悠在线播放| 国产成人无码一区二区三区在线 | 青青草av在线播放| 亚洲国产精品一区二区久久 | 美国一级片在线免费观看视频 | 亚洲精品免费在线播放| www色aa色aawww| 亚洲日本中文字幕区| 一级片一级片一级片| 亚洲另类在线一区| 欧美xxxx黑人xyx性爽| 亚洲精品视频一区| 欧美被狂躁喷白浆精品| 五月婷婷久久丁香| 可以免费看的av毛片| 一本久久精品一区二区| 极品国产91在线网站| 欧美在线免费播放| 亚洲视屏在线观看| 555夜色666亚洲国产免| 国产xxxx在线观看| 日韩午夜小视频| 青青免费在线视频| 中文字幕亚洲欧美| 久久77777| 欧美激情亚洲国产| 亚洲精品成人图区| 国产精品视频最多的网站| 日韩精品一级毛片在线播放| 国产精品久久久久久婷婷天堂| 日本综合字幕| 国产精品一区二区三区毛片淫片| 高清一区二区中文字幕| 国产精品区一区二区三在线播放| 希岛爱理av免费一区二区| 亚洲成人蜜桃| 国产精品sm| 国产青青在线视频| 麻豆精品一区二区综合av| zjzjzjzjzj亚洲女人| 国产欧美日韩亚州综合| 丰满少妇高潮久久三区| 无吗不卡中文字幕| 中文字幕乱码一区二区| 日韩精品一区二区三区视频在线观看 | yellow视频在线观看一区二区| 日韩欧美国产大片| 中文字幕一区综合| 亚洲日产国产精品| 9久久婷婷国产综合精品性色| 国产美女视频91| 中文字幕狠狠干| 亚洲美女视频在线| 精品免费囯产一区二区三区 | 亚洲国产精品国自产拍久久| 精品视频久久久| 国产三区视频在线观看| 欧美一区二区三区精品电影| 亚洲欧美久久精品| 久久精品久久精品国产大片| 亚欧美无遮挡hd高清在线视频| 阿v天堂2017| 精品一区二区免费在线观看| 日本高清www| 亚洲一区二区偷拍精品| 亚洲熟女乱色一区二区三区久久久| 亚洲第一国产精品| 国产淫片在线观看| 国产精品嫩草视频| 色综合www| 国产一区二区三区乱码| 欧美a级理论片| 阿v天堂2014| 欧美日韩午夜激情| 精品久久在线观看| 色婷婷**av毛片一区| 小h片在线观看| 国产精品污www一区二区三区| 国产精品91一区二区三区| 成人三级视频在线播放| 久草这里只有精品视频| 国产人与禽zoz0性伦| 在线看一区二区| 天堂v视频永久在线播放| 久久久久中文字幕2018| 91成人福利社区| 一个色的综合| 蜜臀精品一区二区三区在线观看 | 久久老司机精品视频| 欧美狂野另类xxxxoooo| 可以在线观看的黄色| 国产91对白在线播放| 你懂的在线观看一区二区| 国产精品videossex国产高清| 国产一区二区三区在线看麻豆| 久久精品在线观看视频| 欧美揉bbbbb揉bbbbb| 日韩电影免费| 国产精品第七十二页| 欧美日韩第一| 久久99999| 中文字幕第一区二区| 亚洲天堂视频在线| 一区国产精品视频| 欧美1级2级| 小说区视频区图片区| 紧缚奴在线一区二区三区| 青青操在线视频观看| 欧美一区二区三区影视| 黄色一级片在线观看| 成人性教育视频在线观看| 久久久久美女| 三级网站免费看| 精品毛片网大全| 九色视频在线播放| 国产精品久久久久久中文字 | 国产激情片在线观看| 国产美女久久久久| 国产亚洲精品久久久久久无几年桃| 欧美大片免费久久精品三p| 91麻豆一二三四在线| 精品国产乱码久久久久软件| 亚洲欧美日韩国产一区二区| 国产123在线| 欧美日韩精品一区视频| 成人在线免费看黄| 91免费版网站在线观看| 99re国产精品| 免费视频91蜜桃| 欧美区一区二区三区| 电影k8一区二区三区久久| 久久国产精品一区二区三区四区 | 日本超碰在线观看| 亚洲品质自拍视频| 日韩一级中文字幕| 国产91九色视频| 一本一道久久a久久精品蜜桃| 韩国一区二区在线播放| 午夜精品一区在线观看| 第九色区av在线| 99在线免费观看视频| 国产亚洲精品自拍| 国产午夜精品福利视频| 欧美人xxxx| 第84页国产精品| 黄色片免费在线观看视频|