精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「一只手有幾根手指」,你的GPT-5答對了嗎?

人工智能 新聞
今天,CMU 博士生、英偉達 GEAR(通用具身智能體研究)團隊成員 Tairan He(何泰然)向 GPT-5 詢問了這個問題,結果模型回答錯了。

「一只手有幾根手指?」

這個看似簡單的問題,強如 GPT-5 卻并不能總是答對。

今天,CMU 博士生、英偉達 GEAR(通用具身智能體研究)團隊成員 Tairan He(何泰然)向 GPT-5 詢問了這個問題,結果模型回答錯了。

image.png

他接著延伸出一個論點:語言雖然是強大的工具,但卻很難完全滿足視覺與機器人領域的需求。

我們更需要以視覺為中心的視覺語言模型(VLM)以及以視覺-動作為中心的 VLA 模型。

看起來,這里 Tairan He 對 Fingers 的定義應該是「包括拇指在內所有的手指」。

在英文語境中(包括柯林斯詞典、詞源詞典等的解釋),Fingers 既可以指代除拇指以外的其余四指,也可以指代包括拇指在內的全部五指。

image.png

圖源:柯林斯詞典

image.png

圖源:詞源詞典

不只是 GPT-5,推理版本 GPT-5-Thinking 也犯錯了,「包括拇指在內 5 根手指,不包括拇指則 4 根手指」。

image.png

此前,在 Grok 4 推出之后,同樣有人用數手指問題來測試它,結果同樣翻車

實測:

時對時錯,Gemini 2.5 Pro 也未能幸免

有趣的是,在認定手指(finger)包含拇指的前提下,編輯部也去測試了一下,結果發現 GPT-5 居然答對了,而且多次測試均回答正確。

image.png

image.png

image.png

不過,六指圖的中文語境中 GPT-5 卻總是回答錯誤。

image.png

image.png

我們又在 Gemini 2.5 Pro 上繼續測試,它貼心的單獨統計了 finger 和 thumb,但最終答案是錯的。

image.png

image.png

可以看到,在面對一些基礎常識性問題尤其存在語言先驗干擾(這里的 finger 本身就有歧義)時,即便是頂尖大模型也頻頻「翻車」。

這說明,模型雖然在語言推理方面很強,但對圖像的基礎視覺理解,包括目標檢測和語義分類等,仍然不夠穩健。模型中的視覺模塊可能并不是真正地「看」懂,而只是利用語言模式去猜。

為何回答不對?如何應對?

Tairan He 在后續評論中提到了謝賽寧團隊去年的一篇論文,這篇論文提出并實踐了一套系統、深入且以視覺為中心的研究與評估方法,展示了如何對多模態大語言模型(MLLM)的視覺基礎能力進行科學、嚴謹的評估。

Tairan He 認為,應該將這種嚴謹的評估思想和方法論應用到 VLA 模型研究中去。

image.png

  • 論文標題:Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs 
  • 論文地址:https://arxiv.org/pdf/2406.16860

論文指出,當前許多基準測試并不足以真實評估模型核心的視覺能力,部分測試甚至在沒有視覺輸入的情況下也能被解答。

團隊創建了一個名為 CV-Bench 的全新、更專注的基準測試集,專門用于檢驗模型在物體計數、空間關系判斷及深度感知等關鍵且基礎的 2D 和 3D 視覺理解能力,從而建立了一套更嚴格的評估標準。

論文系統性地評估了超過 20 種不同的視覺編碼器,并對訓練策略和數據配比進行了詳盡的研究,其成果如同一本可供參考的「公開食譜」,為領域內的后續工作提供了嚴謹的參照。

謝賽寧也參與了討論,表示多模態大型語言模型中的虛假相關性是一個棘手的基準測試問題。他認為,模型對語言先驗的依賴既是優勢也是陷阱,因為它可能導致模型忽視其他模態,成為一種「捷徑」。

從經濟角度看,這讓公司能在不進行大量實際多模態研究的情況下,宣稱在「多模態推理」上取得成功。然而,當這些系統被應用于機器人等現實世界時,這種捷徑的缺陷就會暴露,并付出巨大代價。

image.png

另一項研究也印證這種觀點。實驗顯示,最先進的 VLM 在識別常見物體圖像(例如,知道阿迪達斯標志有 3 條條紋,狗有 4 條腿)的數量時,準確率能達到 100%;但在計算反事實圖像(例如,計算一個有 4 條條紋的類阿迪達斯標志中的條紋數量,或一只 5 條腿的狗的腿數)時,準確率僅有約 17%。

  • 項目主頁:https://vlmsarebiased.github.io/

該研究指出,VLM 實際上并不能真的「看到」,它們依賴于記憶的知識而不是視覺分析。

image.png

針對這一問題,密歇根大學的博士生 Martin Ziqiao Ma(馬子喬)也詳細闡述了自己的觀點。

他認為關鍵問題在于:用大語言模型來初始化視覺-語言(-動作)模型(VLA),是一個誘人的陷阱,看似取得了進展,但實際上并沒有真正實現突破。大多數基準測試都過于集中在推理和數字領域,而沒有從根本上解決感知問題,尤其是中、低層次的視覺能力。

image.png

人類在直覺物理和心理理解上,顯然有著前語言階段的認知根基,例如固體性、連續性、重力等基本原則。

2024 年,他及團隊在構建了 GroundHog 之后,花了一些時間反思 VLM 的核心問題。他再也無法說服自己,僅僅把 CLIP 和 DINO 疊加上幾層投影層就是「將視覺符號化」的終極方案。視覺-語言模型需要更強大的視覺基礎,或許必須從以視覺為中心的視角重新開始。

此后,他暫停 VLM 開發一年并探索了其他方向。并且真正從零開始,他開始研究 3D 基礎模型和視頻擴散模型,并暫時擱置了聯合視覺-語言擴散模型的可能性。他開發了 4D-LRM,目標是在完全沒有語言先驗的情況下,大規模學習 4D 先驗。

這只是第一步。未來某個時候,他會回到 VLM 工程領域。但下一次,他希望自己能先從世界模型入手,再在其之上解鎖語言模塊。

大語言模型什么時候能夠真正理解圖像等視覺信息,而不僅僅把視覺當作語言的附屬輸入?對此你怎么看呢?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-10-11 16:46:00

商用軟件

2017-09-13 11:49:11

有孚網絡上云專有云

2022-10-20 07:43:46

2025-08-12 09:18:00

2022-03-02 09:40:26

微軟Windows 8ASCII 貓

2025-06-19 09:06:00

2021-03-16 06:47:47

Python

2017-09-12 12:13:57

夢想 咸魚

2017-11-09 13:56:46

數據庫MongoDB水平擴展

2024-12-17 15:00:00

字符串Java

2025-08-14 09:31:24

GPT-5AI

2020-09-18 06:39:18

hashMap循環數據

2024-01-22 13:57:00

模型訓練

2019-10-30 15:27:28

Google谷歌Alphabet

2025-10-17 17:49:11

GPT-5AI模型

2024-04-01 00:50:00

吳恩達智能體

2019-12-26 14:07:19

隨機數偽隨機多線程

2025-02-13 10:52:56

點贊
收藏

51CTO技術棧公眾號

亚洲激情第一页| 亚洲蜜臀av乱码久久精品蜜桃| 欧美极品少妇xxxxⅹ免费视频| 免费黄视频在线观看| 国产在线视频卡一卡二| 国产极品模特精品一二| 欧美视频国产精品| 69174成人网| 日本在线观看中文字幕| 国产精品手机在线播放| 91精品国产一区二区三区香蕉 | 波多野结衣理论片| 亚洲成av人片乱码色午夜| 欧美日韩一区二区三区| 亚洲 国产 日韩 综合一区| 国产欧美熟妇另类久久久| 一区二区动漫| 超碰精品一区二区三区乱码| 国产精品第七页| 亚洲天堂网站| 欧美性猛交xxxx乱大交| 草草草视频在线观看| 欧美偷拍视频| 国产乱子伦视频一区二区三区 | 亚洲天堂第二页| 野花视频免费在线观看| 国产极品久久久久久久久波多结野 | 欧美性淫爽ww久久久久无| 国产制服91一区二区三区制服| 蜜桃视频在线观看网站| 懂色av一区二区在线播放| 国产精品美乳在线观看| 久久狠狠高潮亚洲精品| 欧美二区不卡| 日韩中文第一页| 能在线观看的av网站| 日韩av官网| 亚洲天堂2014| 伊人久久大香线蕉av一区| 嫩草精品影院| 91论坛在线播放| 国产三区精品| 韩国av在线免费观看| 国产一区二区女| 成人免费高清完整版在线观看| 99久久久久久久久| 欧美亚洲专区| 伊人久久免费视频| 亚洲精品理论片| 欧美交a欧美精品喷水| 欧美成人在线直播| 999在线观看视频| 日韩免费影院| 亚洲综合一区二区| 国产91沈先生在线播放| 黄色福利在线观看| 粉嫩欧美一区二区三区高清影视| 91性高湖久久久久久久久_久久99| 人妻人人澡人人添人人爽| 亚洲大奶少妇| 日韩精品一区二区三区在线播放| 原创真实夫妻啪啪av| 久久精品九色| 欧美成人性战久久| 日本一区二区在线观看视频| 国产成人一二片| 日韩极品精品视频免费观看| 蜜桃精品成人影片| jizzjizz欧美69巨大| 在线视频中文亚洲| а天堂中文在线资源| 天天天综合网| 久久久久久久影院| 91蜜桃视频在线观看| 久久这里只有| 91久久精品国产| 刘亦菲毛片一区二区三区| 91在线一区二区三区| 免费中文日韩| 天天在线视频色| 亚洲最新视频在线观看| 欧美二区在线视频| 中文.日本.精品| 91精品久久久久久久久99蜜臂| 91人妻一区二区三区| 欧美电影免费网站| 中文字幕精品久久| 免费视频一二三区| 久久精品一区二区国产| 国产在线播放91| 高清乱码毛片入口| 国产欧美一区二区精品性色超碰 | 国产三级视频在线看| 国产精品久久久久久久久果冻传媒| 中文字幕第一页亚洲| 999av小视频在线| 亚洲国产成人一区二区三区| 尤物国产精品| 理论片午夜视频在线观看| 欧美综合亚洲图片综合区| 日韩欧美理论片| 欧美丝袜美腿| 久久不射热爱视频精品| 91国产丝袜播放在线| 久久99精品一区二区三区| 欧日韩在线观看| 久久免费公开视频| 日韩国产欧美一区二区三区| 欧美丰满少妇xxxxx做受| 欧美 日韩 精品| 国产一区二区美女| 欧美日韩喷水| 日韩伦理av| 欧美日韩国产片| 国产精品无码网站| 伊人久久大香线蕉综合四虎小说 | www欧美在线| 国产黄色精品视频| 亚洲亚洲精品三区日韩精品在线视频| 日本无删减在线| 欧美日韩一区二区三区高清| 日本人添下边视频免费| 国产精品99在线观看| 日本成人免费在线| 亚洲高清视频在线播放| 亚洲欧美在线高清| 亚洲不卡视频在线| 婷婷亚洲精品| 久久久久成人网| 国产女人高潮毛片| 中文字幕在线观看不卡| 任你操这里只有精品| 国产精品欧美大片| 欧美日韩福利电影| 999久久久久久| 中文字幕欧美国产| 五月婷婷之综合激情| 在线日本制服中文欧美| 久久久久久免费精品| 精品久久无码中文字幕| 国产不卡一区视频| 在线观看成人av电影| 久久久久久久性潮| 中文字幕视频一区二区在线有码 | 欧美一级视频| 精品无人区一区二区三区| 黄页网站大全在线免费观看| 亚洲一区二区综合| 成人毛片一区二区| 88久久精品| 欧美黑人xxx| 精品人妻久久久久一区二区三区| 综合自拍亚洲综合图不卡区| 奇米视频7777| 一本一本久久a久久综合精品| 91精品国产自产在线观看永久| 高清美女视频一区| 欧美日韩一区久久| 成人黄色短视频| 精品无人码麻豆乱码1区2区| 致1999电视剧免费观看策驰影院| 九七电影院97理论片久久tvb| 中文日韩电影网站| 91在线精品入口| 伊人一区二区三区| 日本精品一二三| 国产日韩亚洲| 日韩三级电影| 91成人app| 欧美日韩成人黄色| 亚洲欧美日韩综合在线| 日韩欧美精品中文字幕| 国产美女永久免费无遮挡| 蜜芽一区二区三区| 7777在线视频| 欧美国产极品| 国产精品99久久99久久久二8| 成人福利在线| 日韩一区二区影院| 精品在线播放视频| 亚洲国产精品高清| 日本泡妞xxxx免费视频软件| 99av国产精品欲麻豆| 日产精品高清视频免费| 久久亚洲人体| 久久久久久一区二区三区| 欧美18xxxxx| 欧美精品久久天天躁| 国产精久久久久久| 国产亚洲一区字幕| 初高中福利视频网站| 国产视频亚洲| 在线免费观看成人| 国产伦精品一区二区三区在线播放| 91a在线视频| 精品孕妇一区二区三区| 日韩成人小视频| 国产精品高潮呻吟AV无码| 婷婷夜色潮精品综合在线| 超碰人人人人人人人| 成年人国产精品| 亚洲免费成人在线视频| 国产精品三级| 成人av免费看| jizz欧美| 亚洲色在线视频| 国产jzjzjz丝袜老师水多| 国产精品乱人伦| 无码国产69精品久久久久网站| 久久综合九色| 和岳每晚弄的高潮嗷嗷叫视频| 成人直播大秀| 麻豆av一区二区| 国产一区二区三区| 久久成人免费视频| 青青草在线播放| 精品精品国产高清一毛片一天堂| 最近中文字幕在线观看视频| 久久色在线视频| 国产精品无码自拍| 久久激情五月激情| 爱福利视频一区二区| 欧美日韩夜夜| 97操在线视频| 亚州欧美在线| 国产精品十八以下禁看| 牛牛精品一区二区| 欧美另类xxx| 免费网站黄在线观看| 亚洲精品日韩在线| 天天干天天色综合| 婷婷中文字幕综合| 日韩激情在线播放| 一级中文字幕一区二区| 成人涩涩小片视频日本| 国产精品人成在线观看免费| 国产美女喷水视频| 日韩高清国产一区在线| 欧美在线一区视频| 亚洲区国产区| 欧美精品自拍视频| 亚洲精品资源| 99在线精品免费视频| 欧美久色视频| 欧美大黑帍在线播放| 中文字幕一区二区av| 黄瓜视频免费观看在线观看www | 日韩的一区二区| 天堂成人在线视频| 亚洲精品国产电影| 天堂在线视频观看| 亚洲精品美女在线观看播放| 色wwwwww| 亚洲欧美在线免费| 美州a亚洲一视本频v色道| 亚洲欧美激情另类校园| 中文字幕你懂的| 欧美色窝79yyyycom| 中文字幕日日夜夜| 欧美日韩视频一区二区| 亚洲特级黄色片| 91麻豆精品国产91| 性一交一乱一精一晶| 亚洲国产黄色片| 日韩av高清在线| 色婷婷综合成人av| 成人免费看片| 久久久久亚洲精品成人网小说| 天堂在线中文网官网| 国产成人亚洲综合91精品| 成人亚洲综合| 99re在线播放| 台湾亚洲精品一区二区tv| 欧美精品123| 日韩一区自拍| 亚洲中文字幕无码一区二区三区| 一区在线播放| 亚欧在线免费观看| 国产一区二区三区免费观看| 农村末发育av片一区二区| 99精品在线免费| 久久精品三级视频| 亚洲欧美日韩国产一区二区三区| 久一区二区三区| 日本福利一区二区| 国产日韩欧美中文字幕| 精品成人佐山爱一区二区| 欧美女子与性| 久久视频在线观看免费| 色在线视频观看| 国产精品一区二区久久精品| 视频二区欧美毛片免费观看| 久久偷看各类wc女厕嘘嘘偷窃| 久久美女视频| 国产99久久九九精品无码| 麻豆国产精品官网| xxxwww国产| 成人免费一区二区三区在线观看| 国产一级一片免费播放| 在线精品视频小说1| www夜片内射视频日韩精品成人| 亚洲精品视频播放| 日本无删减在线| 国产精品日日做人人爱| 9国产精品午夜| 影音先锋欧美资源| 国产日韩精品视频一区二区三区 | 国产91丝袜在线播放九色| 香蕉网在线播放| 一区二区免费视频| 中文字幕一区二区三区免费看| 亚洲国产精品成人一区二区| 瑟瑟视频在线| 日韩女在线观看| 国产精品videossex| 中文字幕一区二区三区四区五区人 | 91免费版在线| 久久亚洲AV无码| 欧美理论片在线| 成人精品福利| 国产成人精品日本亚洲| 里番精品3d一二三区| 中国女人做爰视频| 日韩av中文字幕一区二区| 亚洲av成人片色在线观看高潮| 亚洲人成精品久久久久久| 中文字幕日韩第一页| 亚洲新中文字幕| 中文字幕在线高清| 激情小说综合区| 欧美午夜久久| 韩国三级在线播放| 亚洲视频1区2区| 91亚洲精品国偷拍自产在线观看 | 懂色一区二区三区av片| 香蕉av一区二区| 国产永久免费网站| 国产精品毛片久久久久久| 黄色av一区二区| 中文字幕成人精品久久不卡| 欧美123区| 先锋影音亚洲资源| 日韩专区一卡二卡| 日韩一级av毛片| 欧美日韩国产在线看| 婷婷av一区二区三区| 午夜精品福利视频| 欧美电影免费网站| 欧美 国产 日本| 久久精品人人做人人爽人人| 日韩欧美在线观看免费| 亚洲欧美日韩在线一区| 成人天堂yy6080亚洲高清| 免费在线国产精品| 日韩vs国产vs欧美| 国产视频精品免费| 欧美一区二区三区免费视频| www.欧美日本韩国| 成人自拍偷拍| 亚洲视频1区| 丁香花五月婷婷| 欧美日韩国产色站一区二区三区| 国产原创视频在线观看| 99精品99久久久久久宅男| 伊人激情综合| 91精品人妻一区二区三区| 91国模大尺度私拍在线视频| 9色在线视频网站| 91亚洲精品久久久| 国自产拍偷拍福利精品免费一| 中文字幕在线永久| 日本高清视频一区二区| 欧美边添边摸边做边爱免费| 91成人在线看| 亚洲专区免费| 亚洲一区电影在线观看| 欧美va亚洲va| 蜜臀国产一区| 欧美日韩dvd| 久久久欧美精品sm网站| 国产一区二区三区三州| 欧美人在线观看| 国产精品一区二区av交换| 一区二区三区欧美精品| 亚洲sss视频在线视频| 国产福利电影在线| 91精品天堂| 久久亚洲精品伦理| 亚洲熟女www一区二区三区| 亚洲精品白浆高清久久久久久| 日本黄色一区| 黄色大片中文字幕| 中文字幕日本乱码精品影院| 国产成人自拍一区| 国产成人亚洲综合青青| 欧美精品午夜| 99久久99久久精品免费看小说.| 精品久久人人做人人爰| 欧美精品资源| 欧美成人三级在线视频|