精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?

譯文 精選
人工智能
中國與西班牙的聯合研究質疑當前AI通過數據擴容實現類人泛化能力的可行性,強調需突破架構限制以構建抽象推理機制,并呼吁重新審視“智能”的本質定義。

譯者 | 朱先忠

審校 | 重樓

中國和西班牙研究人員發表的一篇新論文發現,即使是像GPT-4.1這樣的先進多模態人工智能模型,也難以從模擬時鐘圖像中識別時間。時鐘中細微的視覺變化都可能導致嚴重的解讀錯誤,而微調也只對熟悉的示例有效。這一結果引發了人們對這些模型在現實世界任務中處理不熟悉圖像時的可靠性的擔憂。

當人類對某個領域(例如重力或其他基本物理原理)有了足夠深入的理解時,我們就能超越具體的例子,掌握其背后的抽象概念。這使我們能夠創造性地跨情境運用這些知識,并通過識別實際應用中的原理來識別新的實例,即使是那些我們從未見過的實例。

當一個領域足夠重要時,我們甚至可能在它并不存在的地方感知到它,就像空想性錯視一樣,其驅動力在于無法識別真實實例的高昂代價。這種模式識別的生存機制如此強大,以至于它甚至促使我們在沒有模式的地方尋找更廣泛的模式

一個領域在我們心中灌輸得越早、越反復,它的基礎就越,并且會持續一生;我們在兒童時期接觸到的最早的視覺數據集之一就是教學時鐘,其中印刷材料或交互式模擬時鐘被用來教我們如何看時間:

幫助孩子學習認識時間的教具

盡管手表設計時尚的變化有時會給我們帶來挑戰,但這種早期領域掌握的彈性令人印象深刻,即使面對復雜或“古怪”的設計選擇,我們也能辨別模擬鐘面:

高級定制腕表中的一些挑戰性面孔

人類不需要成千上萬的例子來了解時鐘的工作原理;一旦掌握了基本概念,我們幾乎可以識別任何形式,即使是扭曲或抽象的形式。

相比之下,人工智能模型在完成這項任務時面臨的困難凸顯了一個更深層次的問題:它們的表面實力可能更多地取決于大量的曝光,而不是理解。

超越模仿游戲?

在近期對大型模型的研究中,表面表現與真正“理解”之間的矛盾反復浮現。上個月,浙江大學和西湖大學在一篇題為《博士級LLM真正掌握初等加法嗎?》(非本文重點)的論文中重新闡述了這個問題,并得出結論:

“盡管基準令人印象深刻,但模型顯示出對模式匹配而非真正理解的嚴重依賴,這由符號表示的失敗和基本屬性的違反所證明。

明確的規則規定會損害性能,這表明存在固有的架構限制。這些見解揭示了評估方面的差距,并強調了對能夠進行超越模式識別的真正數學推理的架構的需求。”

本周,這個問題再次被提出,由南京航空航天大學和西班牙馬德里理工大學合作完成。這篇題為《多模態大型語言模型(MLLM)真的學會了在模擬時鐘上報時嗎?》的新論文探討了多模態模型對報時理解的程度。

盡管論文中僅詳細介紹了研究進展,但研究人員的初步測試表明,OpenAI的GPT-4.1多模態語言模型難以從多種時鐘圖像中正確讀取時間,即使在簡單的情況下也經常給出錯誤的答案。

這表明模型的訓練數據可能存在缺口,因此需要一個更均衡的數據集,以測試模型是否能夠真正學習其背后的概念。因此,作者整理了一個模擬時鐘的合成數據集,均勻地覆蓋了所有可能的時間,并避免了互聯網圖像中常見的偏差:

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區

研究人員合成模擬時鐘數據集中的一個示例,用于在新研究中微調GPT模型

在對新數據集進行微調之前,GPT-4.1一直無法讀取這些時鐘。然而,在接觸了新數據集一段時間后,它的表現有所改善——但前提是新圖像與它之前見過的圖像相似。

當時鐘的形狀或指針的樣式發生變化時,準確度會急劇下降;即使是很小的調整,例如更細的指針或箭頭(下圖最右邊),也足以使其偏離目標;此外,GPT-4.1還難以解讀達利風格的“融化時鐘”:

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂-AI.x社區

標準設計的時鐘圖像(左)、變形的時鐘圖像(中)和修改后的指針圖像(右),以及GPT-4.1微調前后返回的時間

作者推斷,當前的模型(例如GPT-4.1)可能主要通過視覺模式匹配來學習讀鐘,而不是通過任何更深層次的時間概念,并斷言:

“當時鐘變形或指針變細并帶有箭頭時,GPT-4.1就會失效。在150個隨機時間上進行的時間估計中,初始時鐘的平均絕對誤差(MAE)為232.48秒,形狀變形時為1380.69秒,指針改變時為3726.93秒。

這些結果表明,MLLM并沒有學會看時間,而是記住了模式。”

足夠的時間

大多數訓練數據集依賴于抓取的網絡圖像,這些圖像往往會重復特定的時間——尤其是10:10,這是手表廣告中流行的設置

從新論文中,我們可以看到模擬時鐘圖像中“十點十分”時間的流行情況

由于所描繪的時間范圍有限,模型可能只能看到狹窄范圍的時鐘配置,從而限制了其超越這些重復模式進行概括的能力。

關于模型為何無法正確解釋時鐘扭曲的問題,論文指出:

“盡管GPT-4.1在標準時鐘圖像上表現非常出色,但令人驚訝的是,通過使時鐘指針變細并添加箭頭來修改時鐘指針會導致其準確性顯著下降。

直觀地看,人們可能會認為視覺上更復雜的變化——扭曲的表盤——會對性能產生更大的影響,但這種修改似乎影響相對較小。

這就引出了一個問題:MLLM如何解讀時鐘,以及它們為什么會失敗?一種可能性是,較細的指針會削弱模型感知方向的能力,從而削弱其對空間方向的理解。

或者,當模型嘗試將時針、分針和秒針組合成準確的時間讀數時,可能會有其他因素造成混淆。”

作者認為,找出這些失敗的根本原因是推進多模態模型的關鍵:如果問題在于模型如何感知空間方向,微調可能會提供一個簡單的解決方案;但如果問題源于整合多種視覺線索的更大困難,那么這表明這些系統在處理信息的方式上存在更根本的弱點。

微調測試

為了測試模型的缺陷能否通過實踐克服,GPT-4.1在上述綜合合成數據集上進行了微調。在進行微調之前,它的預測結果非常分散,所有類型的鐘面都存在顯著的誤差。在對數據集進行微調之后,其在標準鐘面上的準確率顯著提高,而在變形鐘面上的準確率則有所提升(但幅度較小)。

然而,指針經過修改的時鐘,例如指針變得更細或變成箭頭狀,仍然會產生很大的誤差。

出現了兩種截然不同的故障模式:在正常和變形的時鐘上,模型通常會錯誤判斷指針的方向;但在指針樣式改變的時鐘上,它經常混淆每根指針的功能,將小時誤認為分鐘,或將分鐘誤認為秒。

這張對比圖展示了模型最初的弱點以及通過微調實現的部分改進,圖中顯示了150個隨機選擇的時鐘的預測時間與實際時間(以秒為單位)。左側是微調之前,GPT-4.1的預測結果比較分散,并且通常與正確值相差甚遠,紅色對角線表示正確值。右側是在平衡合成數據集上進行微調之后,預測結果與真實值更加接近,盡管仍然存在一些誤差。

這表明該模型已經學會將指針的厚度等視覺特征與特定角色聯系起來,并且在這些線索發生變化時會遇到困難。

對不熟悉的設計的有限改進進一步引發了人們的懷疑:這種模型是否學習了報時的抽象概念,或者僅僅是改進了其模式匹配。

指針類型

因此,盡管微調提高了GPT-4.1在傳統模擬時鐘上的性能,但它對指針較細或箭頭形狀的時鐘的影響要小得多,這增加了一種可能性,即該模型的失敗不是源于抽象推理,而是源于對哪根指針是哪根指針的混淆。

為了測試消除這種混淆后準確率是否會提高,研究人員對模型對“修改后的指針”數據集的預測進行了新的分析。輸出結果分為兩組:GPT-4.1正確識別時針、分針和秒針的情況;以及未能正確識別的情況。

在微調之前和之后,對預測的平均絕對誤差(MAE)進行評估,并將結果與標準時鐘的結果進行比較;還使用表盤位置作為基線測量了每個指針的角度誤差

修改后的指針數據集中,微調前后有和沒有指針類型混淆的時鐘的誤差比較

混淆時鐘指針的角色會導致最大的誤差。當GPT-4.1將時針誤認為分針或將分針誤認為時針時,最終的時間估算結果往往相差甚遠。相比之下,錯誤判斷正確識別的指針方向所導致的誤差較小。在三個指針中,時針在微調前的角度誤差最大,而秒針的角度誤差最小。

在修改后的指針數據集中,經過微調之前和之后,對于有和沒有指針角色混淆的預測,指針類型的角度誤差。

為了僅關注方向性誤差,分析僅限于模型正確識別每個指針功能的案例。如果該模型已經內化了一般的報時概念,那么它在這些示例上的表現應該與在標準時鐘上的準確度相當。然而,它并沒有,準確度仍然明顯下降。

為了檢驗指針形狀是否會影響模型的方向感,研究人員進行了第二項實驗:創建了兩個新的數據集,每個數據集包含60個只有時針的合成時鐘,指向不同的分鐘刻度。一組數據集使用原始指針設計,另一組數據集使用修改后的版本。要求模型說出指針指向的刻度標記的名稱。

結果表明,修改后的指針識別準確率略有下降,但不足以解釋模型的整體缺陷。即使在之前表現良好的任務中,一個不熟悉的視覺特征似乎也足以擾亂模型的整體解讀。

GPT-4.1在標準、扭曲和修改后的時鐘上進行微調前后的性能,突出了不均衡的收益和持續存在的弱點。

結論

雖然這篇論文的重點乍一看似乎無關緊要,但視覺語言模型能否學會以100%的準確率讀取模擬時鐘,這一點其實也并不重要。這篇文章的真正意義在于它聚焦于一個更深層次的反復出現的問題:用更多(也更多樣化)的數據來填充模型,是否能夠獲得人類通過抽象和泛化獲得的那種領域理解;或者,唯一可行的途徑是否是向該領域注入足夠多的樣本,以便在推理過程中預測所有可能的變化。

這兩種方式都會引發人們對當前架構真正學習能力的懷疑。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:AI’s Struggle to Read Analogue Clocks May Have Deeper Significance,作者:Martin Anderson

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2021-03-22 17:16:04

AI 數據人工智能

2025-06-10 09:10:00

2021-08-02 19:37:27

AI人工智能新冠檢測

2018-05-07 10:23:27

AI 云計算

2025-09-08 18:08:28

AIClockBenchAGI

2024-03-25 11:37:40

機器學習人工智能進化算法

2025-06-03 08:51:00

2024-04-15 12:43:26

人工智能LLM

2021-12-24 16:53:31

AI人工智能

2025-01-21 08:00:00

2025-08-13 11:40:30

2020-10-14 10:29:58

人工智能

2024-06-25 10:07:14

AI產品

2025-09-29 02:00:00

RAGAgentAI

2023-12-14 11:19:52

開源AI

2021-09-06 09:56:10

人工智能AIAI 芯片

2025-08-14 08:20:38

2025-07-14 08:40:00

模型AI推理

2025-10-11 01:25:00

AI 編程ClaudeCursor
點贊
收藏

51CTO技術棧公眾號

亚洲欧洲一区二区三区在线观看 | 日本高清不卡的在线| 精品视频站长推荐| av成人在线看| 一区二区三区欧美在线观看| 狠狠色综合色区| 中文字幕福利视频| 激情欧美国产欧美| 在线观看欧美日韩| 挪威xxxx性hd极品| 黄色成人在线观看网站| 亚洲国产综合91精品麻豆| 茄子视频成人在线观看| 亚洲老妇色熟女老太| 日日噜噜夜夜狠狠视频欧美人| 欧美成人精品在线播放| 国产毛片久久久久久久| 视频在线观看免费影院欧美meiju| 色综合天天视频在线观看| 99re6这里有精品热视频| 久热av在线| 成人精品一区二区三区四区| 国产日韩欧美视频在线| 99久热在线精品996热是什么| 亚洲h色精品| 亚洲新中文字幕| 国产精品手机在线观看| japansex久久高清精品| 91久久一区二区| 水蜜桃色314在线观看| 国产激情视频在线| 欧美激情一区二区| 欧美人与性禽动交精品| 国产 日韩 欧美 精品| 国内精品国产三级国产a久久| 国产精品都在这里| 国产一级做a爱片久久毛片a| 一区二区三区国产精华| 中文字幕欧美日韩va免费视频| 99久久国产精| 鲁大师精品99久久久| 日韩欧美一级精品久久| 91 视频免费观看| 中文.日本.精品| 91久久精品网| 日韩精品一区二区三区色欲av| 国产精品yjizz视频网| 亚洲精品你懂的| 日韩久久不卡| 91在线导航| 国产精品久久毛片a| 日韩精品最新在线观看| 国产大片在线免费观看| 国产色综合一区| 日本一区二区三区精品视频| 毛片在线能看| 国产夜色精品一区二区av| 欧美午夜精品久久久久久蜜| 免费福利在线观看| 久久精品视频在线看| 欧美日韩国产精品一卡| 九色在线免费| 亚洲国产精品国自产拍av| 亚洲精品一区二区三| 尤物网址在线观看| 亚洲日本一区二区三区| 裸体裸乳免费看| 2020国产在线视频| 亚洲成a人在线观看| 噜噜噜久久亚洲精品国产品麻豆 | 精品av在线播放| 国产精品无码一区二区在线| 欧美电影网站| 欧美色老头old∨ideo| 国产永久免费网站| 97品白浆高清久久久久久| 亚洲精品短视频| 偷拍夫妻性生活| 国产精品久久久久久麻豆一区软件| 久久精品成人欧美大片古装| 校园春色 亚洲| 99国产精品| 国产精品精品国产| 亚洲av无码一区二区三区性色 | 国产福利电影在线播放| 欧美中文字幕一二三区视频| aaa一级黄色片| 国产精品1luya在线播放| 精品无人区太爽高潮在线播放| 国产精品无码无卡无需播放器| 四虎8848精品成人免费网站| 欧美激情免费在线| 免费无码国产精品| 国产高清不卡二三区| 欧美日韩高清在线一区| av网址在线免费观看| 午夜精品视频一区| 天天干天天综合| 盗摄牛牛av影视一区二区| 国产午夜精品美女视频明星a级| 卡通动漫亚洲综合| 久久国产福利| 亚洲free性xxxx护士白浆| 水中色av综合| 中文字幕欧美激情一区| 青青青在线视频播放| 777午夜精品电影免费看| 欧美大片日本大片免费观看| 欧美激情 一区| 激情久久综合| 91久久久久久久久久久久久| 五月婷婷六月色| 亚洲欧美日韩一区二区三区在线观看 | 视频一区二区三区在线看免费看| 国产精品久久久久久福利一牛影视 | 粉嫩av懂色av蜜臀av分享| 91一区二区| 日本在线精品视频| 男人天堂一区二区| 日韩美女久久久| 女人另类性混交zo| 国产毛片精品| 久久成人在线视频| 一级爱爱免费视频| 国产色产综合色产在线视频| 国产精品久久中文字幕| 视频在线亚洲| 久久躁狠狠躁夜夜爽| 自拍偷拍色综合| 久久久久久一二三区| 日本欧美视频在线观看| 日韩精品成人在线观看| 久久综合亚洲社区| 一级黄色片在线| 欧美激情一区二区三区蜜桃视频| 国产在线青青草| 嫩草国产精品入口| 97视频免费观看| 无码国产精品高潮久久99| 亚洲图片有声小说| 中国特级黄色片| 国产精品v亚洲精品v日韩精品 | www.av导航| 中文字幕字幕中文在线中不卡视频| 国产又粗又长又大的视频| 欧美热在线视频精品999| 欧美亚洲在线视频| 欧美新色视频| 色成人在线视频| 极品人妻videosss人妻| 日韩一区精品视频| 亚洲人成影视在线观看| 亚洲精品一区av| 久久精品国产亚洲7777| 国产又大又黄又爽| 亚洲你懂的在线视频| 在线播放国产视频| 伊人成年综合电影网| 国产美女在线精品免费观看| 91九色porn在线资源| 日韩av最新在线观看| 五月天激情四射| 国产色产综合色产在线视频| 婷婷免费在线观看| 久久久久亚洲| 国产欧美在线一区二区| 筱崎爱全乳无删减在线观看| 亚洲乱码国产乱码精品精天堂| 午夜精品一区二| 国产精品久久久久久久久免费相片| 一区二区在线免费看| 欧美精品日本| 久草热久草热线频97精品| 色香欲www7777综合网| 久久精品国产96久久久香蕉| 性中国xxx极品hd| 欧美性生交xxxxxdddd| 中文字幕黄色网址| 国产成人综合精品三级| 国产精品沙发午睡系列| 日韩欧美高清在线播放| 69堂成人精品视频免费| 老牛影视精品| 日韩在线视频观看正片免费网站| 精品久久无码中文字幕| 欧美午夜电影在线| 女人裸体性做爰全过| 国产凹凸在线观看一区二区 | 九色综合狠狠综合久久| 日日摸日日碰夜夜爽无码| 欧美日韩一二| 91免费版黄色| 成人不卡视频| 韩国19禁主播vip福利视频| 第一视频专区在线| 精品久久久久久久久久久久久久久久久 | 色婷婷综合五月| www.av视频| 久久久国产精品不卡| 91精品人妻一区二区三区蜜桃2| 久久精品导航| 日本福利视频网站| 成人在线国产| 久久久久高清| 一区二区三区四区视频免费观看| 国产精品777| 9999在线视频| 九九精品视频在线| 1区2区3区在线观看| 日韩电影中文 亚洲精品乱码| 国产精品久久影视| 91豆麻精品91久久久久久| 久久这里只有精品免费| 国产精品萝li| 精品人伦一区二区三电影| 成人免费视频免费观看| 午夜免费一级片| 久久精品国内一区二区三区| 欧美 日本 亚洲| 国产一区二区三区四区老人| 一本一本久久a久久精品综合妖精| 欧美色图婷婷| 成人18视频| 老司机亚洲精品一区二区| 国产精品高潮呻吟久久av野狼| 成年女人在线看片| 欧美二区乱c黑人| www久久日com| 久久伊人91精品综合网站| 日本中文字幕伦在线观看| 亚洲午夜久久久影院| 欧美91精品久久久久国产性生爱| 亚洲第一区在线观看| www.四虎在线观看| 欧美一区二区三区影视| 97在线公开视频| 欧美精品三级日韩久久| 一区二区的视频| 欧美日韩的一区二区| 91影院在线播放| 欧美日韩国产高清一区二区三区 | 精品捆绑美女sm三区| 国产高潮流白浆喷水视频| 欧美高清视频一二三区| 亚洲视频一区在线播放| 欧美日韩亚洲丝袜制服| 中文字幕乱码一区二区| 欧美日韩一区久久| 一级片视频播放| 欧美一区二区视频在线观看2020| 国产又色又爽又黄又免费| 欧美精品日韩一本| 精品国产亚洲一区二区麻豆| 日韩欧美国产三级电影视频| 亚洲国产精品久久久久久久| 亚洲大胆人体视频| 色就是色亚洲色图| 亚洲天天在线日亚洲洲精| 成人影视在线播放| 最近2019年好看中文字幕视频| 1024视频在线| 久久精品91久久香蕉加勒比| 日本aa在线| 69久久夜色精品国产69| 精品国产第一福利网站| 国产精品爽爽ⅴa在线观看| 国外成人福利视频| 97人人澡人人爽| 丝袜美腿一区二区三区动态图| 欧美一区视久久| 99久久综合| 国产自产在线视频| 久久综合九色| 日本黄色的视频| 岛国一区二区三区| 加勒比综合在线| 亚洲毛片av在线| 99精品在线播放| 欧美男人的天堂一二区| 亚洲精品视频91| 国产香蕉一区二区三区在线视频| 伦xxxx在线| 97精品久久久中文字幕免费| 99只有精品| 国内一区二区三区在线视频| 日本成人小视频| 人人妻人人澡人人爽欧美一区双| 亚洲综合社区| 秋霞午夜鲁丝一区二区| 91尤物视频在线观看| 久久成人小视频| 黑人狂躁日本妞一区二区三区| 91av久久久| 日韩国产激情在线| 国产在线高清视频| 日本人成精品视频在线| 91精品久久久久久综合五月天| 视频在线一区二区三区| 亚洲毛片网站| 九九九九九九九九| 国产日韩欧美高清在线| 日韩精品在线免费看| 欧美喷潮久久久xxxxx| 日韩中文字幕免费观看| 日韩视频第一页| 日韩精品99| 国产欧美日韩视频一区二区三区| 999国产精品永久免费视频app| 成人中文字幕在线播放| 国产美女在线观看一区| 欧美激情 一区| 欧美性猛交xxxx免费看| 欧美天堂在线视频| 久久亚洲精品网站| 成人国产在线| 欧美日韩精品综合| 在线精品福利| 男人女人拔萝卜视频| 中文幕一区二区三区久久蜜桃| 日韩成人高清视频| 精品美女一区二区| 国产黄网站在线观看| 国产精品劲爆视频| 久草精品在线| 欧美 日韩 激情| 99视频一区二区三区| 美女毛片在线观看| 91精品国产乱| 欧美成人三区| 国产欧美一区二区三区在线看| 国产尤物久久久| 欧美激情成人网| 久久这里只精品最新地址| 91精品国产高潮对白| 精品精品国产高清a毛片牛牛| 97caopron在线视频| 91热福利电影| 亚洲经典一区| 日批视频在线看| 亚洲综合色区另类av| 88av在线视频| 久久精品久久久久久国产 免费| 国产亚洲人成a在线v网站| 亚洲精品乱码视频| 久久精品国产亚洲aⅴ| 99久久精品久久亚洲精品| 欧美日韩国产首页| 国产精品实拍| 成人91视频| 一本不卡影院| 欧美成人午夜精品免费| 日本高清免费不卡视频| yourporn在线观看视频| 国产美女被下药99| 久久久久久久久丰满| 国模大尺度视频| 亚洲国产日韩综合久久精品| 日本高清视频在线| 欧美专区国产专区| 国产精品亚洲片在线播放| 亚洲77777| 亚洲免费视频中文字幕| 黑人操亚洲女人| 青青草原一区二区| 日韩综合网站| 女女调教被c哭捆绑喷水百合| 香蕉成人伊视频在线观看| 桃花色综合影院| 国产精品成人品| 婷婷亚洲五月色综合| 国产精品99久久久精品无码| 亚洲成国产人片在线观看| 国产免费a∨片在线观看不卡| 国产在线视频一区| 激情久久综合| 久久亚洲AV无码专区成人国产| 欧美精品三级日韩久久| 国产乱码精品一区二三赶尸艳谈| 欧美日韩亚洲一区二区三区在线观看 | 欧美aa一级| 亚洲一区二区三区四区中文| 国产精品亚洲第一区在线暖暖韩国| 在线观看免费国产视频| 色妞欧美日韩在线| 国偷自产av一区二区三区| 日韩欧美xxxx| 一区二区三区资源| 久久久久久青草| 96国产粉嫩美女| 爽爽淫人综合网网站| 丁香花五月激情| 亚洲欧美日韩视频一区| 日韩激情精品| 亚洲少妇久久久| 五月激情六月综合| 麻豆网站在线免费观看| 蜜桃传媒视频麻豆一区| 国产精品性做久久久久久| 国产成人在线视频观看| 欧美高清无遮挡|