精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂? 原創

發布于 2025-5-28 10:27
瀏覽
0收藏

中國與西班牙的聯合研究質疑當前AI通過數據擴容實現類人泛化能力的可行性,強調需突破架構限制以構建抽象推理機制,并呼吁重新審視“智能”的本質定義。

引言

中國和西班牙研究人員發表的一篇新論文發現,即使是像GPT-4.1這樣的先進多模態人工智能模型,也難以從模擬時鐘圖像中識別時間。時鐘中細微的視覺變化都可能導致嚴重的解讀錯誤,而微調也只對熟悉的示例有效。這一結果引發了人們對這些模型在現實世界任務中處理不熟悉圖像時的可靠性的擔憂。

當人類對某個領域(例如重力或其他基本物理原理)有了足夠深入的理解時,我們就能超越具體的例子,掌握其背后的抽象概念。這使我們能夠創造性地跨情境運用這些知識,并通過識別實際應用中的原理來識別新的實例,即使是那些我們從未見過的實例。

當一個領域足夠重要時,我們甚至可能在它并不存在的地方感知到它,就像??空想性錯視??一樣,其驅動力在于無法識別真實實例的高昂代價。這種模式識別的生存機制如此強大,以至于它甚至促使我們在沒有模式的地方??尋找更廣泛的模式??。?

一個領域在我們心中灌輸得越早、越反復,它的基礎就越????,并且會持續一生;我們在兒童時期接觸到的最早的視覺數據集之一就是教學時鐘,其中印刷材料或交互式模擬時鐘被用來教我們如何看時間:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

??幫助孩子學習認識時間的教具???

盡管??手表設計時尚的變化??有時會給我們帶來挑戰,但這種早期領域掌握的彈性令人印象深刻,即使面對復雜或“古怪”的設計選擇,我們也能辨別模擬鐘面:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

??高級定制腕表??中的一些挑戰性面孔?

人類??不需要成千上萬的例子??來了解時鐘的工作原理;一旦掌握了基本概念,我們幾乎可以識別任何形式,即使是扭曲或抽象的形式。?

相比之下,人工智能模型在完成這項任務時面臨的困難凸顯了一個更深層次的問題:它們的表面實力可能更多地取決于大量的曝光,而不是理解。

超越模仿游戲?

在近期對大型模型的研究中,表面表現與真正“理解”之間的矛盾反復浮現。上個月,浙江大學和西湖大學在一篇題為《博士級LLM真正掌握初等加法嗎?》(非本文重點)的?論文??中重新闡述了這個問題,并得出結論:?

“盡管基準令人印象深刻,但模型顯示出對模式匹配而非真正理解的嚴重依賴,這由符號表示的失敗和基本屬性的違反所證明。

明確的規則規定會損害性能,這表明存在固有的架構限制。這些見解揭示了評估方面的差距,并強調了對能夠進行超越模式識別的真正數學推理的架構的需求。”

本周,這個問題再次被提出,由南京航空航天大學和西班牙馬德里理工大學合作完成。這篇題為《多模態大型語言模型(MLLM)真的學會了在模擬時鐘上報時嗎?》的??新論文?探討了多模態模型對報時理解的程度。?

盡管論文中僅詳細介紹了研究進展,但研究人員的初步測試表明,OpenAI的?GPT-4.1??多模態語言模型難以從多種時鐘圖像中正確讀取時間,即使在簡單的情況下也經常給出錯誤的答案。?

這表明模型的訓練數據可能存在缺口,因此需要一個更均衡的數據集,以測試模型是否能夠真正學習其背后的概念。因此,作者整理了一個模擬時鐘的合成數據集,均勻地覆蓋了所有可能的時間,并避免了互聯網圖像中常見的偏差:

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

研究人員合成模擬時鐘數據集中的一個??示例?,用于在新研究中微調GPT模型?

??在對新數據集進行微調?之前,GPT-4.1一直無法讀取這些時鐘。然而,在接觸了新數據集一段時間后,它的表現有所改善——但前提是新圖像與它之前見過的圖像相似。?

當時鐘的形狀或指針的樣式發生變化時,準確度會急劇下降;即使是很小的調整,例如更細的指針或箭頭(下圖最右邊),也足以使其偏離目標;此外,GPT-4.1還難以解讀達利風格的“?融化時鐘??”:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

??標準設計的時鐘圖像(左)、變形的時鐘圖像(中)和修改后的指針圖像(右),以及GPT-4.1微調前后返回的時間??

作者推斷,當前的模型(例如GPT-4.1)可能主要通過視覺模式匹配來學習讀鐘,而不是通過任何更深層次的時間概念,并斷言:

“當時鐘變形或指針變細并帶有箭頭時,GPT-4.1就會失效。在150個隨機時間上進行的時間估計中,初始時鐘的平均絕對誤差(MAE)為232.48秒,形狀變形時為1380.69秒,指針改變時為3726.93秒。

這些結果表明,MLLM并沒有學會看時間,而是記住了模式。”

足夠的時間

大多數訓練數據集依賴于抓取的網絡圖像,這些圖像往往會重復特定的時間——尤其是10:10,這是??手表廣告中流行的設置??:?

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

從新論文中,我們可以看到模擬時鐘圖像中“十點十分”時間的流行情況

由于所描繪的時間范圍有限,模型可能只能看到狹窄范圍的時鐘配置,從而限制了其超越這些重復模式進行概括的能力。

關于模型為何無法正確解釋時鐘扭曲的問題,論文指出:

“盡管GPT-4.1在標準時鐘圖像上表現非常出色,但令人驚訝的是,通過使時鐘指針變細并添加箭頭來修改時鐘指針會導致其準確性顯著下降。

直觀地看,人們可能會認為視覺上更復雜的變化——扭曲的表盤——會對性能產生更大的影響,但這種修改似乎影響相對較小。

這就引出了一個問題:MLLM如何解讀時鐘,以及它們為什么會失敗?一種可能性是,較細的指針會削弱模型感知方向的能力,從而削弱其對空間方向的理解。

或者,當模型嘗試將時針、分針和秒針組合成準確的時間讀數時,可能會有其他因素造成混淆。”

作者認為,找出這些失敗的根本原因是推進多模態模型的關鍵:如果問題在于模型如何感知空間方向,微調可能會提供一個簡單的解決方案;但如果問題源于整合多種視覺線索的更大困難,那么這表明這些系統在處理信息的方式上存在更根本的弱點。

微調測試

為了測試模型的缺陷能否通過實踐克服,GPT-4.1在上述綜合合成數據集上進行了微調。在進行微調之前,它的預測結果非常分散,所有類型的鐘面都存在顯著的誤差。在對數據集進行微調之后,其在標準鐘面上的準確率顯著提高,而在變形鐘面上的準確率則有所提升(但幅度較小)。

然而,指針經過修改的時鐘,例如指針變得更細或變成箭頭狀,仍然會產生很大的誤差。

出現了兩種截然不同的故障模式:在正常和變形的時鐘上,模型通常會錯誤判斷指針的方向;但在指針樣式改變的時鐘上,它經常混淆每根指針的功能,將小時誤認為分鐘,或將分鐘誤認為秒。

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

這張對比圖展示了模型最初的弱點以及通過微調實現的部分改進,圖中顯示了150個隨機選擇的時鐘的預測時間與實際時間(以秒為單位)。左側是微調之前,GPT-4.1的預測結果比較分散,并且通常與正確值相差甚遠,紅色對角線表示正確值。右側是在平衡合成數據集上進行微調之后,預測結果與真實值更加接近,盡管仍然存在一些誤差。

這表明該模型已經學會將指針的厚度等視覺特征與特定角色聯系起來,并且在這些線索發生變化時會遇到困難。

對不熟悉的設計的有限改進進一步引發了人們的懷疑:這種模型是否學習了報時的抽象概念,或者僅僅是改進了其模式匹配。

指針類型

因此,盡管微調提高了GPT-4.1在傳統模擬時鐘上的性能,但它對指針較細或箭頭形狀的時鐘的影響要小得多,這增加了一種可能性,即該模型的失敗不是源于抽象推理,而是源于對哪根指針是哪根指針的混淆。

為了測試消除這種混淆后準確率是否會提高,研究人員對模型對“修改后的指針”數據集的預測進行了新的分析。輸出結果分為兩組:GPT-4.1正確識別時針、分針和秒針的情況;以及未能正確識別的情況。

在微調之前和之后,對預測的平均絕對誤差(MAE)進行評估,并將結果與標準時鐘的結果進行比較;還使用表盤位置作為基線測量了每個指針的角度誤差

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

修改后的指針數據集中,微調前后有和沒有指針類型混淆的時鐘的誤差比較

混淆時鐘指針的角色會導致最大的誤差。當GPT-4.1將時針誤認為分針或將分針誤認為時針時,最終的時間估算結果往往相差甚遠。相比之下,錯誤判斷正確識別的指針方向所導致的誤差較小。在三個指針中,時針在微調前的角度誤差最大,而秒針的角度誤差最小。

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

在修改后的指針數據集中,經過微調之前和之后,對于有和沒有指針角色混淆的預測,指針類型的角度誤差。

為了僅關注方向性誤差,分析僅限于模型正確識別每個指針功能的案例。如果該模型已經內化了一般的報時概念,那么它在這些示例上的表現應該與在標準時鐘上的準確度相當。然而,它并沒有,準確度仍然明顯下降。

為了檢驗指針形狀是否會影響模型的方向感,研究人員進行了第二項實驗:創建了兩個新的數據集,每個數據集包含60個只有時針的合成時鐘,指向不同的分鐘刻度。一組數據集使用原始指針設計,另一組數據集使用修改后的版本。要求模型說出指針指向的刻度標記的名稱。

結果表明,修改后的指針識別準確率略有下降,但不足以解釋模型的整體缺陷。即使在之前表現良好的任務中,一個不熟悉的視覺特征似乎也足以擾亂模型的整體解讀。

AI為何讀不懂鐘表?模擬時鐘暴露的認知短板與AI進化隱憂?-AI.x社區

GPT-4.1在標準、扭曲和修改后的時鐘上進行微調前后的性能,突出了不均衡的收益和持續存在的弱點。

結論

雖然這篇論文的重點乍一看似乎無關緊要,但視覺語言模型能否學會以100%的準確率讀取模擬時鐘,這一點其實也并不重要。這篇文章的真正意義在于它聚焦于一個更深層次的反復出現的問題:用更多(也更多樣化)的數據來填充模型,是否能夠獲得人類通過抽象和泛化獲得的那種領域理解;或者,唯一可行的途徑是否是向該領域注入足夠多的樣本,以便在推理過程中預測所有可能的變化。

這兩種方式都會引發人們對當前架構真正學習能力的懷疑。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:??AI’s Struggle to Read Analogue Clocks May Have Deeper Significance??,作者:Martin Anderson

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
開源情報研究
開源情報研究

只是缺少訓練,這個應該不是很難的問題

回復
2025-5-28 16:45:51
回復
相關推薦
日韩不卡视频在线观看| 亚洲乱码国产乱码精品精软件| 欧美a大片欧美片| 欧美日韩国产一区二区| 久久亚洲午夜电影| 日本在线观看中文字幕| 曰本一区二区三区视频| 在线观看不卡一区| 一个色的综合| 韩国av电影在线观看| 欧美激情精品久久久六区热门| 精品盗摄一区二区三区| 日韩 欧美 视频| 你懂的在线观看视频网站| 日韩精品免费专区| 美女性感视频久久久 | 免费久久99精品国产自在现线| 亚洲欧美国内爽妇网| 福利片一区二区三区| 男人添女人下部高潮视频在线观看| 91蜜桃视频在线| 国产精品中文字幕在线观看| 久久久久久久福利| 婷婷综合一区| 这里只有精品视频在线观看| 三上悠亚久久精品| 在线国产91| av一本久道久久综合久久鬼色| 国产成人av网| 欧美日韩精品亚洲精品| 久久av免费看| 欧美成人在线直播| 成人3d动漫一区二区三区| 性欧美videoshd高清| 国产日韩欧美一区二区三区综合| 亚洲在线免费视频| 免费又黄又爽又猛大片午夜| 欧美视频亚洲视频| 中文字幕日韩欧美在线| 99re久久精品国产| 免费观看性欧美大片无片| 一本色道久久加勒比精品| 今天免费高清在线观看国语| 成人激情电影在线看| 99久久婷婷国产综合精品电影 | 国产suv精品一区二区68| 亚洲黄色录像| 亚洲成人免费网站| 日本高清免费在线视频| 福利一区二区| 日本道在线观看一区二区| 日韩中字在线观看| 主播国产精品| 国产精品第一页第二页第三页| 高清视频一区| 精品乱子伦一区二区| 日韩av一区二区三区四区| 7777kkkk成人观看| 免费观看一级视频| 国精品一区二区三区| 另类美女黄大片| 国产高清视频免费在线观看| 成人免费在线播放| 日韩电影中文字幕在线| 亚洲区 欧美区| 日本精品国产| 欧美日本一道本| 日本一二区免费| 欧美日韩尤物久久| 色婷婷亚洲综合| 欧美视频免费播放| 中文日产幕无线码一区二区| 无码av中文一区二区三区桃花岛| 黑人巨大国产9丨视频| 蜜桃视频在线观看免费视频网站www| 久久久一区二区三区捆绑**| 久久影院理伦片| 日韩三级电影网| 久久新电视剧免费观看| 欧美日韩精品免费观看视一区二区| 午夜在线视频免费| 91论坛在线播放| 欧美日韩一区在线观看视频| 精品视频三区| 国产精品久久久久永久免费观看 | 依依成人综合网| 亚洲一区欧美激情| 热99在线视频| 乱子伦一区二区三区| 日本成人在线一区| 国产欧美中文字幕| 99久久精品国产色欲| 国产成人综合在线观看| 狠狠色噜噜狠狠色综合久| 手机看片福利在线观看| 国产亚洲一区字幕| 国产又爽又黄ai换脸| 最新日本在线观看| 欧美日韩国产中字| 亚洲一级片网站| 欧美成人家庭影院| 91精品国产91综合久久蜜臀| 91人人澡人人爽| 99re8这里有精品热视频8在线| 亚洲国产女人aaa毛片在线| 手机在线播放av| 天堂综合网久久| 欧美成人精品在线播放| 日本a级c片免费看三区| 美腿丝袜亚洲综合| 国产在线资源一区| 成年人黄视频在线观看| 色综合咪咪久久| 久久国产免费视频| 欧美一区二区三| 国产91精品久| www.97超碰| 中文字幕制服丝袜一区二区三区| 可以在线看的av网站| 久久av网站| 中文字幕视频在线免费欧美日韩综合在线看 | 久久男人的天堂| 97人妻精品一区二区三区软件| 久久女同精品一区二区| 97超碰在线人人| 深夜激情久久| www.色综合| 中文字幕777| 久久久91精品国产一区二区精品| 成人在线播放网址| 国产精品99久久免费| 在线a欧美视频| 亚洲s码欧洲m码国产av| av不卡一区二区三区| 久操手机在线视频| 精品一区二区三区中文字幕 | 日本va欧美va欧美va精品| 国产私拍一区| 福利写真视频网站在线| 日韩一区二区在线观看视频播放| а天堂中文在线资源| 日韩av电影天堂| 天堂va久久久噜噜噜久久va| 成人免费影院| 亚洲色无码播放| 在线观看日本视频| 国产日韩欧美综合一区| 欧美日韩在线观看不卡| 成人精品天堂一区二区三区| 国产精品扒开腿做爽爽爽视频| 久久久久国产精品嫩草影院| 欧美视频一二三| 欧美色图亚洲激情| 久久裸体视频| 天堂资源在线亚洲资源| 精品久久久网| 菠萝蜜影院一区二区免费| 国产又粗又猛又爽| 亚洲精品国产一区二区精华液| 日本人dh亚洲人ⅹxx| 影音先锋在线一区| 精品人伦一区二区三区| 东京一区二区| 少妇精69xxtheporn| 91精品在线视频观看| 亚洲男人天堂av| yjizz视频| 久久久久久一区二区| 亚洲午夜精品久久久中文影院av| 欧美特黄色片| 欧美激情中文网| 性感美女一级片| 在线观看中文字幕不卡| 我要看黄色一级片| 成人性生交大片免费| 九九九九免费视频| 日韩欧美高清| 成人欧美一区二区三区黑人免费| 九色porny丨首页入口在线| 亚洲人成电影在线| 国产精品久久综合青草亚洲AV| 亚洲精品高清视频在线观看| 久久久久国产精品无码免费看| 免费在线亚洲欧美| 一区二区免费在线观看| 91蝌蚪精品视频| 日韩美女福利视频| 免费在线午夜视频| 亚洲国产日韩欧美综合久久 | 亚洲国产成人二区| 最近2019中文字幕mv免费看| 亚洲精品国产suv一区| 色综合天天综合| 欧美精品一区二区成人| 久久九九久久九九| 韩国三级hd中文字幕有哪些| 日韩精品一级中文字幕精品视频免费观看 | 亚洲蜜臀av乱码久久精品| 手机在线成人av| 另类小说欧美激情| 黄色一级视频片| 欧美丰满日韩| 麻豆精品传媒视频| 精品视频一二| 国产精品毛片a∨一区二区三区|国 | 欧美精品生活片| 国产精品天堂| 亚洲成人av在线| 91精品视频免费在线观看| 欧美日韩一区二区免费视频| 久久国产高清视频| 91麻豆swag| 一级黄色电影片| 久久精品久久精品| 国产男女在线观看| 亚洲黄色成人| 国产日产欧美一区二区| 成人av资源电影网站| 久久久com| 一区二区三区视频免费视频观看网站 | 丝瓜av网站精品一区二区| 精品午夜一区二区三区| 亚洲日本免费电影| 日本欧美黄网站| 成年男女免费视频网站不卡| 久久成人精品一区二区三区| 超碰免费在线| 亚洲午夜小视频| 色猫av在线| 亚洲激情视频网| 国产小视频免费观看| 欧美一区二区三区视频在线| 中文字幕一区二区三区波野结| 欧美性20hd另类| 国产成人无码精品亚洲| 亚洲一区在线观看免费观看电影高清| 多男操一女视频| 国产精品二区一区二区aⅴ污介绍| 三年中国中文观看免费播放| 2021中文字幕一区亚洲| avtt香蕉久久| 国产99一区视频免费| 免费人成视频在线播放| 韩国女主播成人在线| 超碰超碰在线观看| 另类的小说在线视频另类成人小视频在线 | 国产精品入口免费视| 精品视频在线一区二区在线| 国产成人综合精品在线| 日韩av超清在线观看| 全亚洲最色的网站在线观看| 欧美片第一页| 国产精品美女网站| 99九九久久| 国产欧美日韩最新| 色8久久久久| 成人亚洲欧美一区二区三区| 高清不卡一区| 99国产精品久久久久老师| youjizzjizz亚洲| 精品久久久久久中文字幕动漫| 欧美91在线| 日韩高清国产一区在线观看| 日韩欧美中文| 男人添女人下部视频免费| 亚洲午夜久久久久久尤物| 亚洲国产成人精品无码区99| 99在线观看免费视频精品观看| 精品视频免费在线播放| 久久九九国产| 日韩视频在线观看一区二区三区| 国产99精品国产| 日韩片在线观看| 日本一区二区高清| 久久久精品视频在线| 一本大道综合伊人精品热热| 一级黄在线观看| 精品国产一二三| 国产一区二区三区不卡在线| 久久亚洲一区二区三区四区五区高 | 久久久久久久久久久电影| 天堂在线中文视频| 一区二区三区国产豹纹内裤在线| 日韩欧美亚洲视频| 欧美在线综合视频| 精品人妻少妇嫩草av无码专区| 日韩精品极品在线观看| 一区二区三区视频网站| 国模吧一区二区| 成人啊v在线| 98国产高清一区| 精品freesex老太交| 伊人网在线免费| 久久精品动漫| 潘金莲一级淫片aaaaa| 久久伊99综合婷婷久久伊| 日本中文字幕免费在线观看| 欧美日韩在线免费| av中文字幕观看| 伊人久久五月天| 不卡av免费观看| 91久久中文字幕| 欧美美女在线观看| 少妇人妻大乳在线视频| 久久精品国产网站| 日本黄色特级片| 一区二区三区**美女毛片| 艳妇乳肉豪妇荡乳av无码福利 | 国产欧美一区二区三区在线| 欧美成人专区| 九一免费在线观看| 久久99精品一区二区三区三区| 亚洲蜜桃精久久久久久久久久久久| 亚洲欧美欧美一区二区三区| 国产区一区二区三| 日韩欧美国产高清| 在线观看免费黄视频| 欧美做爰性生交视频| 91精品啪在线观看国产爱臀| 亚洲一二三区精品| 日韩黄色一级片| 国产又黄又粗又猛又爽的视频 | 九一国产在线观看| 精品国产乱码久久久久久久久| 男人天堂手机在线| 国产精品久久色| 精品午夜久久| 欧美性久久久久| 99视频在线观看一区三区| 免费在线一区二区三区| 欧美高清一级片在线| 在线免费观看黄色网址| 国产精品你懂得| av一区二区高清| 欧美一级黄色影院| 久久久精品日韩欧美| 中文字幕av影院| 日韩经典中文字幕在线观看| www.九色在线| 精品人伦一区二区三区| 一道本一区二区| 亚洲国产第一区| 欧美午夜精品久久久久久浪潮| 天天操天天爱天天干| 高清一区二区三区四区五区| 成人免费直播在线| 成人性免费视频| 99re6这里只有精品视频在线观看| 国产精品50页| 亚洲国产欧美一区二区丝袜黑人| 538在线精品| 久久99精品久久久久久久久久 | 性xxxx18| 国产成人精品视频| av中文字幕一区二区| 99视频在线视频| 国产精品久久久久久一区二区三区| 中文字幕日韩国产| 日韩在线播放av| 中文在线免费一区三区| 日本香蕉视频在线观看| jizz一区二区| 国产字幕在线观看| www.亚洲男人天堂| 日韩在线观看一区二区三区| 青青青在线视频播放| 972aa.com艺术欧美| 午夜久久久久久久久久影院| xxx欧美精品| 精品人人人人| 国产精品视频黄色| 亚洲天天做日日做天天谢日日欢| www.97av| 日本一区二区在线免费播放| 日韩精品一卡| 美女扒开腿免费视频| 色婷婷av一区二区三区软件| 日本电影全部在线观看网站视频| 99视频在线免费观看| 香蕉久久a毛片| 糖心vlog免费在线观看 | 动漫美女无遮挡免费| 欧美性猛交xxxx乱大交| 黄色免费网站在线| 精品国产综合区久久久久久| 奇米色777欧美一区二区| 欧美成人综合色| 亚洲午夜精品久久久久久性色 | 国产一区二区三区在线观看免费视频 | 亚洲视频在线不卡| 黑丝美女久久久| 免费大片黄在线观看视频网站| 成人三级在线| 日韩电影在线免费观看| 青青草原在线免费观看视频| 日韩国产精品一区| 亚洲网站三级| 午夜肉伦伦影院| 亚洲一区二区三区三| jizz在线观看|