精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

“我沒錯(cuò)!”GPT-4o嘴硬翻車,AI在黑天鵝事件面前集體宕機(jī)

人工智能
來自哥倫比亞大學(xué)、Vector人工智能研究所以及南洋理工大學(xué)的一個(gè)聯(lián)合研究團(tuán)隊(duì)發(fā)現(xiàn):人工智能模型在處理意外事件時(shí)的推理能力存在嚴(yán)重缺陷。

來自哥倫比亞大學(xué)、Vector人工智能研究所以及南洋理工大學(xué)的一個(gè)聯(lián)合研究團(tuán)隊(duì)發(fā)現(xiàn):人工智能模型在處理意外事件時(shí)的推理能力存在嚴(yán)重缺陷。 

即便是如GPT-4o和Gemini 1.5 Pro這樣的頂尖視覺語言模型(VLM),其表現(xiàn)也遠(yuǎn)遜于人類,差距最高可達(dá)32%。 

圖片

論文地址:https://arxiv.org/pdf/2412.05725

這篇名為《黑天鵝》的研究指出,當(dāng)前主流的AI評(píng)估方式普遍存在一個(gè)根本性問題:大多數(shù)基準(zhǔn)測試圍繞“常規(guī)模式”構(gòu)建,也就是說,它們聚焦于可預(yù)測、規(guī)律清晰的視覺場景。

但現(xiàn)實(shí)世界不按套路出牌。意外、突變和違反常識(shí)的“黑天鵝事件”無處不在。而人類之所以能處理這些狀況,依靠的是兩種核心推理能力。

第一種是溯因推理(abductive reasoning),即從有限的觀察中推斷出最可能的解釋。 例如,觀察到路口有兩輛撞壞的汽車,人們會(huì)推測是一名司機(jī)闖了紅燈。 

圖片

第二種是可廢止推理(defeasible reasoning),即在新證據(jù)出現(xiàn)時(shí)修正最初的結(jié)論。 比如,當(dāng)發(fā)現(xiàn)路口的交通信號(hào)燈發(fā)生故障時(shí),人們會(huì)放棄“司機(jī)闖紅燈”的假設(shè),轉(zhuǎn)而認(rèn)為是信號(hào)燈的問題。 

如果AI要成為自動(dòng)駕駛汽車等領(lǐng)域的可靠決策者,這兩種推理能力至關(guān)重要。 

“黑天鵝套件”:一個(gè)專為意外設(shè)計(jì)的考場

圖片

為了準(zhǔn)確評(píng)估AI在意外情況下的推理能力,研究團(tuán)隊(duì)構(gòu)建了一個(gè)全新的基準(zhǔn)測試,名為“BlackSwanSuite”(黑天鵝套件)。 

這個(gè)基準(zhǔn)測試包含1655個(gè)視頻,內(nèi)容涵蓋了各種打破常規(guī)的真實(shí)場景,例如這些視頻涵蓋了交通事故、兒童失誤、泳池滑倒等。

圖片

研究者將每個(gè)視頻精心劃分為三個(gè)部分:事發(fā)前 (Vpre)、事發(fā)時(shí) (Vmain)和事發(fā)后 (Vpost)。 

這種結(jié)構(gòu)化的處理方式,為設(shè)計(jì)針對(duì)性的推理任務(wù)奠定了基礎(chǔ)。 基于此,團(tuán)隊(duì)設(shè)計(jì)了三大核心任務(wù),共計(jì)超過15000個(gè)問題。 

第一個(gè)任務(wù)是“預(yù)測者”(Forecaster),模型僅觀看視頻的開頭,然后被要求預(yù)測接下來會(huì)發(fā)生什么。 

第二個(gè)任務(wù)是“偵探”(Detective),模型會(huì)看到事件的開頭和結(jié)尾,但中間的關(guān)鍵部分被隱藏,模型需要推斷出中間發(fā)生了什么。 這項(xiàng)任務(wù)直接考驗(yàn)?zāi)P偷乃菀蛲评砟芰Α?/span>

第三個(gè)任務(wù)是“報(bào)告者”(Reporter),模型可以觀看完整的視頻,然后需要描述整個(gè)事件的來龍去脈。 同時(shí),模型還需要重新評(píng)估之前基于不完整信息做出的判斷是否依然成立。這直接測試了模型的可廢止推理能力。

嚴(yán)峻的現(xiàn)實(shí):頂尖模型的顯著短板

圖片

所有頂尖的AI模型,包括GPT-4o、Gemini 1.5 Pro,以及多種開源系統(tǒng)(如LLaVA-Video、VILA、VideoLLaMA 2),在三類任務(wù)中全面落后于人類。

在多項(xiàng)選擇題上,最好的模型落后人類多達(dá)25%。 在是非判斷題上,這個(gè)差距進(jìn)一步擴(kuò)大到了32%。 

具體來看,在考驗(yàn)溯因推理的“偵探”任務(wù)中,表現(xiàn)最好的GPT-4o,其準(zhǔn)確率也比人類低了24.9%。 

而在考驗(yàn)可廢止推理的“報(bào)告者”任務(wù)中,GPT-4o與人類的差距更是達(dá)到了驚人的32%。 

32個(gè)百分點(diǎn)的差距說明一個(gè)問題:AI不僅“看錯(cuò)”,更“改不了”。

圖片

模型往往會(huì)在最初判斷后“鎖定思路”,拒絕基于新證據(jù)進(jìn)行推理更新。這在自動(dòng)駕駛等領(lǐng)域,可能帶來致命后果。

例如,論文中展示:垃圾車應(yīng)該是“裝垃圾”的,但當(dāng)視頻中垃圾車卻“掉下了一棵樹”,AI模型當(dāng)場宕機(jī)。

再例如:一段視頻中,一名男子手持枕頭在圣誕樹旁揮舞。

GPT-4o判斷他想攻擊身邊的人。但實(shí)際情況是:枕頭碰到了圣誕樹,裝飾物從樹上掉落,砸中了旁邊的女性。

視頻結(jié)尾已清晰展示全過程,但GPT-4o依然堅(jiān)持“男子攻擊他人”的原始判斷。

即便事實(shí)已推翻原猜測,模型也不做修正。這種“第一印象即終審判”的僵化思維,成了AI在現(xiàn)實(shí)世界中的最大隱患。

因?yàn)樗也坏竭@個(gè)“異常行為”的參考模式。根源在于,AI模型依賴的是海量訓(xùn)練樣本的“統(tǒng)計(jì)模式”。

它們?cè)谟?xùn)練中學(xué)習(xí)的是“什么事發(fā)生過很多次”,而不是“這事的因果關(guān)系是什么”。

所以,只要場景偏離了“常規(guī)軌跡”,它們就無法處理。為了進(jìn)一步探究問題的根源,研究團(tuán)隊(duì)進(jìn)行了一項(xiàng)關(guān)鍵實(shí)驗(yàn)。 

他們直接向AI模型提供由人類撰寫的、對(duì)視頻內(nèi)容的文字描述,從而繞過模型自身的視覺感知環(huán)節(jié)。 

結(jié)果顯示,在獲得了人類級(jí)別的感知和理解輸入后,模型的推理準(zhǔn)確率提升了高達(dá)10%。

這一發(fā)現(xiàn)表明,當(dāng)前AI的核心短板不僅在于高級(jí)推理,更在于基礎(chǔ)的感知和理解能力。 

注:頭圖AI生成

責(zé)任編輯:龐桂玉 來源: 大數(shù)據(jù)文摘
相關(guān)推薦

2020-04-23 13:33:31

新冠人工智能AI

2020-03-11 16:08:50

戴爾

2020-11-26 14:00:15

大數(shù)據(jù)數(shù)據(jù)分析數(shù)字化轉(zhuǎn)型

2022-06-03 07:36:19

黑天鵝事件漏洞網(wǎng)絡(luò)攻擊

2020-03-06 10:03:31

AI輿情自然語言處理

2019-03-05 13:34:13

華為云

2012-09-19 14:44:14

創(chuàng)業(yè)創(chuàng)業(yè)者黑天鵝

2025-03-11 13:42:19

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-07-16 13:24:38

2024-05-14 11:29:15

2024-08-13 13:50:00

數(shù)據(jù)模型

2024-05-28 08:25:09

2024-08-08 14:27:29

2025-01-06 13:15:02

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

2024-11-28 15:51:19

GPT-4o微軟
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产欧美自拍视频| 成人中文字幕在线观看| 精品人妻一区二区三区日产乱码卜| 免费在线播放电影| 99国产精品久久久久久久久久 | 成人香蕉视频| 国产精品欧美久久久久无广告| 亚洲一区二区久久久久久| 国产精品第一页在线观看| 亚洲区小说区| 日韩精品一区国产麻豆| 热久久精品免费视频| www视频在线免费观看| 久久午夜羞羞影院免费观看| 亚洲va欧美va在线观看| 极品国产91在线网站| 一本一道久久a久久精品蜜桃| 日韩av在线免费看| 污污视频在线免费| 欧美成人ⅴideosxxxxx| 亚洲美女免费视频| 亚洲欧洲久久| 色呦呦免费观看| 日韩电影在线观看电影| 7777kkkk成人观看| 麻豆国产尤物av尤物在线观看 | 国产不卡视频在线播放| 国产精品久久不能| 国产精品变态另类虐交| 中文字幕乱码亚洲无线精品一区| 亚洲色图美腿丝袜| 性色av蜜臀av色欲av| 涩爱av色老久久精品偷偷鲁| 欧美无人高清视频在线观看| 亚洲国产精品久久久久婷蜜芽| 成人在线网址| 中文字幕一区二区三区不卡在线| 鲁丝一区鲁丝二区鲁丝三区| 欧美 日韩 人妻 高清 中文| 国产又黄又大久久| 国产在线播放不卡| 最近国语视频在线观看免费播放| 亚洲综合不卡| 97在线视频免费播放| 九九热视频精品| 欧美日韩免费观看一区=区三区| xxav国产精品美女主播| 国产亚洲精品精品精品| 精品美女久久| 亚洲视频在线播放| 69精品无码成人久久久久久| 国产成人1区| 日韩电影免费在线观看中文字幕| 久久久午夜精品福利内容| 亚洲一区二区三区免费| 日韩欧美一级片| 91精产国品一二三| 99re6热只有精品免费观看| 日韩精品一区二区三区视频| 波多野结衣电影免费观看| 久久伊人影院| 日韩欧美国产午夜精品| 在线xxxxx| 任我爽精品视频在线播放| 日韩激情第一页| 成年人在线观看av| 精品少妇av| 日韩在线欧美在线| 黄色片在线观看网站| 亚洲私人影院| 91黑丝在线观看| 亚洲成人av影片| 老司机午夜精品| 亚洲xxxx3d| 无套内谢的新婚少妇国语播放| 国产成人免费视| 国产原创精品| 免费黄色片在线观看| 国产精品网站在线| 久久久久亚洲av无码专区喷水| 日韩精品卡一| 欧美日韩一区二区在线| 婷婷激情四射五月天| 国产一区 二区| 亚洲国产高潮在线观看| 国产成人av一区二区三区不卡| 成人亚洲一区| 欧美成人午夜剧场免费观看| aaa人片在线| 久久精品二区亚洲w码| 91在线直播亚洲| 三级在线视频| 亚洲摸摸操操av| 免费在线观看亚洲视频| 国产乱子精品一区二区在线观看| 538在线一区二区精品国产| 国产人成视频在线观看| 欧美日韩国产传媒| 欧美精品激情blacked18| 精品人妻一区二区色欲产成人| 蜜臀av国产精品久久久久| 成人午夜影院在线观看| 国产精品秘入口| 亚洲伦理在线精品| 精品少妇无遮挡毛片| 国产一区二区三区黄网站| 日韩久久精品电影| 欧美成人综合色| 日韩成人午夜精品| 国产日韩一区欧美| 国产成人无吗| 欧美亚一区二区| 69亚洲乱人伦| 欧美永久精品| 国产欧美最新羞羞视频在线观看| 欧美一级视频免费| 亚洲色图20p| 国产情侣av自拍| 欧美三级电影在线| 欧美极品在线视频| 国产精品国产三级国产aⅴ| 91免费看`日韩一区二区| 蜜臀av.com| 日韩毛片一区| 亚洲色图国产精品| 国产无人区码熟妇毛片多| 国产.精品.日韩.另类.中文.在线.播放| 色女孩综合网| 欧美人与性动交xxⅹxx| 精品sm捆绑视频| 99久久久免费精品| 免费看黄色91| 日本日本精品二区免费| 手机在线理论片| 精品久久久久久久久久久久包黑料| 天堂资源在线视频| 日韩av一区二区在线影视| 久久精品国产综合精品| 亚洲风情在线资源| 国产视频精品久久久| 中文在线观看免费网站| 丁香一区二区三区| 精品无码av无码免费专区| 成人av在线播放| 久久精品人人做人人爽| 一区二区三区播放| 中文字幕一区二区三区在线播放 | 成人精品视频一区二区三区尤物| 色呦呦网站入口| 国产成人精品一区二区三区视频| 伊人久久免费视频| 中文字幕乱码人妻无码久久| 国产欧美日韩精品一区| 免费看黄色一级大片| 国产成人一区| 国产精品久久久精品| 国产最新视频在线| 欧美中文一区二区三区| 后入内射无码人妻一区| 麻豆专区一区二区三区四区五区| 亚洲一区二区高清视频| 天天综合在线观看| 欧美成人手机在线| 二区三区在线视频| 午夜精品久久久久久久| 日本黄色片在线播放| 久久综合九色| 亚洲国产精品视频一区| 国产免费av国片精品草莓男男| 欧美成人高清视频| 欧美一级做性受免费大片免费| 亚洲成av人影院| 免费中文字幕av| 日本中文字幕一区| 日韩欧美一级在线| 国产精品chinese在线观看| 97超级碰在线看视频免费在线看| 内衣办公室在线| 欧美日韩国产电影| 久久久美女视频| 99国产精品99久久久久久| 中文字幕永久视频| 午夜久久tv| 久久综合九色综合久99| 日韩成人在线电影| 久久久亚洲国产| wwwxxx在线观看| 精品国产伦理网| 樱花视频在线免费观看| 亚洲精品国产一区二区三区四区在线| 国产午夜在线一区二区三区| 日韩国产欧美在线播放| 亚洲天堂第一区| 欧美极品在线观看| 3d精品h动漫啪啪一区二区| 亚洲美女尤物影院| 欧美国产日韩xxxxx| 久久米奇亚洲| 欧美成人一级视频| 亚洲精品国产欧美在线观看| 亚洲伊人伊色伊影伊综合网| 免费网站在线高清观看| 不卡的av电影在线观看| 在线免费观看av网| 免费视频一区二区三区在线观看| 麻豆md0077饥渴少妇| 亚洲欧洲色图| 国产伦精品一区二区三区| 国产精品高潮久久| 91豆花精品一区| 四虎亚洲精品| 中文字幕久热精品在线视频| 亚洲av毛片成人精品| 91精品国产欧美一区二区成人 | 国产桃色电影在线播放| 在线视频欧美日韩精品| 天堂а√在线8种子蜜桃视频| 欧美无人高清视频在线观看| 日韩特级黄色片| 亚洲国产成人高清精品| 国产精品免费人成网站酒店| 日本一区二区视频在线观看| 国产xxxx视频| 国产激情视频一区二区三区欧美| 香蕉视频网站入口| 嫩草成人www欧美| 欧美精品卡一卡二| 亚洲激情中文| 一区二区三视频| 精品国产91久久久久久浪潮蜜月| 国产专区一区二区| caoporn成人| 99热在线国产| heyzo欧美激情| 91免费版黄色| 久久久久亚洲精品中文字幕| 亚洲一区二区三| 2019中文亚洲字幕| 国产日产亚洲精品| 久久久精品一区二区毛片免费看| 国产成人精品久久| 电影一区二区三区| 日韩av电影国产| 六月婷婷综合| 国产成人综合亚洲| 国产精品伦一区二区| 国产精品偷伦视频免费观看国产| 成人激情综合| 国产精品高精视频免费| 国产一区二区三区朝在线观看| 97在线视频国产| 伊人成综合网站| 国产成人精品电影| 国产一区二区色噜噜| 91在线看www| 亚洲综合色婷婷在线观看| 97久久精品午夜一区二区| 亚洲性视频在线| 精品日本一区二区三区在线观看| 日韩激情毛片| 日韩欧美亚洲区| 99久久国产综合精品成人影院| 精品一区二区成人免费视频| 中文精品久久| 99视频在线免费播放| 性欧美xxxx大乳国产app| av无码精品一区二区三区| 久久99国产精品久久99| 亚洲天堂一区二区在线观看| 国产一区二区三区不卡在线观看| 久久久久中文字幕亚洲精品| 99久久精品免费看国产免费软件| 中文字幕xxx| 中文字幕亚洲精品在线观看 | 在线国产91| 久热在线中文字幕色999舞| 爱看av在线入口| 国产mv免费观看入口亚洲| 国产欧美88| 蜜桃导航-精品导航| 国产精品伦理久久久久久| 国产高清av在线播放| 石原莉奈一区二区三区在线观看| 天堂av手机在线| 99麻豆久久久国产精品免费优播| 国产又大又粗又爽的毛片| 亚洲欧美区自拍先锋| 日本一区二区网站| 欧美日韩精品欧美日韩精品一| www.五月婷婷| 亚洲视频日韩精品| 好看的中文字幕在线播放| 国产精品久久久久久久久免费看| 免费一区二区三区在线视频| 蜜桃免费一区二区三区| 亚洲视频电影在线| 久久美女福利视频| 国产精品一区二区无线| 日韩精品无码一区二区三区久久久| 日韩理论片中文av| 欧美超碰在线观看| 精品伦理精品一区| 午夜免费播放观看在线视频| 国产91对白在线播放| 日韩一区二区三区色| 日韩精品欧美在线| 亚洲精品色图| 手机av在线网站| 久久精品亚洲精品国产欧美kt∨| 精品欧美一区二区久久久久| 欧美日韩在线不卡| 日韩电影免费| 欧美精品福利视频| 欧美成人精品午夜一区二区| 日韩欧美一区二区在线观看| 亚洲精品一二| wwwxxxx在线观看| 国产精品理伦片| www.av麻豆| 精品国产免费一区二区三区香蕉| 男人天堂久久久| 国产精品久久久久久久久粉嫩av| 日韩福利视频一区| av在线观看地址| 国产精品香蕉一区二区三区| 日本精品久久久久中文| 在线免费精品视频| 亚洲色大成网站www| 国内精品中文字幕| ccyy激情综合| 久青草视频在线播放| 国产高清在线观看免费不卡| 日韩av手机在线免费观看| 欧美三区免费完整视频在线观看| 男人的天堂av高清在线| 欧美一级视频在线观看| 久久人人爽人人爽人人片av不| av在线com| 国产**成人网毛片九色| 久久久99精品| 精品国产乱子伦一区| www.综合网.com| 国产免费一区| 亚洲一区免费| 久久美女免费视频| 欧美性大战久久久久久久蜜臀| 不卡在线视频| 国产精品丝袜久久久久久高清| 欧美好骚综合网| 国产毛片久久久久久| 一区二区久久久久久| 亚洲精品国产一区二| 性欧美xxxx视频在线观看| 色天下一区二区三区| 91传媒久久久| 国产喷白浆一区二区三区| 日韩久久久久久久久久| 有码中文亚洲精品| 欧美特黄色片| 国产在线视频综合| 99国产一区二区三精品乱码| 中文字幕一区在线播放| 在线播放日韩欧美| 久久一级大片| 精品视频免费在线播放| 国产亚洲人成网站| 97超视频在线观看| 久久久免费观看视频| 午夜a一级毛片亚洲欧洲| 日本成人在线免费视频| 国产精品国产三级国产有无不卡 | 日韩av网址在线| 亚洲电影有码| 亚洲成人动漫在线| 91一区二区三区在线观看| 久久久久精彩视频| 欧美肥老妇视频| 久草成人在线| 一级片黄色免费| 日韩欧美亚洲综合| 色视频在线免费观看| 国产精品二区在线| 视频一区欧美精品| 可以直接看的黄色网址| 日韩精品久久久久| 欧美黑粗硬大| 欧美一区二区中文字幕| 中文字幕精品三区| 免费观看国产精品| 国产精品私拍pans大尺度在线| 中文av一区| 午夜精产品一区二区在线观看的| 51久久夜色精品国产麻豆| 九色porny视频在线观看| 亚洲最大色综合成人av| 99精品一区二区三区| 国产精品久久久久久69| 欧美亚洲第一区| 欧美成人亚洲| аⅴ天堂中文在线网|