精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理

發(fā)布于 2024-11-25 16:24
瀏覽
0收藏

有關(guān)類似GPT-4這樣的大型語言模型(LLM)是否真正模擬人類邏輯和推理的辯論正在進(jìn)行中。一些研究人員認(rèn)為,隨著規(guī)模的擴(kuò)大,LLM可能會發(fā)展出對抽象推理、模式識別和類比制作的新能力。

另一方面,一些人認(rèn)為促使這些能力的內(nèi)部機(jī)制尚未被解釋清楚。一些實(shí)驗(yàn)證明,這些模型在其訓(xùn)練數(shù)據(jù)范圍之外難以推廣。

"在創(chuàng)建和推理抽象表示方面的能力對于強(qiáng)大的泛化至關(guān)重要,因此有必要了解LLM在這方面已經(jīng)取得了多大的能力," 圣塔菲研究所的科學(xué)家在最近的一篇論文中寫道。

在他們的研究中,研究人員深入探討了抽象推理的含義,并提供了在LLM中評估其能力的框架。研究結(jié)果表明,盡管GPT-4及其多模態(tài)版本GPT-4V非常復(fù)雜,但它們都未達(dá)到人類水平的抽象推理能力。

什么是抽象推理

抽象推理是從有限數(shù)據(jù)中識別規(guī)律或模式,并將其推廣到新場景的能力。這種特質(zhì)是人類智能的基石,兒童展示了從最少的例子中學(xué)習(xí)抽象規(guī)則的熟練技能。

評估抽象推理能力是一項(xiàng)困難的任務(wù)。弗朗索瓦·紹萊(Francois Chollet)提出的抽象與推理語料庫(ARC)是一個(gè)公正的衡量工具。ARC是一個(gè)評估人類和人工智能抽象推理能力的框架。該測試包含1,000個(gè)手工制作的類比謎題,每個(gè)謎題呈現(xiàn)一些網(wǎng)格轉(zhuǎn)換的例子和一個(gè)最終不完整的網(wǎng)格,解題者必須正確填充。這些謎題旨在消除任何不公平的優(yōu)勢,如與訓(xùn)練數(shù)據(jù)的相似性或?qū)ν獠恐R的依賴。

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理-AI.x社區(qū)

為了解決這些謎題,必須從少數(shù)示例中推斷出總體的抽象規(guī)律,并將其應(yīng)用于測試網(wǎng)格。解決ARC謎題所需的基礎(chǔ)知識被認(rèn)為是人類天生具備的,包括物體識別、數(shù)量評估以及幾何和拓?fù)涞幕驹淼雀拍睢?/p>

研究人員在他們的論文中寫道:“[ARC] 的目標(biāo)是捕捉抽象推理的核心:從少量示例中歸納出一般規(guī)則或模式,并靈活地應(yīng)用于新的、以前未見過的情境。”

人類在ARC上的表現(xiàn)大約在84%左右。相比之下,利用當(dāng)前人工智能系統(tǒng)嘗試解決ARC的努力表現(xiàn)不佳。在一場著名的Kaggle競賽中,使用了程序合成技術(shù)的頂級參賽作品僅成功解決了這些謎題的21%,而且無法超越其狹窄的范圍進(jìn)行泛化。作為通用問題解決者的LLM表現(xiàn)甚至更差,在最近的實(shí)驗(yàn)中只解決了10-12%的ARC挑戰(zhàn)。

對GPT-4進(jìn)行推理任務(wù)的測試

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理-AI.x社區(qū)

圣塔菲研究所的科學(xué)家們進(jìn)行了一系列新的實(shí)驗(yàn),使用了ConceptARC,這是ARC的一種變體,旨在更易于人類參與,并促進(jìn)對特定概念理解的評估。為了適應(yīng)基于文本的GPT-4,視覺謎題被轉(zhuǎn)化為字符序列。模型接收到一個(gè)包含說明、一個(gè)已解決的例子和一個(gè)新問題的提示。GPT-4的任務(wù)是生成表示解決方案的字符序列,允許最多三次嘗試。

先前的測試顯示,GPT-4在不同溫度下在ConceptARC上的得分分別為19%和25%。但通過新的更全面的提示技術(shù),結(jié)果有所改善。在進(jìn)行了480個(gè)ConceptARC任務(wù)的全面測試中,將模型的溫度設(shè)置調(diào)整為0和0.5時(shí),GPT-4的平均表現(xiàn)約為33%。

盡管取得了一些進(jìn)展,但GPT-4的能力明顯落后于人類表現(xiàn),人類在ConceptARC上的表現(xiàn)令人印象深刻,達(dá)到了91%。圣塔菲科學(xué)家指出:“盡管有更詳細(xì)的提示,GPT-4的表現(xiàn)仍然遠(yuǎn)遠(yuǎn)低于人類的高水平,這支持了一個(gè)結(jié)論,即即使有更多的信息提示,該系統(tǒng)仍然缺乏由這個(gè)語料庫測試的基本抽象推理能力。”

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理-AI.x社區(qū)

多模態(tài)是否可以提高GPT-4的性能

研究人員還在GPT-4V上測試了ConceptARC,這是GPT-4的多模態(tài)版本,除了文本外還能處理圖像。普遍的假設(shè)是,由于其增強(qiáng)的能力,GPT-4V將超越其僅文本的對應(yīng)版本。然而,由于全面測試的高昂成本,研究人員將對GPT-4V的評估限制在ConceptARC謎題的一個(gè)被稱為“注意力檢查”的特定組別上,人類通常在這里達(dá)到95%的成功率。

有趣的是,當(dāng)這些注意力檢查被轉(zhuǎn)換為GPT-4的純文本格式時(shí),該模型獲得了65-69%的分?jǐn)?shù),表明這些任務(wù)比完整集合的任務(wù)更容易。然而,GPT-4V在這些任務(wù)上的表現(xiàn)平均為23-25%,不及僅文本版本的成績。

論文對GPT-4V的回應(yīng)進(jìn)行了有趣的觀察:“GPT-4V經(jīng)常在其解決方案中包含對抽象變換規(guī)則的描述...在某些情況下,盡管識別了錯誤的抽象規(guī)則,該模型準(zhǔn)確地描述了輸出網(wǎng)格,我們將其歸類為成功。另一方面,我們將模型正確識別了抽象規(guī)則但未能準(zhǔn)確描述輸出網(wǎng)格的情況歸類為失敗。”

這個(gè)對LLM申請意味著什么

GPT-4V在完整的ConceptARC語料庫上的表現(xiàn)可能會比注意力檢查子集更差。這個(gè)結(jié)果表明,多模態(tài)能力并不一定會為LLM提供卓越的抽象推理能力。

圣塔菲研究所的研究結(jié)果強(qiáng)調(diào)了人類與當(dāng)前最先進(jìn)的人工智能系統(tǒng)之間在抽象推理方面存在的顯著差異。

研究人員寫道:“我們的結(jié)果支持這樣的假設(shè),即GPT-4,也許是目前最具“通用”性的LLM,仍然無法穩(wěn)健地形成抽象概念并推理有關(guān)其訓(xùn)練數(shù)據(jù)中先前未見過的基本核心概念。其他提示或任務(wù)表示的方法可能會提高GPT-4和GPT-4V的性能;這是未來研究的一個(gè)課題。”

因此,在將這些模型整合到需要精確邏輯的決策過程中時(shí),最好保持謹(jǐn)慎。在人工智能應(yīng)用中,尤其是在敏感領(lǐng)域,人類監(jiān)督仍然至關(guān)重要。

本文轉(zhuǎn)載自 ??MoPaaS魔泊云??,作者: Ben Dickson

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产精品户外野外| 欧美精品tushy高清| 精品久久中出| 在线能看的av| 国产真实有声精品录音| 欧美视频在线播放| 天堂va久久久噜噜噜久久va| 中文字幕人妻色偷偷久久| 青青草综合网| 日韩女优毛片在线| 黄色免费福利视频| p色视频免费在线观看| 国产一区在线视频| 久久久久久久91| 波多野结衣片子| 色999久久久精品人人澡69| 亚洲猫色日本管| 国产高清在线一区二区| 日批视频免费在线观看| 欧美日韩黑人| 日韩免费在线观看| 88av.com| 天堂亚洲精品| 国产欧美日韩另类一区| 91在线免费视频| 精品欧美一区二区三区免费观看| 成久久久网站| 亚洲国产成人91精品| 一区二区三区免费播放| 国产蜜臀一区二区打屁股调教| 久久精品这里都是精品| 亚洲最大福利视频网站| 国产一区二区视频网站| 国产综合欧美| 在线成人激情视频| 亚洲国产综合视频| 久久九九精品视频| 在线亚洲一区观看| 亚洲中文字幕无码av永久| www.在线播放| 久久看人人爽人人| 国产伦理一区二区三区| 国产精品探花视频| 日本在线不卡视频一二三区| 久久露脸国产精品| 免费黄在线观看| 人妖一区二区三区| 欧美成人一区二区三区| 国产精品视频中文字幕| 樱桃视频成人在线观看| 亚洲成年人影院| 日韩精品免费一区| 国产黄网站在线观看| 国产欧美精品在线观看| 久久一区二区精品| 亚洲国产视频一区二区三区| 国产一区二区美女| 国产精品亚洲激情| 波多野结衣激情视频| 国户精品久久久久久久久久久不卡| 日韩中文字幕免费看| 国产精品成人无码免费| 岳的好大精品一区二区三区| 亚洲国产精品99久久| youjizz.com国产| 伊人www22综合色| 日韩欧美一级片| 久久久国产精品久久久| 外国成人毛片| 欧美蜜桃一区二区三区| 人妻有码中文字幕| 欧美国产大片| 日本国产一区二区| 黑人粗进入欧美aaaaa| 日韩av中字| 欧美在线视频日韩| 国产野外作爱视频播放| 日韩av黄色| 欧美一级理论片| 国产吃瓜黑料一区二区| av综合网站| 亚洲国产天堂网精品网站| 日韩成人av一区二区| 欧美一级全黄| 亚洲三级av在线| 九一在线免费观看| 97精品一区| 九九精品在线观看| 奇米影视第四色777| 免费欧美日韩| 国产精品亚洲美女av网站| 一级黄色片网站| 国产精品主播直播| 极品日韩久久| 国产高清在线| 亚洲少妇中出一区| 亚洲色成人www永久在线观看 | 精品久久久久久无| 亚洲天堂2024| 成人嫩草影院| 久久视频国产精品免费视频在线| 久草资源在线视频| 免费亚洲婷婷| 国产精品成熟老女人| 国产又粗又猛又爽又黄91| 成人久久久精品乱码一区二区三区| 九色综合婷婷综合| 一级毛片视频在线| 亚洲成人在线观看视频| 九九热在线免费| 91精品啪在线观看国产手机 | 国产97色在线|日韩| 亚洲综合免费视频| 99国产精品国产精品久久| 日本一区美女| 黄色美女视频在线观看| 一本色道久久综合亚洲91| 91香蕉视频污版| 亚洲午夜免费| 中文字幕欧美在线| 国产精品50页| 美女在线视频一区| 鲁丝片一区二区三区| 青草av在线| 欧美日韩国产系列| 亚洲第一香蕉网| 亚洲国产精品一区| 国产精品丝袜久久久久久高清 | 国内不卡的二区三区中文字幕| 国产精品区一区二区三在线播放| www日韩tube| 黑人巨大精品欧美一区二区| 亚洲一区二区福利视频| 国产精品视频一区二区三区四蜜臂| 色综合久久悠悠| 亚洲无码精品国产| 国产日韩精品一区| 国产白丝袜美女久久久久| 久久99久久久精品欧美| 亚洲精品资源在线| 黄色激情视频在线观看| 国产激情视频一区二区在线观看| 日韩国产一区久久| 在线天堂新版最新版在线8| 精品国产一区二区三区av性色| 亚洲一级片在线播放| 久久国产福利| 精品国产中文字幕| 宅男在线观看免费高清网站| 欧美吻胸吃奶大尺度电影| 四虎永久免费影院| 亚洲成人中文| 国产精品国产三级国产专区53 | 久久综合999| 国产v片免费观看| 欧美日本三级| 久久艳片www.17c.com| 在线观看免费高清视频| 日本一区二区动态图| 粉嫩虎白女毛片人体| 蜜桃一区二区三区| 欧美在线精品免播放器视频| 手机看片1024国产| 亚洲精品欧美专区| 亚洲制服在线观看| 欧美激情麻豆| av电影成人| 超清av在线| 亚洲国产黄色片| 国产网站在线看| eeuss鲁片一区二区三区在线观看| 欧美激情亚洲天堂| 国产在线播放精品| 欧美专区第一页| 国产原创av在线| 欧美性猛交xxxx乱大交| 国产精品久久久久无码av色戒| 视频一区视频二区中文字幕| 日韩欧美亚洲日产国产| 91九色综合| 久久精品成人欧美大片古装| 国产又粗又长又黄| 亚洲精品美腿丝袜| 久久久久亚洲av成人网人人软件| 国产在线成人| 国产在线视频欧美一区二区三区| 成人午夜视屏| 中文字幕亚洲一区| 99精品免费观看| 亚洲国产精品视频| 国产免费无遮挡吸奶头视频| 国产自产视频一区二区三区| 青春草在线视频免费观看| 亚洲国产欧美在线观看| 欧美在线视频一区二区| 黄色在线观看网站| 亚洲第一av在线| 波多野结衣视频观看| 中日韩免费视频中文字幕| 亚洲黄色片免费| 在线日韩电影| 亚洲丰满在线| 97一区二区国产好的精华液| 欧美一级大片在线观看| 日本激情视频在线观看| 亚洲福利在线看| 在线观看色网站| 亚洲国产精品一区二区尤物区| 欧美狂猛xxxxx乱大交3| 日本成人在线一区| youjizz.com在线观看| 精品国产一区二区三区小蝌蚪| 亚洲sss综合天堂久久| 大桥未久在线视频| www国产精品视频| 五月激情丁香婷婷| 香蕉久久精品| 久久久国产在线视频| 色天使在线视频| 毛片av一区二区三区| 女人被男人躁得好爽免费视频| 天美av一区二区三区久久| 成人信息集中地欧美| 天然素人一区二区视频| 欧美一区亚洲一区| 国产黄大片在线观看| 久久99亚洲精品| av在线影院| 久久精品国产欧美亚洲人人爽| 黄色在线播放| 亚洲欧美在线一区二区| 亚洲人视频在线观看| 亚洲第一福利在线观看| 老熟妇高潮一区二区高清视频| 欧美一区二区三区视频在线| 国产又爽又黄又嫩又猛又粗| 色久优优欧美色久优优| 影音先锋在线国产| 日韩欧美黄色动漫| 中文字幕精品三级久久久| 亚洲午夜在线视频| 久久高清免费视频| 五月婷婷激情综合| 日韩女优在线观看| 欧美日韩中国免费专区在线看| 日本三级欧美三级| 无码av中文一区二区三区桃花岛| 国产精品不卡av| 亚洲www啪成人一区二区麻豆| 久久网中文字幕| 亚洲成人一区二区| 中文字幕亚洲高清| 欧美性猛交xxxx免费看漫画| 天堂网视频在线| 在线观看一区二区精品视频| 97人妻精品视频一区| 欧美日韩黄视频| 国产情侣自拍小视频| 日韩精品一区二区三区中文精品| 成人午夜免费福利| 日韩成人网免费视频| 国产精品免费播放| 久久久99久久精品女同性| 中文在线字幕免费观看| 91精品国产色综合| 欧美日韩亚洲国产| 亚洲a∨日韩av高清在线观看| 麻豆国产一区二区三区四区| 国产日韩欧美亚洲一区| 在线亚洲a色| 经典三级在线视频| 99视频精品| 色婷婷成人在线| 国产成人小视频| 欧美做受高潮6| 亚洲久本草在线中文字幕| 国产乡下妇女做爰| 欧美影视一区在线| 精品毛片一区二区三区| 精品亚洲永久免费精品 | 成人av电影在线| 受虐m奴xxx在线观看| 亚洲少妇30p| 一区二区三区在线观看av| 欧美日韩一卡二卡三卡| 丰满人妻妇伦又伦精品国产| 亚洲色图狂野欧美| 99福利在线| 国产成人小视频在线观看| 99久久久成人国产精品| 精品人伦一区二区三区 | 不卡毛片在线看| 理论片午夜视频在线观看| 国产欧美日韩精品丝袜高跟鞋| 都市激情亚洲| 亚洲美女网站18| 国产欧美一级| 中文字幕欧美视频| 97精品国产97久久久久久久久久久久| www..com.cn蕾丝视频在线观看免费版| 亚洲欧美日韩中文播放| 国产一级淫片a视频免费观看| 日韩美女视频一区二区在线观看| 三级毛片在线免费看| 欧美老少配视频| 精品69视频一区二区三区| 久久国产精品-国产精品| 自拍视频亚洲| 久久人人爽av| 最近中文字幕免费观看| 在线观看亚洲一区| 人妻精品一区一区三区蜜桃91| 中文字幕一区日韩电影| 涩涩涩视频在线观看| av免费精品一区二区三区| 久久精品99久久无色码中文字幕| aa视频在线播放| 国产精品中文有码| 国产激情无码一区二区三区| 欧美性猛片xxxx免费看久爱| 亚洲欧美日韩综合在线| 国模精品系列视频| 日韩三级av高清片| eeuss中文| 久国产精品韩国三级视频| www.99热| 在线看国产一区二区| 欧美孕妇孕交xxⅹ孕妇交| 7777精品久久久久久| 91精品短视频| www插插插无码免费视频网站| 精品一区二区国语对白| 午夜黄色福利视频| 欧美在线不卡一区| 高清日韩av电影| 国产精品美女视频网站| 欧美少妇性xxxx| 久久久精品三级| 中文字幕av不卡| 国产偷人爽久久久久久老妇app| 亚洲欧美激情精品一区二区| 女海盗2成人h版中文字幕| 久久99精品久久久久久三级| 精品91久久久久| 国产网站无遮挡| 欧美色视频日本高清在线观看| 视频一区二区在线播放| 国产91免费看片| 欧美三级情趣内衣| 超碰在线播放91| 日韩码欧中文字| 国产肥老妇视频| 欧美疯狂性受xxxxx另类| 国产成人在线中文字幕| 毛片在线播放视频| 久久久久久久久久久久久夜| 无码人妻丰满熟妇区五十路 | 最新成人av网站| 波多野结衣视频播放| 欧美日韩精品二区| 国产精品秘入口| 91中文在线视频| 海角社区69精品视频| 亚洲一区二区乱码| 欧洲精品在线观看| 免费不卡视频| 国产精品一区二区不卡视频| 国产精品普通话对白| 一级特黄曰皮片视频| 欧美一级艳片视频免费观看| 国产极品人妖在线观看| 日本视频一区二区在线观看| 美女诱惑一区二区| 国产一级片播放| 亚洲欧洲国产精品| 成人豆花视频| 欧美变态另类刺激| 国产嫩草影院久久久久| 国产乱人乱偷精品视频| 午夜精品一区二区三区av| re久久精品视频| 国产乱国产乱老熟300部视频| 精品成人av一区| 91网在线播放| 国产主播一区二区三区四区| 美女视频黄免费的久久 | 国产肉体xxxx裸体784大胆| 欧美在线免费视屏| 日本欧美电影在线观看| 欧美精品尤物在线| 国产一区二区精品久久| 黄瓜视频在线免费观看| 欧美大片va欧美在线播放| 国产精品美女久久久久久不卡| 亚洲一二三av| 黑人巨大精品欧美一区免费视频| 国产美女福利在线| 欧美重口乱码一区二区| 高清不卡一二三区| 一级黄色大片免费观看|