精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI能理解自己生成的東西嗎? 在GPT-4、Midjourney上實驗后,有人破案了

人工智能 新聞
近日,華盛頓大學與艾倫人工智能研究院(Allen Institute for AI)聯合發布論文,對這一悖論進行研究。

從 ChatGPT 到 GPT4,從 DALL?E 2/3 到 Midjourney,生成式 AI 引發了前所未有的全球關注。強大的潛力讓人們對 AI 產生了許多期待,但是強大的智能也會引發人們的恐懼和擔憂。近期大牛們針對該問題還上演了一場激烈的論戰。先是圖靈得獎主們「混戰」,后有吳恩達下場加入。

在語言和視覺領域,目前的生成模型只需要幾秒鐘就可輸出,甚至能夠挑戰具有多年技能和知識的專家。這似乎為模型已經超越人類智能的說法提供了令人信服的動機。但是,同樣需要注意到的是,模型輸出中常有理解性的基本錯誤。

這樣看來,似乎出現了一個悖論:我們要如何協調這些模型看似超人的能力與持續存在的大多數人類都能糾正的基本錯誤?

近日,華盛頓大學與艾倫人工智能研究院(Allen Institute for AI)聯合發布論文,對這一悖論進行研究。

圖片

論文地址:https://arxiv.org/abs/2311.00059

本文認為,之所以會出現這樣的現象,是因為當今生成模型中的能力配置與人類的智能配置相背離。本文提出并測試了生成式 AI 悖論假設:生成模型通過訓練,直接輸出媲美專家的結果,該過程直接跳過了理解生成該質量輸出的能力。然而,對于人類來說,這截然不同,基本的理解往往是專家級輸出能力的先決條件。

在本文中,研究者通過對照實驗來檢驗這一假設,分析生成模型對文本和視覺的生成、理解能力。本文首先通過兩個角度講生成模型的「理解」概念化:

  • 1)給定一個生成任務,模型在多大程度上能在同一任務的判別版本中選擇正確的回復;
  • 2)給定一個正確的生成回復,模型在多大程度上能回答有關該回復的內容和問題。這就產生了兩種實驗設置,分別是選擇性實驗和詢問性實驗。

研究者發現,在選擇性評估中,模型在生成任務設置中的表現往往與人類相當甚至優于人類,但在判別(理解)設置中,模型的表現卻不及人類。進一步的分析表明,與 GPT-4 相比,人類的判別能力與生成能力聯系更為緊密,而且人類的判別能力對對抗性輸入也更為魯棒,模型與人類的判別能力差距隨著任務難度的增加而增大。

同樣,在詢問性評估中,雖然模型可以在不同任務中產生高質量的輸出,但研究者觀察到模型在回答有關這些輸出的問題時經常出現錯誤,模型的理解能力再次低于人類的理解能力。本文討論了生成模型與人類在能力配置上出現分歧的一系列潛在原因,包括模型訓練目標、輸入的大小和性質。

這項研究的意義在于,首先,這意味著從人類經驗中得出的現有智能概念可能無法推廣到 AI,即使 AI 的能力在很多方面似乎模仿或超越了人類智能,但其能力可能與人類的預期模式存在根本性差異。另一方面,本文研究結果也建議,在研究生成模型以深入了解人類智能和認知時要謹慎,因為看似專家級的類人輸出可能掩蓋了非人類的機制。 

總之,生成式 AI 悖論鼓勵人們把模型作為一個人類智能的有趣對立面來研究,而不是作為一個平行的對立面來研究。

「生成式 AI 悖論強調了一個有趣的概念,即 AI 模型可以創造出它們自己可能無法完全理解的內容。這就提出了人工智能存在理解的局限性及其強大的生成能力背后所面臨的潛在問題。」網友表示。

圖片

何謂生成式 AI 悖論 

我們首先了解一下生成式 AI 悖論以及測試它的實驗設計。

圖片

圖 1:語言和視覺中的生成式 AI 可以產生高質量的結果。然而,矛盾的是,模型在展示對這些模式的選擇性(A,C)或詢問性(B,D)理解方面有困難。

生成模型獲得生成能力似乎比獲得理解能力更有效,這與人類的智能形成鮮明對比,后者通常是獲得生成能力更難。

要驗證這一假設,需要對悖論的各個方面進行操作性定義。首先,對于給定的模型和任務 t,以人類智能為基線,生成能力比理解能力「更有效」意味著什么。將 g 和 u 作為生成和理解的一些性能指標,研究者將生成式人工智能悖論假設正式表述為:

圖片

簡單地說,對于一項任務 t,如果人類的生成性能 g 與模型相同,那么人類的理解性能 u 就會明顯高于模型(在合理的大 ? 條件下 > ?)。換一種說法,模型在理解方面的表現比研究者對具有類似強大生成能力的人類的預期要差。

生成的操作性定義很簡單:給定一個任務輸入(問題 / 提示),生成就是生成可觀察到的內容以滿足該輸入。因此,可以自動或由人類對性能 g 進行評估(如風格、正確性、偏好)。雖然理解能力不是由一些可觀察到的輸出來定義的,但可以通過明確定義其效果來進行測試:

  1. 選擇性評價。對于一個可以生成應答的給定任務,模型在多大程度上還能在同一任務的判別版本中從提供的候選集中選擇出準確的答案?一個常見的例子是多選題回答,這是檢驗語言模型中人類理解和自然語言理解的最常見方法之一。(圖 1,A、C 欄)
  2. 提問式評價。對于給定生成的模型輸出,模型能在多大程度上準確回答有關該輸出的內容和適當性的問題?這類似于教育中的口試。(圖 1,B、D 欄 )。

這些關于理解的定義提供了一個評估「生成式 AI 悖論」的藍圖,讓研究者能夠檢驗假設 1 是否在不同模式、任務和模型中都成立。

當模型可以生成時,它們能否判別?

首先,研究者在選擇性評估中對生成性任務和判別性任務的變體進行了并列性能分析,以評估模型在語言和視覺模式下的生成和理解能力。他們將這種生成和判別性能與人類進行比較。

下圖 2 比較了 GPT-3.5、GPT-4 和人類的生成和判別性能。可以看到,在 13 個數據集中的 10 個數據集中,至少有一個模型支持子假設 1,模型的生成能力優于人類,但判別能力低于人類。在 13 個數據集中,有 7 個數據集的兩個模型都支持子假設 1。

圖片

要求人類像視覺模型那樣生成詳細圖像是不現實的,普通人無法達到 Midjourney 等模型的風格質量,因此假設人類的生成性能較低。這里只將模型的生成和判別準確性與人類的判別準確性進行比較。與語言領域類似,圖 3 展示了 CLIP 和 OpenCLIP 在判別性能方面也不及人類的準確性。假設人類的生成能力較差,這與子假設 1 一致:視覺 AI 在生成方面超過人類平均水平,但在理解方面落后于人類

圖片

圖 4(左)展示了 GPT-4 與人類的對比。通過觀察,可以發現,當回答冗長且具有挑戰性時,例如總結冗長的文檔,模型往往會在判別任務中犯最多的錯誤。相比之下,人類則能在不同難度的任務中始終保持較高的準確率。

圖 4(右)展示了 OpenCLIP 與人類在不同難度下的判別性能對比。總之,這些結果突出表明,即使面對具有挑戰性或對抗性的樣本,人類也有能力判別出正確答案,但這種能力在語言模型中并不那么強大。這種差異引發了人們對這些模型真正理解程度的疑問。

圖片

圖 5 展示了一個值得注意的趨勢:與人類生成的回復相比,評估員往往更青睞 GPT-4 的回復。

圖片

模型能理解自己生成的結果嗎?

上一節展示了模型通常擅長生成準確的答案,而在判別任務中卻落后于人類。現在,在提問式評估中,研究者通過直接向模型提出有關生成內容的問題,以研究模型能在多大程度上展示出對生成內容有意義的理解 —— 而這正是人類的強項。

圖片

圖 6(左)展示了語言模態的結果。雖然模型在生成方面表現出色,但在回答有關其生成的問題時卻經常出錯,這表明模型在理解方面存在失誤。假設人類無法以同樣的速度或規模生成這樣的文本,盡管問題是關于模型自身的輸出,但與模型相比,人類在質量保證方面的準確率一直較高。正如子假設 2 中所述,研究者預計人類對自己生成的文本會取得更高的準確率。同時可以注意到,本研究中的人類并不是專家,制作與模型輸出一樣復雜的文本可能是一個巨大的挑戰。

因此研究者預計,如果將模型與人類專家進行比較,在理解自己生成內容方面的性能差距會進一步拉大,因為人類專家很可能以接近完美的準確度回答此類問題。

圖 6(右)展示的是視覺模式下的提問結果。可以看到,圖像理解模型在回答有關生成圖像中元素的簡單問題時,其準確性仍然無法與人類相比。同時,圖像生成 SOTA 模型在生成圖像的質量和速度上都超過了大多數普通人(預計普通人很難生成類似的逼真圖像),這表明視覺 AI 在生成(較強)和理解(較弱)方面與人類存在相對差距。令人驚訝的是,與先進的多模態 LLM(即 Bard 和 BingChat)相比,簡單模型與人類之間的性能差距較小,后者具有一些引人入勝的視覺理解能力,但仍難以回答有關生成圖像的簡單問題。

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-06 16:09:46

程序員AI

2023-03-16 19:17:57

2023-08-15 15:03:00

AI工具

2023-06-19 08:19:50

2023-11-02 12:10:00

AI訓練

2025-04-16 09:35:03

2023-03-30 11:08:49

AI模型訓練

2023-05-31 14:23:44

人工智能

2023-05-29 09:29:52

GPT-4語言模型

2023-04-04 08:01:35

2024-05-13 07:14:03

GPT-4生成式AIAI模型

2025-05-30 07:40:56

2023-04-13 15:10:58

AI模型

2023-03-28 13:01:20

GPT-4開發OpenAI

2023-05-03 20:53:48

2023-03-15 07:49:57

GPT-4ChatGPT

2023-11-27 13:06:41

2023-12-15 12:52:17

AI模型

2024-03-22 13:33:00

AI模型

2023-08-02 10:45:43

點贊
收藏

51CTO技術棧公眾號

97人妻精品一区二区三区视频 | 日韩成人免费观看| 免费成人三级| 欧美视频日韩视频| 91亚洲精品国产| 久久免费看视频| 精品在线免费视频| 91超碰caoporn97人人| 亚洲一级片在线播放| 午夜久久av| 欧美亚洲国产bt| www精品久久| 午夜在线小视频| 91偷拍与自偷拍精品| 成人黄色免费看| 天堂а√在线中文在线新版| 91精品91| 在线亚洲国产精品网| 久久久久国产免费| 偷拍自拍亚洲| 色婷婷国产精品| 国产精品自拍合集| 麻豆系列在线观看| 国产网红主播福利一区二区| 高清一区二区三区视频| 亚洲在线精品视频| 久久国产精品毛片| 992tv成人免费视频| 岛国毛片在线观看| 999成人精品视频线3| 亚洲欧美精品中文字幕在线| 极品白嫩少妇无套内谢| 91麻豆精品| 欧美亚洲国产一区二区三区 | 日韩激情中文字幕| 2019中文字幕在线免费观看| 国产精品久久国产愉拍| 久久综合免费视频影院| 蜜桃久久精品成人无码av| 成人精品毛片| 欧美成人精品3d动漫h| 亚洲精品成人在线播放| 成人国产网站| 日本久久一区二区三区| 欧美成人xxxxx| 国产传媒在线观看| 亚洲国产精品久久人人爱| 大片在线观看网站免费收看| 麻豆tv免费在线观看| 国产精品毛片大码女人| 日韩电影免费观看高清完整| 全部免费毛片在线播放网站| 91在线精品一区二区| 国产日韩欧美一区二区| 成人久久久精品国产乱码一区二区| 精品一区二区三区欧美| 91免费的视频在线播放| 国产精品欧美亚洲| 国产精品88av| 成人av男人的天堂| 懂色av蜜臀av粉嫩av分享吧| 成人网在线播放| 精品乱码一区| 黄网在线观看| 中文字幕av一区二区三区高| 亚洲欧洲日韩精品| 成人在线播放免费观看| 一区二区国产盗摄色噜噜| 久久国产午夜精品理论片最新版本| 蜜臀av在线| 黑人巨大精品欧美一区二区免费 | 美女网站视频在线| 亚洲网友自拍偷拍| 精品一区二区中文字幕| 你懂得影院夜精品a| 欧美欧美欧美欧美首页| 欧美性猛交乱大交| 精品伊人久久久| 亚洲天堂网站在线观看视频| 黄色片网站在线播放| 亚洲视频电影在线| 97热精品视频官网| 午夜一级黄色片| 国产精品99久久久久| 好吊色欧美一区二区三区| 国产三级在线免费观看| 亚洲桃色在线一区| 国产黄页在线观看| 成人国产一区| 精品国精品国产尤物美女| 日本黄色特级片| 久久亚洲精品中文字幕蜜潮电影| 精品综合久久久久久97| 亚洲日本视频在线观看| 久久99久国产精品黄毛片色诱| 97伦理在线四区| 男男激情在线| 一区二区欧美精品| 天天视频天天爽| 国产成人夜色高潮福利影视| 中文在线不卡视频| 国产网站在线看| 免费成人在线网站| 韩国一区二区三区美女美女秀| 91精彩在线视频| 五月婷婷激情综合网| 伊人国产在线视频| 日韩成人一级| 欧美另类交人妖| 中文字幕久久熟女蜜桃| 不卡视频免费播放| 日本高清xxxx| 欧美综合影院| 亚洲另类xxxx| 日本在线小视频| 激情五月激情综合网| 欧美一区观看| 蜜桃麻豆影像在线观看| 日韩欧美亚洲国产另类| 少妇的滋味中文字幕bd| 麻豆精品网站| 国产伦精品一区二区三区高清版| 九七久久人人| 欧美性受极品xxxx喷水| 欧美高清性xxxx| 尤物精品在线| 97av影视网在线观看| 午夜不卡视频| 福利精品视频在线| 亚洲高清无码久久| 欧美日本不卡高清| 亚洲一区二区三区四区视频| 日本激情在线观看| 欧洲精品中文字幕| 亚洲午夜久久久久久久国产| 亚洲一区网站| 久久久久资源| 久草在线中文最新视频| 亚洲成av人乱码色午夜| 高h视频免费观看| 国产精品亚洲第一区在线暖暖韩国| 一级做a爰片久久| 成人黄页网站视频| 国产亚洲激情视频在线| 在线观看污污网站| 久久精品一区二区三区不卡| 国产真实乱子伦| 一本色道久久综合狠狠躁的番外| 91产国在线观看动作片喷水| 日韩美女一级视频| 日本久久一区二区三区| 日韩女同一区二区三区| 免费高清在线一区| 在线成人av电影| 国产精品一区二区精品| 欧美精品在线观看91| 亚洲经典一区二区三区| 亚洲成人在线观看视频| 老熟妇精品一区二区三区| 夜夜嗨一区二区三区| 欧美日韩精品不卡| www.一区| 欧美日韩国产成人在线| 粉嫩小泬无遮挡久久久久久| 精品国产精品三级精品av网址| 欧美一级片黄色| 亚欧成人精品| 亚洲精品欧洲精品| 天堂久久av| 国内免费精品永久在线视频| 日韩精品视频无播放器在线看| 色就色 综合激情| 我要看一级黄色录像| 国产成人激情av| 尤物av无码色av无码| 欧美精品一区二区三区精品| 成人黄色在线免费| av手机在线观看| 亚洲小视频在线| www.亚洲黄色| 色综合色狠狠综合色| 中文字幕无码日韩专区免费| 成人免费视频一区二区| 99视频精品免费| 国产精品a级| 欧美一区二区三区四区五区六区| 国产精品白丝久久av网站| 97精品在线观看| 91高清在线| 亚洲精品999| 在线观看中文字幕网站| 亚洲国产精品久久艾草纯爱| 香蕉视频久久久| 粉嫩久久99精品久久久久久夜| 成年人视频在线免费| 欧美一区免费| 日韩成人av网站| 成人爽a毛片免费啪啪红桃视频| 国产成人欧美在线观看| 宅男在线观看免费高清网站| 一区二区三区视频免费在线观看| 国产www免费观看| 91福利在线观看| 日韩污视频在线观看| 中文字幕中文乱码欧美一区二区| www.男人天堂| 狠狠色综合播放一区二区| 黑鬼大战白妞高潮喷白浆| 欧美精品18| 一本一本a久久| 精品在线99| 国产精品国模大尺度私拍| 另类一区二区三区| 欧美孕妇与黑人孕交| 久久亚洲资源| 久热精品在线视频| 香蕉视频在线免费看| 亚洲欧美中文另类| 免费av网站在线播放| 欧美一区二区三区免费在线看| 欧产日产国产69| 亚洲成人黄色影院| 欧美国产日韩在线观看成人| 欧美高清在线一区二区| 一区二区不卡免费视频| 成人激情文学综合网| 性生活在线视频| 另类小说一区二区三区| 可以免费观看av毛片| 国产日韩一区二区三区在线播放 | 综合久久2019| www.久久久久久.com| yourporn在线观看视频| 亚洲欧美日韩在线一区| 亚洲 欧美 激情 小说 另类| 精品国产露脸精彩对白| 国产成人无码www免费视频播放| 欧美一区永久视频免费观看| 一区二区日韩在线观看| 欧美日韩一卡二卡三卡| 最近中文字幕免费观看| 91国在线观看| 色婷婷久久综合中文久久蜜桃av| 91成人在线观看喷潮| 国产91国语对白在线| 欧美性猛交xxxx乱大交3| 中文字幕视频网| 日韩欧美视频一区二区三区| 日韩精品在线免费视频| 狠狠色香婷婷久久亚洲精品| 特级西西444www大精品视频免费看 | 精品亚洲一区二区三区四区五区高| 中文字幕亚洲在线观看| 亚洲综合小说区| 91综合久久爱com| 国产精品视频福利| 日本午夜精品| 相泽南亚洲一区二区在线播放| 日韩国产一区二区| 在线国产精品网| 国产精品a久久久久| 欧美成人免费在线观看视频| 亚欧成人精品| 色天使在线观看| 国产成人免费高清| 韩国无码一区二区三区精品| 久久久av毛片精品| 丁香激情五月少妇| 综合久久久久久| 国产精久久久久久| 欧美日韩免费看| 日本三级一区二区三区| 欧美精品电影在线播放| 成人免费视频国产| 亚洲精品一区中文字幕乱码| 在线观看av黄网站永久| 欧美大尺度激情区在线播放| 超碰高清在线| 国产噜噜噜噜久久久久久久久| 精品午夜视频| 蜜桃传媒一区二区| 五月激情久久久| 日本福利视频在线| 精品中文字幕一区二区| 漂亮人妻被黑人久久精品| 欧美国产日韩一二三区| 深夜福利影院在线观看| 日韩欧美亚洲一二三区| 国产三级小视频| 亚洲欧美日韩网| 怡红院在线播放| 国产999在线观看| av综合网址| 亚洲一区二区三区欧美| 99av国产精品欲麻豆| 中文字幕在线观看日| av男人天堂一区| 成人在线观看高清| 色综合久久天天综合网| www.蜜桃av.com| 中文字幕av一区二区| 在线观看的黄色| av成人在线电影| 99成人超碰| 激情五月开心婷婷| 成人爽a毛片一区二区免费| 欧美美女性生活视频| 欧美视频在线观看 亚洲欧| 99久久久国产精品无码免费| 亚洲视频网站在线观看| heyzo中文字幕在线| 91免费欧美精品| 精品国产一级毛片| 国产成人在线免费看| 国产高清不卡二三区| 亚洲 欧美 国产 另类| 日本韩国精品一区二区在线观看| 少妇精品高潮欲妇又嫩中文字幕 | 精品无人码麻豆乱码1区2区 | 91精品美女在线| 精品欧美久久| 青青在线视频观看| 91网页版在线| 伊人久久综合视频| 亚洲国产美女久久久久| 手机在线免费看av| 亚洲最大福利网| 午夜av一区| 在线观看免费的av| 国产清纯白嫩初高生在线观看91 | 久久99久久久久久| 国产一区二区免费在线| 美国黄色片视频| 在线综合亚洲欧美在线视频| 91露出在线| 国产日韩精品一区二区| 99久久99久久精品国产片桃花| 亚洲天堂网一区| 国产精品日产欧美久久久久| 青娱乐在线免费视频| 亚洲最新在线视频| 欧美成人精品三级网站| 日韩久久久久久久| 免费欧美在线视频| 国产精品麻豆一区| 欧美日韩第一区日日骚| 日韩成人影视| 91精品综合久久久久久五月天| 性欧美69xoxoxoxo| 1314成人网| 亚洲一区二区影院| 亚洲aaaaaaa| 国产精品成人aaaaa网站| 精品一区二区三| 日韩在线一区视频| 一区二区三区欧美亚洲| 六月婷婷中文字幕| 国产91精品黑色丝袜高跟鞋| 国内成人精品| 国产欧美激情视频| 亚洲一区二区欧美| 全色精品综合影院| 国产精品永久免费在线| 一区二区三区四区在线观看国产日韩| 免费观看黄网站| 欧美日韩精品二区| 国产尤物视频在线| 91香蕉亚洲精品| 国产精品分类| 泷泽萝拉在线播放| 欧美日本在线一区| 在线午夜影院| 久久久www免费人成黑人精品| 丝瓜av网站精品一区二区| 久久久久久久久久97| 精品国产免费人成在线观看| 国产精品av一区二区三区| 人人妻人人澡人人爽精品欧美一区| 国产成人aaaa| 成人毛片一区二区三区| 另类视频在线观看| 亚洲bt欧美bt精品777| 色播五月激情五月| 五月天丁香久久| 午夜视频在线观看网站| 国产精品白丝jk白祙| 久久青草久久| 免费中文字幕在线| 国产亚洲综合久久| 日本一区二区乱| 久久久久久三级| 亚洲图片欧美色图| 岛国大片在线观看| 国产另类第一区| 久久99最新地址| 国产www在线| 欧美黄色www| 久久神马影院| 波多野结衣av在线观看| 欧美大片免费久久精品三p|