精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

研究表明大型語言模型在邏輯推理方面存在問題

譯文
人工智能
人工智能系統(tǒng)針對自然語言處理和理解問題有幾個基準(zhǔn)測試,例如GLUE、SuperGLUE、SNLI和SqUAD。隨著Transformer規(guī)模變得越來越大,并在更大的數(shù)據(jù)集上接受訓(xùn)練,Transformer已經(jīng)能夠在這些基準(zhǔn)上逐步改進。

譯者 | 李睿

審校 | 孫淑娟

在具有感知功能的聊天機器人成為熱門話題之前,大型語言模型(LLM)就已經(jīng)引起了人們更多的興奮和擔(dān)憂。近年來,經(jīng)過大量文本訓(xùn)練的深度學(xué)習(xí)模型——大型語言模型(LLM) 在幾個用于衡量語言理解能力的基準(zhǔn)方面表現(xiàn)出色。

諸如GPT-3和LaMDA之類的大型語言模型設(shè)法在較長的文本中保持連貫性。它們似乎對不同的主題很了解,并在冗長的對話中保持一致。大型語言模型(LLM)已經(jīng)變得如此令人信服,以至于有些人將它們與人格和更高形式的智力聯(lián)系在一起。

但是大型語言模型(LLM)能像人類一樣進行邏輯推理嗎?根據(jù)加州大學(xué)洛杉磯分校科學(xué)家發(fā)布的一篇研究論文,在大型語言模型(LLM)中使用的深度學(xué)習(xí)架構(gòu)Transformers并沒有學(xué)習(xí)模擬推理功能。與其相反,電腦們找到了明智的方法來學(xué)習(xí)推理問題中固有的統(tǒng)計特征。

研究人員在一個有限的問題空間中測試了當(dāng)前流行的Transformer架構(gòu)BERT。他們的研究結(jié)果表明,BERT可以準(zhǔn)確地響應(yīng)訓(xùn)練空間中分布內(nèi)示例的推理問題,但不能推廣到基于相同問題空間的其他分布中的示例。

而這些測試突出了深度神經(jīng)網(wǎng)絡(luò)的一些缺點以及用于評估它們的基準(zhǔn)。

1.如何衡量人工智能中的邏輯推理?

人工智能系統(tǒng)針對自然語言處理和理解問題有幾個基準(zhǔn)測試,例如GLUE、SuperGLUE、SNLI和SqUAD。隨著Transformer規(guī)模變得越來越大,并在更大的數(shù)據(jù)集上接受訓(xùn)練,Transformer已經(jīng)能夠在這些基準(zhǔn)上逐步改進。

值得注意的是,人工智能系統(tǒng)在這些基準(zhǔn)上的表現(xiàn)通常與人類智能進行比較。人類在這些基準(zhǔn)上的表現(xiàn)與常識和邏輯推理能力密切相關(guān)。但目前尚不清楚大型語言模型的改進是因為它們獲得了邏輯推理能力,還是因為它們接觸了大量文本。

為了驗證這一點,加州大學(xué)洛杉磯分校的研究人員開發(fā)了SimpleLogic,這是一類基于命題邏輯的邏輯推理問題。為了確保語言模型的推理能力經(jīng)過嚴(yán)格測試,研究人員通過使用模板語言結(jié)構(gòu)消除了語言差異。SimpleLogic問題由一組事實、規(guī)則、查詢和標(biāo)簽組成。事實是已知為“真”的謂詞。規(guī)則是條件,定義為條款。查詢是機器學(xué)習(xí)模型必須響應(yīng)的問題。標(biāo)簽是查詢的答案,也就是“真”或“假”。 SimpleLogic問題被編譯成連續(xù)的文本字符串,其中包含語言模型在訓(xùn)練和推理期間所期望的信號和分隔符。 

圖片

以SimpleLogic格式提出的問題SimpleLogic的特點之一是它的問題是自包含的,不需要先驗知識。這一點尤其重要,因為正如許多科學(xué)家所說,當(dāng)人類說話時,他們忽略了共享的知識。這就是為什么當(dāng)被問及每個人都知道的基本世界知識的問題時,語言模型經(jīng)常陷入陷阱的原因。相比之下,SimpleLogic為開發(fā)人員提供解決其問題所需的一切。 因此,任何查看SimpleLogic格式提出的問題的開發(fā)人員都應(yīng)該能夠推斷其規(guī)則,并能夠處理新示例,無論他們的背景知識如何。

2.統(tǒng)計特征和邏輯推理

研究人員證明,SimpleLogic中的問題空間可以用一個推理函數(shù)來表示。研究人員進一步表明,BERT有足夠的能力解決SimpleLogic中的所有問題,它們可以人工調(diào)整機器學(xué)習(xí)模型的參數(shù)來表示推理功能。

然而,當(dāng)它們在SimpleLogic示例數(shù)據(jù)集上訓(xùn)練BERT時,該模型無法自行學(xué)習(xí)推理功能。機器學(xué)習(xí)模型設(shè)法在一個數(shù)據(jù)分布上實現(xiàn)近乎完美的準(zhǔn)確性。但它并沒有推廣到同一問題空間內(nèi)的其他分布。盡管訓(xùn)練數(shù)據(jù)集覆蓋了整個問題空間,并且所有分布都來自同一推理函數(shù),但情況仍然如此。

圖片

BERT Transformer模型的容量足以表示SimpleLogic的推理功能

(注:這與分布外泛化挑戰(zhàn)不同,后者適用于開放空間問題。當(dāng)模型無法泛化到OOD數(shù)據(jù)時,當(dāng)處理不在其訓(xùn)練集分布范圍內(nèi)的數(shù)據(jù)時,其性能會顯著下降。)

研究人員寫道:“經(jīng)過進一步調(diào)查,我們?yōu)檫@個悖論提供了一個解釋:僅在分布測試示例上達到高精度的模型還沒有學(xué)會推理。事實上,該模型已經(jīng)學(xué)會在邏輯推理問題中使用統(tǒng)計特征來進行預(yù)測,而不是模擬正確的推理功能。”

這一發(fā)現(xiàn)凸顯了將深度學(xué)習(xí)用于語言任務(wù)的一個重要挑戰(zhàn)。神經(jīng)網(wǎng)絡(luò)非常擅長發(fā)現(xiàn)和擬合統(tǒng)計特征。在某些應(yīng)用程序中,這可能非常有用。例如,在情感分析中,某些詞和情感類別之間存在很強的相關(guān)性。

然而,對于邏輯推理任務(wù),即使存在統(tǒng)計特征,其模型也應(yīng)該嘗試找到并學(xué)習(xí)潛在的推理功能。

研究人員寫道:“當(dāng)我們試圖對神經(jīng)模型進行端到端的訓(xùn)練,以解決既涉及邏輯推理又涉及先驗知識且呈現(xiàn)語言差異的自然語言處理(NLP)任務(wù)時,應(yīng)該小心謹(jǐn)慎。”他們強調(diào),SimpleLogic帶來的挑戰(zhàn)在現(xiàn)實世界中變得更加嚴(yán)峻,大型語言模型(LLM)所需的大量信息根本不包含在數(shù)據(jù)中。

研究人員觀察到,當(dāng)他們從訓(xùn)練數(shù)據(jù)集中刪除一個統(tǒng)計特征時,語言模型在相同問題空間的其他分布上的性能得到了改善。然而,問題是發(fā)現(xiàn)和刪除多個統(tǒng)計特征說起來容易做起來難。正如研究人員在論文中指出的那樣,“此類統(tǒng)計特征可能數(shù)不勝數(shù),并且極其復(fù)雜,因此很難從訓(xùn)練數(shù)據(jù)中刪除。”

3.深度學(xué)習(xí)中的推理

不幸的是,隨著語言模型規(guī)模的變大,邏輯推理問題并沒有消失。它只是隱藏在龐大的架構(gòu)和非常大的訓(xùn)練語料庫中。大型語言模型(LLM)可以描述事實并且很好地將句子拼接在一起,但是在邏輯推理方面,他們?nèi)匀皇褂媒y(tǒng)計特征進行推理,這不是一個堅實的基礎(chǔ)。而且,沒有跡象表明通過向Transformers添加層、參數(shù)和注意力頭,邏輯推理的差距將被彌合。

這篇論文與其他顯示神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)邏輯規(guī)則方面的局限性的工作一致,例如生命游戲或視覺數(shù)據(jù)的抽象推理。該論文強調(diào)了當(dāng)前語言模型面臨的主要挑戰(zhàn)之一。正如加州大學(xué)洛杉磯分校的研究人員所指出的,“一方面,當(dāng)一個模型被訓(xùn)練來從數(shù)據(jù)中學(xué)習(xí)一項任務(wù)時,它總是傾向于學(xué)習(xí)統(tǒng)計模式,這些模式固有地存在于推理示例中;然而,另一方面,邏輯規(guī)則從不依賴統(tǒng)計模式來進行推理。由于很難構(gòu)建一個不包含統(tǒng)計特征的邏輯推理數(shù)據(jù)集,因此從數(shù)據(jù)中學(xué)習(xí)推理是很困難的。”

原文鏈接:https://bdtechtalks.com/2022/06/27/large-language-models-logical-reasoning/

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2025-05-08 09:10:30

2022-11-30 10:05:27

VMware

2022-12-01 08:00:00

2021-04-02 09:40:06

量子計算芯片超算

2024-02-04 14:04:46

AIGC

2025-05-26 17:16:51

2025-06-12 01:00:00

2025-03-03 09:40:00

2023-07-19 14:50:01

網(wǎng)絡(luò)安全勒索軟件

2015-09-21 09:52:57

邏輯推理

2025-01-27 12:03:11

2025-03-13 12:09:27

2024-04-26 08:53:46

自動駕駛人工智能大型語言模型

2024-10-16 13:50:00

模型AI

2025-10-14 01:00:00

2023-05-22 15:46:56

模型訓(xùn)練

2024-04-16 16:14:01

人工智能LLMRAG

2025-05-08 02:02:02

2023-06-02 15:47:49

2025-05-28 01:25:00

RAG人工智能語言模型
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲97av| jk漫画禁漫成人入口| 国内一区二区视频| 欧美激情亚洲激情| 星空大象在线观看免费播放| www在线看| 不卡av免费在线观看| 国产成人精品久久二区二区| 国产免费一区二区三区四区| 国产精品天天看天天狠| 在线精品视频小说1| av电影一区二区三区| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 国产精品久久久免费| 久久精品在线播放| 在线观看av中文字幕| 日本午夜免费一区二区| 亚洲成人精品在线观看| 亚洲精品在线免费| 日本毛片在线观看| 久久国产精品一区二区| 96精品视频在线| 亚洲av鲁丝一区二区三区| 亚洲肉体裸体xxxx137| 日韩丝袜美女视频| 国产视频在线视频| 97视频网站入口| 一级全黄裸体片| 日韩av首页| 精品国产31久久久久久| 潘金莲一级淫片aaaaaa播放1| 欧美色视频免费| 成人午夜视频网站| 91亚洲精品久久久| 免费黄色一级大片| 新67194成人永久网站| 欧美黄色性视频| 丰满少妇被猛烈进入一区二区| 国产a久久精品一区二区三区 | 91在线精品一区二区| 91国产在线免费观看| 一级片在线观看视频| 日本午夜精品视频在线观看| 欧美一区二区三区免费视| 国产精彩视频在线观看| 国产精品av一区二区| 精品国偷自产在线视频99| 麻豆视频免费在线播放| 国产一区二区精品福利地址| 亚洲人av在线影院| 久久国产精品无码一级毛片| 欧美a一欧美| 亚洲精品久久久久久久久久久久久| 无码人妻丰满熟妇区毛片蜜桃精品| 亚洲资源在线| 日韩一区二区高清| 国产免费a级片| 国产精品高潮呻吟久久久久| 亚洲大胆人体av| 久久性爱视频网站| 久久综合另类图片小说| 国产视频久久久| 国产男男chinese网站| 天堂一区二区三区四区| 亚洲精品美女久久久| 李宗瑞91在线正在播放| 精品国产aⅴ| 日韩在线免费高清视频| 国产美女福利视频| 欧美精品不卡| 97av在线影院| 国产九色91回来了| 狠狠色丁香婷婷综合| 99九九电视剧免费观看| 欧美性猛交 xxxx| www成人在线观看| 天堂资源在线亚洲资源| 成人77777| 亚洲精品亚洲人成人网在线播放| 日韩精品免费一区| 亚洲优女在线| 欧美日韩一区二区三区四区五区| 久久久久久久久久毛片| а√中文在线天堂精品| 亚洲精品一二区| 四虎地址8848| 激情婷婷久久| 国产精品狠色婷| 99热这里只有精品在线| 97se亚洲国产综合自在线| 色播亚洲视频在线观看| 影音先锋在线播放| 欧美性xxxx极品hd满灌| 欧美视频国产视频| 久久精品国产亚洲blacked| 国产午夜精品美女视频明星a级| 免费成人美女女在线观看| 亚洲经典在线| 国产精品自在线| 乱精品一区字幕二区| 日本一区二区三区免费乱视频 | 一色道久久88加勒比一| 一区二区影视| 日韩免费av在线| 国产av一区二区三区精品| 久久综合九色综合97_久久久| 制服丝袜综合日韩欧美| 色黄视频在线观看| 日韩欧美国产综合一区| 亚洲午夜精品久久久久久高潮| 国产精品jizz在线观看美国| 国产精品精品国产| 日韩在线视频免费| 亚洲视频资源在线| 日本成人黄色网| 精品人人人人| 欧美成人激情在线| 中文人妻熟女乱又乱精品| 911精品国产| 精品无码久久久久久国产| 四虎地址8848| 日本怡春院一区二区| 精品久久久久久亚洲| 好操啊在线观看免费视频| 欧美午夜激情视频| 欧美xxxx日本和非洲| 婷婷久久国产对白刺激五月99| 青草青草久热精品视频在线观看| 精品区在线观看| 自拍偷在线精品自拍偷无码专区| av动漫免费看| 日本天堂一区| 午夜剧场成人观在线视频免费观看| 91亚洲视频在线观看| 欧美韩国一区二区| 最近免费中文字幕中文高清百度| 精品视频高潮| 国内精品中文字幕| 亚洲精品97久久中文字幕| 综合久久一区二区三区| 五月天av在线播放| 日韩精品久久久久久久电影99爱| 国产成人精品在线| 国产在线91| 一本色道久久综合亚洲91| 在线视频 日韩| 亚洲激情影院| 精品不卡一区二区三区| 美女视频在线免费| 日韩精品视频在线播放| 国产一卡二卡在线| 99re8在线精品视频免费播放| 欧美乱大交xxxxx潮喷l头像| 国产极品模特精品一二| 97精品国产91久久久久久| 人妻一区二区三区四区| 精品久久久一区| 麻豆精品免费视频| 日韩高清欧美激情| 亚洲人成人77777线观看| 日韩大陆av| 久久精品人人做人人爽| 国产黄色小视频在线观看| 亚洲综合免费观看高清在线观看| 男人添女人荫蒂国产| av成人天堂| 欧美在线播放一区| 免费成人黄色网| 精品自在线视频| 国产又爽又黄网站亚洲视频123| 欧美视频一二三| 999久久久国产| 国产精品一卡二| 国产成人在线免费看| 精品国产视频| 亚洲a∨日韩av高清在线观看| 污污的网站在线看| 亚洲韩国青草视频| 久草视频在线免费| 亚洲精选一二三| 一级特级黄色片| 日韩成人精品在线| 欧美美女黄色网| 亚洲婷婷丁香| 成人欧美一区二区三区在线| 2020av在线| 在线播放日韩欧美| 成人久久精品人妻一区二区三区| 欧美色视频日本版| 在线观看亚洲网站| 91麻豆国产在线观看| 尤蜜粉嫩av国产一区二区三区| 综合久久精品| 免费在线一区二区| 欧美日本三级| 国产成人拍精品视频午夜网站 | 亚洲人辣妹窥探嘘嘘| 欧美a级在线| 日本黄网免费一区二区精品| 久久久久久久久久久久电影| 日本一区二区在线播放| 羞羞网站在线免费观看| 在线播放亚洲激情| 天天操天天干天天| 56国语精品自产拍在线观看| 五月天婷婷久久| 一区二区三区视频在线看| 成都免费高清电影| 成人v精品蜜桃久久一区| 亚洲免费黄色网| 久久在线91| 僵尸世界大战2 在线播放| 国产精品99久久精品| 欧美日韩喷水| 牛牛影视一区二区三区免费看| 国产欧美婷婷中文| jk漫画禁漫成人入口| 孩xxxx性bbbb欧美| 在线观看h网| 久久精品99久久久香蕉| 国产高清一级毛片在线不卡| 亚洲精品99久久久久| 精品久久无码中文字幕| 欧美日韩第一区日日骚| 在线免费观看av网址| 精品久久久久久久久久久久久| 精品一区在线观看视频| 亚洲国产精品精华液2区45| 免费看黄色aaaaaa 片| 高清不卡一区二区| 欧美又黄又嫩大片a级| 开心九九激情九九欧美日韩精美视频电影 | 无码人妻丰满熟妇啪啪网站| 久久99国产精品尤物| 国产超碰在线播放| 日韩经典一区二区| 日本精品一区二区三区四区| 亚洲国产一区二区三区高清| 国产欧美精品aaaaaa片| 午夜精品久久久久99热蜜桃导演 | 亚洲高清福利视频| 亚洲国产成人精品一区二区三区| 欧美一区二区三区四区在线观看| 亚洲一二区视频| 欧美日韩一区小说| 亚洲香蕉在线视频| 91精品国产免费| 国产99久一区二区三区a片| 日韩欧美国产一区二区三区| 午夜精品久久久久久久爽 | 动漫精品一区二区| 国产综合精品视频| 在线一区二区三区四区| 欧美特级黄色片| 欧美亚洲国产bt| 中文字幕91爱爱| 欧美挠脚心视频网站| 国产片在线播放| 日韩女优制服丝袜电影| 免费看日韩av| 日韩精品在线影院| 国产天堂素人系列在线视频| 伊人av综合网| h片在线免费| 韩国欧美亚洲国产| 中文字幕av一区二区三区佐山爱| 国产91色在线|免| 欧美大片网站| 成人午夜影院在线观看| 神马香蕉久久| 亚洲国产午夜伦理片大全在线观看网站 | 先锋影音日韩| 欧美 亚欧 日韩视频在线| www.亚洲视频.com| 久久久久国产精品午夜一区| 国产一区二区在线免费播放| 国产精品自在欧美一区| 久久久久国产精品无码免费看| 久久久久久久久久久黄色| 黄色av片三级三级三级免费看| 亚洲人成人一区二区在线观看| 久久久久无码国产精品| 色综合久久66| av一区二区三| 亚洲人成人99网站| 91精品国产91久久久久久青草| 午夜精品久久久久久久99热浪潮 | 7777精品伊人久久久大香线蕉超级流畅| 精品人妻一区二区三区日产乱码| 日韩成人在线电影网| 欧美高清视频| 57pao成人永久免费视频| 婷婷激情成人| 美脚丝袜一区二区三区在线观看| 91一区在线| 男女av免费观看| 国产在线国偷精品产拍免费yy| 国产精品成人免费一区久久羞羞| 国产视频一区二区在线观看| 久久免费在线观看视频| 欧美三级日韩在线| 天天操天天干天天干| 久久精品国产69国产精品亚洲| 黄色在线免费观看网站| 91精品综合视频| 国内精品久久久久久久久电影网 | 日韩av网站在线播放| 欧美视频二区36p| 性生活免费网站| 中文字幕日韩视频| 亚洲妇女成熟| 国产精品久久久久久久久久久久午夜片 | 久久精品国产99国产精品澳门| 激情视频网站在线播放色| 91在线高清免费观看| 日韩成人精品一区| 黄色国产精品视频| av成人老司机| 黄色一级片在线| 69久久99精品久久久久婷婷| 成人在线免费视频| 国产69精品久久久久久| 哺乳挤奶一区二区三区免费看| 一级黄色免费在线观看| 日本视频一区二区| 在线免费观看麻豆| 懂色av影视一区二区三区| 色婷婷av一区二区三| 欧美激情欧美狂野欧美精品| av成人在线网站| 日本黄色a视频| 美女性感视频久久| www久久久久久久| 日本韩国精品在线| 巨骚激情综合| 热久久99这里有精品| 日韩mv欧美mv国产网站| 黄色大片在线免费看| 成人午夜电影网站| 亚洲一区 视频| 亚洲第一偷拍网| 多野结衣av一区| 精品国产乱码久久久久软件| 日韩亚洲精品在线| 亚洲天堂资源在线| 欧美日韩激情视频8区| 香蕉视频黄在线观看| 欧美在线欧美在线| 米奇777超碰欧美日韩亚洲| 91黄色小网站| 国产欧美一区二区三区在线老狼| 日韩av免费播放| 色悠悠久久久久| 国产日本亚洲| 男的插女的下面视频| 99在线视频精品| 99精品人妻国产毛片| 在线精品91av| 99视频这里有精品| 亚洲色欲久久久综合网东京热| 成人中文字幕在线| 国产精品一区二区三区四| 亚洲男人天堂2024| 九九热这里有精品| 草草草视频在线观看| 不卡欧美aaaaa| 草莓视频18免费观看| 日韩一区二区福利| 日韩在线精品强乱中文字幕| 成人免费视频91| 久久精品欧美一区二区三区不卡| 中国黄色一级视频| 九九热视频这里只有精品| 久久香蕉精品香蕉| 一区二区三区韩国| 一区二区三区产品免费精品久久75| 日韩一级免费视频| 国产精品嫩草影院一区二区| 久久久久久久久久久妇女 | 日韩av三区| 亚洲欧美视频二区| 亚洲一区在线视频观看| 欧美精品少妇| 亚洲wwwav| 亚久久调教视频| 国产一区二区视频在线观看免费| 日韩av在线免费| 高清一区二区三区av| 春日野结衣av| 亚洲免费av在线| 久久久久国产精品嫩草影院| 91视频国产精品| 亚洲专区免费| 国产又黄又爽又无遮挡| 亚洲欧美三级伦理| 亚洲三区欧美一区国产二区| 日韩视频免费在线播放| 亚洲国产色一区| 免费黄网站在线| 日本精品一区二区三区视频|