精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

長(zhǎng)文本信息準(zhǔn)確率超過(guò)ChatGPT,Meta提出降低大模型幻覺(jué)新方法

人工智能 新聞
所謂大模型幻覺(jué),就是輸出一些看似合理但完全不對(duì)的內(nèi)容。Meta此次提出的“驗(yàn)證鏈”(CoVe),是與“思維鏈”(CoT)相似的一種鏈?zhǔn)椒椒ā?/div>

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

大模型的幻覺(jué)問(wèn)題,又有新的解決方法了!

Meta AI實(shí)驗(yàn)室提出了一種“分而治之”的解決方案。

有了這個(gè)方案,Llama-65B輸出的信息準(zhǔn)確率提升了一倍,甚至超過(guò)了ChatGPT

所謂大模型幻覺(jué),就是輸出一些看似合理但完全不對(duì)的內(nèi)容。

Meta此次提出的“驗(yàn)證鏈”(CoVe),是與“思維鏈”(CoT)相似的一種鏈?zhǔn)椒椒?/span>

區(qū)別在于,“step-by-step”的思維鏈更關(guān)注邏輯推理,而驗(yàn)證鏈更注重事實(shí)信息

有網(wǎng)友看了之后發(fā)現(xiàn),這個(gè)驗(yàn)證鏈很像是自己用ChatGPT寫(xiě)代碼時(shí)的一種科學(xué)方法:

圖片

那么“驗(yàn)證鏈”究竟是個(gè)什么方法,“驗(yàn)證”的又是什么呢?

拆解答案,分而治之

驗(yàn)證鏈的核心思想,是把要驗(yàn)證的一大段內(nèi)容,拆解成一個(gè)個(gè)小的問(wèn)題,具體流程是這樣的:

首先,模型會(huì)根據(jù)用戶提出的問(wèn)題照常生成回復(fù)。

接著,根據(jù)生成的回復(fù)內(nèi)容,針對(duì)其中的各項(xiàng)信息,生成一系列的驗(yàn)證問(wèn)題。

然后讓模型自行回答其所提出的這些問(wèn)題,并根據(jù)結(jié)果對(duì)初始答案進(jìn)行調(diào)整,得到最終結(jié)果。

舉個(gè)簡(jiǎn)單的例子,假如想詢問(wèn)模型19世紀(jì)美墨戰(zhàn)爭(zhēng)的主要原因是什么。

模型回答了事件發(fā)生的時(shí)間,以及在這之前都發(fā)生了什么事。

圖片

之后針對(duì)這一系列事件,逐一詢問(wèn)它們是什么時(shí)候發(fā)生的。

于是,模型發(fā)現(xiàn)自己提到的一項(xiàng)內(nèi)容時(shí)間相差太遠(yuǎn),調(diào)整后給出了最終的答案。

圖片

其中,問(wèn)題的生成和驗(yàn)證是最關(guān)鍵的一環(huán),對(duì)此,研究人員一共提出了四種具體的方式:

  • Joint,即將生成問(wèn)題和回答的指令寫(xiě)入同一段提示詞
  • 2-Step,即先讓模型生成提問(wèn),然后開(kāi)啟新的對(duì)話(一次性)回答提出的問(wèn)題
  • Factored,在2-Step的基礎(chǔ)上,對(duì)提出的每一個(gè)問(wèn)題分別開(kāi)啟新對(duì)話
  • Factor+Revise,在Factored的基礎(chǔ)之上加入一致性檢驗(yàn),讓模型重點(diǎn)關(guān)注前后不一致的內(nèi)容

這四種模式越來(lái)越細(xì)化,準(zhǔn)確率也是越來(lái)越高。

圖片

△從紅色開(kāi)始,四種顏色依次代表無(wú)CoVe、Joint、Factored和Factor+Revise

那么為什么拆分提問(wèn)就能提高模型的準(zhǔn)確性呢?

首先是因?yàn)椴鸾夂蟮膯?wèn)題比整體任務(wù)更容易,論述題變成了問(wèn)答甚至選擇、判斷題,問(wèn)題簡(jiǎn)單了,準(zhǔn)確率也就提升了

此外,把問(wèn)題分解可以讓模型真正重新思考,而不是反復(fù)地重復(fù)錯(cuò)誤答案

那么,驗(yàn)證鏈方式的效果究竟如何呢?

信息準(zhǔn)確率超過(guò)ChatGPT

為了探究這一問(wèn)題,研究人員用Llama進(jìn)行了測(cè)試,測(cè)試任務(wù)一共有三項(xiàng)。

首先是信息列舉,比如列舉出出生于某地、從事某行業(yè)的名人。

這項(xiàng)任務(wù)中,研究人員一共測(cè)試了兩個(gè)數(shù)據(jù)集——簡(jiǎn)單一些的Wikidata和從難一些的Wiki-Category list(從維基百科中提取)。

圖片

結(jié)果發(fā)現(xiàn),65B參數(shù)的Llama,在two-step模式的驗(yàn)證鏈加持下,簡(jiǎn)單問(wèn)題的準(zhǔn)確度從0.17提升到了0.36,增加了一倍還多,復(fù)雜問(wèn)題準(zhǔn)確度也接近翻番。

接下來(lái)是“閉域問(wèn)答”題,研究人員從MultiSpanQA數(shù)據(jù)集中抽取多個(gè)不連續(xù)信息進(jìn)行挖空提問(wèn)。

比如“誰(shuí)在哪一年創(chuàng)建了世界上第一家出版社”(答案是Johannes Gutenberg, 1450)。

結(jié)果,Cove也為L(zhǎng)lama帶來(lái)了20%左右的準(zhǔn)確度提升。

圖片

第三項(xiàng)任務(wù)是“長(zhǎng)段文本傳記生成”,問(wèn)題就是“Tell me a bio of (人名)”,使用FactScore數(shù)據(jù)集進(jìn)行評(píng)價(jià)。

結(jié)果在Factor+Reviese模式下,準(zhǔn)確率不僅比無(wú)驗(yàn)證鏈模式大幅提高,還超過(guò)了ChatGPT

圖片

對(duì)這項(xiàng)研究感興趣的朋友,可以到論文中了解更多細(xì)節(jié)。

論文地址:https://arxiv.org/abs/2309.11495

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-11-08 08:38:43

2023-11-28 13:37:43

語(yǔ)言模型LLM

2023-05-04 09:39:16

AI模型

2024-09-03 14:10:00

模型測(cè)試

2023-06-08 19:07:17

ChatGPTAI

2023-10-19 08:30:56

模型搜索

2025-05-29 09:20:00

模型研究推理

2016-01-27 13:37:53

機(jī)器學(xué)習(xí)數(shù)據(jù)模型算法

2023-10-26 08:40:15

模型隱私推理

2023-11-27 13:20:00

AI訓(xùn)練

2023-10-25 09:19:00

AI訓(xùn)練

2022-12-08 13:00:10

AI性別偏見(jiàn)

2023-10-23 10:02:00

模型技術(shù)

2024-12-26 15:30:00

模型深度學(xué)習(xí)AI

2024-01-03 13:37:00

模型數(shù)據(jù)

2025-10-23 12:46:39

2021-08-10 16:01:18

模型人工智能深度學(xué)習(xí)

2021-11-01 10:40:15

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2024-01-29 12:49:00

AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产乱妇无码大片在线观看| jvid福利在线一区二区| 亚洲二区在线观看| 欧美激情一区二区三区在线视频 | 成人短视频在线| 成人h精品动漫一区二区三区| 日本久久中文字幕| 中文字幕电影av| 欧美交a欧美精品喷水| 欧美曰成人黄网| 免费人成自慰网站| 18视频免费网址在线观看| 国产91精品欧美| 国产精品国产三级国产aⅴ浪潮| 亚洲欧美一区二区三区四区五区| 玖玖玖免费嫩草在线影院一区| 欧美性色黄大片| 一二三四视频社区在线| 免费看a在线观看| 久久天堂av综合合色蜜桃网| 97se亚洲综合| 91九色蝌蚪91por成人| 国产视频一区免费看| 久久久极品av| 日本美女bbw| 亚洲视频分类| 亚洲国产精品va| 99热这里只有精品2| 精品欧美日韩精品| 好吊成人免视频| 大荫蒂性生交片| 久草资源在线| 国产精品传媒入口麻豆| 免费国产在线精品一区二区三区| 午夜精品一二三区| 九一久久久久久| 国产精品一二三视频| 亚洲乱码国产乱码精品| 亚洲精品系列| 欧美成人在线影院| 三级黄色免费观看| 日韩1区2区| 一本久久综合亚洲鲁鲁| 亚洲午夜久久久久久久久红桃| 久久a级毛片毛片免费观看| 欧美一级黄色录像| 手机av在线网站| av在线国产精品| 制服丝袜中文字幕亚洲| 手机看片一级片| 99久久亚洲国产日韩美女| 日本久久一区二区| 国产免费999| 日韩经典一区| 欧美午夜精品久久久久久超碰| 91av俱乐部| 精品肉辣文txt下载| 欧美在线高清视频| 鲁一鲁一鲁一鲁一av| 日韩国产91| 5月丁香婷婷综合| 欧美污在线观看| 中文字幕一区二区三区日韩精品| 精品区一区二区| 91玉足脚交白嫩脚丫| 欧美激情影院| 一区二区三区动漫| 日本二区三区视频| 在线中文一区| 97免费中文视频在线观看| 青青青国产在线| 男男视频亚洲欧美| 91九色单男在线观看| 亚洲国产精品久久久久久6q | 欧美色网站导航| 色婷婷一区二区三区av免费看| 国产精品99久久免费| 精品日韩av一区二区| 三级男人添奶爽爽爽视频| 欧美人与牛zoz0性行为| 最新中文字幕亚洲| 久久97人妻无码一区二区三区| 亚洲激情成人| 国产精品免费电影| 亚洲经典一区二区| 久久久久久免费毛片精品| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 91蜜桃在线视频| 欧美日韩国产一中文字不卡| 男女男精品视频站| 亚洲码欧美码一区二区三区| 日韩成人免费视频| 国产精品18在线| 亚洲福利一区| 国产精自产拍久久久久久蜜| 欧美 日韩 国产 在线| 国产性色一区二区| 黄色成人在线免费观看| 免费日韩电影| 日韩欧美在线123| 亚洲黄色小说视频| 欧美日韩mv| 欧美一级电影久久| 国产婷婷一区二区三区久久| 久久美女高清视频| 女人床在线观看| 成人国产精品| 精品在线小视频| 国产高清在线免费观看| 老司机午夜精品视频在线观看| 91在线精品播放| 福利在线观看| 婷婷久久综合九色综合绿巨人| 色91精品久久久久久久久| 日本亚洲不卡| 欧美日韩国产成人| 国产又粗又猛又爽又黄的视频一 | 成人福利影视| 9191成人精品久久| 久久婷婷五月综合| 中文在线一区| 国产麻豆乱码精品一区二区三区| 四虎久久免费| 在线视频中文字幕一区二区| 国产高清成人久久| 欧美视频网站| 亚洲最大福利网| 欧美69xxx| 欧美色网一区二区| 欧美成人国产精品一区二区| 99在线精品免费视频九九视| 99爱精品视频| av超碰免费在线| 3d动漫精品啪啪1区2区免费| 手机看片福利视频| 久久裸体视频| 欧美成ee人免费视频| mm视频在线视频| 精品日韩在线观看| 九九热视频精品| 国产精品99久| 97av中文字幕| 亚洲一区二区电影| 久久99国产精品久久久久久久久| 国产又黄又大又爽| 国产精品日产欧美久久久久| 久久久久久久久久久久91| 综合国产视频| 国产精品1区2区在线观看| 外国精品视频在线观看| 午夜精品爽啪视频| 麻豆国产精品一区| 久久福利一区| 深夜福利成人| 中文幕av一区二区三区佐山爱| 色噜噜狠狠狠综合曰曰曰| 自拍偷拍福利视频| 国产精品麻豆一区二区| 日本高清久久久| 香蕉久久网站| 北条麻妃高清一区| 三级中文字幕在线观看| 亚洲午夜精品视频| 亚洲专区在线播放| 亚洲精品日韩综合观看成人91| 亚洲天堂一区二区在线观看| 欧美涩涩网站| 久久国产精品亚洲va麻豆| 免费日韩电影| 久久深夜福利免费观看| 亚洲AV无码精品色毛片浪潮| 亚洲高清不卡在线| 最新中文字幕视频| 久久国产成人午夜av影院| 国产av第一区| 免费成人蒂法| 国产精品入口尤物| 尤物yw193can在线观看| 亚洲精品国产综合区久久久久久久| 欧美三级午夜理伦| 国产精品午夜在线观看| 极品白嫩少妇无套内谢| 欧美亚洲三区| 宅男噜噜99国产精品观看免费| 日韩国产在线不卡视频| 欧美在线观看视频| 求av网址在线观看| 亚洲第一页自拍| 成人黄色免费网| 亚洲mv大片欧洲mv大片精品| 美国黄色特级片| 国产高清在线精品| 欧美精品一区二区三区免费播放| 国产精品黑丝在线播放| 国产另类第一区| 成人av集中营| 69久久夜色精品国产7777| 淫片在线观看| 亚洲精品永久免费| 国产精品一区二区免费视频| 欧美日韩亚洲视频| 91高清免费看| 国产免费成人在线视频| 日本xxxx免费| 久久9热精品视频| 国产日韩一区二区在线观看| 久久久久久久久久久久久久| 久久99影院| 日本综合精品一区| 国产精品爽爽爽| 在线播放高清视频www| 美女国内精品自产拍在线播放| 久草视频视频在线播放| 精品99999| 99热这里只有精| 欧美系列一区二区| 中文字幕在线字幕中文| 亚洲免费观看高清完整 | 亚洲女与黑人做爰| 精品欧美一区二区久久久| 成人白浆超碰人人人人| 91亚洲一区二区| 麻豆成人91精品二区三区| 夫妻免费无码v看片| 亚洲私拍自拍| 日本aa在线观看| 综合在线视频| 熟女熟妇伦久久影院毛片一区二区| 精品久久视频| 日本一区二区三区免费看| 色婷婷综合久久久久久| 国产成人精品一区二区三区福利 | 日韩成人免费电影| 欧美性大战久久久久xxx| 亚洲国产高清一区| 美女av免费观看| 综合久久精品| 欧美精品久久96人妻无码| 天天射综合网视频| 一区二区视频在线播放| 97精品国产一区二区三区| 亚洲欧美日韩精品久久久| 成人网18免费网站| 婷婷五月色综合| 成人羞羞在线观看网站| 亚洲午夜精品一区二区三区| 日韩精品诱惑一区?区三区| 日韩欧美亚洲日产国| 欧美少妇性xxxx| 亚洲午夜精品一区二区| 久久精品亚洲欧美日韩精品中文字幕| 日本成人性视频| 伊人久久大香线| 亚洲精品国产suv一区88| 国产精品v亚洲精品v日韩精品| 成人短视频在线观看免费| 欧美日韩1区| www在线观看免费| 国产精品婷婷| 天天影视综合色| 国产综合久久久久久鬼色| 俄罗斯女人裸体性做爰| 成人av网在线| 成人精品999| 国产精品麻豆99久久久久久| 99自拍视频在线| 亚洲国产欧美日韩另类综合 | 亚洲综合影视| 97香蕉超级碰碰久久免费软件| 三级在线观看视频| 国产精品一区二区电影| 国产精品一区免费在线| caoporn国产精品免费公开| 六月丁香久久丫| 日韩一本精品| 亚洲精品888| 黄色大片中文字幕| 老司机精品视频网站| 99中文字幕在线| 91免费看视频| 日本成人免费在线观看| 亚洲综合999| 97人妻一区二区精品视频| 欧美高清视频一二三区| 少妇av一区二区| 在线亚洲欧美视频| 国产黄色大片在线观看| 国产97在线观看| 亚洲国产aⅴ精品一区二区| 久久久久久一区| 911精品美国片911久久久| 精品少妇一区二区三区在线| 蜜桃精品在线观看| 色综合久久五月| 中文字幕中文字幕在线一区| 日韩美女黄色片| 欧美久久一区二区| 天天综合在线视频| 久久综合电影一区| 一区二区三区短视频| 亚洲最大福利视频网| 欧美精品一二| 久久久久久久中文| 国产一区二区三区免费看| 草草影院第一页| 亚洲国产你懂的| 国产精品熟女久久久久久| 亚洲欧美综合精品久久成人| 在线观看中文| 国产一区欧美二区三区| 亚洲小说图片| 可以看毛片的网址| 国产一区二区三区日韩| 欧美日韩中文字幕视频| 欧美日韩国产一区在线| 亚洲成人中文字幕在线| xxxxx91麻豆| 欧美日韩视频免费观看| 精品久久一区二区三区蜜桃| 影音先锋日韩在线| 艹b视频在线观看| 国产日韩欧美精品一区| 久久精品视频1| 日韩av在线免费观看| 精品一性一色一乱农村| 成人欧美一区二区三区在线湿哒哒| 九九热精品视频在线观看| 黄色一级片播放| 成人丝袜高跟foot| 久久午夜无码鲁丝片| 91精品国产欧美一区二区18| yw在线观看| 国产精品福利无圣光在线一区| 五月天亚洲色图| www.com毛片| 久久婷婷综合激情| 成人午夜视频在线播放| 日韩高清av一区二区三区| 男女羞羞视频在线观看| 国产传媒一区| 在线国产欧美| 亚洲最大免费视频| 精品成人久久av| 日本私人网站在线观看| 欧美影院久久久| 国产欧美亚洲精品a| 欧美日韩在线观看不卡| 国产日韩欧美制服另类| 自拍偷拍第八页| 日韩有码在线电影| 精品一区二区三区四区五区| 天堂а√在线中文在线| 成人禁用看黄a在线| 国产成人愉拍精品久久| 亚洲精品自拍视频| 婷婷综合六月| 伊人久久99| 国产成人精品免费一区二区| 伊人国产在线观看| 亚洲精品久久久久中文字幕欢迎你| 黄色18在线观看| 日产国产精品精品a∨| 美腿丝袜亚洲色图| 尤物在线免费视频| 欧美电视剧在线看免费| 美女av在线免费看| 欧美系列一区| 狠狠网亚洲精品| 日本少妇性高潮| 国产一区二区三区欧美| 亚洲欧洲专区| 国产免费黄色一级片| 久久久国产午夜精品| 亚洲最大成人av| 欧美精品福利在线| 精品大片一区二区| 欧美视频亚洲图片| 狠狠色噜噜狠狠狠狠97| 在线看黄色av| 国产伦精品一区二区三区高清| 玖玖精品视频| 国产精品国产三级国产传播| 亚洲国产精品悠悠久久琪琪| 亚洲伦乱视频| 欧美美女黄色网| 国产亚洲欧美日韩日本| 国产成人久久精品77777综合 | 精品国产黄a∨片高清在线| 国产一二三四五| 久久精品人人爽人人爽| 国产高清第一页| 国产精品扒开腿爽爽爽视频| 好吊日精品视频| 国产在线免费av| 亚洲精品美女网站| 999久久久国产999久久久| 亚洲色成人一区二区三区小说| 中文字幕在线一区免费| 五十路在线视频| 91视频免费进入|