精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機(jī)器學(xué)習(xí) | 大模型為什么會(huì)出現(xiàn)"幻覺"?

發(fā)布于 2025-9-22 07:03
瀏覽
0收藏

最近 ??OpenAI?? 發(fā)表了一篇文章《Why Language Models Hallucinate》,解釋為什么會(huì)出現(xiàn) "幻覺",周末我讀了一下,總結(jié)這篇文章。

什么是"幻覺"?

幻覺是語(yǔ)言模型生成了似是而非的答案,即使很簡(jiǎn)單的問題,但是模型可能給出一些不符合事實(shí)的答案,比如:

機(jī)器學(xué)習(xí) | 大模型為什么會(huì)出現(xiàn)"幻覺"?-AI.x社區(qū)

問題:請(qǐng)用一句話回復(fù),其中第三個(gè)詞是 “dog”
回答:I have a dog. 詞列表:I, have, dog, a.

以上就是一個(gè) "幻覺" 錯(cuò)誤,??dog?? 并不是第三個(gè)詞。

幻覺分類:

  • 內(nèi)在幻覺(Intrinsic Hallucinations):生成的內(nèi)容與輸入的源信息沖突,類似上面的這個(gè)問題。
  • 外在幻覺(Extrinsic Hallucinations):生成了與源信息無(wú)關(guān)的內(nèi)容,大部分情況是沒有原始事實(shí),會(huì)導(dǎo)致大模型開始 “胡說八道”。

為什么會(huì)出現(xiàn) "幻覺"?

錯(cuò)誤的獎(jiǎng)勵(lì)機(jī)制

"幻覺" 出現(xiàn)的一個(gè)原因源于目前的評(píng)估方法所設(shè)的錯(cuò)誤獎(jiǎng)勵(lì)機(jī)制。想像一下我們?cè)谧鲞x擇題的時(shí)候,對(duì)于不知道答案的情況下,我們會(huì)怎么選擇?我們直接回答不知道,還是猜測(cè)一個(gè)答案?大家應(yīng)該更傾向猜測(cè)一個(gè)答案,畢竟有一定的概率猜中答案,這樣就能獲得分?jǐn)?shù),如果留空則沒有獎(jiǎng)勵(lì)分?jǐn)?shù)。同樣,如果只以準(zhǔn)確度(即完全答對(duì)問題的百分比)來為模型評(píng)分,那就會(huì)鼓勵(lì)模型猜測(cè),而不是說"我不知道"。所以根本原因是模型在訓(xùn)練過程中,并沒有將棄權(quán)作為評(píng)估模型的一個(gè)指標(biāo),而是根據(jù)準(zhǔn)確度來排列模型的先后次序。

機(jī)器學(xué)習(xí) | 大模型為什么會(huì)出現(xiàn)"幻覺"?-AI.x社區(qū)

以上是大模型幻覺率的排行榜,可以看到 "幻覺" 并不是模型越大,"幻覺" 就越低,而是和本身的模型評(píng)分標(biāo)準(zhǔn)相關(guān)。盡管知道錯(cuò)誤的獎(jiǎng)勵(lì)機(jī)制會(huì)導(dǎo)致 "幻覺" 的出現(xiàn),但衡量準(zhǔn)確度的評(píng)分機(jī)制仍在排行榜和模型資料卡上占據(jù)主導(dǎo)地位,促使開發(fā)人員建立傾向猜測(cè)而非選擇不作答的模型,這樣就進(jìn)一步加劇模型更加自信的提供錯(cuò)誤答案。

預(yù)訓(xùn)練數(shù)據(jù)和微調(diào)問題

"幻覺" 出現(xiàn)的另一個(gè)原因就是預(yù)訓(xùn)練本身就是概率預(yù)測(cè)下一個(gè)詞,這里必然存在一定概率出現(xiàn)非事實(shí)回答,這個(gè)時(shí)候有人可能會(huì)說:為啥拼寫和符號(hào)等問題不會(huì)錯(cuò)?這個(gè)是由于某些事實(shí)的數(shù)據(jù)量小,或者事實(shí)沒有規(guī)律可言的情況下,模型只能按照概率選擇下一個(gè)詞,導(dǎo)致開始 "胡說八道",所以模型的學(xué)習(xí)目標(biāo)(最小化交叉熵?fù)p失進(jìn)行概率密度估計(jì))在統(tǒng)計(jì)上必然會(huì)導(dǎo)致其生成錯(cuò)誤。

同時(shí),Gekhman等人在研究中討論了一個(gè)問題:用新知識(shí)進(jìn)行LLM微調(diào)是否會(huì)促使幻覺現(xiàn)象的發(fā)生。發(fā)現(xiàn) ??LLM?? 學(xué)習(xí)帶有新知識(shí)的樣本,要比學(xué)習(xí)與模型預(yù)先存在的知識(shí)樣本,學(xué)得更慢,一旦學(xué)習(xí)了這些帶有新知識(shí)的樣本,模型產(chǎn)生幻覺的傾向就會(huì)增加。

如何減少 "幻覺"?

基于如上兩個(gè)出現(xiàn)的原因,其對(duì)應(yīng)方案如下。

完善的評(píng)分準(zhǔn)則

對(duì)于模型訓(xùn)練過程中相對(duì)于表示不確定答案,向自信的錯(cuò)誤答案施予更嚴(yán)重的懲罰,并對(duì)表示不確定的答案給予部分分?jǐn)?shù)。論文中認(rèn)為只針對(duì)表示不確定的答案增設(shè)若干新測(cè)試尚不足夠,更有必要更新以準(zhǔn)確度為基礎(chǔ)的熱門評(píng)估機(jī)制,借此令評(píng)分標(biāo)準(zhǔn)不再鼓勵(lì)猜測(cè)。假如主要的評(píng)分機(jī)制持續(xù)獎(jiǎng)勵(lì)僥幸猜測(cè),模型就會(huì)持續(xù)學(xué)習(xí)猜想答案,修定評(píng)分機(jī)制更有助擴(kuò)大幻覺減少技術(shù)的采納范圍。

提升訓(xùn)練數(shù)據(jù)質(zhì)量或者引入外部數(shù)據(jù)

分布偏移:當(dāng)測(cè)試或用戶提問的分布與訓(xùn)練數(shù)據(jù)分布不同時(shí)(OOD),模型更易出錯(cuò)。垃圾進(jìn),垃圾出:訓(xùn)練數(shù)據(jù)本身包含的錯(cuò)誤、半真半假的信息和偏見,會(huì)被模型學(xué)習(xí)并復(fù)制。所以高質(zhì)量的訓(xùn)練數(shù)據(jù)對(duì)于模型是非常重要的,對(duì)于模型不了解的知識(shí),應(yīng)選擇類似 ??RAG?? 等外部數(shù)據(jù)源,補(bǔ)充一些事實(shí)的缺失問題。

參考

(1)??https://zhuanlan.zhihu.com/p/721611756??

(2)https://openai.com/zh-Hant-HK/index/why-language-models-hallucinate/

本文轉(zhuǎn)載自??周末程序猿??,作者:周末程序猿

已于2025-9-22 11:05:06修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
91日韩精品一区| 午夜影院欧美| 欧美日韩国产成人在线免费| 亚洲 欧洲 日韩| 性生交生活影碟片| 视频一区欧美精品| 欧美激情精品久久久久久久变态| 成人做爰www看视频软件| 色香欲www7777综合网| 亚洲欧洲三级电影| 久久riav二区三区| 国产精品羞羞答答在线| 免费视频一区二区三区在线观看| 久久精品视频在线| 右手影院亚洲欧美| 亚洲成人黄色| 欧美日韩色一区| 亚洲色欲综合一区二区三区| 1区2区3区在线视频| 久久毛片高清国产| 国产一区二区精品免费| 国产精品久久久久毛片| 日韩精品电影在线| 91国在线精品国内播放| 国产一区二区播放| 久久伦理在线| 国产一区二区动漫| 99久久国产精| 精品按摩偷拍| 日韩精品资源二区在线| xxx国产在线观看| 欧美一级二级视频| 色综合天天综合色综合av| www污在线观看| 天堂亚洲精品| 亚洲免费观看高清完整 | 牛牛精品成人免费视频| 欧美一区二区精美| 一本之道在线视频| 亚洲一区二区小说| 91精品国产综合久久精品 | 国产极品一区| 欧美视频在线观看一区| 午夜免费一区二区| 韩日精品一区二区| 色综合天天综合网天天狠天天| 欧美亚洲精品一区二区| 51漫画成人app入口| 亚洲乱码精品一二三四区日韩在线| 亚洲精品在线观看免费| 秋霞成人影院| 亚洲精品视频自拍| 亚洲一一在线| 超碰超碰在线| 亚洲精品网站在线观看| 日本一本中文字幕| 福利在线免费视频| 岛国av一区二区| 97av视频在线观看| 吞精囗交69激情欧美| 在线一区二区观看| 黄色永久免费网站| 不卡一区视频| 欧美tickling网站挠脚心| 国产白袜脚足j棉袜在线观看| 中文字幕一区二区三区日韩精品| 日韩精品一区二区三区四区视频| 在线播放av网址| 噜噜噜天天躁狠狠躁夜夜精品| 日韩精品黄色网| japanese中文字幕| 天天做天天爱天天爽综合网| 欧美日本啪啪无遮挡网站| 日韩精品成人在线| 秋霞电影网一区二区| 成人黄色大片在线免费观看| h狠狠躁死你h高h| 不卡一区二区三区四区| 欧美日韩国产精品一区二区| 不卡在线视频| 一区二区三区精密机械公司| 日韩av综合在线观看| 成人看片在线观看| 欧美一级黄色录像| 天天躁日日躁aaaxxⅹ| 色一区二区三区四区| 欧美高清不卡在线| 日本熟妇一区二区三区| 国产一区二区免费看| 国产一区免费在线| 在线观看av黄网站永久| 亚洲动漫第一页| 欧美伦理片在线观看| 综合伊人久久| 亚洲性无码av在线| 国产污视频在线看| 精品一二三四区| 蜜桃视频在线观看91| 黄色网址在线免费播放| 日韩欧美在线视频免费观看| 色婷婷一区二区三区在线观看| 欧美大胆视频| 精品国产区一区二区三区在线观看 | 91久久精品国产91性色69 | 欧美欧美一区二区| av片在线观看| 欧美午夜片在线看| 在线观看国产网站| 欧美成人中文| 国产伦精品免费视频| 午夜av免费观看| 亚洲激情欧美激情| 国产3p在线播放| 岳的好大精品一区二区三区| 欧美精品在线免费观看| 最近中文字幕在线免费观看| 99久久久免费精品国产一区二区| 欧美日韩视频免费在线观看| 欧洲亚洲两性| 亚洲精品99久久久久| 69av.com| 国产在线国偷精品免费看| 日韩aⅴ视频一区二区三区| a天堂资源在线| 欧美一级欧美一级在线播放| 国产探花视频在线| 久久综合九色| 麻豆精品传媒视频| 三妻四妾的电影电视剧在线观看| 欧美岛国在线观看| 欧美卡一卡二卡三| 国产一区二区三区不卡在线观看| 亚洲午夜精品一区二区三区| 欧美成a人片在线观看久| 日韩高清不卡av| 好吊操这里只有精品| 成人国产精品免费网站| 国产精品三级一区二区| 日韩不卡在线视频| 欧美大片网站在线观看| 精品免费久久久| 一区二区成人在线视频| 无套内谢丰满少妇中文字幕| 天天综合网91| 91九色对白| 久久香蕉一区| 亚洲黄色成人网| 青青草免费观看视频| 91在线高清观看| 四虎永久在线精品无码视频| 亚洲8888| 国产精品草莓在线免费观看| 二人午夜免费观看在线视频| 欧美亚洲国产一区二区三区va| 国产1区2区在线观看| 奇米四色…亚洲| 在线免费观看成人网| 国产视频网站一区二区三区| 久久亚洲一区二区三区四区五区高| 国产精品久久777777换脸| 亚洲男人天堂一区| 中国xxxx性xxxx产国| 亚洲主播在线| 亚洲欧美日韩精品久久久| 在线观看亚洲精品福利片| 久久国产精品网站| 天堂网av在线播放| 在线观看不卡视频| 国产suv精品一区二区68| 国产一区二区91| 欧美日韩成人免费视频| 精品产国自在拍| 亚洲伊人成综合成人网| 97人澡人人添人人爽欧美| 亚洲男人天天操| 国产精品系列视频| 狠狠操狠狠色综合网| jizzjizz日本少妇| 成人小视频免费在线观看| 无码aⅴ精品一区二区三区浪潮 | 亚洲一区在线看| 欧美一区二区三区成人精品| 久久丁香综合五月国产三级网站| 精品综合久久88少妇激情| 久久亚洲国产成人| 午夜精品小视频| av在线成人| www.久久久久久.com| 亚洲精品第五页| 在线免费不卡视频| 久久久综合久久久| 国产欧美日韩麻豆91| 91福利视频免费观看| 国产精品视频一二| 日韩高清国产精品| 欧美在线在线| 日本亚洲欧洲色α| www免费视频观看在线| 日韩av在线免费观看| 91中文字幕在线播放| 婷婷开心久久网| 日本激情视频一区二区三区| 91搞黄在线观看| 成人在线激情网| 在线国产一区| 欧美影视一区二区| 成功精品影院| 国产精品成人观看视频国产奇米| 在线三级电影| 中文字幕av一区| 四季av日韩精品一区| 91麻豆精品国产91久久久更新时间 | 成人精品视频99在线观看免费| 国产桃色电影在线播放| 色黄久久久久久| 嫩草研究院在线观看| 欧美www视频| 国产又粗又长视频| 91国内精品野花午夜精品| 99在线观看| 国产黄色一区| 国产精品户外野外| 亚洲色图官网| 性欧美亚洲xxxx乳在线观看| 国产素人视频在线观看| 中文字幕欧美日韩va免费视频| 三级毛片在线免费看| 亚洲成人久久一区| 精品国产99久久久久久宅男i| 欧美性xxxxx极品少妇| 国产精品suv一区| 精品国产31久久久久久| 国产一级片免费| 亚洲一线二线三线视频| 无码人妻精品一区二区三区夜夜嗨| 国产精品高潮呻吟| 黑人と日本人の交わりビデオ| 国产色一区二区| 先锋影音av在线| 国产欧美精品一区二区三区四区| 久久精品无码一区| 久久久久久久久久看片| 中国毛片在线观看| 欧美激情中文字幕| 男人av资源站| 伊人一区二区三区| 国产在线视频99| 午夜精品久久久久久久| 久草国产精品视频| 色综合久久综合网97色综合 | 亚洲夜夜综合| 欧美黑人性猛交| f2c人成在线观看免费视频| 午夜精品福利视频| 欧美xxx性| 国产精品视频久久久| 欧美日韩伦理一区二区| 成人福利在线视频| 日韩区一区二| 精品国产_亚洲人成在线| 日韩精品免费一区二区三区竹菊| 久久草视频在线看| 精品一级毛片| 青少年xxxxx性开放hg| 欧美欧美全黄| 欧美精品一区二区三区三州| 美女国产一区| 国产三级三级看三级| 国产精品一二三区| 久久久国产精品无码| 久久久久国产免费免费| 精品视频第一页| 亚洲一区二区在线观看视频 | heyzo高清在线| 国产精品va在线| 欧美日韩黄网站| 久久精品国产第一区二区三区最新章节 | 亚洲字幕av一区二区三区四区| 欧美军同video69gay| 欧美一级视频免费| 在线观看欧美视频| 欧美家庭影院| 国产精品99久久久久久人| 国产欧美视频在线| 麻豆成人小视频| 一区二区三区国产精华| 日韩在线一级片| 国产专区欧美精品| jlzzjizz在线播放观看| 欧美经典一区二区三区| 国产大学生自拍| 91高清在线观看| 天天干天天摸天天操| 最近2019年好看中文字幕视频| 伊人在我在线看导航| 国产成人av在线| 国产精品99久久免费观看| 亚洲电影免费| 国产不卡一二三区| 欧美精品videofree1080p| 国内激情视频在线观看| 国产精品免费福利| caoporn成人免费视频在线| 日本一区二区三区视频在线观看 | 精品欧美一区二区三区在线观看| 成人国产精品一区二区| 日韩欧美精品综合| 久久精品国产久精国产一老狼 | 国产字幕在线观看| 日韩一卡二卡三卡四卡| 久久手机免费观看| 久久噜噜噜精品国产亚洲综合| 9色精品在线| 国产ts一区二区| 欧美风情在线视频| 欧洲一区二区日韩在线视频观看免费| 亚洲91精品| 欧美三级午夜理伦三级| 国产sm精品调教视频网站| 国产91丝袜美女在线播放| 五月天一区二区| 在线观看一区不卡| 国产3级在线观看| 亚洲香蕉伊在人在线观| 亚洲天堂999| 日韩精品中文字幕在线观看| 精产国品自在线www| 日本精品视频在线观看| 精品自拍偷拍| 久久福利一区二区| 免费人成精品欧美精品| 91精产国品一二三| 精品亚洲欧美一区| 91动漫免费网站| 在线观看一区二区视频| 毛片在线播放网址| 欧美专区中文字幕| 希岛爱理av免费一区二区| 97超碰人人澡| 成人精品高清在线| 日本天堂网在线观看| 欧美tickling挠脚心丨vk| 日韩特级毛片| 国产嫩草影院久久久久| 亚洲第一网站在线观看| 亚洲精品一区二三区不卡| 香蕉伊大人中文在线观看| 精品久久久三级| 国产美女一区| 日本aaa视频| 91久久精品一区二区| 国产超碰精品| 日本成人黄色| 日本欧美一区二区三区乱码| 精品熟妇无码av免费久久| 欧美日韩久久一区| 国产在线观看免费麻豆| 91中文在线观看| 亚洲国产二区| 亚洲永久无码7777kkk| 色香蕉久久蜜桃| 伊人在线视频| 国产精品一区二区三区观看| 亚洲午夜久久久久久久久久久| 日韩在线免费观看av| 色婷婷综合久久久中文字幕| 理论在线观看| 国产热re99久久6国产精品| 婷婷综合伊人| 日本精品一二三区| 欧美日韩精品在线视频| 国产人成在线观看| 国产一区玩具在线观看| 欧美日本三区| 日韩av在线看免费观看| 欧美美女一区二区| 欧美性受xxxx黑人| 欧美日韩视频不卡| hd国产人妖ts另类视频| 秋霞在线观看一区二区三区| 日本aⅴ亚洲精品中文乱码| 国产67194| 亚洲免费一在线| 超碰国产精品一区二页| 青青草成人免费在线视频| 国产日韩欧美电影| 亚洲成人中文字幕在线| 国产成人拍精品视频午夜网站 | 国内精品国产三级国产a久久| 国产日韩欧美视频在线观看| 欧美丰满少妇xxxxx做受| 青青草久久爱| 五月婷婷深爱五月| 一区二区三区久久| 国产女主播在线写真| 999热视频在线观看| 日韩专区一卡二卡| 久久黄色免费视频| 中文字幕欧美日韩| 校花撩起jk露出白色内裤国产精品|