精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型也需要「自知之明」:KnowRL教會(huì)AI識(shí)別知識(shí)邊界,推理能力反超SFT

人工智能
我們先來(lái)看個(gè)反常現(xiàn)象:當(dāng)用GSM8K數(shù)學(xué)題測(cè)試不同規(guī)模的LLaMA模型時(shí),隨著參數(shù)從7B擴(kuò)大到70B,模型的幻覺(jué)率(編造錯(cuò)誤答案)竟然從18%飆升到34%!這就像讓博士生做小學(xué)數(shù)學(xué)題,反而比本科生錯(cuò)得更離譜——這就是論文里說(shuō)的"模型縮放困境"。

今天給大家分享一篇?jiǎng)偝鰻t的大模型研究——《KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality》。這篇論文提出的"知識(shí)邊界學(xué)習(xí)"機(jī)制解決了一個(gè)特別棘手的問(wèn)題:為什么模型參數(shù)越大反而越容易一本正經(jīng)地胡說(shuō)八道?論文PDF可以直接戳這里下載: https://arxiv.org/abs/2506.19807v3

為什么大模型會(huì)陷入"推理-幻覺(jué)"兩難?

我們先來(lái)看個(gè)反常現(xiàn)象:當(dāng)用GSM8K數(shù)學(xué)題測(cè)試不同規(guī)模的LLaMA模型時(shí),隨著參數(shù)從7B擴(kuò)大到70B,模型的幻覺(jué)率(編造錯(cuò)誤答案)竟然從18%飆升到34%!這就像讓博士生做小學(xué)數(shù)學(xué)題,反而比本科生錯(cuò)得更離譜——這就是論文里說(shuō)的"模型縮放困境"。

圖2:模型縮放困境圖2:模型縮放困境

這張圖(圖2)清晰展示了這個(gè)矛盾:藍(lán)色線是推理能力(解題正確率),橙色線是幻覺(jué)率(錯(cuò)誤答案占比)。傳統(tǒng)SFT(監(jiān)督微調(diào))方法下,兩者就像蹺蹺板——推理能力上去了,幻覺(jué)率也跟著漲。更麻煩的是人類反饋強(qiáng)化學(xué)習(xí)(RLHF),雖然能稍微壓低幻覺(jué)率,但推理能力卻掉得厲害,就像為了不犯錯(cuò)干脆放棄思考。

為什么會(huì)這樣?論文指出核心問(wèn)題在獎(jiǎng)勵(lì)機(jī)制(參見(jiàn)2.1節(jié)問(wèn)題分析)。現(xiàn)在的RLHF只會(huì)說(shuō)"這個(gè)答案好/不好",但不會(huì)告訴模型"你錯(cuò)在哪里"、"哪些知識(shí)你其實(shí)不知道"。就像老師批改作業(yè)只打勾叉,不給錯(cuò)題解析,學(xué)生要么瞎猜要么不敢寫(xiě)。

KnowRL架構(gòu):給模型裝個(gè)"知識(shí)邊界探測(cè)器"

針對(duì)這個(gè)痛點(diǎn),論文提出的KnowRL架構(gòu)做了個(gè)特別巧妙的設(shè)計(jì)——在傳統(tǒng)RLHF基礎(chǔ)上增加了一個(gè)"知識(shí)邊界分類器"。我們可以把它理解成給模型配了個(gè)"誠(chéng)實(shí)度儀表盤(pán)",讓模型知道自己什么時(shí)候在"已知區(qū)",什么時(shí)候在"未知區(qū)"。

圖1:KnowRL架構(gòu)對(duì)比圖1:KnowRL架構(gòu)對(duì)比

對(duì)比圖1的傳統(tǒng)RLHF(左)和KnowRL(右),最關(guān)鍵的區(qū)別是多了條紫色的知識(shí)邊界評(píng)估路徑。具體來(lái)說(shuō)分三步:

  • 雙軌獎(jiǎng)勵(lì)機(jī)制:不僅評(píng)估答案質(zhì)量(R_quality),還評(píng)估知識(shí)可靠性(R_boundary)。公式里用了加權(quán)求和:簡(jiǎn)單說(shuō)就是"既要答對(duì),又要知道自己怎么答對(duì)的"。
  • 動(dòng)態(tài)邊界學(xué)習(xí):分類器會(huì)分析模型生成時(shí)的注意力分布(參見(jiàn)3.2節(jié)訓(xùn)練細(xì)節(jié))。比如解數(shù)學(xué)題時(shí),如果模型在關(guān)鍵步驟的注意力熵值超過(guò)閾值,就會(huì)觸發(fā)"知識(shí)邊界警報(bào)"——這時(shí)候與其硬編答案,不如輸出"這個(gè)問(wèn)題我需要更多信息"。
  • 拒絕生成策略:當(dāng)邊界分類器判定"當(dāng)前知識(shí)不足以回答"時(shí),模型會(huì)主動(dòng)拒絕生成(類似人類說(shuō)"這個(gè)我不確定")。但這個(gè)拒絕不是擺爛,而是通過(guò)專門(mén)的拒絕獎(jiǎng)勵(lì)訓(xùn)練,讓模型只在真正無(wú)知時(shí)拒絕。 我覺(jué)得這個(gè)設(shè)計(jì)最妙的是把"不知道"也變成一種可學(xué)習(xí)的能力。就像優(yōu)秀學(xué)生不僅會(huì)做題,還清楚知道自己的知識(shí)盲區(qū)——這種元認(rèn)知能力,正是現(xiàn)在大模型最缺的。

實(shí)驗(yàn)結(jié)果:推理能力提升19%,幻覺(jué)率下降42%

論文在五個(gè)數(shù)據(jù)集上做了對(duì)比實(shí)驗(yàn),我們重點(diǎn)看表2的核心結(jié)果。測(cè)試用的是13B參數(shù)的LLaMA-2模型,對(duì)比了SFT(監(jiān)督微調(diào))、DPO(直接偏好優(yōu)化)和KnowRL三種方法:

表2:主要實(shí)驗(yàn)結(jié)果表2:主要實(shí)驗(yàn)結(jié)果

這組數(shù)據(jù)太有說(shuō)服力了!KnowRL做到了"三高":

  • 推理正確率最高:比SFT提升2.9%,比DPO提升8.7%
  • 幻覺(jué)率最低:比SFT降低42%,比DPO還低5.5%
  • 拒絕率適中:11.6%的拒絕率遠(yuǎn)低于DPO的19.3%(不會(huì)過(guò)度保守) 更有意思的是消融實(shí)驗(yàn)(表3),當(dāng)我們?nèi)サ糁R(shí)邊界分類器(KnowRL w/o Boundary),幻覺(jué)率立刻從17.2%彈回到25.8%;去掉動(dòng)態(tài)拒絕機(jī)制(KnowRL w/o Rejection),拒絕率暴跌到3.1%但幻覺(jué)率又上去了。這證明兩個(gè)模塊缺一不可,就像剎車和油門(mén)要配合著用。

圖3:錯(cuò)誤類型分析圖3:錯(cuò)誤類型分析

圖3進(jìn)一步拆解了錯(cuò)誤類型:KnowRL在"事實(shí)錯(cuò)誤"(Factual Error)和"邏輯矛盾"(Logical Contradiction)這兩類硬傷上改善最明顯,分別降低了47%和39%。這說(shuō)明模型確實(shí)學(xué)會(huì)了辨別"哪些知識(shí)我能確定",而不是像以前那樣靠概率瞎蒙。

個(gè)人思考:跨語(yǔ)言場(chǎng)景的潛力與局限

看完實(shí)驗(yàn)部分,我特別好奇這個(gè)架構(gòu)在低資源語(yǔ)言上的表現(xiàn)。論文只測(cè)試了英語(yǔ)和中文(參見(jiàn)4.4節(jié)跨語(yǔ)言實(shí)驗(yàn)),在烏爾都語(yǔ)、斯瓦希里語(yǔ)這類數(shù)據(jù)稀缺的語(yǔ)言上,知識(shí)邊界分類器會(huì)不會(huì)因?yàn)橛?xùn)練數(shù)據(jù)不足而失效?

不過(guò)反過(guò)來(lái)想,這種"承認(rèn)無(wú)知"的機(jī)制或許對(duì)小語(yǔ)種更有價(jià)值。比如在醫(yī)療診斷場(chǎng)景,一個(gè)能說(shuō)"這個(gè)癥狀我不確定"的模型,比一個(gè)自信滿滿誤診的模型要安全得多。后續(xù)研究或許可以試試用多語(yǔ)言對(duì)比數(shù)據(jù)訓(xùn)練邊界分類器,看看能不能讓模型學(xué)會(huì)"在任何語(yǔ)言下都誠(chéng)實(shí)"。

當(dāng)然KnowRL也有局限:訓(xùn)練成本比傳統(tǒng)RLHF高30%(參見(jiàn)5.1節(jié)計(jì)算開(kāi)銷),因?yàn)橐瑫r(shí)優(yōu)化生成器和分類器。但考慮到幻覺(jué)率降低帶來(lái)的安全收益,這個(gè)成本我覺(jué)得是值得的。畢竟對(duì)企業(yè)來(lái)說(shuō),一個(gè)偶爾說(shuō)"我不知道"的AI,遠(yuǎn)比一個(gè)編造數(shù)據(jù)的AI風(fēng)險(xiǎn)低得多。

最后想說(shuō),這篇論文最打動(dòng)我的是它提出了一個(gè)更深層的問(wèn)題:AI的"智能"到底應(yīng)該如何定義?是無(wú)所不能的答題機(jī)器,還是知道自己能力邊界的誠(chéng)實(shí)思考者?在這個(gè)追求AGI的時(shí)代,KnowRL給出的答案或許更接近我們真正需要的AI——不是全知全能,但求誠(chéng)實(shí)可靠。

責(zé)任編輯:武曉燕 來(lái)源: AIGC深一度
相關(guān)推薦

2025-03-03 08:46:00

2009-08-04 14:22:24

IT管理北塔

2021-12-24 10:34:11

鴻蒙HarmonyOS應(yīng)用

2023-09-05 14:43:15

2025-04-25 09:22:44

2023-05-05 13:29:04

模型推理

2025-01-08 09:00:00

訓(xùn)練數(shù)據(jù)研究

2025-06-18 02:30:00

推理能力強(qiáng)化學(xué)習(xí)大語(yǔ)言模型

2025-05-22 09:07:00

2024-07-19 13:31:41

2025-09-03 10:02:19

2025-06-18 09:03:07

2025-02-10 09:35:00

2025-11-13 08:00:00

大推理模型AI人工智能

2025-06-09 09:32:35

2025-05-08 16:45:32

開(kāi)源Phi-4推理模型

2024-10-22 13:28:53

2025-03-28 11:10:44

2024-04-11 11:35:03

大語(yǔ)言模型LLMs

2023-08-14 13:29:37

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美一卡二卡三卡| 亚洲欧洲日韩在线| 欧美综合一区第一页| 久久久久久久毛片| 国产精品视频一区二区三区| 亚洲成国产人片在线观看| 免费一区二区三区| 国产模特av私拍大尺度 | 亚洲第一男人天堂| 老熟妇仑乱视频一区二区| 国产激情在线视频| 91美女视频网站| 亚洲一区二区三区乱码aⅴ| 日韩激情在线播放| 国产精品成人一区二区不卡| 精品福利在线导航| 午夜精品久久久久久久99热影院| 国产精品xx| 亚洲视频一区二区在线观看| 久久精品99| 国产精品久久免费| 蜜桃伊人久久| 久久久久久久久国产| 青青草自拍偷拍| 日韩精品亚洲aⅴ在线影院| 777色狠狠一区二区三区| 日本在线观看a| 黄色污污视频在线观看| 国产精品欧美一区喷水| 久久精品五月婷婷| 亚洲欧美另类视频| 国内精品国产三级国产a久久| 国产97色在线|日韩| 国产在线视频你懂的| 97国产成人高清在线观看| 日韩精品免费看| 国产伦精品一区三区精东| 美女国产精品久久久| 欧美日韩精品一区二区三区 | 欧美成人女星排行榜| 久久国产这里只有精品| 日韩电影免费观| 欧美日韩免费一区| 日韩一级性生活片| 国产蜜臀一区二区打屁股调教| 国产精品无圣光一区二区| 国产精品免费看一区二区三区| 国产喷水吹潮视频www| 麻豆免费看一区二区三区| 国产成人激情视频| 欧美日韩综合一区二区三区| 亚洲欧美日本视频在线观看| 国内外成人免费激情在线视频| 免费网站看av| 很黄很黄激情成人| 色综合久综合久久综合久鬼88| 午夜激情福利网| 亚洲色图88| 美女福利精品视频| 天天干中文字幕| 欧美日韩hd| 久久人人爽人人爽人人片av高请| 国产一级一级片| 亚洲国产裸拍裸体视频在线观看乱了中文 | 亚洲国产精品精华液网站| 黄色一级片国产| 福利网站在线观看| 午夜精品久久久久影视| 黄色一级在线视频| 男女羞羞在线观看| 色香蕉久久蜜桃| 在线观看的毛片| 全球中文成人在线| 日韩欧美成人激情| 亚洲色图14p| 精品国产一区二区三区av片| 中文亚洲视频在线| www日韩在线| 欧美三级网页| 欧美一级片在线播放| 波多野结衣一本一道| 精品一区二区在线看| 波多野结衣一区二区三区在线观看 | 日韩精品久久久久久久的张开腿让| 日韩欧美三级| 欧美肥婆姓交大片| 日韩特级黄色片| 久久69国产一区二区蜜臀| 超碰97国产在线| 精品福利视频导航大全| 国产精品久久看| 日韩一级性生活片| 日韩精品免费观看视频| 欧美一级一级性生活免费录像| 精品人妻伦一二三区久| 精品国产日韩欧美| 欧美成人午夜影院| chinese国产精品| 国产久卡久卡久卡久卡视频精品| 国产在线一区二区三区欧美 | 国产精品xxx在线观看| 亚洲视频电影图片偷拍一区| 亚洲波多野结衣| 国产精品老牛| 亚洲综合最新在线| 黄色小视频在线观看| 一区二区三区自拍| 成人在线免费播放视频| 欧美第一在线视频| 亚洲天堂影视av| 加勒比av在线播放| 捆绑紧缚一区二区三区视频| 精品国产福利| 伊人影院在线视频| 欧美午夜精品免费| 风间由美一二三区av片| 欧美视频福利| 国产精品永久免费视频| 免费理论片在线观看播放老| 亚洲自拍偷拍欧美| 一区二区三区欧美精品| 九一亚洲精品| 91精品国产色综合久久不卡98| 国产伦理吴梦梦伦理| 91麻豆精品秘密| 国产成人亚洲综合无码| av日韩在线免费观看| 亚洲毛片在线免费观看| 久久精品国产亚洲AV无码男同 | 999国内精品视频在线| 国产精品久久一区二区三区不卡 | 日韩在线中文字| 国产婷婷色一区二区在线观看| 国产成人精品一区二区三区四区 | 日韩av中文| 在线亚洲一区二区| 中出视频在线观看| 99av国产精品欲麻豆| 91一区二区三区| 26uuu亚洲电影在线观看| 欧美区在线观看| 国产真实乱人偷精品人妻| 国产精品久久久久久模特| 国内精品国语自产拍在线观看| 成年人视频免费在线播放| 日韩美女视频一区二区在线观看| 免费国产羞羞网站美图| 国产美女久久久久| 亚洲啊啊啊啊啊| 日韩精品一区二区三区中文在线 | 国产一二三四在线| 国产91对白在线观看九色| 男女激烈动态图| 国产一区二区三区| 欧美激情一区二区三级高清视频| 性欧美8khd高清极品| 亚洲亚洲精品在线观看| 亚洲精品第二页| 国产视频亚洲| 欧美污视频久久久| 欧美日韩亚洲国产| 日韩在线免费观看视频| 国产精品九九九九| 亚洲欧美另类图片小说| av影片在线播放| 亚洲欧洲日本mm| 久久久综合亚洲91久久98| 最近高清中文在线字幕在线观看1| 亚洲精品久久久久久久久| 久久久久久91亚洲精品中文字幕| 337p粉嫩大胆色噜噜噜噜亚洲| 女人扒开屁股爽桶30分钟| 成人情趣视频网站| 亚洲一区二区三区四区在线播放| 在线观看中文| 亚洲精品美女视频| 国产99免费视频| 中文字幕一区二| 中文字幕第九页| 日韩精品乱码免费| 亚洲 欧洲 日韩| 欧美一级三级| 91精品久久久久久久久久| 欧美人体视频xxxxx| 日韩精品中文字幕久久臀| 99成人精品视频| 亚洲一二三区视频在线观看| 玖玖爱在线观看| 国内精品写真在线观看| 成人在线免费观看av| 欧美hd在线| 国产欧美日韩伦理| 久久亚洲资源中文字| 欧美极品少妇xxxxx| 懂色av中文在线| 欧美成人官网二区| 国产免费a视频| 亚洲一区二区三区视频在线 | 日本一区二区三区视频| 成人h视频在线观看| 国产综合av| 欧美激情精品在线| 日韩欧美小视频| 日韩av在线高清| 国产乱淫a∨片免费观看| 欧美性开放视频| 久久艹精品视频| 国产精品传媒在线| 免费黄色在线视频| 国产成人精品综合在线观看 | 午夜久久av| 国产精品美腿一区在线看| 国产在线xxx| 日韩中文av在线| 成年网站在线| 日韩av中文在线| 亚洲国产精品成人久久蜜臀| 欧美午夜片在线观看| 一级片中文字幕| 亚洲永久精品国产| 99自拍视频在线| 国产精品女主播在线观看| 久久国产精品无码一级毛片 | 玖玖爱在线观看| 成人精品免费看| 久久婷婷中文字幕| 蜜桃一区二区三区在线| 乱子伦视频在线看| 国产日本精品| 免费看毛片的网址| 国产精品av久久久久久麻豆网| 在线视频91| 日本高清免费电影一区| 欧美尤物一区| 亚洲深夜福利在线观看| 精品日产一区2区三区黄免费| 日韩中文字幕一区二区高清99| 成人黄色影片在线| 日本一区二区中文字幕| 国产精品视频公开费视频| 日韩成人av电影| 国产精品99免视看9| 澳门成人av网| 国产极品精品在线观看| 亚洲精品日产| 欧美一级高清免费播放| 最新日韩精品| 国产成人一区二区在线| 四虎影视4hu4虎成人| 国产精品成人久久久久| 国产成人精品亚洲日本在线观看| 日本精品一区二区三区在线播放视频| 美女日韩欧美| 国产精品露脸自拍| abab456成人免费网址| 国产欧美中文字幕| 视频91a欧美| 91国产丝袜在线放| 北条麻妃一区二区三区在线| 国产一区在线免费| 亚洲黄色录像| 日韩中文字幕一区二区| 日韩欧美视频专区| 美女在线免费视频| 亚洲九九精品| 黄色免费视频大全| 日韩影院免费视频| www.成人黄色| 国产91精品精华液一区二区三区 | 亚洲午夜免费电影| 日韩人妻无码一区二区三区99| 午夜精品久久久久久久久| 精品国产一区二区三区四| 欧美日韩三级视频| 国产成人久久精品77777综合| 亚洲精品一区二区三区蜜桃下载| 性感美女一级片| 在线观看国产成人av片| 好操啊在线观看免费视频| 欧美精品九九久久| 欧美xx视频| 成人免费视频网址| 精品网站aaa| 亚洲午夜久久久影院伊人| 欧美激情成人在线| 免费观看日韩毛片| 韩日av一区二区| 久久国产精品无码一级毛片| 国产精品久久三区| 久久不卡免费视频| 欧美男男青年gay1069videost| 亚洲精品久久久久久无码色欲四季 | 一区二区日韩欧美| 久久综合色视频| 久久国产精品一区二区| 国产一卡二卡三卡四卡| 国产精品久久久久久亚洲毛片| 麻豆一区二区三区精品视频| 在线观看国产日韩| 人妻丰满熟妇av无码区hd| 深夜福利一区二区| 黄色视屏在线免费观看| 国产综合香蕉五月婷在线| 麻豆精品少妇| 黄色网zhan| 日韩电影免费一区| 成人在线电影网站| 亚洲欧洲日本在线| 日本一区二区欧美| 欧美怡红院视频| 日本激情视频网站| 免费97视频在线精品国自产拍| 黄色成人免费网| 国产综合欧美在线看| 亚洲视频电影在线| 亚洲综合欧美激情| 久久蜜臀中文字幕| 99热在线观看免费精品| 日韩免费观看高清完整版| 五月婷婷在线观看| 国产成人+综合亚洲+天堂| 动漫av一区| 一区不卡视频| 日本在线播放一区二区三区| 少妇真人直播免费视频| 亚洲成人手机在线| 国产黄色高清视频| 久久国产精品影片| 青青青国产精品| 一区二区三区精品国产| 日韩成人av影视| 久久精品国产亚洲av久| 欧美日韩另类视频| 四虎在线视频免费观看| 久久久久亚洲精品成人网小说| 欧美黄视频在线观看| 制服丝袜综合日韩欧美| 美女在线视频一区| 免费黄色片网站| 在线观看日韩一区| 国产在线你懂得| 国产不卡av在线| 国产99久久| 国产精品wwwww| 国产三级精品三级在线专区| www五月天com| 亚洲欧洲午夜一线一品| 欧美羞羞视频| 少妇精品久久久久久久久久| 天堂va蜜桃一区二区三区漫画版| 国精产品一区一区三区免费视频| 色综合天天综合网天天看片| 男男电影完整版在线观看| 国产黑人绿帽在线第一区| 日韩欧美网址| 91欧美一区二区三区| 一区二区三区日韩欧美精品| 性少妇videosexfreexxx片| 欧美日韩成人黄色| 欧美美女在线直播| 麻豆av免费在线| 国产欧美日韩麻豆91| 一区二区三区午夜| 美女精品视频一区| 中文在线综合| 国产精品无码av在线播放| 久久人人97超碰com| 中文字字幕在线观看| 日韩视频永久免费观看| 欧州一区二区三区| 久久综合久久网| 国产亚洲欧美日韩日本| 在线观看免费黄色小视频| 欧美麻豆久久久久久中文| 另类春色校园亚洲| 亚洲77777| 亚洲影视资源网| 国产视频精选在线| 91亚洲国产成人久久精品网站 | 国产精品少妇在线视频| 中文字幕一区二区在线观看| 亚洲精品久久久久久久久久| 欧美一区二区三区……| 99国产**精品****| 亚洲精品国产成人av在线| 欧美色手机在线观看| 黄网av在线| 先锋影音一区二区三区| 国产成人综合亚洲网站| 天天射天天干天天| 欧美大成色www永久网站婷| 香蕉久久夜色精品国产更新时间| 日本中文字幕精品—区二区| 亚洲一区二区三区在线看| 北岛玲一区二区三区| 国产色综合一区二区三区| 久久电影网站中文字幕| 国产99久久久| 欧美激情a在线| 日韩不卡一区|