精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2024|杜克大學(xué)&谷歌提出SLED解碼框架,無需外部數(shù)據(jù)與額外訓(xùn)練,有效緩解大語言模型幻覺,提高事實準(zhǔn)確性

人工智能 新聞
本研究通過引入自驅(qū)動 Logits 進(jìn)化解碼(SLED)方法,成功地提升 LLM 在多種任務(wù)中的事實準(zhǔn)確性。

此項研究成果已被 NeurIPS 2024 錄用。該論文的第一作者是杜克大學(xué)電子計算機(jī)工程系的博士生張健一,其主要研究領(lǐng)域為生成式 AI 的概率建模與可信機(jī)器學(xué)習(xí),導(dǎo)師為陳怡然教授。

大語言模型(LLM)在各種任務(wù)上展示了卓越的性能。然而,受到幻覺(hallucination)的影響,LLM 生成的內(nèi)容有時會出現(xiàn)錯誤或與事實不符,這限制了其在實際應(yīng)用中的可靠性。

針對這一問題,來自杜克大學(xué)和 Google Research 的研究團(tuán)隊提出了一種新的解碼框架 —— 自驅(qū)動 Logits 進(jìn)化解碼(SLED),旨在提升大語言模型的事實準(zhǔn)確性,且無需依賴外部知識庫,也無需進(jìn)行額外的微調(diào)。

圖片

  • 論文地址:https://arxiv.org/pdf/2411.02433
  • 項目主頁:https://jayzhang42.github.io/sled_page/
  • Github地址:https://github.com/JayZhang42/SLED
  • 作者主頁:https://jayzhang42.github.io

研究背景與思路總結(jié)

近期相關(guān)研究顯示,盡管用戶在訪問大語言模型(LLM)時可能無法得到正確的答案,但 LLM 實際上可能已經(jīng)基于海量的訓(xùn)練數(shù)據(jù)和漫長的訓(xùn)練周期學(xué)到了正確的答案,并將其存儲于模型內(nèi)部某處。

研究者將這類無法直觀從模型輸出中獲得的信息稱為 “潛在知識”,并用圖一精煉出了對應(yīng)的 “三體問題”。

圖片圖一:Factuality Decoding 的 “三體問題”

圖一中,考慮到每條問題的標(biāo)準(zhǔn)答案都已包含訓(xùn)練數(shù)據(jù)集中,因此可以說訓(xùn)練時,真實世界的事實分布是已知的。LLM 的訓(xùn)練正是為了縮小 LLM 輸出分布 圖片和真實事實分布圖片 之間的差距。

然而,在 LLM 的推理階段(inference time),真實的事實分布是未知的,因此這項研究的重點便是如何挖掘模型的潛在知識分布,并利用其進(jìn)一步增強(qiáng)模型的輸出。

概括來說, SLED 方法通過對比最后一層的圖片和前面幾層的圖片,有效地挖掘了 LLMs 內(nèi)部的潛在知識。

同時,研究者也指出 LLM 中的潛在知識雖然有價值,但可能并不完美。因此,SLED 不是簡單地使用這些潛在知識替換原始輸出,而是通過類似于對輸出 圖片 進(jìn)行 “梯度下降” 的操作,將其整合到原始輸出圖片中,從而有效地平衡了兩者,避免了過擬合等潛在的風(fēng)險。

圖片

圖二:SLED 框架的主要流程

方法設(shè)計

為了提高事實準(zhǔn)確性,需要確保正確的 token圖片, 在輸出分布圖片中獲得更高的概率。這一過程可以通過優(yōu)化以下?lián)p失函數(shù) L 來描述圖片其中圖片

研究者將這一優(yōu)化過程稱為 Logits 進(jìn)化。有趣的是,這同時也為理解 LLM 的訓(xùn)練提供了新的視角 —— 不同于之前只關(guān)注訓(xùn)練中模型參數(shù)的更新,可以看到:

  • LLM 的訓(xùn)練實際上一個是由訓(xùn)練數(shù)據(jù)集作為外部驅(qū)動的 Logits 進(jìn)化過程;
  • LLM 的訓(xùn)練為這個優(yōu)化過程找到的解就是最后一層的輸出 圖片

從上面的理解出發(fā),可以預(yù)期最后一層的輸出的圖片對應(yīng)的圖片,通常要比前面幾層的輸出 圖片對應(yīng)的圖片要更接近訓(xùn)練時的圖片。這一點也在圖三中得到了驗證。

圖片

圖三:研究者對三個不同規(guī)模的 LLaMA-2 模型計算了每一層對應(yīng)的交叉熵?fù)p失。結(jié)果證實,就 KL 散度而言,最終層的 Logits 輸出分布比所有早期層更接近真實世界的分布

因此,受到經(jīng)典梯度下降算法的啟發(fā),研究者通過如下的近似來反向估計圖片 

圖片

這里對 圖片 的估計,實際上也就是之前提到的潛在知識,因此用圖片來表示。在此基礎(chǔ)上,研究者通過類似梯度下降的方式,用估計出來的潛在知識圖片,實現(xiàn)了對 圖片 自驅(qū)動進(jìn)化,

圖片

從而得到了一個更接近事實分布的最終輸出圖片。更細(xì)節(jié)的方法設(shè)計和討論,請參考原文。

實驗驗證

作為一種新型的層間對比解碼架構(gòu),研究者首先將 SLED 與當(dāng)前最先進(jìn)的方法 DoLa 進(jìn)行了比較。實驗覆蓋了多種 LLM families(LLaMA 2, LLaMA 3, Gemma)和不同模型規(guī)模(從 2B 到 70B),還有當(dāng)前備受關(guān)注的混合專家(MoE)架構(gòu)。

結(jié)果表明,SLED 在多種任務(wù)(包括多選、開放式生成和思維鏈推理任務(wù)的適應(yīng)性)上均展現(xiàn)出明顯的事實準(zhǔn)確性提升。

圖片

此外 SLED 與其他常見的解碼方式(如 contrastive decoding,ITI)具有良好的兼容性,能夠進(jìn)一步提升性能。

圖片

最后,研究者發(fā)現(xiàn),與以往的算法相比,SLED 在計算上幾乎沒有明顯的額外開銷。同時,在生成質(zhì)量方面,SLED 顯著抑制了以往方法中的重復(fù)性問題,進(jìn)一步優(yōu)化了輸出結(jié)果。

圖片

引申思考:與目前流行的 inference-time 算法的聯(lián)系

實際上,不難看出,SLED 為后續(xù)的推理時(inference-time )算法提供了一個新的框架。與目前大多數(shù) inference-time computing 方法主要集中于 sentence level 的輸出或 logits 進(jìn)行啟發(fā)式修改不同,SLED 與經(jīng)典優(yōu)化算法銜接,如梯度下降法的結(jié)合更為緊密自然。

因此,SLED 不僅優(yōu)化效率更高,同時有很多的潛在的研究方向可以嘗試;另一方面,與 inference time training 方法相比,SLED 不涉及模型參數(shù)層面的修改,因此優(yōu)化效率上開銷更小,同時更能保持模型原有性能。

總結(jié)

本研究通過引入自驅(qū)動 Logits 進(jìn)化解碼(SLED)方法,成功地提升 LLM 在多種任務(wù)中的事實準(zhǔn)確性。展望未來,可以探索將 SLED 與監(jiān)督式微調(diào)方法結(jié)合,以適應(yīng)其他領(lǐng)域的特定需求如醫(yī)療和教育領(lǐng)域。同時,改進(jìn)框架設(shè)計也將是持續(xù)關(guān)注的方向。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2020-06-18 11:10:16

AI人工智能神經(jīng)網(wǎng)絡(luò)

2025-09-10 09:15:00

AI模型數(shù)據(jù)

2025-02-10 08:40:00

訓(xùn)練數(shù)據(jù)模型

2024-12-23 13:28:22

2024-12-11 08:12:24

2021-01-29 09:17:00

深度學(xué)習(xí)AI人工智能

2024-01-04 16:41:29

大型語言模型自然語言處理

2024-12-09 13:20:50

2024-01-12 10:29:26

2022-08-19 09:53:20

人工智能大數(shù)據(jù)風(fēng)險

2025-11-20 08:38:46

2025-09-28 09:10:00

2024-10-10 14:10:00

AI模型

2024-10-25 14:00:00

AI語言模型

2014-08-25 13:39:29

光纜故障

2025-06-03 09:08:00

2024-12-18 13:24:30

谷歌AI大語言模型

2019-12-30 09:41:59

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2024-09-13 12:31:21

谷歌DataGemmaAI

2024-11-27 13:36:10

點贊
收藏

51CTO技術(shù)棧公眾號

欧美日韩免费观看一区二区三区| 国产精品一区二区果冻传媒| 国产福利视频一区二区三区| 精品中文字幕在线| 韩国三级与黑人| 亚洲按摩av| 91污在线观看| 国产拍精品一二三| 国产无遮挡又黄又爽在线观看| 美日韩中文字幕| 91精品欧美一区二区三区综合在| 轻点好疼好大好爽视频| 国产黄色片在线观看| 蜜臀av性久久久久蜜臀av麻豆| 欧美日韩国产成人在线观看| 日本理论中文字幕| 91成人噜噜噜在线播放| 欧美午夜精品理论片a级按摩| 成人短视频在线观看免费| 国产原创av在线| 成人免费黄色大片| 成人国产精品日本在线| 国产一区二区视频网站| 国产精品九九| 精品国产一区二区三区久久| 少妇特黄一区二区三区| 日韩免费高清视频网站| 欧美日韩一区二区三区免费看| 日本人体一区二区| 超碰在线观看免费版| 日本一二三不卡| 九色一区二区| 午夜精品久久久久久久96蜜桃| 日本中文在线一区| 清纯唯美亚洲激情| 激情五月色婷婷| 国语精品一区| 欧美精品在线视频观看| 精品女人久久久| 欧洲激情视频| 伊人精品在线观看| 国产全是老熟女太爽了| 蜜臀av一区| 欧美精品一区男女天堂| 丰满少妇中文字幕| 国产精品99久久免费| 欧美日韩亚洲综合在线| 午夜宅男在线视频| 免费视频成人| 欧美日韩国产小视频| 最新天堂中文在线| 欧美成人三级| 欧美精品自拍偷拍动漫精品| 亚洲另类第一页| 国内欧美日韩| 欧美日韩综合一区| 日韩av.com| 色8久久久久| 在线不卡一区二区| 91亚洲一区二区| 精品视频一区二区三区在线观看| 91精品免费观看| 天天操精品视频| 日韩黄色av| 亚洲精品一区二区三区四区高清| 国产真实乱人偷精品| 欧美日韩破处| 亚洲网址你懂得| 色www亚洲国产阿娇yao| 99久久亚洲精品| 欧美精品在线免费播放| 日本三级午夜理伦三级三| 国产午夜久久| 国产精品免费一区| 国产成人久久精品77777综合| 国产乱子轮精品视频| 国产精品乱码| 久久精品蜜桃| 亚洲视频免费在线| 女女同性女同一区二区三区按摩| 在线āv视频| 欧美日韩国产在线| 黄色手机在线视频| 亚洲五码在线| 亚洲片av在线| 丁香花五月激情| 国产欧美成人| 国产精品视频一区国模私拍| 亚洲av成人片无码| 网友自拍一区| 色婷婷综合久久久久中文字幕1| 日本黄色片免费观看| 国产精品www.| 国产精品1区2区在线观看| av在线免费在线观看| 26uuu精品一区二区三区四区在线| 婷婷亚洲婷婷综合色香五月| 成人在线观看亚洲| 欧美性生活大片免费观看网址| 欧美美女性视频| 中文字幕一区日韩精品| 亚洲最大中文字幕| 免费日韩在线视频| 日韩精品每日更新| 成人免费91在线看| аⅴ资源新版在线天堂| 午夜影视日本亚洲欧洲精品| 亚洲高清在线免费观看| 国产日韩三级| 久久久91精品国产| 潘金莲一级淫片aaaaaa播放| 国产不卡在线播放| 亚洲v日韩v欧美v综合| 国产美女高潮在线| 日韩欧美中文一区| 日韩一区二区三区四区视频| 夜久久久久久| 91青青草免费观看| 三区四区在线视频| 一本大道综合伊人精品热热| 91精品人妻一区二区三区四区| 欧美天天综合| 日韩av电影在线免费播放| 亚洲伦理在线观看| 成人免费小视频| 婷婷激情四射五月天| 一本久久青青| 91干在线观看| 欧日韩在线视频| 亚洲精品欧美在线| 亚洲精品20p| 欧美影院三区| 日本精品中文字幕| 少妇高潮一区二区三区69| 一区二区在线看| 999热精品视频| 欧美电影《睫毛膏》| 国产精品青青在线观看爽香蕉 | 日韩av一区二区三区在线观看| 高h调教冰块play男男双性文| 国产精品不卡视频| 孩娇小videos精品| 久久激情电影| 国产精品综合久久久| 黄色在线播放| 色美美综合视频| 91福利免费观看| 日韩在线视屏| 国产人妖伪娘一区91| 9色在线观看| 欧美三区在线观看| 精品丰满少妇一区二区三区| 青青草91视频| 一区二区三区在线视频看| 国产综合色激情| 久久久成人精品视频| 99国产在线播放| 日韩美女视频一区二区| 亚洲一级片av| 一区二区三区四区电影| 99精品欧美一区二区三区| 手机在线免费观看av| 欧美成人综合网站| 日韩三级一区二区三区| 91视频免费播放| 日韩视频免费在线播放| 欧美超碰在线| 国产精品v欧美精品v日韩| 免费看男女www网站入口在线 | 国产欧美日韩综合精品| 国产黄色在线观看| 精品国产亚洲在线| 欧美性猛交bbbbb精品| 国产欧美一区二区三区在线看蜜臀| jizz欧美激情18| 欧美jizz| 成人区精品一区二区| 天堂av在线网| 亚洲欧美日韩免费| 欧美日韩中文一区| 久久久久久久久久久久久女过产乱| 岛国精品在线播放| 日本成年人网址| 97色伦图片97综合影院| 国产精品久久久一区二区三区| 免费福利视频一区二区三区| 色悠悠久久久久| 亚洲精品无amm毛片| 色88888久久久久久影院野外| 日本裸体美女视频| 99久久亚洲一区二区三区青草| 日韩欧美黄色大片| 亚洲精品网址| 欧美激情论坛| 91成人福利社区| 91精品国产91久久久| 午夜精品一区| 亚洲精品国精品久久99热一| 中文天堂在线资源| 亚洲图片一区二区| 青青操在线播放| 2020国产精品| 女人扒开腿免费视频app| 久久精品日产第一区二区| 五月天在线免费视频| 男男gay无套免费视频欧美| 亚洲在线视频福利| 777午夜精品电影免费看| 欧美激情视频在线观看| av在线播放av| 日韩精品极品视频| 亚洲精品国产suv一区| 欧美日韩一区二区三区视频| 成人免费视频毛片| 一区二区三区高清| 日韩在线不卡av| 国产亚洲综合色| 800av在线播放| 国产激情视频一区二区三区欧美 | 日韩av一二三区| 亚洲天堂久久久久久久| 久久中文字幕精品| 91麻豆免费在线观看| 久久久高清视频| 国产在线不卡视频| 在线观看免费的av| 麻豆精品国产91久久久久久| 欧美黄网站在线观看| 亚洲精品乱码| 91动漫在线看| 精品91在线| 国产一区 在线播放| 中文字幕免费一区二区三区| 一区一区视频| 欧美va久久久噜噜噜久久| 亚洲人成人77777线观看| av亚洲在线观看| 欧洲一区二区在线观看| 日韩伦理一区二区三区| 国产另类自拍| 精品av导航| 精品视频一区二区三区四区| 国产成人tv| 国产亚洲一区在线播放| 精品自拍偷拍| 久久综合给合久久狠狠色| aaa在线播放视频| 欧美国产视频日韩| 久久青青色综合| 韩日精品中文字幕| www成人免费观看| 3344国产精品免费看| 婷婷电影在线观看| 日本中文字幕久久看| 综合在线影院| 国产精品三级美女白浆呻吟| 久久青草视频| 91精品美女在线| 国产一精品一av一免费爽爽| 99久久精品免费看国产一区二区三区 | 男女爽爽爽视频| 欧美a级理论片| 亚洲欧美aaa| 国产丶欧美丶日本不卡视频| 久久久久无码国产精品一区李宗瑞| 成人综合婷婷国产精品久久蜜臀| 蜜臀av粉嫩av懂色av| 91蜜桃免费观看视频| 蜜桃传媒一区二区亚洲| 国产精品你懂的| 国产尤物在线播放| 亚洲一区二区欧美| 日韩欧美在线观看免费| 欧美日韩和欧美的一区二区| 99久久精品国产色欲| 精品国产乱码久久久久久牛牛| 天天综合网在线观看| 亚洲香蕉成人av网站在线观看 | 日韩一区免费视频| 亚洲理论在线a中文字幕| 粉嫩av一区| 欧美精品一区二区免费| 亚洲欧洲美洲av| 国产精品私拍pans大尺度在线| 日韩精品成人| 免费精品视频一区| 婷婷综合社区| 亚洲中文字幕无码中文字| 久久精品av麻豆的观看方式| av免费观看不卡| 中文字幕第一区二区| 黄色小说在线观看视频| 欧美亚洲国产一区二区三区| 国产区精品在线| 日韩久久午夜影院| www在线观看播放免费视频日本| 欧美亚洲第一区| 麻豆国产一区二区三区四区| 欧美一进一出视频| 国产一区激情| 色www免费视频| 久久先锋影音av鲁色资源| 欧美又粗又大又长| 欧美性大战久久久久久久| 天天干在线观看| 成人97在线观看视频| 经典三级一区二区| 精品欧美一区二区在线观看视频 | 日韩高清在线免费观看| 制服诱惑一区| 日韩精品一二三区| 800av在线播放| 亚洲一区二区三区四区在线免费观看 | 免费观看日韩电影| 黄色在线免费播放| 亚洲欧洲综合另类| 中文字幕一二区| 亚洲精品视频免费在线观看| 男人添女人下部高潮视频在线观看| 国产精品视频一区二区三区四 | 伊人成年综合网| 亚洲精品按摩视频| 福利在线导航136| 18成人在线| 香蕉久久网站| 久久99爱视频| 国产三区在线成人av| 六月丁香婷婷综合| 亚洲精品按摩视频| 日产福利视频在线观看| 国产精选在线观看91| 国自产拍偷拍福利精品免费一| 一级片黄色免费| 亚洲三级在线观看| 91久久精品无码一区二区| 中文字幕在线精品| 国产在视频一区二区三区吞精| 色一情一乱一伦一区二区三区| 久久精品国产清高在天天线| 中文精品在线观看| 日韩欧美aaa| 青梅竹马是消防员在线| 欧美一区深夜视频| 中国av一区| av视屏在线播放| 日本一区免费视频| 一本色道久久综合无码人妻| 在线精品国产成人综合| 久久婷婷五月综合色丁香| 一区二区三区四区免费视频| 美女一区二区久久| 九九热久久免费视频| 欧美美女直播网站| 中文在线免费| 国产亚洲福利社区| 国产精品一区毛片| 摸摸摸bbb毛毛毛片| 欧美日韩午夜影院| 黄色av网站在线播放| 成人黄色片视频网站| 在线亚洲国产精品网站| 男人天堂av电影| 欧美日韩国产经典色站一区二区三区| 在线免费观看黄色网址| 91在线看www| 激情综合网址| 成人片黄网站色大片免费毛片| 欧美中文字幕不卡| 国产一二三区在线观看| 国产精品永久入口久久久| 国产麻豆综合| 久久久免费看片| 欧美一级一级性生活免费录像| 136福利第一导航国产在线| 欧美日韩精品久久久免费观看| 秋霞电影一区二区| 九九热精品免费视频| 精品无人国产偷自产在线| 成人四虎影院| 超碰10000| 久久久久国产精品人| 国产精品久久久久久久久久久久久久久久 | 在线观看日本视频| 综合网中文字幕| 成人直播在线观看| 我看黄色一级片| 亚洲伊人色欲综合网| 黄色的视频在线免费观看| 91夜夜揉人人捏人人添红杏| 99亚洲精品| 永久免费未视频| 国产视频精品xxxx| 国产精品一区二区三区www| 大肉大捧一进一出好爽视频| 中文字幕在线观看一区二区| 色欲av永久无码精品无码蜜桃| 国产乱人伦真实精品视频| 国产亚洲在线观看| 欧美日韩午夜视频| 亚洲精品中文字幕女同|