精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

知識圖譜、大模型與幻覺:自然語言處理的視角

人工智能
大型語言模型(LLMs)已經徹底改變了基于自然語言處理(NLP)的應用,包括自動化文本生成、問答系統、聊天機器人等。

摘要

大型語言模型(LLMs)已經徹底改變了基于自然語言處理(NLP)的應用,包括自動化文本生成、問答系統、聊天機器人等。然而,它們面臨一個重大挑戰:產生幻覺,即模型生成聽起來合理但實際上錯誤的內容。這削弱了信任,并限制了LLMs在不同領域的適用性。另一方面,知識圖譜(KGs)提供了結構化的互聯事實集合,以實體(節點)及其關系(邊)表示。在最近的研究中,KGs已被用于提供上下文,可以填補LLMs在理解某些話題時的空白,提供了一種緩解LLMs幻覺的有前途的方法,增強了它們的可靠性和準確性,同時受益于它們廣泛的適用性。盡管如此,它仍然是一個非常活躍的研究領域,存在許多未解決的開放性問題。在本文中,我們討論了這些未解決的挑戰,涵蓋了最新的數據集和基準測試,以及知識整合和評估幻覺的方法。在我們的討論中,我們考慮了當前大型語言模型(LLMs)在LLM系統中的使用,并針對每個挑戰確定了未來的方向。

圖片圖片

核心速覽

研究背景

  1. 研究問題:這篇文章要解決的問題是大型語言模型(LLMs)在生成文本時容易出現的事實不一致現象,即“幻覺”。這種幻覺會損害用戶對AI系統的信任,并在某些情況下生成誤導性信息。
  2. 研究難點:該問題的研究難點包括:幻覺的多面性(如世界知識、自相矛盾、與提示指令或給定上下文的幻覺)、評估幻覺的復雜性(需要評估輸出的語義一致性)以及現有數據集和基準測試的局限性。
  3. 相關工作:該問題的研究相關工作有:利用知識圖譜(KGs)提供結構化的事實信息來緩解LLMs的幻覺問題、現有的幻覺檢測方法和知識整合模型。

研究方法

這篇論文提出了利用知識圖譜(KGs)來緩解LLMs的幻覺問題。具體來說,

  1. 知識圖譜的利用:KGs是一種結構化的知識表示形式,由實體(節點)和它們之間的關系(邊)組成。通過將KGs的信息整合到LLMs中,可以在推理或生成過程中提供事實基礎,從而提高輸出的一致性和準確性。
  2. 知識整合模型的分類:根據其底層架構,可以將不同的知識整合模型進行分類。論文提出了一個分類框架,展示了在不同階段加入額外信息以增強事實性的可能性。
  3. 幻覺檢測方法:GraphEval提出了一種兩階段的幻覺檢測和緩解方法,通過從LLMs輸出中提取原子斷言并與給定文本上下文進行比較來進行檢測。其他方法如KGR、Fleek等也采用了類似的方法,但都存在一些局限性。
  4. 多提示評估:DefAn數據集通過為每個問答數據點提供15個不同的問題重述,來評估LLMs的魯棒性和一致性。

實驗設計

  1. 數據集:論文評估了多個幻覺檢測和數據集,包括Shroom SemEval 2024、MuShroom SemEval 2025、MedHalt、HaluEval、TruthfulQA、FELM、HaluBench、DefAn、SimpleQA等。這些數據集覆蓋了多個領域和任務類型,如法律、政治、醫學、科技、藝術、金融等。
  2. 評估指標:使用了多種評估指標,如準確率、校準、F1值等,來評估幻覺檢測模型的性能。對于知識整合方法,還使用了BERTScore和BARTScore等語義相似度度量。
  3. 實驗設置:實驗設置包括對每個數據集的劃分(訓練、驗證、測試)、子任務的定義以及外部知識的來源(如文本上下文、網頁等)。

結果與分析

  1. 幻覺檢測效果:現有的幻覺檢測方法在識別和處理幻覺方面取得了一定的進展,但仍存在一些問題。例如,多階段管道方法的魯棒性和可擴展性有限,且高度依賴于LLMs的提示。
  2. 知識整合效果:通過將KGs信息整合到LLMs中,可以顯著提高輸出的一致性和準確性。然而,現有的知識整合方法在快速知識更新和避免提示脆弱性方面仍存在挑戰。
  3. 多提示評估:DefAn數據集的評估結果表明,多提示方法可以提高LLMs的魯棒性和一致性,但仍需要進一步的研究來驗證其在不同場景下的有效性。

總體結論

這篇論文總結了利用知識圖譜(KGs)來緩解LLMs幻覺問題的現狀和挑戰。盡管已有方法取得了一定的進展,但幻覺緩解仍然是一個持續的研究問題。論文提出了未來研究的方向,包括大規模數據集、多語言和多任務的評估、細粒度的幻覺檢測、減少對文本提示的依賴以及混合使用不同的幻覺緩解方法。通過這些研究方向,論文希望為LLMs的幻覺問題提供更有效的解決方案。

論文評價

優點與創新

  1. 全面性:論文詳細討論了知識圖譜(KGs)在緩解大型語言模型(LLMs)生成幻覺現象中的潛力,涵蓋了當前的研究現狀、局限性以及未來的研究方向。
  2. 分類方法:提出了基于架構的知識集成模型分類方法,并總結了不同階段額外信息加入的類別。
  3. 資源梳理:梳理了現有的評估幻覺的數據集和基準測試,提供了詳細的資源概覽。
  4. 多維度評估:強調了多維度評估的重要性,包括多語言、多任務和多角度的評估方法。
  5. 細粒度檢測:提出了細粒度的幻覺檢測方法,如句子級和段落級的檢測,以更好地捕捉幻覺的細節。
  6. 未來方向:提出了多個未來研究方向,包括大規模數據集、魯棒評估、細粒度幻覺檢測、非文本提示的知識集成方法以及混合不同方法的探索。

不足與反思

  1. 數據集限制:大多數現有數據集缺乏高質量的知識圖譜三元組作為外部知識,限制了知識集成模型的參數化方法的發展。
  2. 評估方法局限:當前的評估方法主要依賴于單一的提示和多語言評估的缺乏,未能全面評估系統的魯棒性和泛化能力。
  3. 方法依賴性:許多方法仍然依賴于文本提示,存在提示脆弱性和高計算成本的問題。
  4. 知識圖譜的局限性:現有的知識圖譜在數據完整性、準確性和多語言覆蓋方面存在局限性,可能影響幻覺緩解的效果。
  5. 未來研究建議:需要進一步研究如何在參數化設置中集成知識,減少對文本提示的依賴,并探索不同方法的有效組合。

關鍵問題及回答

問題1:論文中提到的知識圖譜(KGs)在緩解LLMs幻覺問題中的具體應用有哪些?

  1. 預訓練階段:將KG triples作為訓練數據的一部分,通過掩碼實體預測任務將KG triples與原始文本輸入融合。例如,Ernie 3.0模型通過大規模的知識增強預訓練來提升語言理解和生成能力。
  2. 推理階段:通過提示(prompting)將KG triples與查詢結合,形成輸入對(P={\mathcal{K},\mathcal{Q}}),用于檢索增強生成(RAG)任務。例如,使用BERTscore和BARTScore等語義相似度度量來評估LLMs輸出的質量。
  3. 生成后階段:在生成答案后,通過外部KG進行事實檢查,并根據驗證結果對原始輸出進行修正。例如,GECKO方法完全依賴于KG信息進行文本生成。

問題2:論文中提到的幻覺檢測方法有哪些?它們各自的優缺點是什么?

  1. GraphEval:提出了一種兩階段的幻覺檢測和緩解方法。第一階段通過LLM提示提取原子斷言并形成子圖,第二階段將這些子圖與給定文本上下文進行比較。優點是可以提供細粒度的錯誤分析,缺點是依賴于LLM提示的魯棒性。
  2. KGR:通過命名實體提取KG子圖,并比較源文本和生成文本之間的對齊情況。優點是能夠識別具體的錯誤部分,缺點是可能丟失抽象概念的詳細信息。
  3. Fleek:通過提取結構化三元組并使用另一個LLM進行事實檢查。優點是能夠進行事實驗證,缺點是依賴于多個LLM的推理,計算成本高。
  4. DefAn:通過為每個問答數據點提供多個問題重述來評估LLMs的魯棒性和一致性。優點是多提示評估可以提高模型的魯棒性,缺點是需要大量的標注數據和計算資源。

問題3:論文中提到的知識整合方法在提高LLMs輸出一致性和準確性方面的效果如何?存在哪些挑戰?

  1. 效果:通過將KGs信息整合到LLMs中,可以顯著提高輸出的一致性和準確性。例如,Ernie 3.0模型在大規模知識增強預訓練后,情感分析任務的性能得到了顯著提升。
  2. 挑戰:現有的知識整合方法在快速知識更新和避免提示脆弱性方面仍存在挑戰。例如,基于提示的方法依賴于手工設計的模板,容易受到格式和內容限制的影響。此外,多階段管道方法的魯棒性和可擴展性也有限,高度依賴于LLMs的提示。
責任編輯:武曉燕 來源: 知識圖片科技
相關推薦

2021-04-12 11:41:09

人工智能知識圖譜

2024-01-09 14:05:15

大型語言模型RAG向量數據庫

2023-09-27 09:00:00

大型語言模型自然語言處理

2025-11-05 03:22:00

知識圖譜語言模型生物醫學

2024-01-29 00:25:59

人工智能結構化編碼

2017-10-19 17:05:58

深度學習自然語言

2024-02-20 08:17:55

2024-05-16 08:23:26

大語言模型知識圖譜人工智能

2024-02-26 00:00:00

RAG系統圖譜

2018-02-27 09:32:13

神經網絡自然語言初探

2017-04-13 11:48:05

NLP知識圖譜

2021-01-18 10:50:29

知識圖譜人工智能深度學習

2021-09-03 12:01:07

模型自然語言

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-06-17 07:49:53

2021-05-13 07:17:13

Snownlp自然語言處理庫

2019-03-25 22:03:40

開源自然語言NLP

2025-04-27 00:10:00

AI人工智能知識圖譜

2021-01-19 10:52:15

知識圖譜

2017-03-06 16:48:56

知識圖譜構建存儲
點贊
收藏

51CTO技術棧公眾號

少妇高潮久久久久久潘金莲| 欧美天堂一区二区三区| 国内精品视频在线播放| 波多野结衣一区二区在线 | 激情五月婷婷综合网| 久久91亚洲精品中文字幕奶水 | 久久精品福利| 欧美日韩精品免费观看视频| 国产成人在线小视频| 国产专区在线| 国产91丝袜在线观看| 国产精品日韩在线一区| 日本在线免费观看| 91精品二区| 国产亚洲欧美日韩美女| 风韵丰满熟妇啪啪区老熟熟女| 日韩伦理三区| 午夜视频一区在线观看| 99精品视频网站| 国产精品久久久久一区二区国产 | 精品女同一区二区| 艹b视频在线观看| 成人免费看黄| 香蕉成人伊视频在线观看| 一本—道久久a久久精品蜜桃| 黄色在线播放| 91在线视频免费91| 动漫3d精品一区二区三区| 日韩不卡视频在线| 一本久道久久综合婷婷鲸鱼| 久久伊人精品一区二区三区| 欧美人妻一区二区三区| 中文字幕av一区二区三区人| 精品国产一区久久| 性一交一黄一片| 亚洲成人a级片| 欧美日韩一区二区三区四区| aa免费在线观看| 国产高清自产拍av在线| 亚洲一区二区精品3399| 国产日产欧美一区二区| 人人干在线视频| 国产精品久久久久久亚洲伦 | 亚洲一区二区三区四区av| 欧美a在线观看| 欧美一级欧美三级在线观看| 伊人成人222| 欧美一区=区三区| 欧美日韩国产影片| 永久免费的av网站| 亚洲成人1区| 欧美一区二区三区影视| 日韩欧美理论片| 欧美视频精品全部免费观看| 日韩女优制服丝袜电影| 一区二区三区人妻| jazzjazz国产精品久久| 日韩你懂的在线播放| 一二三区视频在线观看| 成人h动漫免费观看网站| 亚洲成人免费在线视频| 亚洲色偷偷色噜噜狠狠99网| 欧美一区 二区| 亚洲另类欧美自拍| 调教驯服丰满美艳麻麻在线视频| 欧美xxav| 欧美老妇交乱视频| 国产成人在线播放视频| 亚洲欧美高清| 国产精品视频精品| 99热精品在线播放| caoporn国产精品| 欧美午夜精品久久久久久蜜| 午夜激情视频在线| 一区二区三区精品视频在线| 欧美,日韩,国产在线| 成人免费影院| 7777精品伊人久久久大香线蕉最新版| 人妻换人妻仑乱| 麻豆精品99| 在线中文字幕日韩| 欧美一区二区三区爽爽爽| 1024成人| 国产精品一二三在线| av综合在线观看| 91麻豆免费在线观看| 亚洲欧美日本国产有色| 色呦呦在线视频| 色婷婷国产精品| 狠狠干狠狠操视频| 精品av导航| 中文字幕亚洲精品| 日本中文字幕网| 美女视频一区二区三区| 国产亚洲情侣一区二区无| av中文字幕在线| 亚洲一区二区三区自拍| 牛夜精品久久久久久久| 成人中文字幕视频| 少妇久久久久久| 欧美日韩综合在线观看| 国产呦萝稀缺另类资源| 久久亚洲一区二区| 2024最新电影免费在线观看| 欧美午夜美女看片| 91av免费观看| 日韩精品中文字幕第1页| 隔壁老王国产在线精品| 在线观看国产精品视频| 99精品视频在线播放观看| 亚洲v欧美v另类v综合v日韩v| 毛片在线导航| 欧美日韩激情一区二区三区| 亚洲专区区免费| 精品99视频| 91综合免费在线| www 日韩| 91成人在线精品| 稀缺呦国内精品呦| 一本一本久久a久久综合精品| 青草青草久热精品视频在线观看| 黄色福利在线观看| 亚洲欧美另类在线| 性chinese极品按摩| 欧美人与牛zoz0性行为| 97精品国产97久久久久久| 国产又大又粗又长| 中文在线免费一区三区高中清不卡| 人妻熟妇乱又伦精品视频| 深夜福利一区| 久久成人一区二区| 91 中文字幕| 欧美国产1区2区| av动漫免费看| 天堂资源在线亚洲| 91国语精品自产拍在线观看性色| www.我爱av| 亚洲激情男女视频| 手机在线观看日韩av| 天天超碰亚洲| 91免费福利视频| 免费在线观看av| 69堂国产成人免费视频| 肉色超薄丝袜脚交69xx图片| 麻豆成人综合网| 亚洲午夜在线观看| 国产日韩中文在线中文字幕| 久久精品视频在线观看| ,亚洲人成毛片在线播放| 国产精品久久久久久久第一福利| 国产又猛又黄的视频| 欧美午夜精彩| 国产精品视频免费在线观看| 91精彩视频在线播放| 欧美精品久久99久久在免费线 | 亚洲高清免费视频| 黄色av网址在线观看| 午夜在线播放视频欧美| 欧美专区一二三| 欧美一区二区三区婷婷| 久久福利视频导航| 丰满熟女一区二区三区| 午夜私人影院久久久久| 波多野结衣片子| 久久66热re国产| 欧美日韩国产免费| 久久精品免费一区二区三区| 亚洲免费黄色| 国产精品久久久久久久久久三级| 成年人在线免费观看| 欧美日韩精品系列| 免费又黄又爽又色的视频| 成人av网址在线| 乱子伦视频在线看| 日韩情爱电影在线观看| 91免费看蜜桃| 高端美女服务在线视频播放| 国产偷亚洲偷欧美偷精品| 亚洲永久精品一区| 亚洲精品免费在线观看| 最近中文字幕无免费| 蜜臀av亚洲一区中文字幕| 在线观看av的网址| 国产精品密蕾丝视频下载| 91精品在线看| 在线观看涩涩| 久久精品免费电影| 亚洲欧美综合在线观看| 欧美人xxxx| 国产免费av一区二区| 国产精品免费av| 少妇丰满尤物大尺度写真| 老牛嫩草一区二区三区日本| 99精品一级欧美片免费播放| 日韩精品免费一区二区三区竹菊| 国产美女久久精品| 蜜桃麻豆av在线| 美女福利精品视频| 日本aaa在线观看| 日韩欧美精品在线| www.av88| 欧美日韩一二三四五区| 国产精品免费人成网站酒店| 久久久三级国产网站| 国产精品一级无码| 久久99精品久久久久久动态图 | 91福利在线导航| 国产在线视频卡一卡二| 国产精品国产自产拍高清av| 波多野结衣 在线| 国产69精品久久99不卡| 九九热99视频| 日韩高清一级片| 极品粉嫩国产18尤物| 久久久久久久久久久9不雅视频 | 91精品高清| 亚洲高清资源综合久久精品| 天堂日韩电影| 精品国产乱码久久久久久久软件 | 麻豆精品国产传媒mv男同| 能在线观看的av| 日韩午夜精品| 欧洲精品在线播放| 欧美日韩亚洲一区三区| 一本久久a久久精品vr综合| 国产精品亚洲人成在99www| 精品无码久久久久久久动漫| 盗摄牛牛av影视一区二区| 亚洲自拍欧美色图| 国产激情精品一区二区三区| 国产欧美欧洲在线观看| 一区二区视频免费完整版观看| 欧美一级片在线播放| 成人福利影视| 久久久亚洲影院你懂的| av资源一区| 欧美激情影音先锋| 免费电影网站在线视频观看福利| 欧美日韩999| 国内在线视频| 久久久中文字幕| av老司机在线观看| 国模精品系列视频| 成年女人在线看片| 97视频免费观看| 涩涩视频在线播放| 情事1991在线| 99久久er| 成人国产精品一区二区| 国产精品欧美一区二区三区不卡 | 国产精品电影久久久久电影网| 韩国主播福利视频一区二区三区| 日韩av免费在线| 99九九久久| 91香蕉电影院| 中文字幕久久精品一区二区| 国产一区二区三区高清| 亚洲婷婷丁香| 丝袜足脚交91精品| 成人女性视频| 公共露出暴露狂另类av| 亚洲午夜视频| 国产一区二区视频免费在线观看| 蜜臀av性久久久久蜜臀av麻豆| www.桃色.com| 成人黄色a**站在线观看| 欧美大片免费播放器| 国产欧美日本一区二区三区| 182在线观看视频| 亚洲一区二区三区免费视频| 91久久国产综合久久91| 欧美日韩不卡一区| 刘亦菲久久免费一区二区| 亚洲欧美精品在线| 黄色免费在线观看网站| 久久人人爽人人爽人人片av高清| 中文字幕在线看片| 91九色综合久久| 日韩精选在线| 中文字幕在线观看一区二区三区| 国产精品成人一区二区网站软件| heyzo国产| 经典三级在线一区| 麻豆国产精品一区| 国产精品久99| 国产成人精品a视频一区| 欧美三级日本三级少妇99| 午夜精品一区二区三| 亚洲欧美日韩网| 深夜国产在线播放| 国产精品入口免费视频一| 成人18夜夜网深夜福利网| 亚洲国产欧洲综合997久久| 国产精品多人| 天堂网在线免费观看| 91美女视频网站| 欧美高清视频一区二区三区| 色悠悠亚洲一区二区| 亚洲国产精品一| 中文字幕在线看视频国产欧美| 成入视频在线观看| 91精品视频大全| 国产一区二区在线| 日韩激情视频一区二区| 精彩视频一区二区| 一级二级黄色片| 欧美日韩免费一区| 免费激情视频网站| 久久综合久久八八| jizz亚洲女人高潮大叫| 麻豆亚洲一区| 99国产精品久久久久久久成人热| 国产大片一区二区三区| 中文字幕乱码日本亚洲一区二区| 青青草成人av| 亚洲第一福利网站| 污污片在线免费视频| 国产欧美在线观看| 欧美日韩伦理| 日本成人黄色网| 久久久五月婷婷| 免费黄色网址在线| 亚洲成人精品久久久| 久久五月精品中文字幕| 91在线观看免费| 久久久久久免费视频| 亚洲 欧美 日韩系列| 国产亚洲成aⅴ人片在线观看| 五月天综合激情| 日韩精品中文字幕在线观看| 91九色在线播放| 国产亚洲精品美女久久久m| 亚洲人人精品| 色婷婷精品久久二区二区密| 夜夜嗨av一区二区三区中文字幕 | 开心久久婷婷综合中文字幕| 日韩av一区二区三区在线观看| 亚洲欧美日韩国产一区二区| 精品国产一区在线| 欧美性极品xxxx做受| 青青色在线视频| 国产精品678| 久久伦理在线| 女同激情久久av久久| |精品福利一区二区三区| 97在线视频人妻无码| 久久视频国产精品免费视频在线| 精品久久国产一区| www.国产二区| 99riav一区二区三区| 黄色免费av网站| 在线观看欧美视频| 日本电影久久久| 国产高清不卡无码视频| 成人av电影免费在线播放| 中文字幕第15页| 亚洲欧美日韩国产精品| 丁香婷婷久久| 欧美xxxx吸乳| 91色综合久久久久婷婷| 中文字幕在线观看视频免费| 日韩亚洲欧美中文高清在线| 久久伊人影院| 国产免费黄视频| 欧美极品另类videosde| 国产精品美女一区| 久久久这里只有精品视频| 国产亚洲一区| 中文字幕一区二区三区四| 亚洲国产另类av| 激情小视频在线| 99久久99久久精品国产片| 国产亚洲毛片| 香蕉成人在线视频| 亚洲精品在线电影| 国产精欧美一区二区三区蓝颜男同| 亚洲精品成人久久久998| 国产成人在线视频免费播放| 毛片毛片女人毛片毛片| 北条麻妃99精品青青久久| 老牛精品亚洲成av人片| 男女污污的视频| 亚洲成人资源在线| 日韩免费啪啪| 精品国产乱码久久久久| 久久综合综合久久综合| 在线免费观看毛片| 久久精品国产欧美亚洲人人爽| 国产精品极品在线观看| 久久婷婷综合色| 精品国产鲁一鲁一区二区张丽| 欧洲不卡视频| 欧美极品jizzhd欧美| 国产精品乡下勾搭老头1| 天堂网中文字幕| 久久久伊人日本| 亚洲最大黄网| 女人裸体性做爰全过| 精品呦交小u女在线| 欧美专区视频|