精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升 精華

發(fā)布于 2024-9-3 11:53
瀏覽
0收藏

1. GMeLLo 提出的背景

1.1 多跳問答

多跳問答的難度往往比較大,因為不僅要追溯事實,還要聚合與串聯(lián)事實。

事實的來源可以是知識圖譜、表格、自由格式文本,或者是這些來源的異構(gòu)組合。

隨著大型語言模型的發(fā)展,基于提示的方法搭配可選的檢索模塊已成為處理多跳問答的常用手段,但以往多數(shù)工作側(cè)重于靜態(tài)信息庫。

1.2 知識編輯

知識編輯目前有兩種主流方案:修改模型參數(shù)和保留模型參數(shù)。

1.2.1 修改模型參數(shù)

可進一步細分為元學習和定位-編輯方法。

? 元學習方法(meta-learning):利用超網(wǎng)絡來學習編輯大型語言模型所需的調(diào)整。

? 定位-然后-編輯(locate-then-edit)范例,首先識別與特定知識對應的參數(shù),然后通過直接更新目標參數(shù)來進行修改。

2.2.2 保留模型參數(shù)

在保留模型參數(shù)的情況下,主要方法是引入額外的參數(shù)或外部存儲器。

? 額外參數(shù)范式( additional parameters ):將額外的可訓練參數(shù)納入語言模型。這些參數(shù)在修改后的知識數(shù)據(jù)集上進行訓練,而原始模型參數(shù)保持不變。

? 基于存儲器的模型(memory-based models):將所有編輯的示例存儲在存儲器中,并使用檢索器為每個新輸入提取相關的編輯事實,從而引導模型生成編輯后的輸出。

2. GMeLLo

基于以上背景,作者提出了 GMeLLo (Graph Memory-based Editing for Large Language Models)方法,通過整合大語言模型和知識圖譜(Knowgledge Graph),解決知識編輯后的多跳問答任務。

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升-AI.x社區(qū)圖片

如上圖,在更新了有關英國首相的信息后,顯然相應的配偶信息也應予以修改。

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升-AI.x社區(qū)圖片

如上圖所示,GMeLLo  包括以下關鍵步驟:

? 借助大型語言模型將編輯后的事實句子轉(zhuǎn)化為三元組,利用這些三元組來更新知識圖譜,確保其信息保持最新。

? 對于給定的問題,利用大型語言模型提取其關系鏈。通過模板填充,將關系鏈轉(zhuǎn)換為正式查詢,并用于搜索更新后的知識圖譜。

? 依據(jù)問題檢索最相關的編輯事實,并通過大型語言模型依據(jù)這些事實生成答案。

? 當大型語言模型提供的答案與知識圖譜的答案相沖突時,將知識圖譜的答案作為最終回應。

3.1 從知識庫中提取三元組

將知識圖譜 Wikidata 用作基礎知識庫。當收到更新的事實時,運用大型語言模型從句子中提取實體并確定它們的關系(從預定義列表中選擇一個關系)。生成經(jīng)過編輯的事實三元組,然后用于更新知識圖譜。需要依據(jù)主體實體和關系來識別知識圖譜中的連接,打破這些連接,并基于三元組建立新的連接。

通過上下文學習,以確保大型語言模型對任務有深入理解。此外,鑒于大型語言模型可能生成不在預定義關系列表中的關系,使用檢索模型從預定義關系列表中識別出最相似的關系(即嵌入空間中最接近的關系)。檢索模型的融入讓三元組提取過程更強大。

3.2 從問題中提取關系鏈

隨著世界快速發(fā)展,大型語言模型的訓練數(shù)據(jù)可能很快過時。

不過,由于語言模式的演變通常較為緩慢,大型語言模型的大量訓練數(shù)據(jù)應當能使其有效地理解大多數(shù)句子模式。

借助大型語言模型從句子中提取關系鏈,涵蓋問題中提到的實體及其與其他未識別實體的關系。與從知識庫中提取三元組提取類似,讓大型語言模型從預定義列表中選擇一個關系,以減少相同關系的不同表述。

以 MQuAKE-CF 數(shù)據(jù)集中的一個問題句子為例,

問題:

Eeyore 的創(chuàng)作者的孩子的國籍所在國家的首都是什么?

What is the capital of the country of citizenship of the child of the creator of Eeyore?

關系鏈

Eeyore->創(chuàng)作者->?x->孩子->?y->國籍->?z->首都->?m

Eeyore->creator->?x->child->?y->country of citizenship->?z->capital->?m

示例中的這個問題需要一個 4 跳的推理過程。

以“Eeyore”作為關注的已知實體,要得出最終答案,需要依次識別其創(chuàng)作者“?x”,接著是創(chuàng)作者的孩子“?y”,獲取孩子的國籍“?z”,最終檢索該國的首都“?m”。所有的關系,如“創(chuàng)作者”“孩子”“國籍”和“首都”,都從預定義的關系列表中選取。關系鏈囊括了得出答案所需的全部關鍵信息。

為了讓大型語言模型能夠提取關系鏈并以結(jié)構(gòu)化模板生成輸出,在提示中提供了若干關系鏈提取的示例用于模型的上下文學習。具體提示詞如下:

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升-AI.x社區(qū)圖片

? 以上提示詞用于從知識庫中提取三元組

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升-AI.x社區(qū)圖片

? 以上提示詞用于從問題中提取三元組

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升-AI.x社區(qū)圖片

? 以上提示詞用于基于LLM的QA

3.3 將關系鏈轉(zhuǎn)換為正式查詢

一旦獲取關系鏈,接下來就要把已知實體和關系整合到正式的查詢模板中。

考慮以 RDF 格式展示知識圖譜并以 SPARQL 查詢,比如:

PREFIX ent: <http://www.kg/entity/>
PREFIX rel: <http://www.kg/relation/>
SELECT DISTINCT?id?label WHERE {
  ent:E0 rel:R0?x.
  ?x rel:R1?y.
  ?y rel:R2?z.
  ?z rel:R3?id.
  ?id rdfs:label?label.
}LIMIT 1

“ent”和“rel”分別作為實體和關系的前綴。

標識符“E0”在知識圖譜中唯一代表“Eeyore”,而“創(chuàng)作者”“孩子”“國籍”和“首都”的標識符分別記為“R0”“R1”“R2”和“R3”。

在識別出實體“?id”后,檢索其字符串標簽“?label”作為最終答案。

3.4 整合LLM-QA與KG-QA

3.4.1 LLM-QA:基于大型語言模型的問答

使用預訓練的 Contriever 模型從一系列編輯過的事實句子中檢索最相關的事實。然后,大型語言模型依據(jù)問題和這些相關事實生成答案。與 MeLLo 中的“拆分-回答-檢查”流程相比,在事實準確提供的情況下,這種基于大型語言模型的問答方式預計更簡便,并能得出更準確的結(jié)果。

Contriever是一個 Embedding模型,用于Dense Retrieval

Github地址:https://github.com/facebookresearch/contriever

然而,處理多跳問題,尤其是那些編輯的事實與中間跳有關的問題時,往往無法準確檢索到相關信息。

3.4.2 KG-QA:基于知識庫的問答

為了解決基于大型語言模型問答的難題,整合來自基于知識庫的問答的響應,以優(yōu)化大型語言模型的輸出。

當關系鏈和事實三元組準確推導出來后,基于知識庫的問答系統(tǒng)會提供正確答案。

然而,如果關系鏈提取有誤,知識圖譜中的搜索路徑可能失效,導致基于知識庫的問答系統(tǒng)無法產(chǎn)生輸出。在這種情況下,將大型語言模型的響應視作最終答案。

4. 效果評估

4.1 評估數(shù)據(jù)集

MQuAKE是一個聚焦于多跳問答的測試數(shù)據(jù)集,主要包括兩個數(shù)據(jù)集:MQuAKE-CF、MQuAKE-T。

? MQuAKE-CF:在 MQuAKE-CF 上的實驗是基于完整數(shù)據(jù)集的隨機抽樣子集進行的,總計包含 3000 個實例(2、3、4 跳問題各 1000 個實例),專為反事實編輯而設。每個問題都與一個或多個編輯相關,用于檢驗知識編輯方法處理反事實編輯的有效性。

? MQuAKE-T,專為時間知識的更新定制。由 1868 個實例構(gòu)成,每個實例都與一個現(xiàn)實世界的事實變化相關。其旨在評估知識編輯方法在運用當代事實數(shù)據(jù)更新過時信息方面的效能。

4.2 參數(shù)設置

具體而言,測試樣本被分組處理:

? MQuAKE-CF:每組樣本數(shù) n 取值于 {1, 100, 1000, 3000}

? MQuAKE-T:每組樣本數(shù) n 取值于 {1, 100, 500, 1868}

4.3 測試基準

? MEND:通過訓練一個超網(wǎng)絡,基于編輯的事實轉(zhuǎn)換原始微調(diào)梯度來生成權(quán)重更新。

? MEMIT:更新各層的前饋網(wǎng)絡以納入所有相關事實。

? MeLLo:采用基于內(nèi)存的方式進行多跳問答,將所有更新的事實存儲于外部內(nèi)存中。

4.4 主要結(jié)果

GMeLLo:結(jié)合知識圖譜的 LLM 多跳問答技術(shù),效果顯著提升-AI.x社區(qū)圖片

如上圖,GMeLLo 在 MQuAKE-CF 數(shù)據(jù)集和 MQuAKE-T 數(shù)據(jù)集上均顯著優(yōu)于所有現(xiàn)有方法,尤其在處理大量編輯時表現(xiàn)出色。

MeLLo 的性能下降主要歸因于隨著編輯數(shù)量的增加,它在識別相關事實方面遭遇挑戰(zhàn)。

當 k = 1 時,模型僅使用與輸入問題直接相關的事實作為上下文。然而,隨著 k 的增大,模型在從更廣泛的內(nèi)存中辨別相關事實時面臨困境。

GMeLLo 模型通過采用明確的符號圖表示來化解這一難題,增強了系統(tǒng)有效更新和檢索相關事實的能力。這一特性顯著提升了 GMeLLo 的可擴展性,使其非常適用于需要管理大量快速變化信息的實際問答應用。

使用兩個更大的模型,GPT-3.5-Turbo-Instruct 和 GPT-3.5-Turbo 在 MQuAKE-CF 數(shù)據(jù)集上對 MeLLo 和 GMeLLo 進行評估,k = 3000。MeLLo 和 GMeLLo 與 GPT-3.5-Turbo-Instruct 的準確率分別為 30.7%和 51.4%。

而GMeLLo在使用GPT-3.5-Turbo時準確率高達66.4%,但當與MeLLo結(jié)合使用時,該模型卻頻繁出錯。

這些發(fā)現(xiàn)表明,GMeLLo即使在擴展到更大型的語言模型時,依然能夠保持良好的性能。

5. 局限性

? 未借助更為精妙的提示技術(shù),例如思維鏈(CoT),來實現(xiàn)更精準的多跳推理。

? 未優(yōu)化預定義的關系列表,以提升其準確性。

? 可以進一步強化知識圖譜,以支持更復雜的問答,比如涉及歷史信息的查詢。

本文轉(zhuǎn)載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2024-9-3 17:46:58修改
收藏
回復
舉報
回復
相關推薦
一区二区在线观看免费视频播放| 女人色偷偷aa久久天堂| 色综合欧美在线视频区| 任我爽在线视频精品一| 国产乱码一区二区| 精久久久久久| а√中文在线天堂精品| av在线亚洲色图| 婷婷综合在线观看| 日韩欧美99| 空姐吹箫视频大全| 免费久久精品视频| 久久久亚洲福利精品午夜| 国产精品一二三区在线观看| www.久久久久爱免| 欧美丝袜第一区| 国产免费一区二区三区四在线播放| 亚洲xxx在线| 日本欧美一区二区在线观看| 欧美激情在线观看视频| 精品无码国产污污污免费网站| 欧美一级大片在线视频| 色偷偷88欧美精品久久久| 精品嫩模一区二区三区| 国产对白叫床清晰在线播放| 高清不卡在线观看| 国产欧美精品在线播放| 91精品国产乱码久久久张津瑜| 欧美jizz| 亚洲免费视频一区二区| 波多野吉衣在线视频| 粉嫩91精品久久久久久久99蜜桃 | 182在线视频| 国产精品亚洲四区在线观看| 91电影在线观看| 毛片在线播放视频| 婷婷av在线| 亚洲男人天堂一区| 亚洲精品一区二区三区四区五区 | 99国产精品国产精品毛片| 91精品在线一区二区| 精品久久国产97色综合| 无人在线观看的免费高清视频| 好吊日av在线| 亚洲一区自拍偷拍| 久久综合亚洲精品| av免费在线观| 亚洲卡通动漫在线| 青少年xxxxx性开放hg| 1区2区3区在线观看| 国产欧美一区二区三区沐欲| 欧美日韩在线精品| 日韩二区三区| 国产欧美日韩综合| 亚洲成人自拍视频| shkd中文字幕久久在线观看| 国产午夜三级一区二区三| 欧美日韩电影一区二区| 青青操在线视频| 国产亚洲美州欧州综合国| 精品国产乱码久久久久| 美州a亚洲一视本频v色道| 久久久久成人黄色影片| 日本一区二区三区在线视频| 你懂的视频在线| 26uuu亚洲综合色| 欧洲亚洲一区二区| 一区二区三区视频在线观看视频| 中文子幕无线码一区tr| 四虎影院一区二区| 欧美xxxx免费虐| 欧美日韩精品在线视频| 韩国日本美国免费毛片| 久久69成人| 欧美日韩精品综合在线| 日本中文字幕精品| 香蕉精品久久| 日韩在线观看高清| 免费麻豆国产一区二区三区四区| 在线观看一区视频| 日韩av手机在线观看| 91亚洲视频在线观看| 国产91精品入口| 农村寡妇一区二区三区| 一级毛片视频在线观看| 一区二区三区成人| 成人观看免费完整观看| 欧美激情三区| 亚洲电影成人av99爱色| 国产传媒国产传媒| 欧美精品日本| 国产成人精品免高潮在线观看| 中文字字幕在线观看| 高清不卡在线观看| 欧洲久久久久久| 久久久123| 欧美性极品少妇| 国产精品成人免费一区久久羞羞| 国产精品三级| 欧美激情在线一区| 做爰视频毛片视频| 不卡电影一区二区三区| 一区二区三区不卡在线| 理论不卡电影大全神| 欧美日韩视频在线第一区 | www.欧美日本| 136导航精品福利| 一区二区三区高清国产| 国产一级片网址| 美女视频免费一区| 久久99影院| 羞羞的网站在线观看| 日本电影亚洲天堂一区| 大乳护士喂奶hd| 一本到12不卡视频在线dvd| 国产成人精彩在线视频九色| 欧美特级特黄aaaaaa在线看| 中文字幕一区二区三区在线观看| 久久久免费视频网站| 97人人澡人人爽91综合色| 日韩一中文字幕| 欧美 亚洲 另类 激情 另类| 91免费小视频| 欧美综合在线播放| 精品视频一区二区三区在线观看| 一区二区三区美女xx视频| 日韩欧美a级片| 国产成人精品影院| 一本一道久久久a久久久精品91| 亚洲欧美电影| 亚洲精品99999| 久久久久亚洲av成人片| 国产一区二区美女诱惑| 一区二区三区精品国产| aaaa欧美| 中文字幕免费精品一区高清| 波多野结衣视频观看| 久久久久九九视频| 成人av一级片| 亚州精品视频| 51ⅴ精品国产91久久久久久| 婷婷丁香花五月天| 午夜不卡av免费| 日本五十肥熟交尾| 亚洲激情综合| 久久99久久精品国产| 擼擼色在线看观看免费| 亚洲激情在线观看| 日韩精品――中文字幕| 成人黄色在线看| 国产中文字幕二区| 里番精品3d一二三区| 久久99热这里只有精品国产| 亚洲AV无码一区二区三区性 | 一个人看的www久久| 波多野结衣影片| 亚洲国产精品黑人久久久 | 国产精品2024| 男人天堂av片| 亚洲精品一级二级三级| 日韩女在线观看| 天堂中文8资源在线8| 欧美精品久久一区二区三区| 久热这里有精品| www.亚洲激情.com| 国产超级av在线| 欧美日韩激情| 91色琪琪电影亚洲精品久久| 18av在线播放| 亚洲激情视频网站| 中国a一片一级一片| 国产精品成人一区二区三区夜夜夜 | 精品人妻一区二区三区香蕉| 日韩国产在线观看一区| 中文精品视频一区二区在线观看| 国产精品一区免费在线| 久久久久久高潮国产精品视| 日本一二三区在线视频| 欧美日本一道本| 久久综合亚洲色hezyo国产| 91老师国产黑色丝袜在线| 免费看污污网站| 欧美激情日韩| 欧美日韩电影一区二区三区| 亚洲最大的免费视频网站| 欧美精品videosex牲欧美| 日韩福利一区二区| 欧美一区二区三区日韩| 久久国产精品系列| 国产精品乱码妇女bbbb| 在线精品视频播放| 日韩av不卡在线观看| 日本免费黄色小视频| 在线观看欧美理论a影院| 国产伊人精品在线| 人狥杂交一区欧美二区| 久久视频这里只有精品| 色在线免费视频| 日韩欧美色综合网站| 无码人妻精品一区二区| 一区二区国产视频| 毛片视频免费播放| 99久久夜色精品国产网站| 奇米影视四色在线| 国产情侣一区| 超碰10000| 日本不卡免费一区| 六月婷婷久久| 亚洲午夜精品| 成人久久一区二区三区| 最近在线中文字幕| 欧美高清不卡在线| 日本精品在线| 一区二区三区在线播放欧美| 欧洲av在线播放| 欧美一级在线免费| 中文字幕第99页| 欧美性猛交xxxx乱大交蜜桃| 久久久久久久久精| 综合在线观看色| 正在播放国产对白害羞| 久久久久成人黄色影片| 中文成人无字幕乱码精品区| 国产乱码字幕精品高清av| 九色porny91| 久久一二三四| 色欲av无码一区二区人妻| 精品电影一区| 亚洲 欧美 综合 另类 中字| 欧美一区二区| 中文字幕剧情在线观看一区| 成人在线免费视频观看| 日本免费高清一区| 亚洲免费专区| 久久久99爱| 日本三级久久| 久久综合色一本| 亚洲欧洲色图| 欧美午夜精品理论片a级大开眼界| 精品国产一区二区三区不卡蜜臂 | 日韩高清电影免费| 国产亚洲精品久久飘花| 国内精品免费| 黄色小网站91| 一区二区三区视频免费观看| 蜜桃网站成人| 你懂的一区二区三区| 欧美系列一区| 日韩精品一区二区三区免费观影 | 日本中文字幕在线视频| 日韩亚洲精品电影| 国产欧美久久久久久久久| 久久久国产精品视频| 成人在线播放免费观看| 欧美成人免费小视频| 日本欧美电影在线观看| 久久久噜久噜久久综合| 91超碰在线播放| 国内精品在线一区| 韩国主播福利视频一区二区三区| 秋霞成人午夜鲁丝一区二区三区| 国产亚洲一区二区手机在线观看| 国产精品日韩欧美| 国产亚洲精aa在线看| 国产chinese精品一区二区| 成人在线超碰| 欧美精品v日韩精品v国产精品| 精品视频国产| 秋霞在线一区二区| 亚洲性人人天天夜夜摸| 国产精品视频一区二区三区四区五区| 丝袜美腿亚洲一区二区图片| 天天操,天天操| 国产精品2024| 美女爆乳18禁www久久久久久| 中文av一区特黄| 国产一级黄色av| 一本久道中文字幕精品亚洲嫩| 亚洲系列第一页| 亚洲大胆人体视频| 国产福利小视频在线| 欧美美女15p| 日韩电影免费观| 5566av亚洲| 6080亚洲理论片在线观看| 麻豆av一区二区三区久久| 日本a口亚洲| 青青草国产免费| 日韩精品欧美精品| 精品国产乱码久久久久夜深人妻| 91免费观看在线| 少妇视频一区二区| 亚欧色一区w666天堂| 又骚又黄的视频| 亚洲第一网站男人都懂| 9色在线视频| 久久久久久网址| 粉嫩91精品久久久久久久99蜜桃 | 久久精品国产亚洲夜色av网站| 日韩精品免费一区| 日韩在线一区二区三区| 老熟女高潮一区二区三区| 国产欧美日韩综合精品一区二区| 久久久美女视频| 欧美日韩国产系列| 天堂网www中文在线| 久久久国产精彩视频美女艺术照福利| 男人av在线播放| 波多野结衣精品久久| 色综合天天爱| 国产在线青青草| 粉嫩欧美一区二区三区高清影视 | 欧美三级伦理在线| r级无码视频在线观看| 久久99精品国产.久久久久| 免费无码一区二区三区| 亚洲免费资源在线播放| 成人小视频在线播放| 亚洲电影免费观看高清| 成人区精品一区二区不卡| 国产精品高清在线观看| 亚洲激情播播| 僵尸世界大战2 在线播放| 国产一区91精品张津瑜| 91av手机在线| 欧美无乱码久久久免费午夜一区| 四虎成人免费在线| 久久久久在线观看| 97se亚洲| 日韩 欧美 视频| 国产91丝袜在线播放九色| 97成人资源站| 欧美日产国产精品| www.av在线播放| 国产精品视频网| 大片网站久久| 久久婷婷国产91天堂综合精品| 久久久久久99精品| 日韩中文字幕高清| 国产亚洲成av人片在线观看桃| 免费看av不卡| 欧美一区二区三区四区夜夜大片 | 国产精品成人av| 色一情一区二区| 亚洲色图另类专区| 国产男男gay网站| 美女扒开尿口让男人操亚洲视频网站| 欧美一级在线| 国产高清免费在线| 国产一区91精品张津瑜| 欧美精品一区二区蜜桃| 精品久久久久一区| 国产高清视频色在线www| 久99久视频| 老牛影视一区二区三区| 丰满的亚洲女人毛茸茸| 欧美日韩免费一区二区三区视频 | 97在线视频免费播放| 秋霞在线一区| 最新中文字幕2018| 亚洲人成影院在线观看| 成人激情四射网| 欧美一区二区.| 日韩.com| 色婷婷综合在线观看| 亚洲亚洲精品在线观看| 视频一区二区三区在线看免费看| 日本精品中文字幕| 天天射天天综合网| 国产精品一级无码| 欧美三级免费观看| 91在线导航| 成人看片在线| 爽爽淫人综合网网站| 久久精品亚洲a| 欧美精品一区二区三区蜜桃视频| 天天综合av| 裸体裸乳免费看| av成人免费在线观看| 在线免费看毛片| 国内自拍欧美激情| 精品国产99| 天天干天天色天天干| 香蕉av福利精品导航| av免费在线一区二区三区| 97超碰最新| 日本亚洲视频在线| 黄色小视频在线免费看| 在线观看欧美日韩国产| 一区二区三区高清在线观看| 欧美日韩第二页| 夜夜精品浪潮av一区二区三区| 亚洲色偷精品一区二区三区| 成人a免费视频| 国产农村妇女精品一区二区| 免费在线观看a级片| 亚洲欧美日韩一区二区在线| 在线精品国产亚洲| 天天爽夜夜爽一区二区三区| 精品久久久久久久久中文字幕|