精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT性能最多提升214%,刷新七個榜單!IDEA、港科大廣州等提出ToG思維圖譜

人工智能
與IO、CoT、CoT-SC等不同prompting策略下的ChatGPT(GPT-3.5)相比,Think-on-Graph在所有數據集上的表現都顯著更優。以Zeroshot-RE數據集中的對比為例,基于CoT的ChatGPT精度為28.8%,而同底座的Think-on-Graph精度為88%。

大模型雖好,但「一本正經的胡說八道」的問題該怎么解?

在金融、法律、醫療等嚴肅領域,幻覺問題一直是制約大模型落地應用的主要瓶頸。

如何彌補這部分缺陷,使更多行業能快速加入對新一輪生產力變革的探索,是當下AI研究的重要課題,其中,大模型(LLM)與知識圖譜(KG)的融合來彌補前者的能力短板,是頗受關注的研究方向。

最近,來自IDEA研究院、微軟亞洲研究院、香港科技大學、香港科技大學(廣州)、廈門大學和美國南加州大學的研究團隊推出Think-on-Graph(思維圖譜)技術,通過LLM與KG的緊耦合交互,驅動LLM agent在知識圖譜上「思考」,逐步搜索推理出最優答案。

圖片圖片

論文地址:https://arxiv.org/abs/2307.07697

代碼鏈接:https://github.com/IDEA-FinAI/ToG

下面,我們先用一個刁鉆的問題來認識Think-on-Graph的「腦回路」:如何客觀評價段譽和洪七公誰的武功更高強?(段譽出自《天龍八部》,洪七公出自《射雕英雄傳》,兩者未在同一部作品中出現。)

首先看看地表最強大模型GPT-4是怎么說的:

圖片圖片

由于LLM是經由海量碎片化語料訓練而成,此類線索分析型的推理問題確實對其挑戰很大。從回答中不難看出,除了幻覺現象的出現之外,在比較兩位人物的武功水平時,GPT-4著重羅列表象事實,缺乏深度的邏輯分析。那么, Think-on-Graph是怎樣解題的呢?

圖片圖片

首先,圖譜知識顯示,六脈神劍是大理段氏最強武功,而一陽指是大理段氏常用武功,大模型由此判斷「六脈神劍」強于「一陽指」;繼而推理出段譽武功強于以一陽指冠絕江湖的一燈大師。然后,又根據圖譜上的「一燈大師與洪七公同屬『華山四絕』」,推理出兩者武功相當。最終,段譽>一燈大師,而一燈大師=洪七公,于是得出結論:段譽武功更高。可見,融合了結構化知識與大模型推理能力的Think-on-Graph,不僅條理清晰,還提供了可追溯的推理鏈條。LLM從「翻譯官」變「跑腿」,與KG緊耦合實現深度推理眾所周之,大模型擅長理解、推理、生成與學習;知識圖譜則因其結構化的知識存儲方式,在邏輯鏈條推理上表現更佳,且具備更好的推理透明度與可信度。兩者是互補度極高的好拍檔,關鍵在于能否找到好的結合方式,據研究人員介紹,目前主流的方法有兩類。第一類是在模型預訓練或微調階段,將知識圖譜嵌入到一個高維向量空間,并與大模型的嵌入向量相融合。但此類方法不僅耗時、耗算力,也無法發揮知識圖譜的許多天然優勢(如:實時知識更新、可解釋性、推理可追溯等)。第二類路徑則利用知識圖譜的知識結構,通過prompt engineering來進行兩者的融合,這之中又分松耦合、緊耦合兩種范式。

圖片圖片

 松耦合范式中的LLM相當于「翻譯官」,理解用戶的自然語言輸入后,將其翻譯成知識圖譜中的查詢語言,將KG上的搜索結果反向翻譯給用戶,這種范式對知識圖譜本身的質量與完整度要求極高,忽略了大模型的內在知識與推理能力。

圖片圖片

 在Think-on-Graph所代表的緊耦合范式中,LLM變身「跑腿」,作為agent在KG的關聯實體上一步一步搜索推理出最優答案。因此,在每一步推理中,LLM都親自參與,與知識圖譜取長補短。在研究中,團隊用以下例子展示了緊耦合范式的優勢:堪培拉所在國家當前的多數黨是哪個黨派?

圖片圖片

 從上面例子中可以看出,ChatGPT由于信息滯后,給出了錯誤答案。松耦合范式下,盡管引入了包含最新信息的KG,但由于缺少「多數黨」信息,導致推理無法完成;而在緊耦合范式中,LLM自行推理出「議會制國家的政府首腦通常也是多數黨領袖」,彌補了KG中的信息缺失,繞道推理出正確答案。Think-on-Graph,高效的緊耦合新范式據研究團隊介紹,Think-on-Graph借鑒了Transformer的beam-search算法思路。該算法為一個可循環的迭代過程,每次循環需先后完成搜索剪枝、推理決策兩個任務。搜索剪枝用于找出最有希望成為正確答案的推理路徑,推理決策任務則通過LLM來判斷已有的候選推理路徑是否足以回答問題——如果判斷結果為否,則繼續迭代到下個循環。我們依然以「堪培拉所在國當前的多數黨是哪個黨派?」為例來解釋。 

圖片圖片

案例:用搜索寬度N=2的beam-search實現Think-on-Graph推理在搜索剪枝任務中,大模型從關鍵詞Canberra出發,匹配到知識圖譜中最接近(或一致)的實體,分別搜索了5個「關系→實體」對,并為它們打分(得分越高,則代表此新實體加入推理路徑中,可正確回答問題的能力越高)。       

圖片圖片

將分數從高到低排序后,LLM保留了得分最高的2個,形成兩條候選推理路徑:接下來,LLM對候選推理路徑進行評估,并將結果以Yes/No的形式反饋給算法。在案例中可見,LLM連續兩輪否決了候選路徑,直到完成第三輪迭代時,LLM才判斷已獲取回答問題的充分信息,因此停止算法迭代,向用戶輸出答案(該答案確為正確答案)。 

圖片圖片

大模型推理如何更可信?可解釋、可追溯、可修正研究團隊表示,Think-on-Graph算法還有效提升了大模型推理的可解釋性,并實現知識的可追溯、可糾錯與可修正。尤其是借助人工反饋與LLM推理能力,發現并修正知識圖譜中的錯誤信息,彌補LLM訓練時間長、知識更新慢的缺點。為測試此能力,我們設計了一個實驗:在前述「段譽與洪七公武功對比」案例的知識圖譜中,故意摻入錯誤信息「大理段氏的最強武功是一陽指,一般武功是六脈神劍」。

圖片圖片

   可見,盡管Think-on-Graph根據錯誤知識得出了錯誤答案,但由于算法內置的「自我反思」能力,當判斷答案可信度不足時,會自動回溯在知識圖譜上的推理路徑,檢查路徑中的所有三元組。此時,LLM將利用自有知識,將疑似有誤的三元組挑選出來,并向用戶反饋分析與糾錯建議。 

圖片圖片

7個新SOTA,深度推理較ChatGPT最多提升214%研究在四類知識密集型任務(KBQA, Open-Domain QA, Slot Filling, Fact Checking)的共9個數據集上,對Think-on-Graph的表現進行了評估。

圖片圖片

與IO、CoT、CoT-SC等不同prompting策略下的ChatGPT(GPT-3.5)相比,Think-on-Graph在所有數據集上的表現都顯著更優。以Zeroshot-RE數據集中的對比為例,基于CoT的ChatGPT精度為28.8%,而同底座的Think-on-Graph精度為88%。當底座模型升級為GPT-4后,Think-on-Graph的推理精度也明顯提升,在7個數據集上取得了SOTA,剩余數據集中的CWQ上也十分接近SOTA。值得注意的是,Think-on-Graph未在上述任何測試數據集上進行過監督學習性質的增量訓練或增量微調,體現出超強的即插即用能力。此外,研究者還發現,即便替換小規模的底座模型(如LLAMA2-70B),Think-on-Graph依然可在多個數據集上超越ChatGPT,這或可為大模型使用者提供一條低算力需求的技術路線選擇。

參考資料:

https://arxiv.org/abs/2307.07697

https://github.com/IDEA-FinAI/ToG

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-03-14 13:25:24

ChatGPT人工智能

2022-10-08 13:13:14

Python程序性能

2023-11-01 18:01:02

改進WakaTime編程

2022-08-17 09:54:57

Java性能優化

2023-04-13 15:40:59

模型論文

2024-07-01 18:04:57

2023-11-09 15:10:00

訓練數據

2025-11-20 08:52:48

2023-03-13 10:49:30

ChatGPT人力資源

2025-06-12 11:56:30

模型框架開源

2024-09-26 06:21:59

Python代碼

2024-09-25 08:00:00

Python文件處理

2025-01-10 08:38:16

2025-01-17 11:07:28

2023-09-05 12:35:47

2024-06-04 00:00:02

實用插件IDEA

2025-02-19 12:00:00

JavaScript代碼數組方法

2024-10-07 10:00:00

Python代碼編碼

2024-09-20 09:37:31

2024-05-21 00:00:00

點贊
收藏

51CTO技術棧公眾號

久久国产精品-国产精品| 蜜臀久久99精品久久久久久宅男| 免费无码av片在线观看| 黄色片在线播放| 麻豆一区二区三| 久久69精品久久久久久国产越南| 一级黄色片毛片| 日韩视频网站在线观看| 亚洲欧美日韩国产手机在线| 国产综合第一页| 一区二区三区在线免费观看视频| 久久久久成人精品免费播放动漫| 中文字幕日韩经典| 在线观看不卡| 日韩中文字幕精品视频| 国产精品果冻传媒| 四虎国产精品免费久久5151| 午夜天堂影视香蕉久久| 亚洲最新在线| 亚洲av成人精品日韩在线播放| 美洲天堂一区二卡三卡四卡视频| 久久久久久久国产| 99在线视频免费| 久久综合另类图片小说| 欧美美女直播网站| 999香蕉视频| 污污片在线免费视频| 国产亚洲欧美激情| 国产精品免费看一区二区三区| 亚洲中文无码av在线| 在线 亚洲欧美在线综合一区| 色天天综合狠狠色| 三级黄色片网站| 中文字幕亚洲在线观看| 欧美写真视频网站| 国产aaa一级片| av老司机免费在线| 亚洲精品国产一区二区精华液| 亚洲国产精品视频一区| 日色在线视频| 99精品黄色片免费大全| 亚洲一区二区三区久久| 这里只有精品免费视频| 国产精品久久久久毛片大屁完整版| 欧美精品手机在线| 女同久久另类69精品国产| 国产真实有声精品录音| 精品一区二区亚洲| 9.1成人看片| 精品三级av在线导航| 欧美大片日本大片免费观看| 日韩在线一区视频| 日韩精品一页| 欧美日韩国产综合一区二区 | 中文字幕在线三区| 中文字幕一区日韩精品欧美| 亚洲狠狠婷婷综合久久久| 国产系列电影在线播放网址| 久久网站最新地址| 欧美精品一区二区三区在线四季 | 不卡在线观看av| 高清视频一区| 人人妻人人澡人人爽人人欧美一区| 国产高清久久久久| 97人人模人人爽人人少妇| 国内精品国产成人国产三级| 国产精品中文字幕欧美| 91精品国产高清久久久久久91裸体| 国产乱人乱偷精品视频| 狠狠色狠狠色合久久伊人| 92国产精品视频| 国产色视频在线| 国产一区二区久久| 国新精品乱码一区二区三区18| 国精品人妻无码一区二区三区喝尿| 国产999精品久久| 国精产品一区二区| 国产特黄在线| 一区在线观看视频| 国产高清不卡无码视频| 9999精品成人免费毛片在线看| 午夜精品福利一区二区三区av| 日本毛片在线免费观看| 国产一区二区主播在线| 91麻豆精品久久久久蜜臀| 超级砰砰砰97免费观看最新一期 | 亚洲国产精品va在线看黑人动漫| 国产精品嫩草av| 欧美一级精品片在线看| 美女撒尿一区二区三区| 日本中文字幕免费| 日本美女一区二区三区| 3d精品h动漫啪啪一区二区| 黄色成人一级片| 国产欧美一区二区三区在线看蜜臀| 一区二区三区四区欧美日韩| 丰满大乳少妇在线观看网站| 色婷婷亚洲一区二区三区| 国产三级生活片| 欧美尿孔扩张虐视频| 中文字幕一区日韩电影| 久久久精品人妻一区二区三区四 | 亚洲精品日韩专区silk| av免费播放网址| 成人国产精品久久| 国产午夜精品理论片a级探花| 亚洲国产精品一区二区久久hs| 樱桃成人精品视频在线播放| 国产女同一区二区| 亚洲 欧美 激情 小说 另类| 亚洲美腿欧美偷拍| 国产裸体舞一区二区三区| 精品一区二区三区中文字幕视频 | 天堂资源在线中文| 精品欧美激情精品一区| 91日韩精品视频| 亚洲婷婷影院| 欧美激情综合色综合啪啪五月| 四虎影院在线免费播放| 国产不卡免费视频| 亚洲一区二区在线免费观看| 蜜桃视频www网站在线观看| 欧美久久一二区| 丰满圆润老女人hd| 91精品一区二区三区综合在线爱| 国产激情久久久久| 污视频软件在线观看| 亚洲精品乱码久久久久久久久 | 亚洲精品视频二区| 久草视频中文在线| 久久99国产精品久久| 神马影院一区二区| 免费看av不卡| 日韩精品高清在线| 国产精彩视频在线观看| 国产精品亚洲一区二区三区在线| 日韩中文字幕一区二区| 欧美aa视频| 亚洲欧美综合精品久久成人| 丰满少妇乱子伦精品看片| 国产黑丝在线一区二区三区| 亚洲AV无码成人精品一区| 99re久久| 在线观看日韩视频| 中文在线观看av| 亚洲国产精品v| 欧洲熟妇精品视频| 清纯唯美日韩| 国产精品视频自拍| √天堂资源地址在线官网| 欧美在线观看视频一区二区三区| 亚洲激情视频小说| 老司机免费视频久久| 欧美18视频| 亚洲欧美在线成人| 伊人伊人伊人久久| 一个人看的www日本高清视频| 欧美激情资源网| 美女少妇一区二区| 我不卡神马影院| 91久久精品国产91久久性色tv| 国产原厂视频在线观看| 日韩一区二区在线观看视频| 黄色一级视频在线观看| 成人激情文学综合网| 尤物av无码色av无码| 色综合久久中文| 国产成人中文字幕| 蜜桃视频在线观看www社区| 51久久夜色精品国产麻豆| 手机在线免费看片| 波多野洁衣一区| wwwxxx黄色片| 欧美电影《睫毛膏》| 91九色偷拍| 草草视频在线观看| 国产亚洲美女久久| 国产精品九九九九| 亚洲无人区一区| 爱爱免费小视频| 国产一区在线观看麻豆| 亚洲不卡中文字幕无码| 国产精品入口久久| 91亚洲va在线va天堂va国| h片在线观看| 有码中文亚洲精品| 亚洲男人天堂久久| 91黄色免费版| 久草资源在线视频| 久久九九影视网| 日韩av片免费观看| 国产欧美另类| 手机成人av在线| 蜜桃久久久久| 国产一区二中文字幕在线看| 欧美大片黄色| 在线播放日韩av| 精品国产区一区二| 色老汉av一区二区三区| 欧美日韩精品在线观看视频| 久久久久久久综合日本| 三级黄色片播放| 日韩黄色免费网站| 国产传媒久久久| 三级电影一区| 久久青青草原一区二区| 精品国产一区二| 国产精品99久久久久久人| 色图在线观看| 中文字幕亚洲综合| 日本天堂在线| 欧美美女直播网站| 日韩在线 中文字幕| 亚洲精品菠萝久久久久久久| 久久久视频6r| 99免费精品视频| 两女双腿交缠激烈磨豆腐 | 岛国毛片在线播放| 久久久国产亚洲精品| 91国在线高清视频| 手机亚洲手机国产手机日韩| 久久精品成人一区二区三区蜜臀 | 污污的网站在线免费观看| 伊人久久免费视频| 日韩一区二区三区中文字幕| 日韩视频永久免费| 亚洲天堂aaa| 91国内精品野花午夜精品| 日韩经典在线观看| 一区二区三区在线免费| 免费看特级毛片| 国产精品入口麻豆九色| 自拍偷拍中文字幕| 91在线观看地址| 欧美激情 亚洲| 国产精品99久久久久久久女警| 中文字幕 日韩 欧美| 日本欧美加勒比视频| 日韩一级片播放| 天堂资源在线中文精品| 欧美日韩在线视频一区二区三区| 狠狠色丁香久久综合频道| 免费观看中文字幕| 国产精品久久久久久久久久10秀 | 精品视频二区| 亚洲精选在线观看| 手机看片国产1024| 亚洲成人黄色在线| 污污视频在线观看网站| 亚洲国产精品中文| 天堂v视频永久在线播放| 亚洲第一综合天堂另类专| www.黄色小说.com| 欧美草草影院在线视频| 亚洲黄色在线播放| 亚洲高清av在线| 天堂av手机版| 国产婷婷色综合av蜜臀av| 黄色小视频在线观看| 国产一区二区三区丝袜| 在线免费观看黄色av| 日韩视频免费观看| 一二三四区在线观看| 欧美疯狂做受xxxx高潮| av3级在线| 18性欧美xxxⅹ性满足| 欧美xxx网站| 国产欧美精品一区二区三区介绍| 国产亚洲字幕| 国产麻豆日韩| 久久成人av| 伊人久久大香线蕉av一区| 亚洲一区在线| 久久国产精品网| 三级不卡在线观看| 中文字幕精品一区二区三区在线| 国产精品自拍在线| av黄色一级片| 国产欧美va欧美不卡在线| av黄色免费在线观看| 一区二区三区欧美日| 99视频在线看| 欧美日韩在线播放一区| h狠狠躁死你h高h| 亚洲美女av电影| 激情视频在线观看| 午夜精品福利在线观看| 日本精品在线中文字幕| 97夜夜澡人人双人人人喊| 先锋影音国产精品| 亚洲在线色站| 一本色道久久综合亚洲精品不| 久久久国产欧美| 国产suv精品一区二区6| 人妻视频一区二区| 一区二区三区四区不卡在线 | 欧美美女一区二区| 刘亦菲毛片一区二区三区| 国产一区二区日韩| 男男gaygays亚洲| 国产成人福利视频| 一区二区三区四区高清视频| 日本一区二区三区精品视频| 欧美体内she精视频在线观看| 免费观看成人网| 国产999精品久久| 成年人免费视频播放| 亚洲成av人片在线观看无码| 秋霞av一区二区三区| 精品久久久久久久久久久久包黑料| 国产在线网站| 久久久久久成人精品| 91精品亚洲一区在线观看| 欧美主播一区二区三区美女 久久精品人 | 国产经典三级在线| 国产精品视频区1| 亚洲三级精品| www在线观看免费| 国产一区二区免费看| 中文字幕有码在线播放| 天天射综合影视| 超碰人人人人人人| 久久久999精品免费| 亚洲精品粉嫩美女一区| 国产一区二区精品在线| 欧美国产91| 国产精欧美一区二区三区白种人| 国产亚洲自拍一区| 亚洲男人的天堂在线视频| 欧美va日韩va| av网站大全在线| 91精品久久久久久久久久另类 | 亚洲欧美国产制服动漫| zzzwww在线看片免费| 国产精成人品localhost| 我不卡影院28| 亚洲欧美日本一区二区| 中文字幕日韩一区二区| 在线观看黄色网| 中文字幕免费国产精品| 国产麻豆久久| 水蜜桃亚洲精品| 欧美aaaaaa午夜精品| www.99热| 欧美性一二三区| 二区在线观看| 国产精品自拍小视频| 欧美残忍xxxx极端| 欧美日韩中文不卡| 亚洲欧美自拍偷拍色图| 国产精品毛片一区视频播| 久久精品中文字幕| 免费精品一区| 国产高清不卡无码视频| 波多野结衣在线aⅴ中文字幕不卡| 免费在线观看国产精品| 精品少妇一区二区三区视频免付费| 日本三级韩国三级欧美三级| 国产精品一区二区不卡视频| 激情成人综合| 18禁裸乳无遮挡啪啪无码免费| 欧美性极品xxxx做受| 国产视频福利在线| 国产日韩视频在线观看| 亚欧美无遮挡hd高清在线视频| 亚洲一二三不卡| 亚洲高清视频中文字幕| 日韩a在线看| 国产乱人伦真实精品视频| 国产精品久久久久一区二区三区厕所 | 日韩一区国产二区欧美三区| 免费男女羞羞的视频网站在线观看| 国产麻豆乱码精品一区二区三区| 久久成人一区| 很污很黄的网站| 精品欧美一区二区久久| 精品91久久| 五月天av影院| 99热99精品| 一区二区美女视频| 久久久久久久av| 欧美日韩水蜜桃| www.色.com| 欧美色另类天堂2015| 日本不卡不卡| 国产欧美欧洲| 青青草一区二区三区| 久久久一区二区三区四区| 亚洲天堂av图片| youjizz欧美| 亚洲欧美在线精品| 午夜电影久久久| 日日夜夜精品一区| 黑人巨大精品欧美一区二区小视频 | 色综合五月天导航| 久久91成人| 亚洲少妇一区二区三区| 91福利在线观看| 91老司机福利在线| 超碰成人在线免费观看|