精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了

發布于 2024-6-7 12:50
瀏覽
0收藏

徐俊東,本文第一作者。本科畢業于倫敦大學學院(UCL),碩士就讀于新加坡國立大學(NUS)計算機系。主要研究方向為大語言模型的推理能力。


個人主頁:https://aiden0526.github.io/JundongXu/


不使用外部工具也能讓大語言模型(LLMs)實現嚴謹可信的推理,新國立提出 SymbCoT 推理框架:結合符號化邏輯(Symbolic Logical)表達式與思維鏈,極大提升推理質量,魯棒性與可信度。


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區


LLMs 已表現出強大的語義理解能力。但現有的 LLMs 在實行嚴密的邏輯符號推理方面還存在很大的不足,依然需要依賴不同的思維提示方法與外部的符號推理工具進行邏輯推理。如何能讓 LLMs 本身具備強大的符號邏輯推理能力,是目前讓 LLMs 變得更強大的重要研究方向。


最近,新加坡國立大學聯合加州大學圣芭芭拉分校與奧克蘭大學的研究人員共同提出全新的符號邏輯推理框架 SymbCoT(Symbolic Chain-of-Thought),在推理質量,魯棒性與可信度都要超越現有的方法。該工作已被 ACL 2024 錄用。


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區


  • 論文:Faithful Logical Reasoning via Symbolic Chain-of-Thought
  • 論文地址:https://arxiv.org/pdf/2405.18357.pdf
  • 代碼地址:https://github.com/Aiden0526/SymbCoT


當前有效的邏輯推理方法還存在一些缺陷。比如說 CoT 在嚴密的邏輯推理過程中經常會產生邏輯謬誤。引入外部工具的方法,比如 Logic-LM,使用 LLM 來翻譯前提,然后使用外部推理工具如 Prover9 來進行邏輯推導,但這種方法在翻譯的過程中容易出現信息損失或翻譯錯誤導致外部推理工具無法執行。


因此,作者提出 SymbCoT,一個既可以引入嚴密邏輯推理,又能避免翻譯造成的信息損失 / 錯誤導致外部推理工具失效的框架。通過實驗證明,SymbCoT 與直接提示,傳統 CoT 和使用外部推理工具相比,SymbCoT 分別在三個復雜邏輯推理數據集上提升 22.08%、9.31% 和 7.88%。并且在復雜場景推理、可信度、魯棒性等方面優于現有方法。


推特知名人工智能博主隨后轉發了這篇論文,認為這種方法有助于改進高級工作流程,構建更可靠和智能的 LLM AI 代理。該推文僅發布一天,已獲得 6w + 瀏覽量和超過 1200 + 點贊與收藏。


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區


A.SymbCoT 框架介紹


總體來說,SymbCoT 包含四個部分:


1. 翻譯:將邏輯推理任務中的前提與結論翻譯成對應的符號化表達。

2. 規劃:根據結合翻譯前后的自然語言與符號化表達,生成符合邏輯推理的計劃。

3. 執行:嚴格按照對應的邏輯推理規則去驗證結論的邏輯正確性。

4. 驗證:驗證翻譯與執行是否存在錯誤。通過對比翻譯前后的語義信息,去驗證翻譯過程中存在的錯誤并矯正,同時驗證執行過程中是否存在不符合邏輯推理規則的步驟。


以下結合具體的使用示例進行介紹。


  • 任務定義:

作者提出的 SymbCoT 來解決邏輯推理任務。該任務需要從一系列給定的前提中,判斷給定的聲明是否正確


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 翻譯:

首先,SymbCoT 中的翻譯模塊會將給定的前提 P,聲明 S,翻譯成對應的符號化表達 P' 和 S'


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 規劃:

結合翻譯前后的自然語言與符號化信息,規劃模塊會基于相關的邏輯規則去生成一個可執行的邏輯推理計劃


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 執行:

根據翻譯前后結合的信息,配合規劃模塊生成的執行計劃,SymbCoT 會嚴密地遵守邏輯推理規則去執行計劃,對聲明的正確性得出一個初步結論


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 驗證:

該模塊主要有兩個功能。第一:通過比對翻譯前后的語義信息,驗證翻譯中是否存在錯誤;第二:檢查執行過程中的每一步是否遵守了嚴謹的邏輯規則。若任何一個步驟中存在錯誤,驗證模塊會更正發現的錯誤并給出正確的推理步驟與結果


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

B. 實驗結果


作者首先使用 First-order logic 的規則,在三個邏輯推理數據集上進行了測試。實驗證明 SymbCoT 在 GPT3.5-turbo 與 GPT-4 上均能大幅超越傳統 CoT 的性能,甚至超越了使用外部工具的框架(Logic-LM)。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

為了驗證該框架的普適性,作者隨后使用 Constraint Optimization 符號表達的推理規則在另外兩個數據集上進行了測試。實驗證明使用不同的邏輯規則也能帶來更好的性能。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 復雜推理能力:

作者分析了不同方法在不同推理深度上的表現,發現隨著推理深度的增加,SymbCoT 相對于 CoT 的改進變得更加明顯,表明 SymbCoT 在處理更復雜問題上的優勢。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 魯棒性:

作者比較了完全基于 LLM 的推理器與依賴外部解析器的方法(如 Logic-LM)在執行符號表達式語法時的成功率,發現 SymbCoT 在語法執行上的成功率顯著提高,展示了對語法錯誤的顯著魯棒性。


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 可信的邏輯推理:

傳統 CoT 在邏輯推理的時候有時候會基于錯誤的推理過程得到正確的答案,這種情況會誤導使用者從而造成不好的后果。SymbCoT 基于嚴密邏輯推理與驗證,有效消除了傳統 CoT 中過程不可信的缺陷。


ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 符號與自然語言混合表達的優勢:

作者分析了 LLM 從自然語言到符號語言的轉換過程中可能遺漏的關鍵信息或引入的不準確性,發現 SymbCoT 通過結合符號和自然語言表達來糾正翻譯錯誤并增強邏輯推理的有效性。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

  • 不同 LLM 的影響:

作者還比較了 GPT-3.5 和 GPT-4 在三個 FOL 數據集上的表現,發現在升級模型后,SymbCoT 方法的性能提升最為顯著,強調了 SymbCoT 方法與更先進模型之間的協同效應。

ACL 2024 | 讓純LLM實現類人的符號邏輯推理能力,開源框架SymbCoT來了-AI.x社區

總體來說,SymbCoT 是一個更準確、更可信且更魯棒的邏輯推理框架,適合用于要求復雜且精確的邏輯推理任務。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/qYDBKHQmJg4TKXgwIoaapQ??

已于2024-6-7 12:51:39修改
收藏
回復
舉報
回復
相關推薦
av一区二区在线看| 欧美r级在线观看| 亚洲精品在线免费| 国产不卡精品视频| 肉丝袜脚交视频一区二区| 中文字幕亚洲欧美| 极品白嫩的小少妇| 成人不卡视频| 婷婷成人激情在线网| 亚洲一区二区三区欧美| 国 产 黄 色 大 片| 日韩国产一区二| 久久免费在线观看| fc2ppv在线播放| 青青久久av| 欧美一区二视频| 国产熟人av一二三区| aaa大片在线观看| 久久青草国产手机看片福利盒子 | 在线观看日本视频| 欧美欧美全黄| www.亚洲天堂| 男人天堂av电影| 白嫩白嫩国产精品| 91精品国产高清一区二区三区| 国产肥臀一区二区福利视频| 国产不卡在线| 中文字幕精品—区二区四季| 精品国产免费人成电影在线观...| 艳妇乳肉豪妇荡乳av| 免费在线成人| 高清一区二区三区日本久| 神马午夜精品91| 青青草原综合久久大伊人精品 | 香港伦理在线| 91美女蜜桃在线| 国产精品日韩一区二区免费视频| 在线免费观看av片| 鲁大师影院一区二区三区| 久久久亚洲天堂| 久久99久久98精品免观看软件 | 97人妻精品一区二区三区动漫| 国产精品日韩| 欧美一级bbbbb性bbbb喷潮片| 久草视频免费在线| 欧美三级视频| 久久久久久国产免费| 青青草成人免费| 欧美在线首页| 欧美国产乱视频| 欧美黄色免费看| 国产在线不卡| 欧美精品福利视频| 国产一级一级片| 精品白丝av| 亚洲97在线观看| 日韩高清精品免费观看| 亚洲美女黄网| 国内精品免费午夜毛片| 日韩精品无码一区二区| 99av国产精品欲麻豆| 国外视频精品毛片| 西西44rtwww国产精品| 欧美一级播放| 国产精品美女免费看| 在线观看亚洲一区二区| 麻豆91精品视频| 成人做爰www免费看视频网站| 国产精品一二三四五区| 国产精品99久久久久久有的能看| 91九色蝌蚪嫩草| 欧美自拍偷拍第一页| 成人福利电影精品一区二区在线观看 | 黑人巨大精品一区二区在线| 亚洲天堂偷拍| 国产成人精品日本亚洲专区61| 黄色av网站免费| 国产在线视视频有精品| 国产 高清 精品 在线 a| 欧美熟妇乱码在线一区| 久久久久久久网| 亚洲精品中文综合第一页| 国产午夜精品久久久久免费视| 亚洲乱码国产乱码精品精可以看| aa视频在线播放| 日韩美女在线看免费观看| 欧美精品自拍偷拍| 超碰caoprom| 激情综合网站| 欧美激情a在线| 国产一级片av| 成人午夜精品在线| 日本在线免费观看一区| h片在线观看网站| 色综合天天狠狠| 久久6免费视频| 天堂俺去俺来也www久久婷婷| 中文字幕亚洲综合久久| 国产精品30p| 麻豆成人免费电影| 久久久一本精品99久久精品| 日本视频在线免费观看| 五月天激情综合| 爱爱爱爱免费视频| 思热99re视热频这里只精品| 久久国产精品免费视频| 区一区二在线观看| 丁香网亚洲国际| 一区二区三区三区在线| free性护士videos欧美| 欧美精品一级二级三级| 欧美图片一区二区| 亚洲国产综合在线看不卡| 国产精品美女免费看| 亚洲色图21p| 亚洲摸摸操操av| 超碰在线播放91| 欧美日韩一本| 欧美精品激情视频| 国产极品久久久| 国产精品久久久久7777按摩| 免费无码av片在线观看| 精品综合久久88少妇激情| 久久精品视频亚洲| 中文字幕+乱码+中文乱码www| 99久久亚洲一区二区三区青草| 日本久久高清视频| 欧美成人高清视频在线观看| 亚洲色图美腿丝袜| 亚洲黄色小说图片| www.激情成人| 全黄性性激高免费视频| 美国十次综合久久| 久久色精品视频| 91亚洲精品国偷拍自产在线观看| 国产色一区二区| 久久久久免费精品| 亚洲小说图片| 日韩av电影院| 国外av在线| 色婷婷亚洲婷婷| 久久丫精品忘忧草西安产品| 亚洲影院一区| 久久综合入口| 少妇在线看www| 日韩电视剧免费观看网站| 日本天堂在线视频| 99久久99久久久精品齐齐| 日本a视频在线观看| 美国一区二区| 7777精品久久久久久| 午夜av免费在线观看| 日韩欧美高清在线视频| 99re久久精品国产| 噜噜噜在线观看免费视频日韩 | 日韩在线观看| 91精品视频一区| 69xxx在线| 精品国产成人在线影院| 亚洲精品视频在线观看免费视频| 不卡的av电影在线观看| 日韩人妻精品无码一区二区三区| 午夜先锋成人动漫在线| 国产精品久久久久秋霞鲁丝| 亚乱亚乱亚洲乱妇| 日韩女优av电影在线观看| 日本一二三区视频| 久久久久久久久久久久久久久99| 亚欧在线免费观看| 亚洲v在线看| 国产精品一区二| 香蕉视频亚洲一级| 日韩在线观看精品| 国产综合视频在线| 91久久精品午夜一区二区| 黄色录像免费观看| 成人精品小蝌蚪| 国模杨依粉嫩蝴蝶150p| 香蕉久久网站| 久久久久久久久久久久久9999| ww久久综合久中文字幕| 欧美激情啊啊啊| 成人在线二区| 精品久久久久久亚洲综合网| 国产午夜麻豆影院在线观看| 亚洲天堂网中文字| 日本少妇色视频| 精品一区二区三区日韩| 久久这里只有精品23| 色婷婷色综合| 黄色国产精品一区二区三区| 91亚洲精品| 欧美激情啊啊啊| 香蕉视频国产在线观看| 日韩精品久久久久 | 国产精欧美一区二区三区蓝颜男同| 在线观看精品自拍私拍| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 一本一道久久a久久精品综合蜜臀| 国产精品夜夜夜爽阿娇| 91影院在线免费观看| 激情图片中文字幕| 狂野欧美一区| 国产美女主播在线播放 | 中文字幕av一区二区| 好吊视频一区二区三区| 欧美日韩国产综合视频在线观看| 日本一区二区网站| 亚洲男人电影天堂| 色撸撸在线视频| www成人在线观看| 国产吃瓜黑料一区二区| 美国欧美日韩国产在线播放| 一区二区传媒有限公司| 国内精品久久久久久久影视蜜臀 | 成年人网站免费看| 国产sm精品调教视频网站| 午夜国产福利在线观看| 日韩精品欧美精品| 免费看一级大黄情大片| 午夜日韩电影| 日韩video| 国产精品99一区二区三| 亚洲精品在线观看免费| 国产永久精品大片wwwapp| 九色视频成人porny| 国产精品主播在线观看| www.久久爱.cn| 成人亚洲精品| 亚洲一区二区中文字幕| 亚洲电影二区| 成人激情视频在线播放| 国产激情欧美| 国产综合视频在线观看| 黄色成人小视频| 国产在线视频91| 深夜福利亚洲| 国产啪精品视频网站| 久久久久久久性潮| 国产精品自产拍在线观| av成人亚洲| 国产日韩一区在线| 日韩专区视频网站| 91性高湖久久久久久久久_久久99| 福利一区视频| 成人激情视频小说免费下载| crdy在线观看欧美| 91精品视频在线看| 日韩高清一区| 国产欧美日韩伦理| 日韩电影不卡一区| 欧美精品123| 精品国产精品| 在线视频福利一区| 一区二区三区四区电影| 国产毛片久久久久久国产毛片| 欧美三级小说| 欧美日韩亚洲一| 美女精品在线| 看看黄色一级片| 国产iv一区二区三区| 在线观看日韩精品视频| 国产亚洲精品福利| 亚洲天堂网av在线| 亚洲综合免费观看高清完整版| 国产成人精品亚洲男人的天堂| 五月天国产精品| 中文字幕在线观看欧美| 欧美一区二区女人| 婷婷婷国产在线视频| 伊人av综合网| 在线观看中文| 欧美一级bbbbb性bbbb喷潮片| 韩国成人在线| 99久久伊人精品影院| 亚洲精品无吗| 妞干网这里只有精品| 亚洲经典在线看| 五月婷婷激情久久| 成人精品国产一区二区4080| 一级性生活大片| 亚洲欧美一区二区三区极速播放| 豆国产97在线 | 亚洲| 日本精品一级二级| 亚洲第一黄色片| 亚洲欧洲日本专区| 国产午夜精品久久久久免费视| 久久久久在线观看| 激情久久99| 国偷自产av一区二区三区小尤奈| 不卡一区综合视频| xxxx18hd亚洲hd捆绑| 久久99久久99| 欧美性xxxx图片| 一区二区三区日韩在线观看| 一级一片免费看| 精品av久久707| 免费在线观看av| 欧美重口另类videos人妖| 91精品一久久香蕉国产线看观看| 狠狠色综合色区| 欧美日韩调教| 亚洲天堂网一区| www激情久久| 久久网一区二区| 欧美剧情片在线观看| 国产综合视频一区二区三区免费| 欧美国产在线视频| 外国成人毛片| 三区精品视频观看| 亚洲欧美日韩在线观看a三区| www.久久com| 国产精品色在线| 国产一级淫片a视频免费观看| 精品国产99国产精品| 黄色一级片在线观看| 国产成人精品视| 亚洲精品亚洲人成在线| 黄页网站在线观看视频| 国产成人精品www牛牛影视| 国产日产在线观看| 一本久久a久久精品亚洲| 欧美一区,二区| 欧美精品成人91久久久久久久| 国产美女亚洲精品7777| 日本成人性视频| 免费成人小视频| 国产美女免费无遮挡| 精品久久久久人成| 天堂网2014av| 91a在线视频| 秋霞影院一区二区三区| 久久这里只有精品23| 大桥未久av一区二区三区中文| 九九热最新地址| 欧美一区二区在线免费播放| 欧美jizzhd欧美| 91免费看国产| 综合国产精品| 欧美熟妇另类久久久久久多毛| 自拍偷拍国产精品| 国产xxxxxx| 欧美激情精品久久久久久变态| 日韩精品视频在线看| 欧美性猛交内射兽交老熟妇| 粉嫩嫩av羞羞动漫久久久| 青春草免费视频| 亚洲第一网站男人都懂| bbw在线视频| 欧美高清性xxxxhd | 国产精品亚洲片夜色在线| 欧美手机视频| 国产又黄又猛的视频| 综合亚洲深深色噜噜狠狠网站| 国产欧美日韩综合精品一区二区三区| 久久九九国产精品怡红院 | 日韩av中文字幕在线免费观看| 国模精品视频| 欧美一区二区三区精美影视| 秋霞电影一区二区| 日韩欧美123区| 亚洲成年网站在线观看| 中文字幕乱码在线播放| 视频一区国产精品| 国内精品写真在线观看| 久久精品无码人妻| 亚洲人午夜精品| 国产成年精品| 可以看毛片的网址| 久久久99免费| 国产激情久久久久久熟女老人av| 久久久免费精品视频| 欧美男男gaytwinkfreevideos| 制服丝袜综合网| 亚洲影院免费观看| 奇米影视888狠狠狠777不卡| 国产精品揄拍一区二区| 合欧美一区二区三区| 一区二区伦理片| 日韩亚洲国产中文字幕欧美| 国产免费拔擦拔擦8x在线播放 | 亚洲欧美成人影院| 精品视频在线观看| 蜜臀av性久久久久av蜜臀妖精 | 免费网站免费进入在线| 成人区精品一区二区| 日韩中文欧美在线| 久久久久久久国产精品毛片| 亚洲欧美日韩精品久久亚洲区 | 久久爱另类一区二区小说| 日本熟妇成熟毛茸茸| 日韩网站免费观看| 全球av集中精品导航福利| 欧美日韩精品区别| 欧美午夜精品久久久久久人妖| sm国产在线调教视频| 日韩精品福利视频| 成人av在线网| 国产手机av在线| 国产精品福利在线|