精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

CREATOR制造、使用工具,實現LLM「自我進化」

人工智能 新聞
近日,來自清華大學以及 UIUC 的研究人員聯合發布了關于大模型工具創造的研究框架。其旨在讓大模型自己進行工具創造,以此剝離模型的抽象與具象思維能力,以降低任務推理成本,取得更好的效果。研究進一步探索了模型在工具創造方面的潛在應用價值,在當下對大模型能力的探索上更進了一步。

自古以來,工具的使用被視為區分人與其他物種的一大區別,也被視為是智能的一種根本體現。而當下,人工智能已不再局限于對工具的簡單使用,它們已然能夠根據問題創造性地建立自己的工具來尋求解決方案。在思維上,這代表著當下大模型已經能夠掌握更高層次的抽象思維認知,并將其與具象思維劃分,共同解決問題;而在能力上,工具創造的出現也意味著模型已經能夠從 “學習” 中蛻變,去運用已知 “創造” 未來的無限可能。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2305.14318.pdf

研究背景

近年來,大規模語言模型(Large Language Models)取得了顯著的研究進展,包括 GPT-3、Codex、PaLM、LLaMA、ChatGPT 和最近發布的 GPT-4 等。這些模型在上下文學習(In-Context Learning)、代碼生成(Code Generation)和各種其他自然語言處理任務方面表現出色,將模型的潛力進一步推向了通用人工智能。

盡管大模型在這些取得了巨大的成功,其當下仍然存在很多短板,包括無法識別或回答最新的實時信息、很難在大規模的數據計算上達到高準確性,在題干邏輯復雜時推理能力不穩定等等。針對這些短板,研究者開始致力于向當前模型架構中引入對外部資源的利用能力,例如引入計算器,問答系統,維基百科等等外部知識源,來增強模型能力。這一系列研究奠定了模型工具學習(Tool Learning)能力的基礎。

然而,當下研究中利用的外部工具數量仍然有限,而在潛在的新任務類型幾乎是無盡的。因此,在面對新的問題類型時,很難找到現有的適合解決問題的工具。此外,即使提供了有效的可利用的工具,模型需要在工具包文檔中進行海量搜索、匹配并針對問題進行針對性地規劃。這將給模型帶來很大的認知負擔,并需要較高的學習成本

因此,研究團隊提出了全新的一種研究范式:工具創造(Tool Creation)。其不再是簡單利用大模型使用工具的能力,而是加入了全新的工具創造模塊,讓模型針對所面對的問題進行工具創造并尋求解決方案。

利用大模型創造工具能夠提高工具的普適性、可復用性和多樣性,超越給定 API 的限制。工具創造模塊的設計還可以減輕大模型的認知負擔,并解耦其進行抽象推理(創建可推廣的具有普適性的工具)和具象推理(根據工具實現細節和工具使用文檔進行決策)的能力。同時,該框架下模型以代碼作為工具創造的媒介,這使得模型對于錯誤更加敏感,并能根據工具創造與使用中的問題進行回溯與修正

圖片

工具創造范式相比工具使用更加靈活并對不同場景有更強的適應能力

CREATOR 研究框架

大模型進行工具創造來解決問題的框架 CREATOR 主要分為了以下四個階段:

  • 創造(Creation):運用大模型對于問題的抽象推理能力,通過代碼有針對性性地創造所需工具以及其使用說明。
  • 決策(Decision):運用大模型對于問題的具象推理能力,決策如何調用工具來解決當前問題。
  • 執行(Execution):根據創造的工具以及決策內容,進行決策的執行,并捕獲執行過程中的輸出信息。
  • 修正(Rectification):運用大模型對于錯因推理以及自我修復的能力,對執行階段捕捉到的問題進行修復。

圖片

大模型進行工具創造與決策的流程框架

大模型首先將根據問題創造所需要的工具以及其相關使用說明;此后,問題內容以及工具信息將同時再次返回給大模型,用以決策針對本問題的解決方案,以及如何使用這些工具。此后,模型將根據執行情況對工具及決策做出調整,以更好地適應問題并尋求解答。

整個工具創造框架靈活運用了大模型的不同思維能力:提取問題關鍵信息的抽象思維推理,根據任務實施方案決策的具象思維推理,以及根據問題尋求解決方案的自我修復推理。這些能力的解耦幫助大模型避免了在普通推理鏈(Chain-of-Thought, CoT)中的思維混亂而導致的失敗現象,有效提升了大模型對于任務的適應能力及表現。

CREATOR 實驗評測

作者將 CREATOR 框架與當前的普通推理鏈方法(CoT),程序推理鏈方法(Program-of-Thought, PoT)以及沒有創造的簡單工具使用(Tool Use)進行了比對。同時,為了驗證框架中剝離抽象推理與具象推理的有效性,作者還額外引入了整體工具創造(Tool Create - whole)作為基線,該方法將 CREATOR 框架中的創造階段與決策階段合二為一,不再進行推理能力上的解耦。

圖片

Creation Challenge 數據集問題,標準工具及決策示例

圖片

在 MATH 數據集上 CREATOR 框架的表現高于其他推理方法以及簡單的工具運用

在數據集的選取上,作者選擇了 MATH 以及 TabMWP 數據集作為主要驗證。其中前者包含了美國數學競賽當中的高難度數學問題,而后者將問題與豐富的數據表結合,二者都考驗了模型對于多樣化場景的問題推理與解決能力。除此之外,作者還額外引入了全新構建的 Creation Challenge 數據集,其中的問題都無法直接套用現有工具或者代碼包解決,從而考驗了模型進行工具創造的能力。

圖片

圖片

在 TabMWP 數據集以及 Creation Challenge 上 CREATOR 框架效果也顯著更強

從實驗結果看來,CREATOR 框架的推理結果要明顯好于所有基線,尤其相對于標準的推理方法以及程序推理方法,均達到了更好的效果。同時實驗也證明了對抽象與具象推理能力進行解耦也可以有效幫助模型提高準確率。在 Creation Challenge 測試集上,作者還額外驗證了在有創造什么樣的工具的提示(hint)的情況下,模型將會對問題有著更強的解決能力。因此,提示與思維解耦這兩點也成為了工具創造中的重要影響因素。

圖片

不同方法針對任務難度的準確率統計

圖片

在修正階段的參與下效果的提升

除此之外,作者還驗證了不同方法對于任務難度的變化曲線,以及修正階段參與輪次與大模型效果提升之間的聯系。結果表明,CREATOR 框架面對有難度的問題能夠保持更好的魯棒性,以及修正階段的參與能夠讓不僅是 CREATOR 框架,甚至是 PoT 推理方法都能得到大幅度提升,證實了在實驗中引入修正階段的合理性與有效性。

工具創造的其他優勢

在主實驗之外,文章作者也著重探討了工具創造的其他優勢以及當下大模型工具創造能力的不同展現形式。既然是創造工具,那么作為工具的一大優勢必定是其可復用性。作者也順此思路進一步展示了工具的復用對于任務效果的提升。

作者設計了 300 條問題并三個一組分為了 100 組。其中每一組的三個問題雖然場景不同,但都涉及相同的核心知識(Core Knowledge),即同類問題。作者驗證了將對于一個問題創造的工具用于一組問題中的所有場景,是否都能夠有效解決并提升準確率。

圖片

對于大模型創造的工具在其他問題上遷移,能夠有效提高準確率

實驗統計表明將模型創造的正確可用的工具遷移到其他同類問題場景,能夠有效提升問題解決的正確率。這即表明大模型創造的工具具有良好的可復用性,對于同類問題也有著良好的普適性。

除此之外,作者還展示了大模型進行工具創造的三個維度:對已有工具進行封裝以實現不同目的,將不同工具進行組合實現目標功能,以及進行層次化的工具創建。這三個維度由低到高展示了當下大模型工具創造的能力,而這些能力也幫助大模型能夠更高效地適應不同場景。

圖片

大模型進行工具創造的三個維度

總結

CREATOR 框架通過工具創造實現了大模型抽象與具象思維能力的解耦,是繼工具學習之后,對模型能力邊際探索的又一大突破。相信未來的更多研究將會以此為基礎,繼續在工具的使用與創造上不斷證明與增強模型潛力,為我們帶來更多驚喜。

文章主要作者

圖片


錢成,清華大學大三年級本科生,THUNLP 實驗室成員,導師劉知遠。目前研究方向包括大模型預訓練,大模型高效微調,以及工具學習等領域。曾獲清華大學計算機綜合優秀獎學金,并以共同一作身份在 EMNLP,ACL 等國際會議中發表論文。

個人主頁:https://qiancheng0.github.io/

責任編輯:張燕妮 來源: 機器學習
相關推薦

2025-07-31 02:00:00

智能體Agent人工超級智能

2025-03-07 09:34:14

2024-01-24 13:37:36

大型語言模型人工智能

2025-10-29 08:40:00

2024-04-15 12:43:26

人工智能LLM

2025-09-01 09:09:00

2025-08-11 08:05:58

MCP服務工具

2024-09-27 12:20:18

2017-11-22 09:22:00

AI智能機器學習

2025-11-17 08:35:00

AI模型工具

2023-07-31 10:24:29

云計算開源

2010-07-08 13:17:19

2025-01-22 08:30:00

2024-10-28 14:05:00

2015-07-20 09:11:19

企業移動管理EMMBYOD安全

2015-07-17 08:27:19

EMMBYOD

2025-07-22 08:24:15

2009-07-10 17:54:29

SwingUtilit

2025-09-12 15:47:50

2019-06-17 09:55:05

GPartedLinux根分區
點贊
收藏

51CTO技術棧公眾號

亚洲综合在线一区二区| 综合久久国产| 一区二区三区在线观看av| 免费观看久久av| 欧美性感一区二区三区| 伊人天天久久大香线蕉av色| 国产黄色一区二区| 国产亚洲综合精品| 日韩中文字幕在线精品| 国产精品一区二区无码对白| 欧美xoxoxo| 中文字幕亚洲欧美在线不卡| 成人在线免费网站| 中文字幕超碰在线| 91精品综合久久久久久久久久久| 欧美草草影院在线视频| 粗暴91大变态调教| 影音先锋男人在线资源| 久久午夜免费电影| 3d蒂法精品啪啪一区二区免费| 国产午夜激情视频| 手机在线电影一区| 亚洲精品美女视频| 午夜免费福利网站| 怡红院成人在线| 一区二区三区不卡视频| 日韩av电影免费观看| 午夜精品小视频| 日韩电影一区二区三区| 国a精品视频大全| 91麻豆精品久久毛片一级| 欧美成人午夜77777| 91精品国产综合久久精品麻豆| 欧美变态另类刺激| 午夜羞羞小视频在线观看| 国产欧美一区二区精品婷婷 | 欧美精品一区二区三区久久| 国产美女永久免费| 日韩不卡免费视频| 91大神福利视频在线| 极品颜值美女露脸啪啪| 日韩在线视频精品| 亚洲天堂视频在线观看| 800av在线播放| 欧美一级片网址| 欧美日韩视频在线第一区| 欧美视频第一区| 99在线视频影院| 亚洲日本电影在线| 一区二区高清视频| h视频在线播放| 国产欧美综合在线观看第十页| 精品久久sese| 特黄aaaaaaaaa真人毛片| 国产河南妇女毛片精品久久久| 国产精品香蕉av| 一二三区免费视频| 久久精品一区| 青草热久免费精品视频| 国产成人在线免费观看视频| 国内精品福利| 欧美激情精品久久久久久变态| 在线免费日韩av| 欧美激情91| 欧美人交a欧美精品| 美女视频黄免费| 精品91视频| 午夜精品久久久久久久白皮肤 | 日本精品久久久久影院| 亚洲天堂一区在线| 日韩精品免费视频人成| 国产精品激情自拍| 最近日韩免费视频| 美女久久久精品| 国产日产欧美a一级在线| 久久久久久久久久成人| 日本vs亚洲vs韩国一区三区| 国产精品视频最多的网站| 一二区在线观看| 国产一区二区三区蝌蚪| 懂色一区二区三区av片| 亚洲欧美国产高清va在线播放| 粉嫩嫩av羞羞动漫久久久| 激情五月综合色婷婷一区二区| 日本大臀精品| 国产精品―色哟哟| 成年在线观看视频| 天堂√中文最新版在线| 精品视频999| 在线成人精品视频| 神马久久av| 中文字幕国产精品久久| 男的操女的网站| 激情婷婷亚洲| 国产福利成人在线| 国产av无码专区亚洲av麻豆| 91网址在线看| 一本一本a久久| а√在线中文在线新版| 欧美日精品一区视频| 久久久久99人妻一区二区三区 | 日本高清一区| 国产剧情在线| 黑人狂躁日本妞一区二区三区 | 国产精品一区二区在线观看不卡| 国产精品美女黄网| 番号在线播放| 亚洲国产成人精品视频| 亚洲精品怡红院| 91精品导航| 一个色综合导航| 久久一二三四区| 美女一区二区三区在线观看| 国产伦精品一区二区三区四区免费| 国产美女性感在线观看懂色av| 亚洲精品国产第一综合99久久 | 麻豆freexxxx性91精品| 国产日韩精品推荐| 欧美三级黄网| 午夜久久久久久久久久一区二区| 色片在线免费观看| 欧美理伦片在线播放| 久久天天躁狠狠躁夜夜躁2014| 毛片基地在线观看| 国产黑丝在线一区二区三区| 视频一区视频二区视频| 九九精品调教| 欧美另类z0zxhd电影| 瑟瑟视频在线观看| 99视频精品| 7777精品久久久大香线蕉小说| 日本电影一区二区在线观看 | av大全在线观看| 国产ts人妖一区二区| 亚洲一区二区三区涩| 中文字幕资源网在线观看免费| 日韩免费一区二区| 日本 欧美 国产| 日本欧洲一区二区| 欧美高清视频一区| 美女av在线免费看| 亚洲丁香久久久| 久久久精品一区二区涩爱| 精品一区二区国语对白| 视频一区二区三| 欧美123区| 国产亚洲综合久久| 亚洲视频 欧美视频| 2021中文字幕一区亚洲| 欧美牲交a欧美牲交| 欧美日韩夜夜| 2019中文字幕在线| 亚洲日本香蕉视频| 欧美日韩国产一区二区| avtt香蕉久久| 久久狠狠婷婷| 日韩电影在线播放| 电影亚洲一区| 中文字幕亚洲一区二区三区五十路| 波多野结衣啪啪| 久久精品一二三| 噼里啪啦国语在线观看免费版高清版| 久久93精品国产91久久综合| 欧美一级大片在线免费观看| 天堂资源最新在线| 色88888久久久久久影院按摩| 亚洲午夜久久久久久久久红桃| 亚洲伊人观看| 日韩电影免费观看在| 日韩午夜电影免费看| 蜜月aⅴ免费一区二区三区 | 91精品在线一区二区| 卡通动漫亚洲综合| 成人永久免费视频| 精品一区二区中文字幕| 精品国产视频| 91欧美视频网站| 青草在线视频| 亚洲免费成人av电影| 最近中文字幕免费在线观看| 中文字幕一区二区三区在线播放 | 免费高清视频在线一区| 色偷偷噜噜噜亚洲男人| 精品久久久久久亚洲综合网站| 亚洲高清在线精品| 深爱五月激情网| 蜜臀久久久99精品久久久久久| 熟女视频一区二区三区| jizz性欧美23| 国产成人精品在线观看| 免费黄网在线观看| 亚洲国产日韩欧美在线图片| 久久亚洲精品石原莉奈| 亚洲桃色在线一区| 国产人妻黑人一区二区三区| 天堂成人免费av电影一区| 国产精品av免费| 久久精品福利| 成人av资源在线播放| 多野结衣av一区| 中文字幕精品av| 成人毛片视频免费看| 色噜噜狠狠一区二区三区果冻| 国产尤物在线播放| eeuss影院一区二区三区| 91国产精品视频在线观看| 好看的亚洲午夜视频在线| 日本一区二区在线视频| 一区二区三区高清在线观看| 国产精品都在这里| 成人三级小说| 久久精品91久久香蕉加勒比| 无码国产精品一区二区免费16| 欧美日韩视频第一区| 日韩男人的天堂| 综合久久综合久久| 亚洲综合网在线观看| 成人综合婷婷国产精品久久免费| 欧美精品性生活| 一本色道久久综合亚洲精品不| a级网站在线观看| 伊人成综合网yiren22| 粉嫩av一区二区三区免费观看| 国产成人免费| 日本成人黄色片| 黄色美女视频在线观看| 久久精品视频va| 国产福利第一视频在线播放| 日韩精品高清视频| 蜜桃久久一区二区三区| 日韩一区二区三区在线视频| 亚洲天堂手机在线| 日本高清免费不卡视频| 黄色片免费观看视频| 亚洲一区二区欧美日韩| 男人操女人的视频网站| 国产精品不卡视频| 日本一二三不卡视频| 久久久亚洲精品一区二区三区| 亚洲av无码专区在线播放中文| 精彩视频一区二区| 成人黄色一级大片| 久久99热狠狠色一区二区| 99视频在线视频| 日本色综合中文字幕| 麻豆传传媒久久久爱| 久久亚洲二区| 国产成人无码一二三区视频| 一本一本久久| 蜜臀av无码一区二区三区| 在线看片日韩| 亚洲中文字幕无码av永久| 欧美激情1区| a级黄色小视频| 亚洲婷婷在线| 缅甸午夜性猛交xxxx| 中文日韩欧美| 少妇性饥渴无码a区免费| 麻豆久久婷婷| 欧美 日韩精品| 久久性色av| 亚洲一级片网站| 九色综合狠狠综合久久| 日韩高清在线一区二区| 国产精品一区在线观看乱码 | 国产亚洲精品久久久久久| 可以直接在线观看的av| 中文字幕免费国产精品| 欧美精品日韩少妇| 欧美尺度大的性做爰视频| 牛牛电影国产一区二区| 午夜免费日韩视频| 日韩电影免费观| 国产美女直播视频一区| 久久综合给合| 精品久久蜜桃| jvid福利在线一区二区| 无码人妻aⅴ一区二区三区日本| 国产精品红桃| 日日摸日日碰夜夜爽av| 蜜桃视频免费观看一区| 免费欧美一级片| 99国内精品久久| 阿v天堂2014| 亚洲精品免费在线| 在线天堂中文字幕| 国产一区二区三区18| 在线观看欧美精品| 一级片在线观看免费| 欧美亚一区二区| 做爰视频毛片视频| 欧美一二区视频| 污污网站在线免费观看| 国产一区二区三区四区五区美女| 在线观看免费黄网站| 精品一区二区三区蜜桃| 久久久久亚洲AV成人无码国产| 国产欧美日韩三级| 免费中文字幕在线观看| 欧美午夜电影在线| 国产精品高潮呻吟久久久| 亚洲成人网在线| a中文在线播放| 欧美激情精品久久久久| 亚洲第一会所001| 国产精品播放| 久久久影院免费| 欧美日韩国产区一| 亚州av在线播放| 精品国产一区二区三区久久狼5月| 2020国产在线| 国产精品香蕉国产| 日韩精彩视频| 97精品久久| 亚欧精品在线| 亚洲激情影院| 亚洲第一天堂久久| 久久久久久久久蜜桃| 久久国产在线视频| 在线免费观看日韩欧美| 亚洲国产精品二区| 亚洲精品自产拍| 国产鲁鲁视频在线观看特色| 国产成人av网| 99久久免费精品国产72精品九九| 亚洲精品二区| 丝袜国产日韩另类美女| xxxwww国产| 中文字幕在线不卡视频| 一级一片免费看| 日韩福利在线播放| 黑人玩欧美人三根一起进| 91精品一区二区| 成人影视亚洲图片在线| 亚洲色欲综合一区二区三区| 不卡一区二区三区四区| 九九热国产在线| 91福利在线播放| 天堂在线中文| 久久久国产精品x99av| www.精品国产| 水蜜桃一区二区| 欧美综合二区| 日本高清免费观看| 综合分类小说区另类春色亚洲小说欧美| 亚洲av中文无码乱人伦在线视色| 欧美成人综合网站| 中文字幕有码在线视频| 91久久久久久久| 99久久综合狠狠综合久久aⅴ| 日韩免费毛片视频| 久久综合色综合88| 久久久久久久久久网站| 91精品国产综合久久久久久久| 午夜国产福利在线| 国产精品一区二区三区毛片淫片 | 26uuu亚洲电影在线观看| 成人一区二区电影| 一区二区三区在线电影| a级大片免费看| 一区二区三区在线观看欧美| 国产精品久久影视| 欧美成年人视频网站欧美| 日韩精品一级毛片在线播放| 中文字幕一区综合| 国产乱码精品一区二区三| 欧美另类视频在线观看| 欧美一区二区成人| 调教一区二区| 国产欧美日本在线| 亚洲黄页一区| aaaaa级少妇高潮大片免费看| 日本精品视频一区二区| √新版天堂资源在线资源| 成人激情视频在线| 欧美日本一区二区高清播放视频| 美女日批在线观看| 欧美三级免费观看| 最新国产在线观看| 不卡视频一区二区| 亚洲专区欧美专区| 国产成人在线网址| 欧美va在线播放| 竹内纱里奈兽皇系列在线观看| 日韩福利视频| 国产精品自在欧美一区| 日韩成人高清视频| 亚洲性无码av在线| 久久av网站| 国产三区在线视频| 日韩美女久久久| 天堂在线视频免费观看| 国产精品大陆在线观看| 亚洲电影影音先锋| www.日本高清| 欧美日韩免费视频| 黑人极品ⅴideos精品欧美棵| 欧美精品v日韩精品v国产精品| 久久精品国产精品亚洲红杏| 青青草原在线免费观看视频|