精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-3.5逆襲GPT-4!谷歌DeepMind華人天團,讓LLM像人類一樣制作工具,完勝CoT

人工智能
最近,來自Google DeepMind,普林斯頓和斯坦福的頂尖華人團隊提出了一種全新的框架?,F在,LLM可以像人類一樣制作自己的工具了!

ChatGPT等大語言模型誕生以來,憑著強大的語言理解能力、生成能力、邏輯推理能力等,已經被人類玩出了花。

而OpenAI公開GPT-4后,最大的驚喜之一,莫過于插件模式的引入了。

插件使得GPT-4可以執行代碼、搜索引擎、集成各種APP的功能。這無疑是對于LLM后續應用模式的一大突破。

圖片

顯然,通過工具的使用,我們可以顯著地提升LLM的生產力,

但是,如果沒有合適的工具怎么辦?

——那就讓LLM自己造!

最近,來自Google DeepMind,普林斯頓和斯坦福的華人團隊提出了一種閉環框架,讓LLM可以通過程序的形式,制作并使用全新的工具(能重復使用的那種)。

簡單來說,就是讓一個LLM作為工具制造者制作新工具,另一個LLM作為工具使用者,使用工具來解決新問題。

圖片

論文地址:https://arxiv.org/abs/2305.17126

項目地址:https://github.com/ctlllll/LLM-ToolMaker

基于這個框架,LLM就變得像人類的祖先一樣,能夠自我開發,并且學會使用工具。

同時,這種工具制造者和使用者之間的分工,在不降低生成工具和解決方案質量的情況下,就能實現成本效益。

結果顯示,當使用GPT-4作為工具制造者,GPT-3.5 Turbo作為工具使用者時,可以在成本低、速度快的GPT-3.5 Turbo上實現與GPT-4相當的性能。

讓LLM自己造工具

雖然LLM很好用,但如果問題太多的話,直接丟給GPT-4這種性能很強的模型,成本會非常高。

另一方面,輕量級模型在成本效益上很高,但通常在處理復雜任務時遇到困難。

LATM通過利用強大的模型作為工具制造者,為請求中觀察到的任務生成可重復使用的工具(以Python函數實現),并將工具傳遞給一個成本效益高的工具使用者模型,用于解決后續請求中的類似實例。

這種方法使得輕量級模型在保持更高的成本效率的同時,能夠達到與強大模型相當的性能。

圖片


LATM的閉環框架

LATM可以分為兩個階段:

1. 制造工具:一個強大但更昂貴的模型作為工具制造者,從一些示例中生成通用且可重復使用的工具;

2. 使用工具:一個輕量且更便宜的模型作為工具使用者,使用工具來解決任務的各種實例。

制造工具階段可以進一步劃分為三個子階段:

(1)工具提議:工具制造者試圖從一些訓練示例中生成工具(Python函數),如果工具無法執行,報告錯誤并生成新的(修復函數中的問題);

(2)工具驗證:工具制造者在驗證樣本上運行單元測試,如果工具沒有通過測試,報告錯誤并生成新的測試(修復單元測試中函數調用的問題);

(3)工具封裝:封裝函數代碼和如何從單元測試中將問題轉換為函數調用的示例,為工具使用者準備可用的工具。

圖片

LATM的流程

在現實世界的場景中,任務實例通常都是按順序來的。為了適應這種數據流,團隊引入了第三個LLM——分派器。

具體來說,當收到一個新的任務實例時,分派器首先確定是否有適合當前任務的工具。

· 如果存在合適的工具,分派器將實例及其相應的工具傳遞給工具使用者進行任務解決。

· 如果沒有找到合適的工具,分派器將該實例識別為新任務,并使用強大的模型甚至調用人類標注者來解決該實例。

鑒于分派任務的簡單性,分派器可以是一個配備了適當提示的輕量級模型,這只會為整個流程增加很小的成本。

結果顯示,分派器可以有效地識別現有的工具,而且對于沒有見過的任務也不會有顯著的性能下降。

圖片

分派器的工作流程

在下面這個任務示例中,需要根據給定的幾個條件確定五個對象的順序。

在工具提議階段,工具制造者(如GPT-4)會寫一個通用的Python函數,能夠解決任務中提供的k個示例(實驗中k=3)。

然后,工具制造者會生成一個搜索算法,枚舉所有可能的排序,并根據給定的條件進行驗證

在工具使用階段,工具使用者將每個自然語言問題轉化為一系列條件,生成函數調用,利用工具解決每個任務實例。

圖片

工具提議和工具使用階段(邏輯推理任務)

結果顯示,不管是由人類編寫還是由GPT-4生成,CoT在任務完成的準確率上,都會被LATM吊打。

圖片

使用GPT-4生成的CoT的準確性

如表1所示,當被用作工具制造者時,GPT-4會搜索所有排列組合,并選出滿足給定約束條件的,最終成功解決任務。

而且,工具制造者即便是接收到了錯誤的信息,也依然有能力進行糾正。

圖片

工具制造者為解決任務而生成的函數

在表2中,團隊將思維鏈提示方法和LATM的性能進行了比較。

結果顯示,有了工具的幫助,像GPT-3.5 Turbo這樣的輕量級模型可以實現與GPT-4相當的性能,并顯著優于CoT提示。

而且,能夠利用工具的GPT-3.5 Turbo在平均成本上,也比直接用GPT-4低得多。

有趣的是,對于Dyck語言任務,作為工具使用者的GPT-3.5 Turbo,甚至甚至超過了同樣作為使用者的GPT-4。

在研究錯誤的案例時,團隊發現,在將問題轉化為函數調用時,GPT-4有時會自發地去「解決」問題。然而,這是完全不必要的,而且還會導致函數輸出錯誤。

圖片

LATM和思維鏈(CoT)的性能比較

此外,在所有的模型中,GPT-3.5 Turbo也有著最佳的性價比。

圖片

各種工具使用者模型的性能比較

不過,雖然GPT-3.5 Turbo在作為使用者時表現出色,但它并不能很好地扮演工具制造者的角色。

結果顯示,對于像邏輯推理這樣比較困難的任務,GPT-3.5 Turbo一次都沒成功。

也就是說,使用一個強大的模型作為工具的制造者,是很有必要的。

圖片

GPT-4和GPT-3.5 Turbo在生成新工具時的成功率

LATM Prompt

圖片

工具制造

圖片

工具驗證

圖片

工具封裝

圖片

分派器

封裝工具


圖片



邏輯推理

圖片

查找隨機對象

圖片

Dyck語言

圖片

單詞排序

圖片


余數定理

圖片

安排會議

作者介紹

論文一作Tianle Cai(蔡天樂),是普林斯頓大學的一年級博士生。

在此之前,他就讀于北京大學,主修應用數學,同時兼修計算機科學。

他的興趣非常廣泛,橫跨機器學習的很堵領域。比如,優化,表征學習,架構設計(Transformer,圖神經網絡等)。宗旨就是,讓機器學習更通用,更高效,更可靠。

圖片

Xuezhi Wang是谷歌大腦的研究科學家。

在此之前,她于2016年在卡耐基梅隆大學計算機科學系獲得博士學位,于2011年在清華大學取得計算機科學學士學位。

她的主要興趣是NLP模型的魯棒性和公平性,以及在語言模型中實現系統化的泛化。

圖片

Tengyu Ma(馬騰宇)是斯坦福大學計算機科學和統計學的助理教授。

他的研究興趣廣泛,包括機器學習、算法及其理論方面的課題,如深度學習、(深度)強化學習、預訓練/基礎模型、魯棒性、非凸優化、分布式優化和高維統計。

圖片

Xinyun Chen(陳昕昀)是谷歌大腦的高級研究科學家。

在此之前,她于2022年在加州大學伯克利分校獲得計算機科學博士學位,并在上海交通大學ACM班獲得計算機科學學士學位。

她的研究興趣是神經程序合成和對抗性機器學習。

圖片

Denny Zhou是谷歌大腦和DeepMind推理團隊的創始人和負責人。

研究方向是通過建立和教授大型語言模型(LLMs)來解決人工通用智能(AGI)問題,實現人類水平的推理。

研究突破包括:指令調整(FLAN2)、思維鏈提示、自洽性解碼、最小到最大提示,以及LLMs的涌現特性。

值得一提的是,谷歌首席執行官Sundar Pichai在2022年谷歌I/O大會上介紹了他們的工作。

圖片

參考資料:https://arxiv.org/abs/2305.17126

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-05-05 09:42:12

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-10-13 13:12:44

2023-09-06 16:44:03

2023-03-20 08:19:23

GPT-4OpenAI

2023-10-31 15:26:02

阿里云通義千問

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2023-06-05 12:32:48

模型論文

2024-05-20 08:40:00

2023-06-21 13:37:41

模型研究

2023-03-29 10:31:40

MIT論文

2023-08-27 12:54:59

GPT-4神秘版本Code

2023-07-04 14:01:26

GPT-4模型

2023-10-30 17:23:54

數據模型

2023-06-19 08:19:50

2023-10-10 13:59:00

模型研究

2024-01-29 10:31:00

AI模型

2023-11-06 12:46:00

AI數據

2023-12-12 13:57:00

GPT-3.5MistralAI

2025-04-16 09:35:03

點贊
收藏

51CTO技術棧公眾號

91亚洲精品久久久蜜桃| 日韩黄色大片网站| 欧美午夜女人视频在线| 日本一区二区在线视频| 中文字幕制服诱惑| 午夜精品视频| 国产婷婷色综合av蜜臀av| 黄色一级二级三级| 国产福利在线播放麻豆| 91在线国产观看| 国产日韩欧美视频| 日韩黄色a级片| 日韩在线观看| 亚洲美女在线看| 国产亚洲色婷婷久久| 在线天堂资源| 亚洲一区电影777| 日韩一区免费观看| 隣の若妻さん波多野结衣| 日韩精品每日更新| 性欧美xxxx交| 91在线播放观看| 凹凸成人精品亚洲精品密奴| 精品88久久久久88久久久| 亚洲综合欧美激情| 筱崎爱全乳无删减在线观看| 亚洲免费在线播放| 欧洲精品一区色| 女人18毛片一区二区三区| 蜜臀av性久久久久av蜜臀妖精| 午夜精品国产精品大乳美女| 国产成人自拍网站| sdde在线播放一区二区| 亚洲精品456在线播放狼人| 99九九精品视频| av在线日韩| 欧美日韩亚洲一区二| 国产精品日产欧美久久久久| 欧美麻豆久久久久久中文| 高潮毛片无遮挡| 欧美日韩直播| 亚洲国产成人av在线| www.日本久久| 99久久久国产| 欧美日韩夫妻久久| 艹b视频在线观看| 九色成人搞黄网站| 色婷婷综合久久| 狠狠爱免费视频| 日韩伦理福利| 欧美性猛交xxxx偷拍洗澡| 老太脱裤让老头玩ⅹxxxx| 美足av综合网| 一区二区三区.www| 菠萝蜜视频在线观看入口| 91视频在线观看| 国产精品国产三级国产a | 一区二区三区 日韩| 欧洲亚洲两性| 欧美亚洲一区二区在线观看| 一级在线免费视频| 欧美激情福利| 欧美一级电影网站| 国产男女无遮挡猛进猛出| 国产乱码精品一区二区三区亚洲人 | 黄色免费av网站| 国产精品视频| 国产成人亚洲综合91精品| 黄色污污网站在线观看| 蜜桃av一区二区在线观看| 国产日产欧美精品| 国产口爆吞精一区二区| 国产**成人网毛片九色| 国产精品手机视频| 欧美视频免费一区二区三区| 国产女主播视频一区二区| 在线天堂一区av电影| 成人在线直播| 亚洲成人一区二区在线观看| 午夜肉伦伦影院| 青青青国产精品| 日韩一区二区三区四区| av免费观看不卡| 香蕉久久精品日日躁夜夜躁| 中文字幕av一区| 免费看特级毛片| 91久久综合| 国产精品久久精品| 国内精品国产成人国产三级| 99精品视频免费在线观看| 色姑娘综合网| 日韩123区| 色综合中文字幕国产| 国产三级生活片| 综合久久成人| 国产午夜精品全部视频在线播放| 免费在线观看a级片| 99精品国产一区二区青青牛奶| 国产精品www| 亚洲精品无amm毛片| 久久精品综合网| 热久久最新网址| 久久久人成影片一区二区三区在哪下载 | 国产亚洲成av人片在线观黄桃| 亚洲午夜久久久影院| 波多野结衣爱爱视频| 天堂精品中文字幕在线| 2014国产精品| chinese偷拍一区二区三区| 一区二区久久久久久| jizz欧美激情18| 国产女人18毛片水真多18精品| 中文字幕在线精品| 亚洲免费在线观看av| 国产精品一区二区久久不卡| 日韩亚洲视频在线| 日本不良网站在线观看| 日韩三级高清在线| 无码人妻丰满熟妇啪啪欧美| 99精品热视频只有精品10| 91精品免费久久久久久久久| 男人的天堂在线| 亚洲福利一二三区| 天堂av手机在线| 欧洲激情视频| 日本亚洲欧洲色α| 五月婷婷伊人网| 夜夜亚洲天天久久| 欧美激情第四页| 欧美hd在线| 国产精品久久久久久久电影| 日色在线视频| 欧美日韩国产中文精品字幕自在自线| 无码人妻一区二区三区在线视频| 91麻豆国产自产在线观看亚洲 | 成人免费视频国产免费| www.亚洲激情.com| 国产成人永久免费视频| 欧美久久亚洲| 久久国产精品99国产精| 亚洲性生活大片| 国产精品久久久久久久久搜平片 | 国产不卡在线播放| 免费看污污视频| 免费观看亚洲视频大全| xxx成人少妇69| 91麻豆成人精品国产| 国产精品国产三级国产普通话三级| 成人亚洲精品777777大片| 精品日韩免费| 国产精品视频一区国模私拍| 精品久久久久一区二区三区 | 高清一区在线观看| 国产精品羞羞答答在线观看| 国产成人黄色av| 成人高清免费观看mv| 欧美性高清videossexo| 长河落日免费高清观看| 免费不卡在线视频| 亚洲欧洲精品一区二区三区波多野1战4| 日韩精品一区二区三区av| 亚洲新中文字幕| 亚洲最新av网站| 亚洲嫩草精品久久| 一级黄色免费视频| 国产亚洲亚洲| 日韩欧美激情一区二区| 日本久久久久| 欧美激情在线观看| 色吊丝在线永久观看最新版本| 日韩欧美在线一区| 人妻互换一区二区激情偷拍| 久久国产精品99精品国产| 欧美性受xxxx黑人猛交88| jizzjizzjizz欧美| 日韩免费精品视频| 高清全集视频免费在线| 精品国产成人系列| 看黄色一级大片| 日韩毛片一二三区| 黄色国产在线视频| 日韩成人免费在线| 国产日韩欧美大片| 美女主播精品视频一二三四| 国产精品美女主播| 黄网av在线| 亚洲最新av网址| 不卡的日韩av| 色综合久久中文综合久久97| 你懂得在线观看| 成人国产亚洲欧美成人综合网| 久久久久久久久久久福利| 国产精品99一区二区三| 精品日韩电影| 国产精品va视频| 日本久久精品视频| 污视频免费在线观看| 亚洲欧美在线播放| 99国产精品一区二区三区| 欧美日韩免费一区| 91日韩中文字幕| 久久无码av三级| 欧美熟妇另类久久久久久多毛| 久久国产精品久久久久久电车| 一区二区三区我不卡| 天天躁日日躁狠狠躁欧美巨大小说| 国产区亚洲区欧美区| 偷拍自拍在线看| 美日韩精品免费观看视频| 三级在线播放| 亚洲精品一线二线三线无人区| 91精品国产乱码久久| 色综合一区二区| 日本少妇吞精囗交| 亚洲伦在线观看| 少妇太紧太爽又黄又硬又爽小说 | 欧美乱大交做爰xxxⅹ小说| zzijzzij亚洲日本少妇熟睡| 日韩精品视频网址| 日韩成人一级片| 中国丰满人妻videoshd| 欧美日韩综合| 在线观看18视频网站| 精品国产乱码久久久| 美脚丝袜一区二区三区在线观看| 6080亚洲理论片在线观看| 91在线免费视频| 国产成人精品一区二区三区免费| 欧美亚洲视频一区二区| av资源一区| 欧美极品少妇xxxxⅹ裸体艺术 | 日韩av密桃| 欧美日韩一区在线观看视频| 日本一区福利在线| 国产日韩欧美一区二区| 风间由美中文字幕在线看视频国产欧美 | 亚洲国产岛国毛片在线| 男人天堂av电影| 91一区二区在线| 污污内射在线观看一区二区少妇| 国产黄人亚洲片| 久久久九九九热| 国产传媒欧美日韩成人| 久久久久中文字幕亚洲精品| 国产精品1区二区.| 韩国三级与黑人| 国产精品亚洲第一| 人妻激情偷乱视频一区二区三区| 国产精品一二三区在线| 成人在线短视频| 国产福利一区二区三区视频| 日韩精品――色哟哟| 国产成人一级电影| 国产原创剧情av| 99热99精品| 亚洲激情视频小说| 国产亚洲精品7777| 亚洲AV成人无码网站天堂久久| 亚洲欧洲av色图| 激情五月婷婷在线| 亚洲国产wwwccc36天堂| 精品欧美一区二区三区免费观看 | 免费裸体美女网站| 丝袜美腿成人在线| 久久久久国产一区| 国产在线播放一区二区三区| 无码人妻一区二区三区精品视频| 99久久99久久综合| 少妇光屁股影院| 国产精品三级久久久久三级| 91插插插插插插| 亚洲午夜激情网站| 全部毛片永久免费看| 欧美性受xxxx| 性猛交富婆╳xxx乱大交天津 | 日本免费在线视频| 九九视频这里只有精品 | 欧美日韩国产影院| 中文字幕人妻一区二区在线视频| 欧美高清精品3d| 高清毛片aaaaaaaaa片| 亚洲欧美变态国产另类| 生活片a∨在线观看| 国内精品久久久久| 久久精品女人天堂av免费观看| 国产欧美日韩免费| 成人涩涩网站| 亚洲视频欧美在线| 亚洲第一黄色| 免费看涩涩视频| 成人美女视频在线观看18| 麻豆精品免费视频| 亚洲伦理在线精品| 国产精品成人无码| 精品国产制服丝袜高跟| 国产玉足榨精视频在线观看| 久精品免费视频| 日本美女久久| 精品久久sese| 你懂的视频一区二区| 成人性做爰aaa片免费看不忠| 国产成人av福利| 日本少妇xxxxx| 午夜一区二区三区在线观看| 91亚洲国产成人精品一区| 精品性高朝久久久久久久| 成人高清免费在线| 国产精品电影观看| 欧美男男freegayvideosroom| 亚洲一卡二卡三卡四卡无卡网站在线看| 1024日韩| 日本中文字幕在线不卡| 国产日韩影视精品| 日本中文字幕在线免费观看| 欧美一区二区三区日韩| 国产黄色片在线播放| 992tv在线成人免费观看| 日本成人手机在线| 一区二区三区我不卡| 日韩成人午夜精品| 在线免费观看日韩av| 亚洲第一av色| 成人av一区二区三区在线观看| 色妞色视频一区二区三区四区| 澳门成人av网| 久久久一本精品99久久精品| 国产一区欧美| 26uuu国产| 亚洲欧美日韩国产综合| 姑娘第5集在线观看免费好剧| 亚洲色图av在线| 日韩伦理精品| 久久综合狠狠综合久久综青草| 99热精品在线观看| 国产人成视频在线观看| 亚洲国产精品综合小说图片区| 国产视频手机在线| 久久久久北条麻妃免费看| 青青伊人久久| 天天干天天操天天干天天操| 麻豆免费看一区二区三区| 亚洲精品成人av久久| 在线免费av一区| seseavlu视频在线| 国产精品日韩在线一区| 成人嫩草影院| 午夜激情av在线| ...av二区三区久久精品| 91免费视频播放| 欧美成年人视频| 日韩一区二区三区精品| 国产精品自拍合集| 成人永久看片免费视频天堂| 国产午夜视频在线播放| 亚洲国产精品va在线| 一个人看的www视频在线免费观看| 麻豆av一区二区| 日韩av网站免费在线| 一本色道久久88| 91精品国产入口| 激情网站在线| 美日韩免费视频| 视频一区在线播放| 在线免费看视频| 日韩一区二区三区视频| 888av在线视频| 日本黑人久久| 国内外成人在线视频| 久久久久久久久久久久国产| 日韩精品视频在线观看免费| 免费高清视频在线一区| 久久久久亚洲av无码专区喷水| 国产不卡视频在线观看| 二区视频在线观看| 日韩在线激情视频| jizz国产精品| 国产裸体免费无遮挡| 亚洲老妇xxxxxx| 日本人妖在线| 国产专区精品视频| 极品裸体白嫩激情啪啪国产精品| 成人免费网站黄| 91精品视频网| 伊人色综合一区二区三区影院视频| 视频一区视频二区视频三区高| 国产一区二区伦理| 久久一区二区三区视频| 久久精品视频免费播放| 久久夜色精品国产噜噜av小说| 三上悠亚av一区二区三区| 亚洲综合免费观看高清完整版在线 | 91污在线观看| 国产精品自产拍| 日韩免费精品视频| 国内精品久久久久久久影视麻豆 | 在线免费看a| 国产综合18久久久久久| 精品综合免费视频观看| 黄色片网站在线免费观看| 不卡av在线网站|