精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI設計自己,代碼造物主已來!UBC華人一作首提ADAS,數學能力暴漲25.9%

人工智能 新聞
AI掌握自我設計的權力,將會怎樣?最近,來自UBC等機構研究人員提出了「智能體自動化設計」系統,讓元智能體使用搜索算法,自動構建強大的同類。

AI訓AI已經老生常談了,那么,AI能夠設計出更強的AI嗎?

這不,來自UBC等機構的研究人員提出了一種全新系統——智能體自動化設計(ADAS)。

圖片

ADAS就是為了讓AI自動創建強大的智能體,包括發明新的構建模塊,或以新的方式組合它們。

具體來說,作者提出了一個「元智能體搜索」簡單而有效的算法。

其中元智能體根據不斷擴大的數據庫,迭代編程出有趣的智能體。

圖片

論文地址:https://arxiv.org/pdf/2408.08435

鑒于圖靈完備性,新方法可以學習任何可能的智能體系統,包括新提示、工具使用、控制流程,以及組合。

再加上,ADAS本身就是一個智能體,因此也可以實現自身改進,從而讓「元智能體」自我進化。

實驗證明,新系統可以讓代碼自定義智能體,而且「元智能體」可通過代碼,來設計新的智能體。

而且,由「元智能體搜索」發明的新智能體,即便在跨領域/跨模型轉移時,仍保持優越性、穩健性。

正如論文所言,這項研究展示了,一個令人興奮的新研究方向的潛力,即自動設計越來越強的智能體系統。

AI設計強大的自己,真到了那天,或許AGI就不遠了。

圖片

那么,它是如何做到的呢?

AI自我設計,代碼造物主已來

機器學習史,指明AI方向

以往,研究人員投入了大量精力,開發強大通用智能體。

其中,基礎模型被用作智能體系統中的模塊,比如,思維鏈、自我反思、Toolformer等等。

然而,機器學習的歷史告訴我們,手動設計的解決方案,最終會被自我學習的方案所取代。

說來也巧,幾天前「AI科學家」研究也是出自Jeff Clune之手。

圖片

不列顛哥倫比亞大學CS教授,曾任OpenAI研究團隊負責人,DeepMind高級研究顧問

在上一篇研究中,展示了一個自動化研究流程,AI一口氣完成了十篇論文,部分還達到了機器學習頂會的接收的門檻。

關鍵是,AI的助力,直接將研究成本打了下來,每篇論文僅15美元。

圖片

那么,若是讓AI設計AI,不僅省事省力,而且AI還能自我迭代。

論文中,研究團隊提出的ADAS,由三個關鍵部分組成:

- 搜索空間:定義了ADAS可以創建的所有可能的智能體系統

- 搜索算法:ADAS用來在搜索空間中尋找優秀智能體設計的方法

- 評估函數:用于判斷創建的智能體的質量或性能

圖片

具體來說,ADAS就是涉及使用搜索算法,來發現搜索空間中的智能體系統,從而優化評估函數。

圖片

元智能體搜索

為了進一步實施想法,研究人員提出了「元智能體搜索」算法,用于演示代碼中定義和搜索智能體的方法。

元智能體搜索的核心思想是,讓基礎模型(FM)作為元智能體,根據不斷擴增的數據庫,迭代新智能體。

理論上,元智能體可以從頭開始編程任何可能的構建模塊和智能體系統。

圖片

不過,在實踐中,為避免元智能體提供任何基本功能(比如FM查詢API、現有工具)是低效的。

因此,論文中,作者為元智能體定義了一個簡單的框架(100行代碼以內),為其提供了一組基本的功能,如查詢FM或格式化提示。

結果,元智能體只需要編程一個「前向」函數來定義一個新的智能體系統,類似于FunSearch中的做法。

圖片

這個函數接收任務信息,并輸出智能體對任務的響應。

如下圖所示,作者展示了元智能體編程新智能體的主要提示,其中提示中的變量,被高亮顯示。

提示中,研究人員鼓勵元智能體基于不斷增長的先前發現檔案,探索有趣的新智能體。

另外,他們還在元智能體中采用了自我反思迭代,其中它對提案的新穎性和正確性進行兩次迭代的改進,并在運行代碼時出現錯誤時進行最多三次改進。

圖片

在生成新的智能體后,研究人員決定使用目標領域的驗證數據對其進行評估。

評估結果

ARC挑戰

抽象和推理語料庫(Abstraction and Reasoning Corpus,ARC)是一個非常具有挑戰性的基準,可以通過衡量人工智能系統有效獲取新技能的能力,來評估它們的一般智力。

圖片

ARC挑戰包括3個重要步驟:

-給AI系統展示多個視覺輸入輸出網格模式的例子

-AI系統從例子中學習網格模式的轉換規則

-在給定測試輸入網格模式的情況下,預測輸出網格模式

經研究團隊驗證,元智能體搜索能夠發現新的代理系統,并在ARC挑戰中,優于SOTA人工設計智能體。

圖片

推理和問題解決

接下來,元智能體需要接受在數學、閱讀和推理領域的考驗。

用于測試的是4個常用基準:用于評估閱讀理解能力的DROP、評估多語言環境下數學能力的MGSM 、評估多任務問題解決的MMLU,以及評估在科學領域解決研究生水平問題的GPQA。

結果表明,元智能體搜索可以發現性能優于SOTA人工設計的智能體——

圖片

元智能體搜索和SOTA人工設計智能體的性能比較,元智能體搜索在每個領域都發現了比基線更好的智能體

不得不強調的一點是,在閱讀理解和數學領域,自我學習的智能體把人工設計的智能體遠遠甩在身后:F1分數提高了13.6/100,準確率提高了14.4%。

元智能體搜索在多任務和科學領域的表現也優于基線,但二者差距沒有這么懸殊。

總的來說,不同領域的基準測試結果顯示出元智能體搜索在針對特定領域定制智能體方面的有效性。

泛化和可轉移性

至此,研究人員已經說明了元智能體搜索可以為各個任務找到有效的智能體,那么,這些新發現的智能體是否具有可轉移性和可推廣性呢?

這就需要進行新的實驗。

首先將發現的代理從GPT-3.5轉移到ARC上的其他FM中,以測試在使用一個FM執行元智能體搜索時發現的代理是否可以推廣到其他FM中。

團隊選擇了三種流行的模型進行轉移,Claude-Haiku、GPT-4和Claude-Sonnet。

依然采用與在ARC挑戰和MGSM中使用的相同的基線。

如下表所示,元智能體搜索到的智能體始終優于人工設計的智能體,而且,差距不小。

圖片

值得注意的是,Claude-Sonnet,這個 Anthropic最強大的模型,在所有測試模型中表現最好,使最好的智能體在ARC上達到近50%的準確率。

接下來,研究人員將元智能體所發現的智能體從MGSM領域轉移到其他數學領域,以測試新智能體是否可以在不同的領域進行泛化。

同樣,測試了MGSM的前3個智能體,并將它們轉移到四個流行的數學領域:GSM8K、GSM-Hard、SVAMP和ASDiv,以及在上一小節中除數學之外的三個領域。

如下表所示,與基線相比,元智能體搜索保持了性能優勢。

圖片

與基線相比,在GSM8K和GSM-Hard上的準確率分別提高了25.9%和13.2%。

更令人驚訝的是,在數學領域中發現的智能體可以被轉移到非數學領域。

圖片

雖然最初在數學領域中搜索的智能體的性能與專門為目標領域設計的智能體并不完全匹配,但它們仍然優于(在閱讀理解和多任務中)或(在科學中)SOTA人工設計的智能體基線。

這些結果表明,元智能體搜索可以發現可推廣的設計模式和智能體系統。

作者介紹

這篇論文的一作和二作是兩位華人,Shengran Hu和Cong Lu,他們目前都在不列顛哥倫比亞大學(UBC)就讀,師從Jeff Clune。

Shengran Hu

圖片

Hu現在是UBC的一名博士生,主要研究興趣是AI智能體和開放式學習系統。

Cong Lu

圖片

Cong Lu是UBC向量學院的博士后研究員,致力于開發安全、具有好奇心并能以開放式方式學習的自主智能體。

Lu之前在牛津大學獲得了博士學位,在攻讀博士學位期間,他對離線強化學習特別感興趣,包括對未見過的任務的泛化、離線世界模型的不確定性量化、像素學習以及強化學習的擴散合成數據。

Jeff Clune

圖片

如前所述,Jeff Clune現任UBC計算機科學的教授,同時也是CIFAR AI主席、向量學院成員,DeepMind高級顧問。

值得一提的是,CIFAR(加拿大高等研究院,發音為「see-far」)自1982年成立以來不斷發展,已從加拿大學者的一個小團體發展成為全球研究界的領導者,象征著全球性、跨學科性和無限性。

向量學院成立于2017年,是一所非盈利研究性機構,也是加拿大政府鼎力支持的AI研究中心,人工智能教父Geoffrey Hinton當年成為了這家機構的首席科學顧問。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-08-23 08:08:00

2023-06-19 09:36:16

AI矩陣

2025-03-03 09:00:00

2022-07-20 11:26:59

Web3.0去中心化投資

2024-12-03 10:15:00

2022-12-23 15:04:33

Meta模型

2023-11-16 15:58:00

訓練數據

2025-06-03 08:51:00

2021-05-26 09:13:35

Linux之父未來科技

2022-02-07 09:35:00

CUP細胞研究

2023-06-19 19:22:50

AI場景隨機數學

2021-10-29 22:45:47

大數據算法技術

2022-05-16 13:46:22

2D3D,AI

2025-09-01 02:00:00

AI署名論文推理

2025-02-17 14:34:52

2021-12-09 09:45:44

AI 數據神經網絡

2021-09-03 00:54:31

人工智能機器人工具

2023-10-19 08:27:31

AI模型
點贊
收藏

51CTO技術棧公眾號

亚洲av毛片在线观看| 亚洲资源在线网| 中文字幕在线观看视频网站| 精品国产乱码久久久| 欧美日韩三级一区二区| 亚洲天堂第一区| 日韩一级免费视频| 日本va欧美va欧美va精品| 乱亲女秽乱长久久久| 国产十八熟妇av成人一区| 亚洲天堂一区二区| 一区二区三区四区精品在线视频 | 亚洲精品中文综合第一页| 国产精品毛片一区二区在线看舒淇| 亚洲天堂偷拍| 在线观看免费高清视频97| 欧美一级片在线免费观看| 第四色男人最爱上成人网| 亚洲人午夜精品天堂一二香蕉| 精品日韩美女| 国产精品区在线观看| 国产农村妇女精品一区二区| 久久精品国产亚洲7777| 人妻在线日韩免费视频| 国产精品一级在线观看| 色欲综合视频天天天| 国产一级做a爰片久久毛片男| 国产高清免费av在线| 国产·精品毛片| 成人天堂噜噜噜| 波多野结衣影片| 亚洲视频播放| 欧美黑人性视频| 国产美女高潮视频| 欧美日韩老妇| 亚洲欧洲xxxx| 中文字幕在线观看网址| 视频成人永久免费视频| 欧美日韩国产一级片| 免费大片在线观看| 成人三级高清视频在线看| 亚洲美女视频在线| 成人手机视频在线| 尤物在线视频| 国产精品黄色在线观看| 日本一区二区精品| 国产剧情在线观看| 久久精品人人爽人人爽| 美媛馆国产精品一区二区| 三级视频在线看| 成人成人成人在线视频| 97久久夜色精品国产九色 | 日本麻豆一区二区三区视频| 欧美最猛性xxxxx(亚洲精品)| 国产成人无码精品亚洲| 99在线精品免费视频九九视 | 亚洲电影在线观看| 四虎永久免费观看| 我不卡一区二区| 国产精品第5页| 欧美网站在线| 久久久久这里只有精品| 黄色一级片在线| 国产色视频一区| 久久久久这里只有精品| 日韩一级免费片| 视频在线99| 欧美大片网站在线观看| 国产无人区一区二区三区| 国产精选一区| 欧美成人三级| av观看在线| 一级片免费网址| 丰满爆乳一区二区三区| 91精品久久久久久久| 欧美激情免费观看| 久久久在线免费观看| 日韩黄在线观看| 伊人久久久久久久久久| 亚洲天堂一区二区三区| 亚洲一二三级电影| 日韩精品高清不卡| 欧美一级免费| 欧洲精品久久一区二区| 88久久精品无码一区二区毛片| 青青成人在线| 日韩色av导航| 欧美乱妇20p| 欧美日韩一区二区三区在线看| 日本成人黄色| 日本天堂在线观看| 亚洲精品国产视频| 欧美,日韩,国产在线| 怡红院成人在线| 在线不卡中文字幕播放| 成人在线电影网站| 成人精品中文字幕| 欧美激情奇米色| 最近免费中文字幕大全免费版视频| 日韩成人伦理电影在线观看| 成人在线一区二区| 天天操天天射天天| 国产精品三级久久久久三级| 糖心vlog在线免费观看| 九色porny丨入口在线| 欧美性xxxxxx少妇| 久久精品aⅴ无码中文字字幕重口| 亚洲自拍都市欧美小说| 欧美成人精品激情在线观看| 黄色在线观看国产| 国产一区二区看久久| 蜜桃传媒视频第一区入口在线看| 欧美成人精品一区二区男人看| 亚洲成av人片| 亚洲精品永久视频| 日韩极品少妇| 久久99久久99精品免观看粉嫩 | 日本中文字幕二区| 欧美性生活一级片| 美日韩精品视频免费看| 99久久久无码国产精品免费蜜柚| 国产91丝袜在线18| 亚洲在线欧美| 日韩欧美精品电影| 亚洲国产精品久久久久| 五月天av网站| 蜜臀av亚洲一区中文字幕| 精品久久久久亚洲| 2024最新电影免费在线观看| 欧美性大战久久久久久久蜜臀| 超碰男人的天堂| 狠狠干成人综合网| 亚洲淫片在线视频| 欧美成年黄网站色视频| 在线一区二区观看| a级片在线观看| 一本久道久久综合狠狠爱| 999热视频| 成人av免费| 91精品国产综合久久精品| 手机看片国产日韩| 日韩精品每日更新| 任我爽在线视频精品一| 成人小电影网站| 亚洲精品中文字幕av| 日韩伦人妻无码| 99免费精品视频| 日韩五码在线观看| 激情小说亚洲色图| 久久久久久久网站| 老熟妇高潮一区二区高清视频| 一区二区三区四区在线播放| 亚洲一级片免费观看| 羞羞色午夜精品一区二区三区| 国产精品久久久久久影视| 成年人视频在线看| 欧美三级电影网站| 成人黄色短视频| 精品一区二区在线视频| 一区二区三区观看| 9999精品视频| 久久精品中文字幕电影| 国产露脸91国语对白| 国产精品国产自产拍高清av| 色一情一区二区三区| 国产精品成人一区二区不卡| 91麻豆国产精品| 中文在线手机av| 亚洲白拍色综合图区| 国产午夜福利片| ww久久中文字幕| 超碰在线播放91| 午夜久久免费观看| 亚洲综合在线做性| 9999在线视频| 亚洲欧美国产一本综合首页| 最好看的日本字幕mv视频大全| 国产精品久久久久三级| 波多野结衣在线免费观看| 黑丝一区二区三区| 精品毛片久久久久久| 中文字幕在线官网| 最新国产精品亚洲| 国产丰满果冻videossex| 香蕉成人伊视频在线观看| 国产乱了高清露脸对白| 日本成人中文字幕| 成人短视频在线观看免费| 日韩系列在线| 91精品久久久久久久久青青| 污污的网站在线免费观看| 精品一区二区三区三区| 在线观看视频中文字幕| 一区二区免费在线| 精品少妇人妻一区二区黑料社区| 久久av资源站| 亚洲熟妇av日韩熟妇在线| 精品美女视频| 国产精成人品localhost| 欧美电影免费观看高清完整| 日韩在线观看视频免费| 手机在线精品视频| 欧美精三区欧美精三区| 欧美自拍视频在线| 亚洲一级片免费看| 亚洲国产精品久久久久婷婷884 | 国产一区二区三区在线观看视频| 一级久久久久久久| 富二代精品短视频| 国产精品丝袜一区二区| 久久五月婷婷丁香社区| 一区二区三区人妻| 蜜桃在线一区二区三区| 九一国产精品视频| 91超碰成人| 日本在线播放一区| 久久综合五月婷婷| 91亚洲国产精品| 日韩三区免费| 欧美一级电影久久| 青春草在线免费视频| 色婷婷**av毛片一区| 青青色在线视频| 精品国产一区二区三区av性色| 中文资源在线播放| 欧美日韩另类在线| 免费视频网站www| 中文字幕中文字幕一区二区| 91精品人妻一区二区| 国产91丝袜在线播放| 伊人国产精品视频| 久久se精品一区二区| 少妇性l交大片| 国产欧美在线| 免费av手机在线观看| 欧美fxxxxxx另类| 97超碰免费观看| 欧美大片aaaa| 一区二区三区四区欧美日韩| 国产一区二区在线| 日本福利一区二区三区| 欧美人与牛zoz0性行为| 免费试看一区| 欧美男男gaytwinkfreevideos| 精品综合在线| 日韩欧美在线精品| 久久精品magnetxturnbtih| 久久免费视频66| 国产日韩亚洲精品| 嫩草国产精品入口| 久久福利电影| 亚洲女娇小黑人粗硬| 免费在线观看91| 神马影视一区二区| 青青草国产精品| 波多野结衣在线观看一区二区三区| 日本精品一区二区三区高清 久久| 国产亚洲欧美日韩在线观看一区二区| 欧美乱偷一区二区三区在线| 伊人春色精品| 日韩欧美在线电影| 日韩精品一卡| ijzzijzzij亚洲大全| 欧美国产免费| 奇米影视亚洲色图| 在线亚洲免费| 人人爽人人av| 久久av老司机精品网站导航| 99九九精品视频| 国产aⅴ综合色| 影音先锋黄色资源| 久久人人爽爽爽人久久久| 波多野在线播放| 国产精品久久久久久久久果冻传媒| 日韩av手机在线免费观看| 亚洲精品ww久久久久久p站| 国产精品第108页| 色综合激情久久| 91麻豆国产在线| 精品精品欲导航| 日本国产在线| 精品国产一区二区三区久久狼5月| 日本一级理论片在线大全| 欧美伊久线香蕉线新在线| 精品国产欧美日韩一区二区三区| 亚洲精品欧美日韩| 秋霞影视一区二区三区| 亚洲精品美女久久7777777| 欧美成人综合| 欧美视频第三页| 国产精品资源网站| 美国黄色一级毛片| 亚洲欧洲日产国码二区| 欧美成人aaaaⅴ片在线看| 色婷婷久久综合| 国产美女自慰在线观看| 亚洲欧美日韩国产中文| 国产写真视频在线观看| 欧美在线一区二区视频| 伊人久久综合网另类网站| 国产视频一区二区三区四区| 色琪琪久久se色| 黄色大片在线免费看| 精品一区二区免费视频| 美国黄色一级毛片| 一区二区三区鲁丝不卡| 中文字幕永久在线| 精品国产一区二区三区久久久蜜月| 免费国产在线观看| 欧美激情久久久| 懂色aⅴ精品一区二区三区| 国产伦精品一区二区三区视频黑人 | 熟女俱乐部一区二区| 亚洲最大成人综合| 亚洲视频在线观看一区二区| 日韩精品亚洲视频| 日本h片在线观看| 国产拍精品一二三| 国产一区二区三区四区五区 | 乱码第一页成人| 久久久久国产免费| 日韩毛片一二三区| 国产一级片免费视频| 亚洲黄色免费三级| 欧洲一区二区三区| 亚洲一区二区三区在线视频| 日韩www.| 九九视频精品在线观看| 91网站视频在线观看| 久久综合综合久久| 欧美一级片免费看| 日p在线观看| 国产精品久久久久久久久免费 | 蜜桃视频成人m3u8| 免费精品视频一区| 国产欧美丝祙| 亚洲最大免费视频| 午夜欧美视频在线观看 | 国产成人精品123区免费视频| 国产一区二区高清视频| 黄色日韩在线| 性生交大片免费看l| 一区二区三区四区亚洲| 精品国产va久久久久久久| 久久久久99精品久久久久| 亚洲欧美在线人成swag| 亚洲日本欧美在线| 久久国内精品自在自线400部| 日韩av片在线免费观看| 欧美日韩精品一区二区三区蜜桃| 成人激情电影在线看| 国产成人精品av| 精品国产美女| 日韩av手机版| 国产精品久久久久久福利一牛影视| 特级西西444www高清大视频| 中文字幕9999| 欧洲亚洲精品| 天天综合五月天| 国产v综合v亚洲欧| 日韩xxx高潮hd| 精品性高朝久久久久久久| 美女18一级毛片一品久道久久综合| 蜜桃av色综合| 麻豆成人久久精品二区三区红 | 日韩美女一区二区三区在线观看| 黑森林精品导航| 国产精品欧美经典| 国产三级三级在线观看| 欧美高清视频免费观看| 日韩精品丝袜美腿| 北条麻妃视频在线| 欧美国产精品中文字幕| 国产伦精品一区二区三区四区| 欧美成aaa人片免费看| 岛国av一区| 粗暴91大变态调教| 亚洲少妇中出一区| 欧美在线精品一区二区三区| 日韩美女免费视频| 天天做天天爱综合| a天堂视频在线观看| 欧美中文字幕一区二区三区亚洲| 二区三区在线观看| 精品卡一卡二| 经典三级在线一区| 日韩精品手机在线| 色av中文字幕一区| 极品束缚调教一区二区网站| 可以免费在线看黄的网站| 亚洲欧美日韩久久精品| 四虎精品一区二区三区| 国产精品免费看久久久香蕉| 国产一区日韩一区| 波多野结衣av在线观看| 日韩精品中午字幕| 日韩经典一区| 奇米影视亚洲色图| 亚洲人一二三区| 国产私人尤物无码不卡|