精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率 原創 精華

發布于 2025-10-17 08:30
瀏覽
0收藏

一、AI 模型訓練的“數據幻覺”

在人工智能領域,有一個近乎鐵律的共識:數據越多,模型越聰明。這條邏輯支撐了過去十年的 AI 爆發——從 GPT 到 Claude,再到 DeepSeek,所有巨頭都在堆算力、卷數據、拼參數。

但當 DeepSeek 以 1/30 成本訓練出高性能模型后,這條鐵律開始動搖。 如今,一篇來自 LIMI 團隊的新論文再次顛覆認知——他們僅用 78 個高質量訓練樣本,就讓模型在智能體評測中超越了使用 10,000 個樣本訓練的對手

是的,你沒看錯:128 倍更少的數據,性能反而高出 53.7%。

這個研究的名字叫——LIMI:Less Is More for Intelligent Agency(少即是多的智能體訓練)。 而它提出的核心原則,或許將成為未來 AI 訓練的新范式:

“真正的智能,不源于數據的堆砌,而源于高質量的任務體驗。”

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

二、什么是“智能體”?

在深入 LIMI 之前,我們得先搞清楚“智能體(Agentic AI)”到底意味著什么。

過去的語言模型,只能“說”,不能“做”。 它們接收提示詞、生成回答,像是一個被動的智囊。

但智能體不同。它會主動思考、規劃、行動。 正如論文中定義的那樣:智能體是一種具備自主行動能力的 AI,可以主動發現問題、制定計劃、調用工具并與環境交互完成任務。

這意味著,它不再只是回答問題,而是能:

  • 主動調試代碼;
  • 自動完成數據分析任務;
  • 自行規劃科研流程;
  • 在遇到錯誤時進行自我修復。

舉個例子: 傳統模型像學生,等老師提問再作答; 智能體像工程師,能獨立接項目、寫代碼、調工具、修 bug,一條龍完成任務。

這正是當下 AI 從“對話型”向“執行型”演化的關鍵拐點。 而 LIMI,正是要解決——如何高效訓練出這樣的智能體?

三、為什么“更少的數據”反而更有效?

十幾年來,AI 領域一直信奉“Scaling Law”:模型參數越大、數據越多、性能越強。 但近幾年開始出現反例——尤其是在復雜推理與多步驟任務上,“更多”反而拖慢了模型學習的關鍵能力。

比如:

  • LIMA (2023)表明,只需 1000 個高質量示例即可實現模型對齊;
  • LIMO (2025)證明,用 817 個精心挑選的數學樣本,就能讓模型在復雜推理中提升 45.8%。

LIMI 則把這一理念推向極致。 它認為:學習“智能行為”不是記憶,而是體驗。

想象你學做菜。 看 10,000 個視頻,也許能背下每個菜譜; 但跟廚師實操一次,切菜、調味、試錯、修正,你才能真正“會做”。

AI 訓練也是如此。 LIMI 沒有用成千上萬條重復樣本,而是精挑出 78 條高質量的“完整任務體驗”——每條都涵蓋了從計劃、執行、到修正的全過程。 這讓模型學到的,不是孤立知識點,而是完整的解決問題思維鏈

四、LIMI 的三大創新:用結構化體驗替代大規模樣本

LIMI 的突破,來自三個關鍵方法。

1. Agentic Query Synthesis:讓訓練任務更像真實協作

傳統訓練樣本通常是單輪問答或簡單任務。 LIMI 反其道而行,它模擬了真實開發者與研究者的協作場景。

  • 從專業開發者與科學家的真實問題中采樣 60 條;
  • 再利用 GPT-5 從 GitHub Pull Request 自動生成 18 條“偽真實”任務;
  • 每個任務都要求模型進行多輪推理、工具調用與環境交互

這讓訓練過程不再是填鴨式學習,而像在真實工作中積累經驗。

2. Trajectory Collection Protocol:記錄“全過程”的學習軌跡

每個任務不僅包括輸入與輸出,還完整記錄了模型思考、行動、反饋的全過程

  • 推理步驟(思維鏈)
  • 工具調用(如代碼編輯、API 請求)
  • 環境反饋(如報錯、用戶修改)

平均每條任務記錄 4.2 萬個 token,最長超過 15 萬。 這讓模型真正理解“行動邏輯”——什么時候思考、什么時候動手、遇錯如何修復。

3. Focus on High-Impact Domains:聚焦真實高價值場景

LIMI 并非泛化采樣,而是聚焦兩大高密度領域:

  • Vibe Coding:多人協作開發、調試與測試;
  • Research Workflows:科研任務,如論文檢索、實驗設計與數據分析。

這兩個領域的共性是:復雜度高、反饋密集、需要多步行動。因此每個樣本都極具信息密度,相當于一場高質量的“項目實戰”。

五、從 GitHub 到協作智能:數據集是怎么煉成的?

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

LIMI 數據集的構建過程堪稱“工藝級”:

  1. 任務池創建:從 GitHub 熱門項目中抽取真實 Pull Request,再經 GPT-5 轉化為結構化問題。
  2. 嚴格篩選:由 4 位博士級專家人工審核,確保語義完整與任務真實度。
  3. 交互生成:使用具備代碼執行與網頁訪問功能的 SII CLI 環境,讓 GPT-5 與人工協作完成任務,全程錄制交互軌跡。

最終留下的 78 個樣本,每一個都像一個完整的“項目案例庫”。 每條記錄濃縮了數小時的真實問題解決過程,信息密度遠超常規訓練樣本。

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

六、測試結果:78 個樣本干翻 10,000 個樣本的模型

在全新評測集 AgencyBench 上,LIMI 展現了驚人的性能:

模型

樣本量

性能分數

GLM-4.5

10,000

45.1%

DeepSeek-V3.1

10,000

11.9%

Kimi-K2

10,000

24.1%

LIMI (78 樣本)

78

73.5%

在子指標上同樣碾壓:

  • 首輪任務完成率:71.7% vs 37.8%
  • 三輪內成功率:74.6% vs 47.4%
  • 執行效率:74.2% vs 50.0%

更令人驚訝的是,LIMI 的泛化能力也極強—— 在代碼生成(HumanEval)、工具使用(TAU2-bench)、科研計算(SciCode)等多項任務中,LIMI 都刷新了記錄。

這說明,它學到的并非某類任務的套路,而是真正的“通用行動智能”。

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

七、案例對比:智能體的“實戰智商”

研究團隊還在論文中展示了幾個鮮明的案例:

  • 五子棋游戲開發任務:傳統模型 GLM-4.5 無法完成棋盤渲染與勝負判斷;LIMI 一次性完成所有模塊。
  • 數據集發現任務:LIMI 在 Hugging Face 上能精確找到最相關的數據集;而 GLM 輸出了無關內容。
  • 科學函數擬合任務:GLM 需要多次提示才能達到誤差 1.14e-6,LIMI 首次嘗試就達到 5.95e-7。
  • NBA 交易推理任務:LIMI 僅用一次提示即可得出正確推理路徑。

這些結果充分證明——LIMI 不僅“知道”,還“會做”。

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

八、“智能體效率原理”:AI 自主性的本質

LIMI 團隊在論文中提出了一個新概念:Agency Efficiency Principle(智能體效率原理)。 它指出:

“機器自主性,不是由數據量堆出來的,而是來自高質量行動演示的戰略性設計。”

這句話的意義深遠。 它告訴我們: 與其追求更多的樣本,不如去設計更有代表性的任務; 與其擴充數據規模,不如提升數據的“行動價值密度”。

換句話說,AI 的未來競爭,不再是誰爬取更多網頁,而是誰更懂“教模型做事”。

九、從“堆料”到“調味”:AI 訓練的新范式

LIMI 的出現,預示著 AI 訓練的一個重要拐點。

過去十年,AI 的進步靠“堆料”:堆數據、堆顯卡、堆參數。 但未來十年,將更像“調味”:精準選擇素材,合理設計任務,優化模型體驗。

這意味著:

  • AI 開發的重心將從算力轉向認知設計
  • 高質量任務數據將成為新型競爭壁壘
  • 中小企業也能以低成本訓練高性能模型。

這是一場從“量”到“質”的范式轉移,可能徹底改變 AI 的生態格局。

十、寫在最后:AI,不需要“更大”,而需要“更聰明”

LIMI 的研究,用 78 個樣本告訴我們一個簡單卻深刻的道理——AI 不需要更多數據,它需要更好的學習體驗。

當模型從“被動輸出”變成“主動行動”, 當訓練從“堆疊樣本”變成“設計體驗”, 我們或許才真正踏上了“通用人工智能”的道路。

未來的 AI,不屬于擁有最多數據的公司, 而屬于那些最懂如何教機器思考和行動的人。


本文轉載自??Halo咯咯??    作者:基咯咯

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-10-17 08:30:52修改
收藏
回復
舉報
回復
相關推薦
国产亚洲自拍偷拍| 欧美精品久久久久| 五月天av在线播放| 免费看a在线观看| 国产乱子伦视频一区二区三区| 久久久精品免费| 中国免费黄色片| 伊伊综合在线| 亚洲品质自拍视频网站| 国产呦系列欧美呦日韩呦| 中文字幕av久久爽| 国内精品久久久久国产盗摄免费观看完整版 | 精品视频第一区| 中国黄色一级视频| 亚洲茄子视频| 久久精品国产免费观看| 一区二区三区免费在线观看视频| 日日夜夜精品| 色播五月激情综合网| 亚洲中文字幕无码一区二区三区| 青青草视频免费在线观看| 国产酒店精品激情| 国产精品久久久久99| 国产香蕉在线视频| 亚洲色图网站| 最近2019免费中文字幕视频三| 中文字幕天堂av| 色综合.com| 在线观看不卡一区| 无罩大乳的熟妇正在播放| 婷婷丁香在线| 中文字幕中文字幕一区二区| 欧美高清性xxxxhdvideosex| 可以免费观看的毛片| 激情成人午夜视频| 国产精品视频区| 国产免费www| 亚洲欧美日韩专区| 午夜精品理论片| 亚洲色婷婷一区二区三区| 日韩在线观看| 中文字幕无线精品亚洲乱码一区| 国产熟妇搡bbbb搡bbbb| 日韩高清影视在线观看| 亚洲激情在线观看视频免费| 无码国产精品一区二区高潮| 精品视频一二| 91精品婷婷国产综合久久性色| 污污的网站18| 欧美日一区二区三区| 色素色在线综合| www日韩视频| 日韩电影免费观看高清完整版| 黄色一区二区在线观看| 大陆av在线播放| 91高清视频在线观看| 亚洲一区在线观看免费| 国产青草视频在线观看| 欧美激情成人动漫| 亚洲成人在线网站| 欧美亚洲国产成人| 神马电影网我不卡| 欧美影院一区二区三区| 蜜桃福利午夜精品一区| 国产999精品在线观看| 日韩午夜激情视频| 国产香蕉精品视频| 欧美91在线| 亚洲欧美国产日韩天堂区| 91成人破解版| 成人激情在线| 欧美成人手机在线| 国产稀缺真实呦乱在线| 男人的天堂成人在线| 国产精品欧美在线| 99久久精品免费看国产交换| 成人免费视频播放| 你懂的视频在线一区二区| 成人性爱视频在线观看| 亚洲视频在线一区观看| 欧美无砖专区免费| 伊人久久精品一区二区三区| 欧美怡红院视频| 欧美污在线观看| 久久97精品| 一区二区三区回区在观看免费视频| 青青青视频在线免费观看| 欧美成人一品| 日本欧美一级片| 国产露脸国语对白在线| www.一区二区| 亚洲欧美日韩精品在线| 色呦呦在线观看视频| 日韩欧美精品网址| 国内自拍第二页| 老司机成人在线| www亚洲欧美| 可以免费看的av毛片| 麻豆一区二区三| 成人毛片网站| 97视频在线观看网站| 亚洲国产精品久久久久秋霞影院| 欧美一级黄色片视频| 免费观看在线一区二区三区| 日韩av影视在线| 黑鬼狂亚洲人videos| 久久黄色网页| 国产91视觉| 在线观看免费版| 精品美女久久久久久免费| 五月激情婷婷在线| 免费看成人哺乳视频网站| 欧美大片免费看| 中文字幕免费播放| 91美女在线观看| 成人午夜视频免费观看| 久久69成人| 亚洲人成网站在线播| 久久免费少妇高潮99精品| 精品伊人久久久久7777人| 欧美精品七区| av免费不卡国产观看| 日韩一区二区在线免费观看| 日韩女同一区二区三区| 99国产精品| 岛国视频一区| 成人av福利| 欧美精品乱人伦久久久久久| 国产亚洲精品熟女国产成人| 99国产精品| 国产三区精品| 另类视频在线| 日韩一区二区免费视频| 亚洲色偷偷综合亚洲av伊人| 日日夜夜精品视频天天综合网| 精品在线一区| 国产精品蜜芽在线观看| 精品久久久久香蕉网| 欧美日韩三级在线观看| 国产原创一区二区| 自拍另类欧美| 色噜噜成人av在线| 久久久国产精品视频| 91亚洲欧美激情| 国产精品电影一区二区三区| 尤物国产在线观看| 色777狠狠狠综合伊人| 国产精品欧美风情| 香蕉视频网站在线观看| 欧美日韩国产一二三| 日韩一区二区三区四区视频| 日本一不卡视频| 水蜜桃一区二区三区| a屁视频一区二区三区四区| 在线视频日本亚洲性| 中文字幕日产av| 国产精品美女久久久久久久久| wwww.国产| 97精品国产| 亚洲a级在线观看| 欧美草逼视频| 日韩精品999| youjizz在线视频| 久久精品视频一区二区三区| 九九热在线免费| 99热国内精品| 成人黄动漫网站免费| 国产在线88av| 亚洲丝袜一区在线| 一级黄在线观看| 亚洲精品高清在线| 欧美双性人妖o0| 日韩成人一区二区| 99中文字幕在线观看| 日本中文字幕在线一区| 国产精品久久久久久影视| 日本a级在线| 亚洲成成品网站| 男人天堂2024| 亚洲丝袜自拍清纯另类| 成熟妇人a片免费看网站| 西西裸体人体做爰大胆久久久| 色99中文字幕| 亚洲国产中文在线二区三区免| 2019中文字幕在线观看| 午夜免费视频在线国产| 欧美第一区第二区| 国产伦精品一区二区三区视频我| 国产精品国产三级国产普通话蜜臀 | 97中文在线观看| 中文字幕在线视频久| 视频直播国产精品| 亚欧在线观看视频| 欧美日韩国产精品成人| 日本a在线观看| 国产精品久久久久一区| 四季av综合网站| 国内久久婷婷综合| 欧美 激情 在线| 欧美精品日韩| 亚洲激情一区二区三区| 激情av综合| 91影院在线免费观看视频| 亚洲天堂导航| 欧美黑人狂野猛交老妇| av片在线看| 亚洲精品一区中文| www.激情五月| 欧美巨大另类极品videosbest| 你懂的国产视频| 亚洲欧美另类小说视频| 新91视频在线观看| 不卡电影免费在线播放一区| www.cao超碰| 久久久久国内| 五十路熟女丰满大屁股| 在线一区电影| 亚洲国产欧洲综合997久久 | 正在播放亚洲| 激情综合网五月| 久久久com| 激情av综合| 动漫美女被爆操久久久| 国产精选久久| 国产一区香蕉久久| 欧洲成人一区| 国产成人涩涩涩视频在线观看| a级片在线免费| 欧美高清在线视频观看不卡| 国产午夜精品久久久久免费视| 在线日韩中文字幕| 国产三区四区在线观看| 亚洲视频电影图片偷拍一区| 日本天堂影院在线视频| 亚洲国产日韩欧美在线99| 亚洲精品字幕在线观看| 欧美成人a在线| 国产福利资源在线| 日韩欧美成人激情| 国产肥老妇视频| 51精品视频一区二区三区| 国产一区二区波多野结衣| 欧美日韩国产一级片| 国产又粗又猛视频免费| 欧美丰满美乳xxx高潮www| 亚洲天堂久久久久| 欧美日本在线观看| 国产精品玖玖玖| 日韩视频免费观看高清完整版| 国产女人18毛片18精品| 91精品国产综合久久久久| 国产伦子伦对白视频| 日韩欧美三级在线| 亚洲精品久久久久久久久久| 精品电影一区二区三区| 天天操天天操天天干| 精品一区二区三区四区| 亚洲色图欧美视频| 亚洲视频免费一区| 日本a级在线| 欧美极品欧美精品欧美视频| 福利写真视频网站在线| 2019亚洲日韩新视频| 性感美女一区二区在线观看| 国产精品视频不卡| 精品视频在线播放一区二区三区| www日韩av| 日日天天久久| 亚洲乱码一区二区三区三上悠亚 | youjizz.com在线观看| 激情久久综合| 99精品人妻少妇一区二区| 老司机精品视频网站| 色18美女社区| 99精品热视频| 性色国产成人久久久精品| 亚洲精品国产精华液| 国产精品视频久久久久久久| 日本丶国产丶欧美色综合| 国产又粗又猛又爽| 亚洲成人网在线| av片在线免费观看| 久久久久久一区二区三区 | 日韩欧美高清视频| 亚洲中文字幕在线观看| 精品国产一区二区三区av性色| 日韩av地址| 久久精品免费电影| 女海盗2成人h版中文字幕| 国产精品久久久久一区二区| 一区二区在线视频观看| 欧美另类一区| 中文字幕一区二区三区久久网站| av免费观看网| 国产又黄又大久久| 91精品人妻一区二区三区蜜桃欧美| 国产精品美女www爽爽爽| 久久午夜无码鲁丝片| 欧美亚洲免费在线一区| 亚洲乱码在线观看| 在线性视频日韩欧美| 日韩av一卡| 亚洲在线观看视频| 欧美一二区在线观看| 国产一二三在线视频| 久久成人综合网| aaaaa级少妇高潮大片免费看| 亚洲人成网站精品片在线观看| 亚洲成人av影片| 欧美成人官网二区| 美女隐私在线观看| 国产97在线|日韩| 懂色av一区二区| 国产精品无码乱伦| 日本中文在线一区| 欧美老熟妇乱大交xxxxx| 亚洲一区中文日韩| 国产精品视频一区二区三区,| 亚洲色图校园春色| 久久久男人天堂| 国产日韩亚洲精品| 国内久久精品| 国产成人精品一区二区在线小狼| 中文字幕在线不卡| 羞羞色院91蜜桃| 亚洲欧美激情一区| 一区二区三区短视频| 久久99欧美| 99国产精品| 182在线视频| 亚洲成a人v欧美综合天堂| 99国产精品久久久久99打野战| 中日韩午夜理伦电影免费| 欧美性猛交xxx高清大费中文| 国产伦精品一区二区三区四区视频 | 78精品国产综合久久香蕉| 欧美乱偷一区二区三区在线| 99国内精品| 日本一区二区三区网站| 精品久久久久久久久中文字幕| 亚洲美女综合网| 久久久久久久av| 高清欧美性猛交xxxx黑人猛| 丰满的少妇愉情hd高清果冻传媒 | 欧美一区免费视频| 首页国产欧美久久| 中字幕一区二区三区乱码| 在线观看国产91| 日本高清中文字幕在线| 成人黄色免费在线观看| 天天影视综合| 青娱乐国产精品视频| 亚洲一区二区三区视频在线播放| 亚洲国产精品久久久久爰性色| 久久久久久69| 欧美调教在线| 久草综合在线观看| 国产精品美女一区二区三区| 国产男女无套免费网站| 欧美激情按摩在线| 日本三级久久| 国产精品igao| 亚洲私人影院在线观看| 亚洲精品免费在线观看视频| 久久久免费在线观看| 亚洲香蕉视频| 免费成年人高清视频| 夜色激情一区二区| 四虎在线观看| 国产精品丝袜久久久久久高清| 亚洲精品久久| 国产草草浮力影院| 91福利资源站| 91精选在线| 免费日韩av电影| 蜜臀a∨国产成人精品| 久久久久久免费观看| 国产婷婷97碰碰久久人人蜜臀| 777午夜精品电影免费看| 97超碰人人爱| 91美女视频网站| 国产精品一级视频| 97国产在线观看| 色无极亚洲影院| 中文字幕乱码一区| 欧美日韩一二区| 都市激情国产精品| 亚洲国产精品一区在线观看不卡| 国产98色在线|日韩| 无码人妻精品一区二区蜜桃色欲| 久久久久999| 免费av一区二区三区四区| 999在线精品视频| 欧美视频不卡中文| 久久国产精品一区| 欧美精品尤物在线| 成人视屏免费看| 伊人久久亚洲综合| 538国产精品视频一区二区| 亚洲成人av|