精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta打開AI元認知,讓AI不止會解題,還會總結套路了

人工智能 新聞
Meta、Mila-Quebec人工智能研究所、蒙特利爾大學、普林斯頓大學,他們提出了一套簡單的機制,給大模型打開了元認知,讓它學會了反思和總結。

大語言模型記性不太好。

具體來說,它們在解決需要多個步驟的復雜問題時,經常“顧尾不顧頭”。

比如它剛辛辛苦苦推導出一個幾何級數求和公式解了一道題,下一道題遇到類似的問題,它就把剛才的功夫忘得一干二凈,又從頭開始重新推導一遍。這個過程不僅浪費了大量的計算資源,還拖慢了響應速度。

這就像一個學生,每次考試都現場推導勾股定理,而不是直接記住a2+b2=c2。

Meta、Mila-Quebec人工智能研究所、蒙特利爾大學、普林斯頓大學,他們提出了一套簡單的機制,給大模型打開了元認知,讓它學會了反思和總結。

簡單說,就是讓模型在解完一道題后,自己回頭看看解題過程,把那些重復出現的、可以泛化的推理步驟給揪出來,然后打包成一個簡潔、可重用的‘行為’。

這個‘行為’就像一個武功招式,有個名字,還有一句心法口訣。比如下面這個:

systematic_counting → 通過檢查每個數字的貢獻而不重疊來系統地計算可能性;這樣可以防止遺漏案例和重復計算。

這些‘行為’招式會被收錄進一本不斷更新的‘行為手冊’里。以后再遇到類似的江湖難題,模型就直接翻開手冊查閱對應的招式就行。

這套玩法,研究人員稱之為‘元認知重用’。

AI如何打造自己的‘武功秘笈’

這本秘笈不是人類高手寫的,而是大模型自己琢磨出來的。

整個過程有點像一個三步走的自我修煉:

第一步,找一個策略大師。研究人員請來了DeepSeek-R1-Distill-Llama-70B這個模型擔任‘元認知策略師’。它基于Llama-3.3-70B-Instruct架構,是個解數學題和編程題的好手。

第二步,解題與反思。策略師先老老實實地解決一個給定的問題,寫下詳細的解題思路和答案。然后,它會像一個嚴格的老師一樣,回頭審視自己的解題過程,進行反思:邏輯通不通順?答案對不對?更重要的是,這里面有沒有什么可以提煉出來、以后能用得上的通用技巧?

第三步,提煉與入庫。策略師結合原始問題、自己的解題方案和反思,最終提煉出一套‘行為’,也就是(名稱,指令)的組合,然后把它們鄭重地寫進那本不斷加厚的‘行為手冊’里。

這個過程就像一個武學宗師,打贏了一場架,不僅要復盤勝負手,還要把其中的精妙招式總結成心法,傳給后人。

值得一提的是,這種‘行為手冊’里裝的是程序性的知識,是關于‘如何思考’的方法論。這和市面上主流的檢索增強生成(Retrieval-Augmented Generation,RAG)系統有本質區別,RAG主要存儲的是陳述性的事實知識,比如‘法國的首都是巴黎’,用來回答事實性問題。而‘行為手冊’教的是‘如何找到首都’的通用方法。

‘武功秘笈’的三種實戰用法

秘笈寫好了,研究人員設計了三種方式,讓這本手冊在實戰中發揮作用。

第一種,行為條件推理(Behavior-Conditioned Inference,BCI)。

這是最直接的用法。來了一個新問題,先別急著動手,去手冊里翻一翻,找幾條可能用得上的招式。然后把這些招式連同問題一起,作為上下文(context)喂給解題的模型。

這相當于給學生發了一張寫著關鍵公式和提示的‘小抄’。

怎么找相關的招式呢?

對于像MATH數據集這種題目本身就分好類的,比如‘代數’、‘幾何’,那就簡單了,直接從對應類別的行為里找就行。研究人員從MATH訓練集中隨機抽取了1000個問題,生成了一本包含七個章節(主題)的行為手冊,共計785條行為。

對于沒有分類的數據集,比如美國數學邀請賽(American Invitational Mathematics Examination,AIME)的題目,就得上點技術手段了。研究人員使用BGE-M3模型將問題和手冊里所有行為都轉換成向量,然后用FAISS(一個用于密集向量相似性搜索和聚類的庫)這個工具,快速找到和問題向量最接近的前40條行為。這種基于嵌入的檢索方式擴展性很強,理論上可以維護一個跨領域的超大行為庫,并且能以很低的延遲檢索。

實驗結果顯示,有了‘小抄’的模型,在MATH和AIME數據集上,用更少的輸出令牌就達到了與原始模型相當甚至更高的準確率。省錢又增效。

第二種,行為引導的自我改進。

這個玩法是讓模型自己教自己。模型(比如R1-Llama-70B)既是出題的元認知策略師,又是答題的學生。

它先用較少的計算資源(2048令牌預算)解一道題,得到一個初步的答案。然后,它從這個初步的解題過程中提煉出‘行為’,再把這些新鮮出爐的行為作為提示,回頭用更多的計算資源(2048到16384令牌)重新解這道題。

相當于一個學生做完草稿后,自己總結了一下方法論,然后用這個方法論去完善草稿,寫出更漂亮的最終答案。

研究人員設計了一個‘批判和修訂’的基線方法做對比,也就是讓模型直接回頭看自己的草稿,然后進行修改。

結果顯示,行為引導的自我改進方法,在準確率上幾乎全面優于簡單的‘批判和修訂’。而且隨著給的計算資源增多,性能提升也更穩定。這說明,提煉‘行為’這個步驟,確實能幫助模型更有效地進行自我提升。

第三種,行為條件監督微調(Behavior-Conditioned Supervised Fine-Tuning,BC-SFT)。

前面兩種方法,每次解題都得帶著那本厚厚的‘行為手冊’,不僅麻煩,還增加了輸入令牌的成本。有沒有辦法把這些武功招式直接內化成模型的本能呢?

有,就是監督微調。

這個過程需要三個角色:元認知策略師(還是R1-Llama-70B)、教師(也是R1-Llama-70B)和學生(比如Qwen或Llama系列的一些小模型)。

首先,策略師和教師合作,用BCI的方法生成一大批高質量的、帶有行為指導的解題范例。這批范例構成了一個特殊的訓練數據集DBC。

然后,讓學生模型在這個數據集上進行微調訓練。

關鍵點在于,訓練的時候,學生模型看到的是問題和教師給出的‘行為條件響應’,但并不直接看到行為本身。訓練完成后,在測試時,也只給學生模型問題,不給任何行為提示。

這么做的目的,是希望學生模型能通過學習這些優秀的解題范例,把其中蘊含的推理‘行為’融入到自己的參數里,變成一種直覺。

這就好比一個武學奇才,不需要看武功秘笈,只通過觀摩頂尖高手的過招,就領悟了其中的精髓,并化為己用。

實驗結果令人振奮。經過BC-SFT訓練的學生模型,不僅在解題時令牌效率更高,而且在幾乎所有計算預算下,準確率都超過了兩個基線(原始模型和在普通解題數據上微調的模型)。

更厲害的是,BC-SFT能有效地把一些本身不擅長推理的模型(比如Qwen2.5-14B-Base)調教成推理高手。這表明,BC-SFT不僅僅是教模型如何說得更簡潔,而是真正向模型的參數里注入了有用的推理能力。

研究人員檢查了訓練數據的答案正確率,發現帶有行為指導的范例(44.4%)和普通范例(42.7%)的正確率差距微乎其微。這說明,下游性能的巨大差異,源于解題過程的質量,而不是答案本身。

局限與未來

這項工作為大模型推理效率低下這個老大難問題,提供了一個優雅的解決方案。通過元認知重用,模型進化到可以回憶和運用已有的方法論。

這個框架是通用的,不局限于數學,未來可以在編程、科學推理、甚至開放式對話等領域大放異彩。

當然,目前的實現還有一些局限。

比如,行為的檢索是在解題開始前一次性完成的,不夠靈活。理想情況下,模型應該能在推理過程中,根據需要動態地、即時地去手冊里查找行為,就像人思考時隨時查資料一樣。

另外,這項研究目前只是一個概念驗證。未來能否擴展到構建一個跨越多個領域的龐大行為庫,并在大規模微調中應用,還有待觀察。

看來,不僅會解決問題,還知道‘如何’解決問題的AI就要來了。

責任編輯:張燕妮 來源: AIGC開放社區
相關推薦

2018-07-16 14:19:44

AI銀行人工智能

2025-10-15 00:00:00

2024-12-18 15:02:48

2021-05-25 14:10:34

AI 數據人工智能

2025-09-25 09:04:00

2025-02-04 15:14:34

2019-11-25 14:06:44

AI無人駕駛自動駕駛

2024-12-20 08:00:00

2024-11-01 11:55:14

2023-05-31 09:48:01

開源AI

2021-03-22 17:16:04

AI 數據人工智能

2023-05-22 14:11:22

MetaAI芯片

2025-08-20 13:24:54

2023-05-06 09:34:15

MetaAI

2025-09-02 01:35:00

JavaAIMIP

2021-12-24 16:53:31

AI人工智能

2017-08-10 10:51:58

云AI服務微軟

2025-09-23 10:23:59

2022-12-02 17:37:57

AIOpenAI游戲

2025-09-29 01:15:00

AI代碼CWM模型Python語言
點贊
收藏

51CTO技術棧公眾號

久久久123| 国产日韩一区在线| 欧美日韩另类丝袜其他| 开心激情五月网| 精品av中文字幕在线毛片| 午夜久久免费观看| 国产婷婷色一区二区三区| 欧美日韩xxx| 久久久久久蜜桃一区二区| 五月婷婷丁香花| 黑丝一区二区三区| 欧美一区二区三区电影| 一区视频二区视频| 中文字幕日本人妻久久久免费| 狠狠久久伊人| 亚洲电影第三页| 国产精品久久国产精品| 久草视频免费播放| 欧美9999| 亚洲另类中文字| 91夜夜揉人人捏人人添红杏| 特黄一区二区三区| 日本亚洲欧洲无免费码在线| 欧美激情一区二区三区四区| 国产精品成人一区二区| 亚洲最大成人网站| 欧美激情喷水| 国产亚洲成av人在线观看导航| 91亚洲人电影| 中文在线免费观看| 国产午夜精品一区二区三区欧美 | 国产特级黄色大片| 风流少妇一区二区三区91| 欧美精品综合| 精品国产一区a| 国产av国片精品| 国产精品自拍电影| 欧美a级片网站| 精品成人一区二区| 亚洲精品视频三区| 91最新在线视频| 成人午夜av影视| 777午夜精品福利在线观看| 极品粉嫩小仙女高潮喷水久久| 亚洲午夜天堂| 国产精品午夜久久| 97超级碰碰| 欧美一级特黄视频| 不卡日本视频| 日韩欧美的一区二区| 免费国产黄色网址| 白白色在线观看| 久久久精品人体av艺术| 国产精品自产拍在线观看| 国产免费久久久久| 欧美电影在线观看免费| 欧美三级中文字幕| www.国产在线视频| 大片免费播放在线视频| 国产精品一区二区免费不卡 | 91九色porn在线资源| 久久美女高清视频 | 韩国三级成人在线| 91精品欧美福利在线观看| 成人av在线不卡| 久久精品国产亚洲a∨麻豆| 久久这里只有精品6| 欧美极品日韩| h视频网站在线观看| 国产精品视频你懂的| 国产精品xxx在线观看www| 日韩国产成人在线| 怡红院精品视频在线观看极品| 亚洲欧美三级在线| 91丨porny丨九色| 精品欧美一区二区三区在线观看 | 国产精品一区二区久激情瑜伽 | 国产精品久久久99| 超碰在线97av| 在线亚洲欧美日韩| 国产日韩欧美一区| 国产成人久久久精品一区| 久久久久久久久久久97| 欧美性感美女一区二区| 日韩在线不卡视频| 亚洲综合色一区| 欧美精品一二| 亚洲精品资源美女情侣酒店| 成人三级做爰av| 国产欧美三级电影| 91精品国产91热久久久做人人| 久久综合在线观看| 78精品国产综合久久香蕉| 日韩欧美成人精品| 国产精品国产亚洲精品看不卡| 国产美女高潮在线| 一区二区三区波多野结衣在线观看| 日本午夜精品一区二区三区| 五月婷婷在线播放| 国产日韩av一区二区| 亚洲成年人专区| 午夜免费福利在线观看| 久久精品网站免费观看| 中文字幕一区二区三区四区五区六区| 牛牛精品视频在线| 欧美在线观看一区| 久久九九国产视频| 成人美女黄网站| 欧美一区二区三区色| 性欧美成人播放77777| 国产精品99视频| 色婷婷成人综合| 萌白酱视频在线| 亚洲美女少妇无套啪啪呻吟| 久久久久久久久久久成人| 少妇影院在线观看| 午夜国产一区| 国产成人综合一区二区三区| 二区三区在线视频| 一区在线中文字幕| 国产一二三四五| 在线欧美三级| 91福利区一区二区三区| 日本人视频jizz页码69| 日韩av懂色| 亚洲男人天天操| 国产香蕉在线视频| 国产精品毛片在线看| 91久久中文字幕| 国产黄色片在线播放| 欧美激情综合五月色丁香| 日本午夜激情视频| 日韩一区二区三区色| 亚洲国产精品人久久电影| 国产美女精品久久| 亚洲国产高清视频| 欧美做爰性生交视频| 国产精品成人久久久| 久久99久久精品| 51国偷自产一区二区三区的来源| 成人免费高清在线播放| 色又黄又爽网站www久久| 天天视频天天爽| 国产成人三级| 久久精品国产久精国产一老狼| 欧美卡一卡二卡三| 国内精品伊人久久久久av一坑| 国产91精品一区二区绿帽| 欧美r级在线| 亚洲va韩国va欧美va精品| 精品欧美一区免费观看α√| av成人app永久免费| 亚洲乱码av中文一区二区| 久久久一二三区| 国产白丝精品91爽爽久久| 蜜桃麻豆www久久国产精品| 午夜视频在线观看网站| 欧美日韩国产免费一区二区 | 国产精品久久久久久久久免费高清| 欧美日韩国产123区| 波多野结衣一二三四区| 欧美日韩1区| 成人激情直播| 国产污视频在线播放| 日韩大片免费观看视频播放| 亚洲天堂精品一区| 激情久久久久| 国产精品国色综合久久| 美女搞黄视频在线观看| 91精品国产福利在线观看| 欧美黄色免费在线观看| 不卡av电影在线播放| 亚洲自拍偷拍二区| 日韩欧美精品一区二区三区| 精品视频久久久久久| 成年人视频免费| 国产精品久久久久久久久久久免费看| 亚洲综合20p| 在线看片一区| 日韩精品一区二区三区丰满| 久久www人成免费看片中文| 亚洲国产第一页| 欧美黄色一区二区三区| 99在线精品一区二区三区| 99亚洲国产精品| 国产福利亚洲| 色综合久久悠悠| 天天干,天天干| 成人av资源在线| 免费看又黄又无码的网站| 国产91久久精品一区二区| 午夜精品在线视频| 亚洲h视频在线观看| 亚洲三级电影网站| 亚洲成人天堂网| 韩国av一区| 先锋影音一区二区三区| 粉嫩一区二区三区| 欧美精品在线播放| 国产又粗又猛又爽又黄91| 一区二区三区欧美在线观看| 成年人三级黄色片| 成人影视亚洲图片在线| 7777奇米亚洲综合久久| 秋霞国产精品| 国产亚洲视频在线观看| 欧美一级片免费在线观看| 成人免费毛片嘿嘿连载视频| 黄色国产小视频| 欧美精品91| 亚洲国产高清国产精品| 国产精品麻豆成人av电影艾秋| 久久91精品国产91久久久| h网站在线免费观看| 亚洲精品成人久久久| 99riav国产| 亚洲精品大片www| 阿v天堂2014| 日本视频一区二区| 亚洲国产午夜伦理片大全在线观看网站 | 精品久久久免费视频| 亚洲黄色免费网站| 久久免费手机视频| 91丨九色丨蝌蚪富婆spa| 免费在线激情视频| 精品高清在线| 狠狠色综合色区| 免费亚洲电影| 97香蕉久久夜色精品国产| 国产三级在线播放| 日韩欧美久久一区| 伊人影院中文字幕| 色先锋久久av资源部| 国产情侣自拍av| 亚洲国产精品久久不卡毛片 | 国产欧美亚洲精品| 四虎影视4hu4虎成人| 日韩美女免费视频| 日本中文字幕在线看| 伊人久久大香线蕉av一区二区| 在线观看国产精品入口男同| 色诱亚洲精品久久久久久| 日韩精品手机在线| 亚洲国产成人自拍| 丰满少妇高潮一区二区| 久久久电影一区二区三区| 日本黄色录像片| 久久精品国产成人一区二区三区| 黄色网址在线免费看| 色爱综合网欧美| 国产精品一区二区三区免费观看| 国产一区一区| 日韩av免费一区| 免费成人动漫| 国产精品国产三级国产aⅴ9色 | 韩日在线一区| 欧美男女爱爱视频| 羞羞答答国产精品www一本| 天天综合色天天综合色hd| 国内精品视频在线观看| 亚洲成人自拍| 888久久久| 国产精品自拍合集| 亚洲精品乱码| 欧美两根一起进3p做受视频| 午夜精品久久久久99热蜜桃导演 | 国产在线免费av| 综合久久久久综合| 久久久精品人妻一区二区三区四| 亚洲国产日产av| 少妇太紧太爽又黄又硬又爽| 国产精品理伦片| 粉嫩av性色av蜜臀av网站| 91伊人久久大香线蕉| 国产不卡的av| 日韩精品乱码免费| 日韩国产欧美亚洲| 久久成人一区| 亚洲视频一区二区在线观看| 欧美wwwwwww| 韩日精品视频一区| 性久久久久久久久久久| 国产人成亚洲第一网站在线播放| 国产三级精品三级观看| 亚洲午夜激情av| 欧美视频一区二区在线| 亚洲另类在线制服丝袜| 色婷婷在线观看视频| 欧美日韩欧美一区二区| 免费看国产片在线观看| 欧美猛男gaygay网站| 无码日韩精品一区二区| 欧美日韩国产123区| 人妻一区二区三区免费| 尤物九九久久国产精品的分类 | 亚洲色图久久久| 国产婷婷精品| 日本黄色福利视频| 91在线丨porny丨国产| 日本成人免费在线观看| 午夜欧美在线一二页| 中文字幕永久免费视频| 精品国产91九色蝌蚪| av网站在线播放| 中文字幕久热精品视频在线| 免费动漫网站在线观看| 亚洲女在线观看| 直接在线观看的三级网址| 欧洲成人性视频| 66精品视频在线观看| 肥熟一91porny丨九色丨| 精品国产一区探花在线观看| 日本国产中文字幕| 狠狠色丁香久久综合频道| 日韩毛片在线免费看| 国产不卡高清在线观看视频| 国精产品一区一区| 大桥未久av一区二区三区| 国产一级做a爱免费视频| 欧美视频一区二区三区四区| 日韩中文字幕免费观看| 久久夜色精品国产| 美女尤物在线视频| 国产中文字幕日韩| 九九视频免费观看视频精品| 夜夜添无码一区二区三区| 国产一区久久久| 成年人看片网站| 91在线视频免费91| 久久黄色免费网站| 91麻豆精品国产91久久久资源速度 | 日韩精品一区国产麻豆| 午夜激情视频在线| 国产大片精品免费永久看nba| 欧美jizz19性欧美| 国产v片免费观看| 成人免费va视频| 精品在线免费观看视频| 日韩精品一区二区三区视频播放 | 奇米777第四色| 亚洲一卡二卡三卡四卡五卡| 99在线精品视频免费观看软件| 日韩欧美一二区| 麻豆网在线观看| 4438成人网| 亚洲国产精品久久久久爰色欲| 男人在线资源站| 蜜臀av性久久久久av蜜臀妖精| 日韩女优人人人人射在线视频| 网站一区二区| 久久av高潮av| 国v精品久久久网| 国产精品99精品| 亚洲国产精品va在线看黑人动漫 | 国产蜜臀av在线一区二区三区| 天天干天天干天天| 亚洲美女av电影| 经典三级一区二区| 亚洲欧美丝袜| 国产一区免费电影| 久久精品久久精品久久| 亚洲国产欧美一区二区三区久久| 国产美女精品写真福利视频| 久久天堂国产精品| 99久久久久国产精品| 中文字幕22页| 一区二区三区高清| 国产又爽又黄网站亚洲视频123| 69av视频在线播放| 视频一区中文| 亚洲欧美天堂在线| 亚洲国产综合人成综合网站| 五月婷婷开心中文字幕| 国产成人一区二区三区电影| 久久国产精品亚洲人一区二区三区| 成人亚洲免费视频| 性做久久久久久| 国产女主播在线写真| 成人免费淫片aa视频免费| 国产精品免费99久久久| 亚洲最大综合网| 一区二区三区四区乱视频| 偷拍精品一区二区三区| 国产精品电影在线观看| 中文字幕一区二区av| 自拍偷拍21p| 一区二区三区日韩欧美| 欧美男男同志| 91亚洲国产精品| 国产日本精品| 婷婷社区五月天| 亚洲精品理论电影| 亚洲一区二区三区久久久| 神马影院午夜我不卡影院| 韩日av一区二区| 亚洲自拍一区在线观看| 欧美另类在线播放| 国产一区二区三区日韩精品| 人妻精品久久久久中文字幕69| 在线观看视频一区|