精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微調已死!「共識機制」實現提示詞自我進化,性能飆升

人工智能 新聞
團隊創新性地提出了「共識表決得分」這一進化指標,用于評估單個提示詞在成組工作時的性能潛力,同時采用海島算法提升組內個體的多樣性。

當前,人工智能領域正經歷一場由「模型微調」向「上下文工程」的范式轉變。

通過在輸入中引入更明確的指令和更豐富詳實的知識,「上下文工程」既無需投入高昂的訓練成本,亦不依賴開源模型權重參數,同時能夠為用戶和開發者提供更強的可解釋性,正逐漸成為構建高性能、可擴展且具備自我改進能力的 AI 系統的核心范式。

正因如此,「微調已死」成為了AI領域近期廣泛認可的熱門話題。

斯坦福新論文:微調已死,自主上下文當立

這其中最具有代表性的是提詞適應與優化算法。該類方法(如Alpha Evolve和GEPA)通過不斷迭代優化,得到一個最優提示詞實際使用。

然而,單一提示詞的表達能力有限,往往難以全面嚴謹地表述復雜任務的所有需求。

對于這一缺陷,多提示詞的相互協作是一個很自然的解決方案——單個提示詞可能無法處理特定輸入,但其他提示詞可以彌補這一方面的性能損失。

如果能基于多個提示詞生成的回答提取他們所達成的「共識」,AI系統就更有可能輸出正確答案。

基于這一思想,西湖大學MAPLE實驗室齊國君教授團隊提出了基于「共識機制」的提示詞組進化算法C-Evolve。

與既往僅優化單一提示詞不同,C-Evolve旨在通過進化算法生成一組提示詞。該組提示詞在對輸入信息進行獨立處理后,通過提取所有輸出結果的共識,以實現最優任務性能。

為實現這一目標,團隊創新性地提出了「共識表決得分」這一進化指標,用于評估單個提示詞在成組工作時的性能潛力,同時采用海島算法提升組內個體的多樣性。

通過多提示詞共識機制所帶來的增益,C-Evolve能夠突破單一系統提示詞的性能局限,顯著提升系統整體性能。

具體下面來看。

共識機制

一個AI系統由一系列LLM調用模塊組成。

每個模塊包含系統提示詞。

為了優化這些提示詞,使任務上的性能指標最大化,團隊定義如下優化問題:

其中x代表任務的一條實例數據輸入,m代表評測所需的其他標注。

共識機制由一組獨立、同功能的提示詞共同完成。

給定任務輸入x,每個個體首先分別處理得到結果。

然后,基于所有個體輸出,團隊利用一個共識提取器從中提取最終結果:

對于數學計算、客觀選擇等封閉回答類問題,團隊采用多數表決輸出高頻一致答案。

而對于開放式提問,團隊用LLM表決:通過大語言模型篩選出最具代表性的輸出結果,確保其能夠充分反映群體反饋中的主流意見。

尋找在共識機制下最優的一組提示詞的優化問題如下:

基于海島的多提示詞進化算法

為了獲得一組性能最佳的提示詞,團隊采用了基于海島的進化算法:在個相互獨立的海島內并行迭代種群。

整個進化過程包含兩個階段:

1、基于個體獨立性能的預熱階段;

2、基于跨海島分組協作表現的共識進化階段。

兩階段均使用評估指標和度量數據集進行性能評估,同時另設反饋數據集,用于生成每個個體的詳細執行記錄,作為額外的反饋信息輔助進化。

預熱階段

在此階段,團隊將個體獨立得分作為進化算法的適應度評分。

每輪迭代中,每個海島首先依據島內所有個體的適應度采樣一個父個體。

隨后,將選中的父個體與其在上采樣數據得到的執行反饋、在上測得的評估指標共同輸入至LLM,進化生成新個體。

每個島嶼的個體數量上限為

如超出,算法將淘汰在上表現最差的個體。

完整的預熱階段算法如下:

共識表決階段

此階段中,每個個體依據其組成提示組之后的性能作為進化的適應度。

如圖所示,每個海島均生成一個新個體后,C-Evolve算法會構建個提示組。

每個提示組從各島嶼i中分別采樣一個個體。

而后,團隊基于共識機制測試這些組在上的評估性能。

△基于共識機制的多提示詞進化算法

基于組評估結果,團隊很自然地想到可以以組為單位直接淘汰表現最差組的所有成員個體。

然而,不同組間存在個體重疊,這種激進的淘汰策略將同時影響其他表現較優的提示組。

為解決這一問題,團隊定義了每個個體Π的共識表決得分,通過計算包含個體Π的所有提示詞組的評估性能的平均值,團隊能量化評估該個體有多大潛力參與構建一個好的提示詞組:

考慮到種群的動態變化,團隊采用指數平滑后的得分作為進化的適應度評分,更新公式為:

此處,團隊特意避免直接計算個體參與的所有歷史提示詞組的平均性能。

這是因為早期采樣的提示詞組中的其他成員可能已被淘汰,這些過時結果無法真實反映個體在當前種群中的實際貢獻。

因此,采用EMA方法賦予最新采樣出的組更高權重,能有效抑制早期歷史結果對個體評估的影響。

△共識表決階段算法流程

提示詞性能飆升

實驗表明,C-Evolve同時適用于以Qwen3-8B為代表的開源模型和以GPT-4.1-mini為代表的閉源模型,并提升包括檢索問答、數學推理、指令遵從在內的一系列任務性能。

從IFBench任務上的系統提示詞優化過程示意圖可以看出,3個島會分別演化出關注不同側重點的提示詞,最終組成性能最好的提示詞組。

△IFBench任務提示詞組進化過程可視化圖

對訓練過程中種群特征進行降維并可視化,也可以看出在共識表決進化階段,不同種群會顯著地朝著不同方向進化,這保證了組內的多樣性和互補性。

△C-Evolve進化過程中提示詞種群分布

走向更高效的提示詞優化

總而言之,這篇文章介紹了一種基于共識機制和進化算法的多提示詞優化方法,C-Evolve。

通過系統性優化和融合多提示詞的智能特征,該方法能夠有效突破單一系統提示詞的性能局限,無需參數微調即可實現算法效能的顯著提升。

在上下文工程日益彰顯其重要性的今天,如何通過更好地設計提示詞,挖掘諸如Claude、GPT等成熟商業LLM的模型能力,是一個具有極高實際意義的課題。

「共識機制」為提示詞優化提供了全新的思路,通過模擬生物進化與群體協作的動態過程,不僅提升了提示詞的性能,還增強了模型在復雜任務中的適應能力,有望進一步釋放大語言模型的潛力,推動智能系統向更高效、更自適應的方向發展。

論文地址:https://arxiv.org/abs/2509.23331

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-10-11 18:05:23

AI智能體模型

2024-12-10 09:07:17

2025-10-13 09:03:00

2025-11-17 08:35:00

AI模型工具

2011-05-11 09:01:29

面向對象技術函數式語言

2011-01-07 10:18:28

RSSWeb

2022-09-15 10:44:42

SidecarIstioeBPFizer

2023-02-06 07:37:29

Java編程語言

2023-06-12 12:21:27

研究框架

2014-01-06 09:36:53

IT部門BYODBYOA

2024-02-05 13:09:00

AI數據

2012-02-20 10:12:09

Java

2024-12-19 17:07:31

2025-07-31 02:00:00

智能體Agent人工超級智能

2025-10-11 08:52:06

2022-10-13 08:32:26

區塊鏈共識機制

2015-08-31 10:59:22

2021-01-19 10:58:15

漏洞管理漏洞數據泄露

2011-12-07 10:20:19

Email新聞

2013-01-31 17:23:20

RIM黑莓BB10
點贊
收藏

51CTO技術棧公眾號

国产91丝袜在线播放0| 全球成人免费直播| 欧美性猛xxx| 欧美一二三区| 精品女同一区二区三区| 国产亚洲激情| 久久精品人人做人人爽| 亚洲欧洲日韩综合| 91成人抖音| 亚洲一级在线观看| 色大师av一区二区三区| 亚洲人成电影网站色| 国产性xxxx18免费观看视频| 91欧美在线视频| 成人在线综合网| 国产精品福利网| 国产在线免费视频| 日韩国产欧美| 亚洲精品不卡在线| 国产精品嫩草影视| 欧美日韩国产网站| 精品国产精品自拍| 国产成年人在线观看| 涩涩视频在线观看免费| 国产一区在线不卡| 国产精品老牛影院在线观看| 日韩手机在线观看| 91tv官网精品成人亚洲| 亚洲人成在线观看网站高清| 国产xxx在线观看| 日韩av黄色| 日本韩国欧美在线| 国产91美女视频| 色婷婷在线播放| 亚洲欧美日韩一区| 亚洲精品一品区二品区三品区| 香蕉视频911| 国产成人精品免费网站| 亚洲va久久久噜噜噜| 亚洲视屏在线观看| 久久综合九色| 日韩av电影院| 一级片中文字幕| 一本色道久久综合亚洲精品不| 九九热这里只有精品6| 中日韩一级黄色片| 欧美第一精品| 深夜精品寂寞黄网站在线观看| 自拍偷拍视频亚洲| 欧美人与拘性视交免费看| 日韩精品视频免费专区在线播放| 日本精品一二三| 97青娱国产盛宴精品视频| 日韩精品中午字幕| 91porn在线| 豆花视频一区二区| 亚洲国产天堂久久国产91| www国产视频| 欧美人体视频| 国产午夜精品视频| 一级特黄曰皮片视频| 国内成人自拍| www.欧美免费| 欧美另类videoxo高潮| 国产精品99一区二区三| 美女少妇精品视频| 久久精品性爱视频| 亚洲一区二区三区四区五区午夜 | 欧美日韩精品一区| 国产日本在线观看| 亚洲欧洲三级电影| 伊人网在线免费| 波多野结衣视频一区二区| 欧美日韩视频在线| 日韩免费高清在线| 电影中文字幕一区二区| 精品99999| 性欧美13一14内谢| 99热国内精品永久免费观看| 欧美成人在线影院| 日韩精品在线免费视频| 免费在线看一区| 91丨九色丨国产| 日本天堂在线| 亚洲欧美日韩国产中文在线| youjizz.com在线观看| 偷拍自拍在线看| 欧美日本一道本在线视频| 制服下的诱惑暮生| 一区二区三区视频免费观看| 久久精品国产91精品亚洲 | 精品电影一区| 国产99久久久欧美黑人| 国产精品毛片一区二区在线看舒淇 | 波多野结衣一区| 欧美激情日韩图片| 日本视频www色| 成人午夜av影视| 污视频在线免费观看一区二区三区| 超碰在线网址| 一本久久a久久免费精品不卡| 99日在线视频| 嫩草影视亚洲| 欧美激情在线观看| 在线观看国产成人| 95精品视频在线| 无码毛片aaa在线| 中文字幕系列一区| 亚洲精品成人免费| a在线视频播放观看免费观看| 国产精品chinese| 国产精品网址在线| 亚洲精品wwww| 奇米视频888| 蜜桃一区av| 久久久av一区| 国产成人无码专区| 成人晚上爱看视频| 中文字幕在线中文字幕日亚韩一区| 成人观看网址| 日韩欧美一二区| 5566中文字幕| 蜜臀av一级做a爰片久久| 国产尤物91| 亚洲综合图区| 欧美高清精品3d| 亚洲人成人无码网www国产 | 久久久99免费| 欧美精品自拍视频| eeuss国产一区二区三区四区| 中文字幕欧美日韩| 国产乱码77777777| 2021国产精品久久精品| 日韩av综合在线观看| 99久热这里只有精品视频免费观看| 久久精品久久久久电影| 一级特黄aaaaaa大片| 国产色爱av资源综合区| 欧美综合在线观看视频| 婷婷精品视频| 91av在线不卡| 欧美一区二区少妇| 福利二区91精品bt7086| 日本xxx在线播放| 99精品视频免费| 国外成人在线视频网站| 97超碰免费在线| 亚洲激情视频网站| 国产精品第9页| 97精品电影院| 日本在线视频www| 国内精品久久久久久99蜜桃| 国产精品第二页| 91在线网址| 欧美日韩成人一区| 久久久久久视频| 成人激情黄色小说| 国产在线精品91| 亚洲区小说区| 国产欧美中文字幕| 国产精品va在线观看视色| 日韩欧美激情一区| 日韩欧美三级在线观看| 26uuu精品一区二区三区四区在线| 亚洲午夜精品久久久久久人妖| 婷婷精品在线| 国产精品狠色婷| 国产原创在线观看| 亚洲成人在线视频播放| 久久久久久在线观看| 国产精品欧美精品| 亚洲天堂小视频| 国产在线网站| 欧美一区久久| 国产精品yjizz| 亚洲欧美韩国| 三级精品视频久久久久| 国产成人毛毛毛片| 精品免费在线观看| 日日操免费视频| 国产成人啪午夜精品网站男同| av高清在线免费观看| 免费不卡中文字幕在线| 国产精品视频免费在线| 欧美巨大xxxx做受沙滩| 亚洲一区二区黄| www.色视频| 色噜噜夜夜夜综合网| 天天操天天操天天操天天操天天操| 成人午夜激情视频| 亚洲欧美在线精品| 亚洲电影av| 一区二区免费电影| 久久99精品国产自在现线| 国产精品久久久久久五月尺| 日本电影在线观看| 国产一区二区三区毛片| 亚洲精品无遮挡| 在线观看免费一区| 国产极品美女高潮无套嗷嗷叫酒店| 久久久久久久久久久久久久久99 | jizz久久久久久| 欧美国产日韩一区| yiren22综合网成人| 亚洲成人av资源网| 91在线视频国产| 色综合色狠狠天天综合色| 免费无码毛片一区二区app| 国产日韩av一区二区| 91精品啪在线观看国产| 日韩成人av影视| 一二三四视频社区在线| 亚洲综合婷婷| 亚洲欧美久久久久一区二区三区| 老司机精品在线| 99在线高清视频在线播放| 久久亚洲国产精品尤物| 日本成熟性欧美| 国产后进白嫩翘臀在线观看视频| 综合av色偷偷网| 激情小视频在线| 日韩久久精品成人| 少妇人妻偷人精品一区二区 | 欧美精品色综合| 91久久极品少妇xxxxⅹ软件 | 欧美偷拍综合| 久久涩涩网站| 欧美亚洲大陆| 国产区一区二区三区| 日韩欧美中文在线观看| 国产在线视频91| 成人精品国产亚洲| 国产suv精品一区二区| 午夜裸体女人视频网站在线观看| 欧美极品欧美精品欧美视频 | 日本免费一区二区三区视频观看| 欧美大片黄色| 欧美国产一区二区三区| av免费在线免费| 久久国产精品久久久久| 黄色一级片在线观看| 日韩在线欧美在线| 在线国产情侣| 日韩一中文字幕| 91在线不卡| 久久久精品网站| 超碰免费公开在线| 久久91超碰青草是什么| 青青草原av在线| 欧美激情精品久久久久久蜜臀| 中文字幕在线播放网址| 欧美大片第1页| 91福利在线尤物| 91大神在线播放精品| 精品日韩在线视频| 93在线视频精品免费观看| 亚洲一区二区三区精品在线观看 | 亚洲色图偷窥自拍| 久草福利在线| 亚洲最新中文字幕| 免费不卡视频| 欧美老肥婆性猛交视频| av午夜在线观看| 国产成人精品久久| 亚洲一区av| 国产精品一区二区三区免费观看| 久久久久久毛片免费看 | 狠狠躁夜夜躁人人爽超碰91| 中文字幕第四页| 欧美亚洲精品一区| 国产伦理一区二区| 欧美精品一区二区三区在线播放 | 久久综合色视频| 日韩精品成人一区二区三区| 手机视频在线观看| 国产精品夜夜爽| 亚洲狠狠婷婷综合久久久久图片| 国产亚洲欧洲一区高清在线观看| 黄色片网站在线播放| 亚洲激情自拍视频| 无码一区二区三区| 777午夜精品免费视频| 四虎永久在线观看| 日韩中文字幕欧美| 国产ktv在线视频| 国产精品一二三在线| 成人动漫视频| 先锋影音网一区| 亚洲黄色av| 国产视频1区2区3区| 成人免费福利片| 国产又粗又长免费视频| 亚洲成人av电影| 91久久久久久久久久久久| 亚洲精品国产精品久久清纯直播| av在线资源网| 97色在线视频观看| 日本中文字幕视频一区| 久久riav| 欧美+日本+国产+在线a∨观看| avav在线看| 国产99久久久国产精品潘金| 蜜乳av中文字幕| 亚洲成人第一页| jizz中国少妇| 亚洲一级片在线看| av午夜在线观看| 亚洲最大成人免费视频| 欧美午夜精彩| 激情深爱综合网| 国产成人亚洲综合a∨婷婷| 日韩女同一区二区三区| 午夜欧美2019年伦理| 国产精品久久免费| 中文字幕日本精品| 涩涩视频在线播放| 99国产超薄丝袜足j在线观看 | 中文字幕一区二区久久人妻| 亚洲加勒比久久88色综合| 26uuu亚洲电影在线观看| 国产精品激情av在线播放| 欧美日韩夜夜| 夜夜添无码一区二区三区| 国内精品视频一区二区三区八戒| 日韩一区二区a片免费观看| 激情成人中文字幕| 精品人妻一区二区三区四区不卡 | 亚洲一区二区三区自拍| 亚洲字幕av一区二区三区四区| 亚洲美女性视频| 末成年女av片一区二区下载| 国产精品免费看一区二区三区| 亚洲国产一区二区三区在线播放 | 日韩成人一区| 视频在线99re| 日韩av一级片| 精品国产成人亚洲午夜福利| 欧美性猛交xxxx久久久| 天堂v视频永久在线播放| 午夜精品在线视频| 老司机在线精品视频| 一区二区传媒有限公司| www.欧美日韩国产在线| 国产午夜久久久| 亚洲第一区在线观看| 国产高潮在线| 欧美lavv| 免费在线观看成人| 懂色av蜜桃av| 欧美人xxxx| 在线网址91| 国产精品成人观看视频免费| 亚洲私拍自拍| 国产精品无码一区二区三区免费 | 青青草娱乐在线| 欧美在线日韩在线| 精品国产乱码久久久| 牛夜精品久久久久久久| 国产精品网站导航| 国产乱码久久久久| 欧美国产日本高清在线| 欧美三级电影在线| 中文字幕欧美人妻精品一区| 国产欧美一区在线| 国产绿帽刺激高潮对白| 欧美大肥婆大肥bbbbb| 国产精品久av福利在线观看| 无码精品a∨在线观看中文| 国产亚洲综合性久久久影院| 中文字幕乱码无码人妻系列蜜桃| 久久伊人色综合| 国产精品色呦| 国产理论在线播放| 亚洲色图19p| 视频一区二区免费| 国产精品wwwwww| 欧美不卡视频| 屁屁影院国产第一页| 欧美亚洲一区二区在线观看| jizz性欧美| 免费av在线一区二区| 美女视频一区二区| 国产大片中文字幕| 最近2019好看的中文字幕免费| 91国内精品| 宅男噜噜噜66国产免费观看| 一区二区三区在线视频播放| 欧美孕妇孕交| 99精品国产一区二区| 久久精品日产第一区二区| 欧美丰满熟妇bbbbbb| 日韩久久精品成人| 久久99精品久久久野外观看| 青青青在线视频播放| 亚洲国产精品激情在线观看| 丰满熟妇人妻中文字幕| 国产精品一二区| 国产亚洲精品v| www.99re7| 自拍偷拍免费精品|