精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MIT發布自適應語言模型!新任務,自生成遠超「GPT-4.1合成訓練數據」

人工智能
自適應語言模型框架SEAL,讓大模型通過生成自己的微調數據和更新指令來適應新任務。SEAL在少樣本學習和知識整合任務上表現優異,顯著提升了模型的適應性和性能,為大模型的自主學習和優化提供了新的思路。

經過海量文本預訓練后的大模型,已經能夠很好地理解語言,并根據要求來生成文本。

不過,在部署大模型應用于特定任務、整合新信息或學習新的推理技能時,仍然需要人工標注數據對模型權重進行微調。

大模型是否可以通過「自己生成訓練數據和學習方法」來實現對新任務的自適應?

麻省理工學院的研究人員提出了一個全新的自適應語言模型(Self-Adapting LLMs,簡稱SEAL)的框架,可以讓大模型通過生成自己的微調數據和更新指令來實現自適應。

圖片圖片

論文鏈接:https://arxiv.org/pdf/2506.10943

項目主頁:https://jyopari.github.io/posts/seal

與以往依賴獨立適應模塊或輔助網絡的方法不同,SEAL直接利用模型自身的生成能力來參數化和控制其自我適應過程。

當模型接收到新的輸入時,會生成一個「自編輯」(self-edit)——即自然語言指令,用于指定數據和優化超參數,以更新模型的權重。

通過有監督微調(SFT),自編輯能夠實現持久的權重更新,從而實現長期的適應性。

圖片圖片

為了訓練模型生成有效的自編輯,研究人員采用強化學習循環,以「更新后模型在下游任務中的表現」作為獎勵信號。

在嘗試「將新的事實性知識整合到LLM」的實驗上,研究人員使用SEAL模型生成的合成數據進行微調。

相比與直接在原始文本上微調不同,經過強化學習訓練后,使用SEAL生成的合成數據進行微調,將SQuAD無上下文版本的問題回答準確率從33.5%提高到47.0%,甚至超過了GPT-4.1生成的合成數據。

研究人員還在ARC-AGI基準測試的簡化子集上對SEAL進行了少樣本學習評估,模型需要利用一組工具自主選擇合成數據增強和優化超參數(例如學習率、訓練周期、對特定token類型的損失計算)。

實驗表明,使用SEAL自動選擇和配置這些工具,比標準的上下文學習(ICL)和沒有強化學習訓練的自編輯表現更好。

自適應大模型

自適應大模型(SEAL)可以幫助語言模型更好地適應特定任務。

假設語言模型的參數為θ,C是與任務相關的上下文信息,τ是用于評估模型適應性的下游任務,SEAL會針對每個任務實例(C, τ)進行操作。

在知識整合任務中,C是需要整合到模型內部知識中的段落,τ是關于該段落的問題和答案;

在少樣本學習任務中,C是新任務的少量示例,τ是查詢輸入和真實輸出。

給定上下文C后,模型會生成一個自編輯(SE),通過有監督微調的方式來更新自己的參數。

研究人員使用強化學習來優化自編輯生成的過程:模型生成SE作為動作,根據生成SE后模型在τ上的表現獲得獎勵,并根據獎勵更新策略,以最大化預期獎勵。

獎勵與模型參數θ有關,所以強化學習的狀態為上下文C和參數θ。

圖片圖片

由于模型參數會不斷更新,之前版本模型收集的(狀態,動作,獎勵)三元組可能不再適用于當前模型。

因此,研究人員采用「在線策略」方法,即從當前模型中采樣自編輯,并基于當前模型計算獎勵。

相比其他策略方法,ReSTEM采用的「拒絕采樣+有監督微調」,可以讓訓練過程更穩定。

ReSTEM的過程為:首先從當前模型策略中采樣一些候選輸出(即自編輯),然后只對那些獲得正獎勵的樣本進行監督微調,以此來強化模型的策略。

實驗結果

少樣本學習

研究人員使用了一個沒有經過針對ARC(抽象和推理語料,Abstract and Reasoning Corpus)預訓練的小型開源模型Llama-3.2-1B-Instruct進行實驗。

由于大多數ARC任務對于未經過ARC預訓練的模型來說難度較大,研究人員從ARC訓練集中篩選出11個任務,從評估集中篩選出8個任務,確保這些任務在最優TTT(測試時訓練,test-time training)配置下可以被基礎的Llama-3.2-1B-Instruct模型解決。

在訓練過程中,研究人員使用ReSTEM方法,通過為每個訓練任務采樣15個自編輯來訓練模型。

每個自編輯分別應用于生成15個更新后的模型,然后在對應的測試樣本上進行評估,只保留那些「經過適應后能夠為測試輸入生成正確輸出」的模型。

評估指標為成功率:為每個保留的評估任務生成5個自編輯并評估模型,然后統計能夠產生正確輸出的自編輯的百分比,可以反映出所學自編輯生成策略的質量。

圖片圖片

對比基線方法包括上下文學習(ICL)、TTT+自編輯(無強化學習)和Oracle TTT(性能上限)。

與基線方法相比,SEAL顯著提高了適應成功率(72.5%),而未經強化學習訓練的基礎模型的自編輯成功率僅為20%,不進行任何適應的成功率為0%

知識整合(Knowledge Incorporation)

研究人員使用Qwen2.5-7B模型,從SQuAD(斯坦福問答數據集)的段落中整合新的事實內容。

對比基線包括基礎模型(直接在問答任務上評估,Base Model)、僅在段落上微調模型(Train on Passage)、在段落和自動生成的推論上訓練模型(Train on Passage + Synthetic)、在段落和通過OpenAI API從GPT-4.1收集的模型生成推論上訓練。

圖片圖片

在單段落設置下,僅在段落上微調的模型相比基礎模型幾乎沒有提升(33.5% vs. 32.7%),表明僅使用原始數據是不夠的。

使用GPT-4.1生成的推論可以將準確率提升到46.3%,比僅使用段落的基線提高了12.8個百分點。

使用Qwen2.5-7B模型生成的合成數據可以達到39.7%,提高了6.2個百分點。

經過強化學習后,SEAL進一步將準確率提升到47.0%,盡管模型規模較小,但表現優于使用GPT-4.1生成的合成數據。

在持續預訓練(CPT)設置下,模型從200個段落中整合信息,并在所有974個相關問題上進行評估。研究人員為每個段落采樣5個自編輯生成內容,并將這些合成數據用于持續預訓練。

結果顯示,SEAL在多段落設置下也優于所有基線方法,準確率達到43.8%。

雖然絕對性能低于單段落設置,但相對提升效果保持一致,這表明SEAL發現的編輯策略不僅適用于單個段落的合成數據生成,還能推廣到更廣泛的場景。

圖片圖片

僅需兩次迭代,SEAL就超過了使用GPT-4.1數據的效果,后續迭代的提升效果逐漸減弱,表明策略迅速收斂到一種能夠「將段落提煉為易于學習的基本事實」的編輯風格。

圖片圖片

從例子中,可以看到強化學習可以促使生成更詳細的自編輯內容,而這些更詳細的編輯又反過來提升了整體性能。

參考資料:

https://arxiv.org/abs/2506.10943

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-06-25 08:53:00

模型AI強化學習

2025-06-03 08:12:00

模型框架訓練

2021-12-14 15:59:38

數據模型推理

2023-04-10 09:23:36

模型AI

2015-08-17 14:47:26

大數據

2018-08-20 11:51:35

Worktile

2023-10-13 12:58:04

AI訓練

2022-07-04 15:50:41

Windows 11微軟任務管理器

2025-05-15 11:54:11

GPT-4.1PlusAPI

2021-01-11 11:14:38

Windows 10Windows微軟

2025-04-24 08:29:59

OpenAIGPT-4.1人工智能

2011-04-18 10:50:16

Windows 8任務管理器

2009-07-07 08:43:18

微軟Windows 7新功能

2025-04-16 09:30:16

2025-06-26 15:16:42

AI獎勵模型GPT-4.1

2025-05-06 00:22:00

2025-04-14 09:00:00

模型AI數據

2025-04-15 07:41:18

2021-07-23 08:01:38

Windows 11操作系統微軟

2020-10-30 13:10:14

Windows 10任務管理器PC游戲
點贊
收藏

51CTO技術棧公眾號

日韩图片一区| 涩涩屋成人免费视频软件| 久久久久久一二三区| 国产成人精品av| youjizz亚洲女人| 成人乱码手机视频| 亚洲国产欧美另类丝袜| 麻豆亚洲一区| 国产精品美女一区| 亚洲午夜在线| 国产亚洲精品美女| 制服丝袜中文字幕第一页| xxxx另类黑人| 国产午夜精品一区二区| 91手机在线视频| 久久久久久久久久成人| 欧美激情在线| 国产一区二区美女视频| 午夜性福利视频| 午夜精品成人av| 亚洲一区二区五区| 亚洲国产精品www| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | 在线观看中文字幕亚洲| 欧美一级片在线免费观看| 欧洲av不卡| 亚洲一区二区av电影| 水蜜桃一区二区三区| 秋霞网一区二区| 久久99精品一区二区三区三区| 久久全球大尺度高清视频| 国产免费嫩草影院| 自拍自偷一区二区三区| 精品国产一区二区亚洲人成毛片 | 久久丫精品久久丫| 日韩免费视频| 亚洲人a成www在线影院| 三级视频网站在线观看| 久久av网站| 亚洲蜜臀av乱码久久精品| 欧美国产日韩一区二区在线观看| 亚洲理论片在线观看| a看欧美黄色女同性恋| 欧美日韩美女一区二区| 鲁一鲁一鲁一鲁一色| 日韩欧美一起| 最新不卡av在线| 亚洲一区二区三区免费观看| 免费动漫网站在线观看| 本田岬高潮一区二区三区| 99精品99久久久久久宅男| 91精品国产综合久| 日韩不卡在线观看日韩不卡视频| 欧美一区二区三区四区在线| 日本在线免费观看| 午夜久久福利| 欧美福利视频在线观看| 九九热最新地址| 一区二区蜜桃| 美女久久久久久久| 国产极品国产极品| 亚洲精品极品少妇16p| 色偷偷噜噜噜亚洲男人| sm捆绑调教视频| 欧美电影免费播放| 久久精品国产一区| 日本在线一级片| 久久精品国内一区二区三区水蜜桃| 日韩在线激情视频| 在线观看美女av| 欧美福利电影在线观看| 欧美日韩成人网| 麻豆影视在线播放| 亚洲永久激情精品| 在线视频中文字幕第一页| 亚洲精品成人少妇| 国产一区二区片| www.综合| 色香色香欲天天天影视综合网| 女性隐私黄www网站视频| 国模一区二区| 欧美日韩高清影院| 欧美一级免费在线| 全球av集中精品导航福利| 日韩电影大片中文字幕| 无码一区二区三区在线| 91一区二区三区四区| 免费成人高清视频| 久久国产精品免费看| 久久婷婷丁香| 成人在线播放av| 女人18毛片一区二区三区| 久久久美女毛片| 艳母动漫在线观看| 成人免费图片免费观看| 欧美视频完全免费看| 一级黄色高清视频| 天海翼亚洲一区二区三区| 中文字幕欧美日韩| 久久精品一区二区三| 久久久久久自在自线| 91夜夜揉人人捏人人添红杏| 亚洲av电影一区| 国产精品久久毛片| 日本网站免费在线观看| 日韩成人综合网| 亚洲国产成人精品久久久国产成人一区| 午夜理伦三级做爰电影| 午夜激情久久| 国产91|九色| 国产永久免费视频| 91啪九色porn原创视频在线观看| 亚洲精品中文字幕乱码三区不卡 | 2020日本不卡一区二区视频| 在线观看欧美激情| 在线黄色的网站| 91精品国产91久久久久久一区二区 | 女人一区二区三区| 黄色成人在线| 91精品1区2区| 奇米777第四色| 999成人网| 国产精品白丝jk喷水视频一区| 精品国产亚洲AV| 国产人伦精品一区二区| 欧美日韩一道本| 视频在线一区| 色噜噜狠狠狠综合曰曰曰| 国产乱国产乱老熟| 粉嫩一区二区三区性色av| 一区二区精品免费视频| 欧美专区福利免费| 日韩电影中文字幕在线观看| 久草中文在线视频| 激情偷乱视频一区二区三区| 日本一区免费| 国产精品25p| 精品国产伦理网| 538精品在线观看| 国产一区二区三区在线观看精品| 亚洲国产欧美不卡在线观看| 在线观看的黄色| 亚洲国产欧美一区二区丝袜黑人| www青青草原| 国产一区二三区好的| 自拍偷拍亚洲色图欧美| av在线不卡精品| 亚洲视频axxx| 麻豆精品久久久久久久99蜜桃| 成人激情黄色小说| 91.com在线| 成人涩涩网站| 久久久人成影片一区二区三区| 亚洲第一成人av| 一区二区三区加勒比av| 无码人妻一区二区三区在线视频| 一区二区三区午夜视频| 91香蕉电影院| gogo在线高清视频| 日韩亚洲欧美在线| 免费在线一级片| 国产99久久久国产精品潘金| 日韩在线视频在线| 99a精品视频在线观看| 欧美黑人又粗大| 免费观看成年人视频| 亚洲va韩国va欧美va| 91丝袜在线观看| 性色一区二区三区| 欧洲亚洲一区二区三区四区五区| 日韩免费小视频| 日韩在线视频免费观看高清中文| 国产又粗又猛又爽又黄的| 中文字幕亚洲欧美在线不卡| 国产成人强伦免费视频网站| 欧美va天堂| 国产亚洲情侣一区二区无| 少妇视频在线观看| 一区二区三欧美| 一区二区三区www污污污网站| 亚洲免费资源在线播放| 中文字幕视频观看| 久久福利毛片| 中文视频一区视频二区视频三区| 日本免费精品| 2019av中文字幕| 国产乱视频在线观看| 欧美肥妇毛茸茸| 国产亚洲欧美久久久久| 91麻豆国产香蕉久久精品| www.99av.com| 欧美激情精品久久久六区热门| 精品伦理一区二区三区| 成人在线视频免费| 欧美精品videossex88| 你懂的在线观看视频网站| 91精品国产入口| 日韩精品一区二区av| 国产精品久久久久久久久免费相片 | 久久久精品91| 久久久久久久电影| 少妇性l交大片7724com| 老妇喷水一区二区三区| 视色,视色影院,视色影库,视色网| 久久婷婷国产| 91精品国产自产在线老师啪| 黄色污网站在线观看| 色吧影院999| 日韩精品视频无播放器在线看 | 97超级碰碰碰| 91成人高清| 亚洲国产又黄又爽女人高潮的| 奴色虐av一区二区三区| 一区二区三区四区视频精品免费| 丰腴饱满的极品熟妇| 国产乱淫av一区二区三区 | 狠狠色2019综合网| 黄色动漫在线免费看| 在线中文字幕亚洲| 日韩久久精品一区二区三区| 97久久综合区小说区图片区| 国产中文字幕日韩| 免费福利视频一区二区三区| 欧美激情一级二级| 毛片在线播放a| 亚洲午夜精品视频| 五月婷婷六月丁香综合| 欧美一级在线免费| 91国产精品一区| 在线观看一区二区视频| 中文字幕在线观看视频网站| 亚洲精品国产无套在线观| 香蕉久久久久久久| 国产欧美一区二区三区在线看蜜臀 | 亚洲性无码av在线| 后进极品白嫩翘臀在线视频| 欧美一区三区二区| 国产又黄又爽视频| 欧美人牲a欧美精品| 真实新婚偷拍xxxxx| 在线观看欧美黄色| 在线免费观看av网址| 欧美视频免费在线观看| 日本在线视频免费| 精品久久久久久中文字幕一区奶水 | ...av二区三区久久精品| jizz中文字幕| 国产偷国产偷亚洲高清人白洁| 亚洲AV无码国产精品| 99re热这里只有精品视频| 男人网站在线观看| av不卡在线播放| 亚洲精品乱码久久久久久蜜桃图片| 国产99久久久精品| 折磨小男生性器羞耻的故事| 丰满岳乱妇一区二区三区| 亚洲一级Av无码毛片久久精品| 国产成人av自拍| 国产精品果冻传媒| 99在线精品一区二区三区| 性囗交免费视频观看| 91网站在线播放| 草草影院第一页| 国产日韩精品一区二区浪潮av | 夜夜亚洲天天久久| 国产精品变态另类虐交| 亚洲成a人片综合在线| 日韩欧美中文字幕一区二区| 精品欧美国产一区二区三区| 日本中文字幕第一页| 在线看国产一区| 91 中文字幕| 精品嫩草影院久久| 天天干视频在线| 亚洲区中文字幕| 在线免费av网站| 欧美成人免费网| 电影在线观看一区| 国产精品电影网站| 欧美黄色成人| 粉嫩av一区二区三区免费观看| 人人精品视频| 亚洲人一区二区| 亚洲乱码精品| 久操网在线观看| 久久一区亚洲| 亚洲综合20p| 99re视频这里只有精品| 久久精品在线观看视频| 亚洲资源中文字幕| 国产又粗又猛又黄视频| 欧美一区二区三区精品| 色欲久久久天天天综合网| 尤物九九久久国产精品的分类| 麻豆影视在线观看_| 久久久久亚洲精品成人网小说| 欧美日韩精品免费观看视完整| 成人免费自拍视频| 欧美一级三级| 综合视频在线观看| 亚洲一区二区三区高清| 午夜剧场高清版免费观看| 99v久久综合狠狠综合久久| 妖精视频在线观看免费 | 国产第一页在线观看| 日韩一区二区三免费高清| 神马久久高清| 超在线视频97| 香蕉视频亚洲一级| 国产精品久久久久久久久久直播 | 亚洲视频在线播放| av在线免费网址| 国产精品高潮呻吟久久av无限| 中文字幕一区二区三区四区久久 | 欧美国产三级| 手机看片福利盒子久久| eeuss影院一区二区三区| 人人干在线观看| 日韩欧美在线国产| 亚洲成人久久精品| 久久精品国产欧美亚洲人人爽| 日韩久久一区二区三区| 国产一区自拍视频| 欧美日韩伊人| а 天堂 在线| 国产女主播一区| 国产成人精品777777| 精品国产乱码久久久久久闺蜜| 毛片av在线| 国产精品午夜一区二区欲梦| 无码少妇一区二区三区| 久久人人爽人人爽人人av| 国产一区美女在线| 国精产品一区一区二区三区mba| 色综合色综合色综合色综合色综合| 刘玥91精选国产在线观看| 美女啪啪无遮挡免费久久网站| 日韩综合久久| 亚洲国产精品一区二区第四页av| 久久在线精品| 熟女俱乐部一区二区视频在线| 性做久久久久久免费观看| 亚洲AV无码一区二区三区性| 久久九九亚洲综合| 四虎精品一区二区免费| 亚洲a∨一区二区三区| 青青草成人在线观看| 人与嘼交av免费| 欧美三级欧美一级| wwwxxx在线观看| 国产精品入口免费视| 超碰成人久久| 三级在线视频观看| 中文字幕+乱码+中文字幕一区| 自拍偷拍校园春色| 在线播放精品一区二区三区| 福利一区二区三区视频在线观看| 亚洲高清精品中出| 久久国产剧场电影| 性欧美疯狂猛交69hd| 日韩小视频在线观看专区| 日本中文字幕中出在线| 成人av免费看| 亚洲视频大全| 国产精品无码久久久久一区二区| 色88888久久久久久影院野外| sese一区| 亚洲一区二区久久久久久久| 欧美日韩国产探花| 日本黄色免费观看| 91精品办公室少妇高潮对白| 亚洲精品承认| 91九色蝌蚪嫩草| 亚洲乱亚洲高清| 中文字幕免费高清| 欧美日韩精品一区二区三区四区 | 老牛影视一区二区三区| 老熟妇精品一区二区三区| 一本到高清视频免费精品| 18免费在线视频| 99久久自偷自偷国产精品不卡| 亚洲黄色精品| 美女100%露胸无遮挡| 日韩一区二区三区四区五区六区| 国产盗摄在线视频网站| 欧美性xxxx69| 极品少妇xxxx偷拍精品少妇| 国产在线视频第一页| 亚洲无亚洲人成网站77777| 精品中文字幕一区二区三区四区 | 成人性生交大片免费看在线播放| 精选一区二区三区四区五区| 日本aⅴ免费视频一区二区三区| 久草视频手机在线| 日韩成人在线播放| 久久精品嫩草影院| 熟女少妇在线视频播放| 国产精品色哟哟| 丁香六月色婷婷| 国产精品一区二区女厕厕|