精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1不是唯一路徑!MIT新研究:在測試時訓練,模型推理能力最高升至5.8倍

人工智能
不同于傳統的先訓練后測試模式,測試時訓練(Test-Time Training,TTT)在部署階段面對新的測試樣本時,不直接用訓練好的模型去推理。

o1不是通向大模型推理的唯一路徑!

MIT的新研究發現,在測試時對大模型進行訓練,可以讓推理水平大幅提升。

在挑戰超難的ARC任務時,準確率最高可提升至原來的5.83倍。

圖片圖片

這樣的表現不僅優于GPT-4和Claude,如果與其他推理方法相結合,還能超越人類的平均水準。

圖片圖片

OpenAI o1團隊成員Noam Brown表示,o1的大規模計算可能不是最好的方法,很高興看到有學者在提高推理能力上探索新的方法。

圖片圖片

在測試中訓練模型

不同于傳統的先訓練后測試模式,測試時訓練(Test-Time Training,TTT)在部署階段面對新的測試樣本時,不直接用訓練好的模型去推理

在推理之前,測試樣本自身攜帶的信息,會通過快速的訓練過程被用于調整模型參數。

總體來說,TTT過程中一共有三個關鍵階段——訓練數據生成、模型適應范式設計以及推理階段的策略

數據生成的核心是將測試任務中蘊含的輸入輸出對關系,通過數據增強的方式最大限度地利用,可具體分為兩個步驟。

首先是基于leave-one-out構造新的任務。

對于包含K個輸入輸出對的測試任務,依次將每個樣本留出作為測試樣本,其余K-1個作為訓練樣本,由此構造出K個新的TTT訓練任務。

這樣就可以從一個測試任務出發,構造出K個結構一致但內容互補的新任務,從而擴充了TTT訓練數據。

在此基礎上,作者還進行了數據增強,主要包括對輸入輸出施加各類幾何變換,以及打亂訓練樣本對的順序。

經過這一步,TTT訓練集的規模可以得到顯著擴大。

整個TTT數據構造過程可高度自動化,不依賴人工標注。

圖片圖片

利用構造好的TTT數據集,就可以對預訓練好的語言模型進行測試時訓練。

考慮到測試時的資源限制,作者采用了參數高效的LoRA,為每個測試任務學習一組獨立的adapter參數,附加在預訓練模型的每一層之上,通過一個低秩矩陣與原始權重相乘起到調節作用。

過程中還額外加入了對所有前綴序列的預測,目的是通過在各種長度的演示樣本上都計算損失,鼓勵模型盡早地從少量信息中總結出抽象規律,從而提高魯棒性。

圖片圖片

最后,為了實現TTT效果的最大化,作者在推理階段應用了數據增強和集成學習策略。

推理過程中,先利用一系列預定義的幾何變換算子(如旋轉、翻轉等)擴充原始輸入,生成若干等價視角下的輸入變體。

之后將每個變體輸入并行地送入LoRA-tuned模型,獨立完成預測,然后再對齊和還原到原始輸入空間,由此得到一組成對的預測。

在成對預測的基礎上,通過分兩層投票的方式完成集成融合:

  • 第一層在每種變換內部進行投票,選出置信度最高的Top-3個預測;
  • 第二層在不同變換的Top-3預測之間進行全局投票,選出最終的Top-2作為輸出。

這一推理策略,既通過數據增強引入了輸入的多樣性,又用分層投票的方式對不同來源的預測進行了結構化的組合,進一步提升了TTT方法的效果。

圖片圖片

ARC任務準確率最高升至6倍

為了評估TTT方法的效果,研究團隊以8B參數的GPT-3作為基礎模型進行了測試。

如果不使用TTT僅進行微調,模型在ARC數據集上的準確率只有18.3%,加入TTT后提升到47.1%,增長率達到了157%。

圖片圖片

另外,作者還從ARC數據集中隨機選擇了80個任務作為子集進行了測試。

測試發現,TTT方法對于1B模型的提升效果更加明顯,調整后模型的準確率接近調整前的6倍。

并且在調整前后,1B和8B兩個規模的模型之間的相對差距也在縮小。

圖片圖片

進一步地,作者還將TTT方法與之前在ARC任務上取得優異成績的BARC(Bootstrapping Approach for Reward model Construction)方法進行了比較和結合。

具體來說,作者首先獨立運行這兩個系統,得到它們在每個測試任務上的輸出。

如果兩者輸出完全一致,則直接認為推理結果是正確的;

如果輸出不一致,則看BARC是否能夠生成確定的、唯一覆蓋所有測試樣本的解題程序,若是則認為BARC的輸出更可靠;

反之,如果BARC生成了多個候選程序但無法確定最優解,或者干脆無法生成任何滿足約束的程序,則認為TTT的輸出更可靠。

兩種方式配合使用后,取得了61.9%的SOTA成績,已經超過了人類的平均水平

圖片圖片

One More Thing

根據作者在推文中的介紹,在這篇論文發布前,一個叫做MindsAI的團隊已經發現使用了相同的技術。

利用TTT技術,該團隊已經用58%的正確率取得了ARC挑戰的第一名。

作者的論文發布之后,MindsAI團隊領導者Jack Cole也發文進行了祝賀:

很高興,我們掀起了這場對TTT的興趣風暴。

圖片圖片

同時,Jack還推薦了另一名研究TTT的學者——斯坦福大學華人博士后Yu Sun,表示他的研究值得被關注。

圖片圖片

Sun的個人主頁顯示,他針對測試時訓練進行了大量研究,相關成果入選過ICML、NeurIPS、ICLR等多個頂級會議。

圖片圖片

論文地址:https://ekinakyurek.github.io/papers/ttt.pdf

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-09-24 11:01:03

2025-01-23 14:53:15

2024-10-05 00:00:00

2025-01-23 10:45:52

2025-01-13 12:30:58

2024-11-18 14:00:00

模型AI

2025-07-22 10:22:02

2025-01-20 13:08:25

2025-01-20 09:28:00

AI工具模型

2024-11-07 15:40:00

2025-04-18 09:13:00

2025-02-08 14:03:25

2024-06-17 13:34:54

2025-04-08 00:40:00

谷歌合成數據大模型

2025-02-03 14:17:27

2024-09-19 13:32:24

2024-10-05 15:30:00

LLM模型推理

2024-09-13 06:32:25

2011-03-28 10:52:51

戴爾高效企業

2024-10-10 13:01:43

點贊
收藏

51CTO技術棧公眾號

成人无码精品1区2区3区免费看| 最新av在线免费观看| 日韩 欧美 综合| 久久动漫网址| 色综合中文综合网| 视频一区免费观看| 97人妻一区二区精品免费视频| 久久99国内| 欧美日韩精品综合在线| 亚洲精品欧美精品| 97免费观看视频| 中日韩男男gay无套| 亚洲美女av在线播放| 精品无码国产一区二区三区av| 隣の若妻さん波多野结衣| 亚洲黄色天堂| 亚洲精品自拍第一页| 不卡av免费在线| 黄av在线播放| 久久久久久黄色| 亚洲综合色激情五月| 69av视频在线| 亚洲影院天堂中文av色| 欧美久久久久久久久久| 加勒比成人在线| 在线a人片免费观看视频| 国产乱码精品一区二区三区av | 男女h黄动漫啪啪无遮挡软件| 国产chinasex对白videos麻豆| 亚洲国产精品一区制服丝袜| 亚洲国产中文字幕久久网| 黄色免费网址大全| 国产极品人妖在线观看| 国产精品午夜久久| 91超碰rencao97精品| 亚洲中文一区二区| 亚洲狼人精品一区二区三区| 丝袜一区二区三区| 少妇特黄一区二区三区| www一区二区三区| 色综合久久综合网| 大陆av在线播放| 美国黄色一级视频| 成人不卡视频| 欧美午夜www高清视频| 日本一道在线观看| www在线免费观看| 99精品在线观看视频| 91在线精品播放| 中文字幕理论片| 母乳一区在线观看| 午夜精品久久久久久99热| 91精品一区二区三区蜜桃| 成人精品久久| 亚洲欧美中文字幕| 国产a√精品区二区三区四区| 伊人网在线播放| 亚洲主播在线观看| 永久免费精品视频网站| av中文天堂在线| 久久色视频免费观看| 国产高清在线一区二区| 国产视频第一页| 麻豆久久久久久久| 国产精品第一视频| 五月天婷婷导航| 亚洲日产国产精品| 欧美激情a在线| 欧美性猛交xxxxx少妇| 亚洲五月综合| 欧美成aaa人片在线观看蜜臀| 亚洲女人久久久| 久久网站免费观看| zzijzzij亚洲日本成熟少妇| 老司机深夜福利网站| 久久精品国产68国产精品亚洲| 亚洲黄一区二区| 91超薄肉色丝袜交足高跟凉鞋| 香蕉大人久久国产成人av| 91精品国产91久久久久久一区二区 | 欧美精品在线免费| 黄色一级片中国| 最新精品国产| 久久免费观看视频| 国产成人在线播放视频| 国产亚洲精品v| 国产精品igao视频| 中文字幕乱码一区二区 | 国产精品午夜在线| 亚洲在线不卡| 欧美日韩在线视频免费观看| 亚洲动漫第一页| 国产人妻777人伦精品hd| 欧美激情护士| 色综合色狠狠天天综合色| 我看黄色一级片| 精品国产一区二| 欧美精品一区二| 37p粉嫩大胆色噜噜噜| 欧美日韩一区二区综合| 精品国产一区二区三区四区在线观看 | 国产精品一区二区免费| 视频午夜在线| 国产精品国产三级国产普通话99| avove在线观看| 999福利在线视频| 欧美亚洲综合网| 超碰在线免费av| 欧美电影在线观看免费| 在线一区二区日韩| 久久久精品视频在线| 噜噜噜91成人网| 91性高湖久久久久久久久_久久99| 亚洲高清视频在线播放| 久久天天做天天爱综合色| 亚洲一区三区电影在线观看| 在线视频国产区| 色综合一区二区| 久久发布国产伦子伦精品| 日韩影视在线观看| 久久综合免费视频| 99热只有这里有精品| 蜜臀久久久久久久| 国产伦精品一区二区三区照片91 | 精品一级少妇久久久久久久| 免费日韩视频| 98国产高清一区| avtt亚洲| 欧美日韩国产色| 在线观看中文av| 精品久久久久久久| 久久久久久久激情视频| 一道本无吗一区| 99re这里只有精品视频首页| 丰满女人性猛交| 一呦二呦三呦精品国产| 日韩精品一区二区三区视频| 日韩一区二区a片免费观看| 欧美freesex交免费视频| 国产精品久久久久久久久男| 国产精品久久无码一三区| 久久精品亚洲麻豆av一区二区| 婷婷视频在线播放| 国产成人亚洲一区二区三区| 日韩精品视频在线观看网址 | 1313精品午夜理伦电影| 最近2019中文字幕mv免费看 | 精品欧美一区二区三区在线观看| 精品国产乱码久久久久久牛牛| 三级黄色在线观看| 老鸭窝一区二区久久精品| 欧美精品尤物在线| 极品视频在线| 日韩视频在线观看一区二区| 亚洲AV成人无码精电影在线| 日韩高清不卡一区二区| 欧美高清性xxxxhdvideosex| 久久男人av资源站| 亚洲第一中文字幕| 久久精品免费在线| 粉嫩13p一区二区三区| 色婷婷777777仙踪林| 视频欧美精品| 久久躁狠狠躁夜夜爽| 国产精品欧美综合亚洲| 中文字幕中文字幕一区二区| 中文字幕国产免费| 欧美第一精品| 成人免费视频a| 超碰公开在线| 日韩欧美高清在线| 久久精品欧美一区二区| 波多野结衣中文一区| 精品少妇在线视频| 欧美日日夜夜| 91精品国产91| 黄视频在线观看免费| 欧美亚洲综合久久| 欧美h片在线观看| 狠狠色狠狠色综合系列| 今天免费高清在线观看国语| 午夜日韩影院| 97超级碰碰人国产在线观看| 日本韩国一区| 欧美视频在线观看一区| 国产黄色小视频网站| 国产成人综合精品三级| 丁香六月激情婷婷| 日韩极品少妇| 国产精品美乳在线观看| 精品国产丝袜高跟鞋| 日韩女优毛片在线| 天天综合网久久综合网| 久久久www免费人成精品| 日本熟妇人妻中出| 成人在线亚洲| 成人免费看片网站| 唐人社导航福利精品| 最近2019年中文视频免费在线观看| h片在线免费看| 天天色综合天天| 国产在线免费av| 国产乱子轮精品视频| 毛片在线视频播放| 欧美r级电影| 国产精品国产三级国产专区53 | 樱花草国产18久久久久| 网站免费在线观看| 麻豆精品视频在线观看免费| 男人添女人下部视频免费| 真实原创一区二区影院| 91亚洲一区精品| 性欧美freesex顶级少妇| www国产精品视频| av女名字大全列表| 欧美一区永久视频免费观看| 久久精品国产成人av| 亚洲柠檬福利资源导航| 亚洲做受高潮无遮挡| 国产一区二区三区四| 欧妇女乱妇女乱视频| 四虎5151久久欧美毛片| 91在线视频成人| 日韩天堂在线| 欧美精品videossex性护士| 高清国产福利在线观看| 精品国产人成亚洲区| 一级欧美一级日韩| 欧美午夜电影在线| 美女视频黄免费| 中文字幕一区av| 成人精品在线观看视频| 国产精品一区二区黑丝| 蜜臀av免费观看| 国产欧美一区二区三区国产幕精品| 伊人天天久久大香线蕉av色| 九色成人国产蝌蚪91| 国产日韩一区欧美| 精品国产亚洲一区二区在线观看 | 亚洲午夜视频| 国产精品美女在线播放| 国产成人ay| 久久久久久久久久久久久久久久av| 国产精品视频一区视频二区| 国产精品久久久久福利| 一根才成人网| 国模私拍一区二区三区| 伊人在我在线看导航| 色偷偷88888欧美精品久久久| 男同在线观看| 日韩精品在线观看网站| 亚洲精品综合网| 欧美三区在线视频| 亚洲成人第一网站| 欧美性猛交xxxx免费看| 粉嫩aⅴ一区二区三区| 亚洲一区二三区| 欧美交换国产一区内射| 亚洲精品水蜜桃| 91在线播放观看| 亚洲精品大片www| 日本高清黄色片| 久久久久久久久久久久久夜| 91网站免费入口| 久久久91精品国产一区二区三区| 一本加勒比北条麻妃| 国产午夜精品理论片a级大结局 | 丝袜老师在线| 青青草原一区二区| 久久久久久久| 国产精品久久久久7777婷婷| 成人一区视频| 91精品久久久久久久久久另类| 欧美亚洲福利| 91夜夜揉人人捏人人添红杏| 香蕉成人app| 精品国产乱码久久久久| 成人高潮a毛片免费观看网站| 国产精品日韩一区二区| 韩国精品福利一区二区三区| 蜜桃视频成人| 日韩av密桃| 9色视频在线观看| 亚洲福利一区| 97在线免费公开视频| 日韩高清不卡一区二区三区| 制服丝袜综合网| 精品在线播放免费| 久久久国产精品久久久| 97久久久精品综合88久久| 国产人妻大战黑人20p| 国产精品久久99| 麻豆视频在线观看| 日韩欧美在线视频| 91成品人影院| 亚洲精品狠狠操| 91大神在线网站| 欧美激情18p| а√在线中文在线新版| 1769国内精品视频在线播放| 69堂精品视频在线播放| 亚洲伊人第一页| 亚洲+变态+欧美+另类+精品| 亚洲国产精品www| 亚洲午夜91| 乌克兰美女av| 成人小视频在线| 永久免费观看片现看| 亚洲va国产va欧美va观看| 99re热视频| 欧美成人女星排行榜| 99免在线观看免费视频高清| 欧美精品videos性欧美| 国产毛片精品久久| 精品免费国产| 99热精品久久| 久久无码高潮喷水| 国内精品第一页| 成熟妇人a片免费看网站| 国产精品丝袜一区| 日韩免费一级片| 欧美高清你懂得| 日韩电影网址| 欧美国产日本高清在线 | 色窝窝无码一区二区三区| 在线亚洲国产精品网| 欧美三级网站| 成人免费视频网站| 91久久国产| 久久精品午夜福利| 久久精品国产**网站演员| 中文在线永久免费观看| 亚洲精选免费视频| 在线观看免费观看在线| 亚洲美女视频网站| av在线视屏| dy888夜精品国产专区| 久久免费av| 三级在线免费看| 久久伊人中文字幕| 男人天堂中文字幕| 日韩午夜小视频| 欧洲不卡av| 国产精品视频资源| 国产一区二区三区91| aa在线免费观看| av一区二区久久| 日韩免费一二三区| 欧美精品xxxxbbbb| 色多多视频在线观看| 国产精品久久久久久久久久尿 | 韩国精品一区二区| 亚洲天堂黄色片| 日韩欧美卡一卡二| aa国产成人| 日本在线免费观看一区| 青青草国产精品亚洲专区无| 欧美视频一区二区在线| 555www色欧美视频| 黄色的视频在线观看| 久久国产精品 国产精品| 久久性天堂网| 亚洲天堂网av在线| 日韩精品在线一区二区| bbw在线视频| 日产精品高清视频免费| 麻豆国产一区二区| 久久久久成人网站| 亚洲毛片在线免费观看| 日本精品久久| 久久精品xxx| 国产欧美综合在线| 99热在线只有精品| 91精品国产99久久久久久| 精品久久久久中文字幕小说 | 国产精品国产亚洲精品看不卡| 91免费视频网址| 国产精品久久久国产盗摄| 欧美精品激情视频| 欧美一区二区性| 潘金莲一级淫片aaaaa| 日本韩国一区二区三区| av免费在线观看网址| 久久久久久久久久久久久9999| 寂寞少妇一区二区三区| 好吊操这里只有精品| 日韩在线国产精品| 精品在线网站观看| 奇米视频888| 动漫精品一区二区| 米奇精品一区二区三区| 久久久久高清| 国产精品资源网| 日韩手机在线视频| 久操成人在线视频| 成人6969www免费视频| 娇妻高潮浓精白浆xxⅹ| 欧美日韩黄视频| 樱花草涩涩www在线播放| 99久re热视频精品98|