精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

港科大Apple新研究:Tokens使用量減少,模型推理還更強了

人工智能 新聞
來自港科大、港城、滑鐵盧大學和Apple的研究人員,最近提出了Laser系列新方法,實現了更好的模型效率和準確率平衡,做到了兩者的共同顯著提升。

1+1等于幾?

現在的大推理模型(LRMs)已經展現出了非凡的推理能力。但是面對這樣最簡單的數學問題,現有的LRMs仍需要花費1400+的tokens來思考。

那么有辦法讓LRMs在推理思考時更快更強嗎?

來自港科大、港城、滑鐵盧大學和Apple的研究人員,最近提出了Laser系列新方法,實現了更好的模型效率和準確率平衡,做到了兩者的共同顯著提升。

圖片

經過Laser和它的進階方法Laser-D、Laser-DE訓練后的模型,相較于訓練前模型或者其他方法訓練的模型,在準確率(Accuracy)和Tokens使用效率(Efficiency)上,同時取得了顯著的提升。

例如在知名復雜數學推理基準AIME24上,Laser-D和Laser-DE方法能夠讓模型在減少Tokens使用量63%的情況下,還繼續提升6.1的性能。

同時,研究人員還發現,經過訓練的模型的思考過程里,冗余的“self-reflection”的比例大大降低,呈現出了一種更加健康的思考模式。

圖片

這一研究也在??引起了討論:

圖片

那么,Laser是如何讓大模型推理又快又好的呢?

三大創新實現性能-效率雙贏

Laser的研究人員首先發現,僅僅通過在強化學習過程中,對模型輸出長度進行截斷,就可以讓訓練后的模型的推理效率大幅提升。

但這種方式,只能帶來效率的提升,對于模型推理的準確性仍然有不小的損害。

這意味著,推理的準確性和效率其實是一個平衡問題(Trade-off),用更多的Tokens經常能取得更高的準確率,反之可能準確率就會受到損害。

所以不應該僅僅關注某一指標,而應該將兩者一同考慮,將問題的重點放在如何提升它們之間的平衡上面。

圖片

Laser主要通過以下三點創新來平衡效率和準確率,以做到雙提升:

1、統一視角:提出了一套統一的框架來看待各類基于長度的獎勵設計(Length-based Reward),并且將訓練時截斷這一簡單方法也統一進了這一套框架內。

2、Laser(Length-bAsed StEp Reward):基于這一個統一框架,研究人員提出一種全新的基于目標長度和階躍函數(Step Function)的獎勵設計,規避了之前獎勵設計存在的一些問題。

3、動態且帶有難度感知的Laser-D、Laser-DE方法:進一步的,研究人員提出了一套自動適配機制,來匹配不同難度下,不同題目的最優目標長度,讓Laser達到最優的平衡。

下面分別詳細展開下。

統一視角看待不同獎勵設計

研究人員首先將直接截斷訓練的方法和先前不同的長度獎勵設計聯系起來,統一成了一套統一的獎勵設計框架。

具體而言,所有的這些方法,都可以看做是正確性的獎勵C(x)、基于長度的獎勵S(x),以及一個控制開關λ(y)的組合。

圖片圖片

表中最右側的可視化圖片,展示了不同的方法對應的獎勵函數的不同形狀,其中藍線代表正確的回復對應的獎勵函數,紅線代表錯誤的回復對應的獎勵函數。

從圖上可以看到,訓練時直接截斷的方法,有一個很大的問題在于,當模型產生的回復很長的時候,正確回復和錯誤回復的獎勵會雜糅在一起,使得模型無法正確區分回復的正確性,影響對對應數據的學習

Laser:基于目標長度和階躍函數的獎勵設計

為了解決訓練截斷中“無法區分正確但冗長的回答”這一問題,研究人員提出了Laser獎勵函數

Laser不再“懲罰”所有長回答,而是對在目標長度以內生成的正確回答給予額外的正向獎勵。

這種階躍函數(Step Function)形式的獎勵機制,既鼓勵簡潔,也保留了對準確推理的認可,有效提升了準確率與效率的整體平衡。

動態且帶有難度感知的LASER-D / LASER-DE方法

在進一步提升準確率與效率的平衡性上,研究人員提出了LASER-D方法:

通過引入動態調整目標長度與題目難度感知機制,模型在訓練過程中可以根據題目的難易程度,自適應設定更合適的token使用上限。

這一機制通過監控模型在不同難度題目上的生成表現,動態評估不同難度題目的最優目標長度。

具體來說,這一機制會定期使用一個小規模的監控集,對不同長度設定下的“預期正確回答數量”進行估算,并據此動態更新易/中/難三類題目的目標長度,幾乎不增加訓練開銷,卻顯著提升了訓練時獎勵函數的靈活性與適應性。

此外,他們還提出了LASER-DE。即在模型答錯時,鼓勵模型在更長長度上進行探索,嘗試糾正錯誤、發現更優的推理路徑,從而提升在困難題目上的表現。

這一系列改進讓LASER系列方法在多個benchmark上,實現了更優的性能-效率雙贏效果。

實驗效果

研究人員用DeepSeek-R1-Distill-Qwen的1.5B / 7B / 32B三個不同規模的模型,在MATH500、AIME24、AMC23、Olympiad Bench上進行了廣泛實驗。

首先,他們通過調整各個方法在訓練中的關鍵參數,繪制出不同方法在準確率(Accuracy)與token使用量(Efficiency)上的帕累托(Pareto)前沿。

如圖所示,在AIME2024和所有Benchmarks的平均上,原始模型(藍色虛線)在token使用上代價巨大。

而其他baselines方法雖然在效率上有所提升,但準確率下降明顯。

圖片

相比之下,LASER、LASER-D和LASER-DE(橙紅色)始終位于原模型的準確率之上——

在顯著減少Tokens使用的同時,準確率還明顯高于baseline,展現出強大的推理性能和推理效率雙提升。

特別是在AIME2024上,LASER-D在只使用原始模型1/3 Tokens的情況下,就能取得+6.1的準確率提升,證明其在復雜數學推理任務中的強大效果。

圖片

在7B和32B模型上,LASER-D和LASER-DE相較于其他方法,在準確率和token使用效率上都取得了更優表現。

DeepSeek-R1-Distill-Qwen-7B模型上,例如對于AIME24,LASER-D在7B模型上,在提升5.1的準確率的同時,平均token使用量還能降低60%,再次實現效率準確率雙提升。

研究人員還在多個領域外(OOD)測試集(GPQA、LSAT、MMLU)上對他們的方法進行了驗證。

實驗結果表明,在OOD測試集上,LASER、LASER-D和LASER-DE取得良好的泛化,同樣取得了最優的準確率與效率平衡,實現了準確率效率雙提升。

圖片

行為分析

為了進一步理解LASER系列方法為何能在保持準確性的同時大幅壓縮token使用,研究人員對模型推理行為的變化進行了分析。

結果顯示,經過LASER訓練后,模型生成中冗余的Backtracking(反復自我否定)顯著減少,而Verification(驗證)、Subgoal Setting(子目標拆解)等關鍵推理行為得以保留甚至增強。

這表明LASER不僅壓縮了長度,還引導模型學會了更簡潔、結構更清晰的思考方式。

這也與文章開頭展示的 “1+1等于幾” 的案例相呼應——

訓練后的模型不再陷入反復的self-reflections,而是能直接識別出問題的關鍵,做出高效、準確的回應。

圖片

團隊表示,他們相信“能夠準確且精簡地表達”是高級智能的重要體現。

真正強大的模型,應在準確性與簡潔性之間實現良好平衡,而非只追求其中任何一者。

LASER系列方法正是朝這一目標邁出的關鍵一步,它不僅壓縮了推理長度,更提升了推理質量。

團隊也表示,未來將繼續探索更靈活、更通用的方法,進一步推高模型的這一高級智能的能力。

論文: https://arxiv.org/abs/2505.15612
GitHub倉庫: https://github.com/hkust-nlp/Laser

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-26 08:40:00

2024-06-11 14:30:18

2025-10-08 10:44:16

2010-11-08 10:07:23

SQL Server內

2024-06-17 13:34:54

2025-06-10 09:07:00

2024-08-22 16:23:05

2021-08-17 10:03:34

.NET開發者使用量

2012-08-06 13:45:38

LTE網絡LTE

2024-03-18 09:54:32

開源AI模型

2023-04-13 15:40:59

模型論文

2022-06-30 18:05:51

訓練模型圖像

2025-09-23 09:09:49

2013-10-30 17:23:01

Chrome瀏覽器

2023-06-20 13:38:22

2022-03-28 18:38:00

SD-WANMPLS

2024-03-04 13:36:00

模型訓練

2021-04-02 09:40:06

量子計算芯片超算
點贊
收藏

51CTO技術棧公眾號

欧美老女人bb| 久久久久久久免费| a级片在线观看免费| 538任你躁精品视频网免费| 亚洲成a人在线观看| 日本不卡二区高清三区| 国产高清免费av| 午夜在线播放视频欧美| 色七七影院综合| 中文字幕人妻一区| 欧美jizz18| 欧美日韩亚洲高清| 麻豆映画在线观看| 国产中文在线视频| 成人国产精品免费网站| 国产精品欧美久久久| 国产第100页| 国产精品99久久精品| 精品亚洲国产视频| 精品无码av一区二区三区不卡| 成人啊v在线| 香蕉久久一区二区不卡无毒影院| 一区二区高清视频| 巨骚激情综合| 99视频精品免费视频| 91香蕉亚洲精品| 亚洲高清在线看| 中文欧美日韩| 国内精久久久久久久久久人| 欧美日韩色视频| 日韩欧美大片| 亚洲男人天堂2024| 国产xxxxxxxxx| 99久久香蕉| 日韩一区二区电影| 中文字幕在线视频精品| 成人国产精品| 欧美在线你懂得| 国产精品免费成人| 神马久久资源| 色综合久久88色综合天天免费| 欧美乱做爰xxxⅹ久久久| 中文字幕资源网在线观看| 国产精品久久久久天堂| 日韩性感在线| 国产九色在线| 国产精品毛片无遮挡高清| 日韩.欧美.亚洲| 国产精品视频二区三区| 久久久天堂av| 欧美精品一区二区三区在线四季 | 精品国产91久久久久久久妲己| 亚洲午夜精品一区| 国产一区二区在线观| 91精品国产91综合久久蜜臀| 久久久精品高清| 在线免费成人| 欧美一卡2卡3卡4卡| av噜噜在线观看| 免费欧美网站| 日韩精品中文字幕在线不卡尤物| 四虎成人免费视频| 神马日本精品| 在线电影av不卡网址| 又色又爽的视频| 国产精品久久久久久久久妇女| 视频在线观看99| 日日骚一区二区三区| 狠狠干综合网| 日韩av大片免费看| 夜夜嗨aⅴ一区二区三区| 精品在线免费观看| 岛国一区二区三区高清视频| 婷婷丁香一区二区三区| 久久久久久毛片| 在线观看日韩羞羞视频| 黄色成人在线网| 色综合久久九月婷婷色综合| 久久国产精品国产精品| 日本免费一区二区视频| 亚洲第一网站男人都懂| 精品人妻无码一区二区三区换脸| 久久麻豆精品| 久久久亚洲影院| 无码人妻精品一区二| 韩国成人在线视频| 久久av一区二区| 在线观看麻豆蜜桃| 亚洲高清在线精品| 中文字幕 91| 成人av综合网| 永久免费毛片在线播放不卡| 在线看的片片片免费| 亚洲精品影院在线观看| 国产精品久久久久久婷婷天堂| 国产深喉视频一区二区| 91丨九色丨蝌蚪富婆spa| 五月天亚洲综合| 波多野结衣中文在线| 欧美亚洲丝袜传媒另类| 麻豆tv在线观看| 色男人天堂综合再现| 久久久久五月天| 在线免费观看高清视频| 99天天综合性| 伊人再见免费在线观看高清版| 亚洲一区站长工具| 日韩欧美久久一区| 青青操在线播放| 久久高清国产| 国产一区福利视频| 2024短剧网剧在线观看| 欧美艳星brazzers| 中文字幕5566| 亚洲午夜极品| 成人中文字幕+乱码+中文字幕| 欧美一区二区视频| 亚洲综合激情另类小说区| 色婷婷综合网站| 欧美日韩有码| 日本精品视频在线| 国产又爽又黄网站亚洲视频123| 中文字幕中文在线不卡住| 哪个网站能看毛片| 美女扒开腿让男人桶爽久久动漫| 久久久www成人免费精品张筱雨| 黄色av一区二区| 91麻豆高清视频| 成年人午夜视频在线观看| 涩涩屋成人免费视频软件| 色婷婷av一区二区三区久久| 在线永久看片免费的视频| 91丨九色丨国产丨porny| 国产日韩欧美精品在线观看| 粉嫩一区二区三区在线观看| 色小说视频一区| 精品国产青草久久久久96| 91美女片黄在线| 黄色av网址在线播放| 粉嫩久久久久久久极品| 色综合男人天堂| 午夜久久久久久久久久| 亚洲免费电影在线| 久草福利在线观看| 欧美精品日本| 国产免费一区二区三区| 爱看av在线入口| 亚洲精品一区二区三区精华液| 久久久久亚洲av片无码下载蜜桃| 国产白丝精品91爽爽久久| 免费cad大片在线观看| 凹凸成人在线| 97国产在线视频| 亚洲色欧美另类| 欧美综合欧美视频| 国产精品久久久免费看| 国产一区二区伦理| 97久久国产亚洲精品超碰热| 亚洲精品黑牛一区二区三区| 欧美激情精品久久久久久蜜臀| 亚洲爆乳无码一区二区三区| 亚洲va在线va天堂| 国产麻豆天美果冻无码视频 | 国产精品久久国产精麻豆99网站 | 精品久久在线| 久久综合久久88| 久久嫩草精品久久久精品一| 老司机免费视频一区二区| 欧美与欧洲交xxxx免费观看| 日本三级免费看| 狠狠色伊人亚洲综合成人| 中文一区一区三区免费| 亚洲二区av| 欧美理论电影在线播放| 色丁香婷婷综合久久| 欧美性猛交xxxx乱大交极品| 国产高清一区二区三区四区| 美腿丝袜亚洲三区| www.国产二区| 欧美亚洲禁片免费| 非洲一级黄色片| 老鸭窝一区二区久久精品| 一区二区三区观看| 欧美经典影片视频网站| 91福利视频在线观看| 在线免费观看黄色| 精品国产91亚洲一区二区三区婷婷 | 欧美深深色噜噜狠狠yyy| 国产日韩电影| 久久久精品国产一区二区| 国产香蕉在线观看| 在线免费观看成人短视频| 在线观看亚洲网站| 92国产精品观看| 久久精品久久99| 国产精品伦理在线| 好看的日韩精品| 桃花岛tv亚洲品质| 欧美成人精品在线| 欧美性孕妇孕交| 91精品国产aⅴ一区二区| 久久午夜免费视频| 国产免费区一区二区三视频免费| 久久精品欧美视频| 三级做a全过程在线观看| 777精品伊人久久久久大香线蕉| 日韩av免费网址| |精品福利一区二区三区| 成人手机在线免费视频| 国产乱子伦视频一区二区三区| 日本精品久久久久中文字幕| 很黄很黄激情成人| 黄色一级片网址| 精品国产aⅴ| 国产精品麻豆免费版| 亚洲精品tv| 国产精品久久中文| 国产污视频在线播放| 欧美精品午夜视频| 麻豆av在线免费看| 在线精品高清中文字幕| 久久久久国产精品嫩草影院| 精品免费视频一区二区| 99久久国产免费| 欧美日韩国产123区| 在线免费观看av网址| 欧美性xxxx18| 亚洲第一在线播放| 亚洲成人你懂的| 国产性生活网站| 亚洲综合一区二区三区| 欧美日韩偷拍视频| 亚洲蜜臀av乱码久久精品| 国产视频不卡在线| 国产精品日韩精品欧美在线| 成人免费无遮挡无码黄漫视频| 久久综合给合久久狠狠狠97色69| 国产老熟女伦老熟妇露脸| 成人美女视频在线看| 天天躁日日躁狠狠躁av| 国产高清不卡一区二区| 亚洲五月激情网| 国产精品伊人色| 久久精品一二三四| 国产ts人妖一区二区| 亚洲国产精品狼友在线观看| 成人精品免费看| 日韩av无码一区二区三区不卡 | 亚洲综合激情网| 久久久久久久久久一区二区三区| 一区二区三区小说| 日本天堂网在线观看| 大荫蒂欧美视频另类xxxx| 国产又大又黑又粗免费视频| 香蕉影视欧美成人| 欧美精品韩国精品| 在线观看日韩毛片| 91麻豆国产在线| 日韩一区二区三区四区| 精品女同一区二区三区| 亚洲国产第一页| 欧美午夜黄色| 日韩在线视频二区| 99久久精品免费观看国产| 韩日欧美一区二区| 亚洲天堂一区二区| 成人网在线免费看| 精品国产乱子伦一区二区| 欧美日韩电影一区二区三区| 波多野结衣在线观看一区二区三区| 一区二区三区电影| 好吊视频一区二区三区四区| 国产视频一视频二| 麻豆专区一区二区三区四区五区| 色播五月综合网| 成人黄色av电影| 免费成人深夜天涯网站| 亚洲免费观看高清| 在线观看日本网站| 91精品国产色综合久久| 五月天激情婷婷| 日韩中文在线不卡| а√在线中文在线新版| 国产精品视频一| 日韩精品中文字幕吗一区二区| 精品国产乱码久久久久久蜜柚| 欧美精品一区二区三区中文字幕| xxxxxx在线观看| 石原莉奈在线亚洲三区| 中文在线字幕观看| 中文字幕第一区综合| 精品无码久久久久久久| 91国偷自产一区二区三区成为亚洲经典| 中文字幕有码无码人妻av蜜桃| 日韩精品一区在线| www.国产精品.com| 97色伦亚洲国产| 91精品一久久香蕉国产线看观看| 国产尤物99| 一区二区蜜桃| 三级a在线观看| caoporn国产精品| 国产又粗又硬又长又爽| 91国偷自产一区二区三区观看| 亚洲精品一区二区三区不卡| 伊人青青综合网站| 日韩欧美精品一区二区三区| 91亚洲国产成人久久精品网站| 免费看成人哺乳视频网站| h无码动漫在线观看| 美女网站视频久久| 99久久久久久久久久| 亚洲一区二区三区中文字幕 | 日韩欧美在线网站| 国产1区2区3区在线| 97成人精品视频在线观看| 日韩精品一区二区三区中文在线| 亚洲一区二区三区精品在线观看| 在线亚洲观看| 亚洲中文字幕无码一区| 亚洲欧美另类在线| 亚洲字幕av一区二区三区四区| 亚洲天堂2020| 黄瓜视频成人app免费| 久久大片网站| 日韩香蕉视频| 日韩成人av一区二区| 亚洲国产日韩a在线播放性色| av加勒比在线| 美日韩丰满少妇在线观看| 免费成人高清在线视频| 先锋影音网一区| 蜜桃精品视频在线| 九九九视频在线观看| 欧美伊人久久久久久久久影院 | 国产夫绿帽单男3p精品视频| 日韩中文字在线| 未满十八勿进黄网站一区不卡| 亚洲精品成人久久久998| 日本不卡高清视频| 欧美aaa级片| 欧美另类z0zxhd电影| 免费在线视频欧美| 91在线观看欧美日韩| 一区二区三区四区电影| 天天久久综合网| 亚洲一线二线三线久久久| 亚洲精品久久久蜜桃动漫| 久久久久久国产精品三级玉女聊斋| 欧美二区观看| 日韩a∨精品日韩在线观看| 99视频在线观看一区三区| 免费黄色网址在线| 永久免费精品影视网站| 亚洲国产天堂| 日韩亚洲欧美一区二区| 成人免费的视频| 国产精品久久久久久久久久久久久久久久久| 亚洲男人天堂2023| 国产精品99| 17c丨国产丨精品视频| 26uuu久久天堂性欧美| 尤物视频免费观看| 欧美成人精品xxx| 老司机成人在线| 国产精彩免费视频| 亚洲欧美日韩国产一区二区三区| 亚洲a视频在线| 日本中文字幕久久看| 国产精品x453.com| 国产精品手机在线观看| 欧洲视频一区二区| 日本在线视频中文有码| 欧美aaaaa喷水| 韩国av一区二区三区四区| 久一区二区三区| 中文字幕欧美日韩| 亚洲成人影音| 免费大片在线观看| 一区二区三区四区不卡在线| 日韩专区一区二区| 国产专区欧美专区| 亚洲三级影院| 国内毛片毛片毛片毛片毛片| 日韩精品一区二区三区视频播放| 亚洲淫成人影院| 超碰10000| 国产网站一区二区| 亚洲AV无码乱码国产精品牛牛| 国产成人在线播放| 欧美日韩影院| 国产美女网站视频| 国产丝袜一区二区| 奇米一区二区| 超碰在线播放91| 午夜精品久久久久久久99樱桃| 一区二区三区视频网站| 国产精品一二三区| 日本少妇全体裸体洗澡| 在线观看国产欧美|