精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

dLLM的「Free Lunch」!浙大&螞蟻利用中間結(jié)果顯著提升擴(kuò)散語言模型

人工智能 新聞
這項(xiàng)工作揭示了 dLLM 生成過程中的「先對后錯(cuò)」現(xiàn)象,并提出了兩種創(chuàng)新方法——Temporal Self-Consistency Voting 和 Temporal Consistency Reinforcement。

本文第一作者王文,浙江大學(xué)博士生,研究方向是多模態(tài)理解與生成等。本文通訊作者沈春華,浙江大學(xué)求是講席教授,主要研究課題包括具身智能、大模型推理增強(qiáng)、強(qiáng)化學(xué)習(xí)、通用感知模型等。

近年來,擴(kuò)散大語言模型(Diffusion Large Language Models, dLLMs)正迅速嶄露頭角,成為文本生成領(lǐng)域的一股新勢力。與傳統(tǒng)自回歸(Autoregressive, AR)模型從左到右逐字生成不同,dLLM 依托迭代去噪的生成機(jī)制,不僅能夠一次性生成多個(gè) token,還能在對話、推理、創(chuàng)作等任務(wù)中展現(xiàn)出獨(dú)特的優(yōu)勢。當(dāng)你還在等傳統(tǒng) LLM「一個(gè)字一個(gè)字」地憋出答案時(shí),dLLM 早已通過幾輪迭代「秒」出完整結(jié)果,帶來前所未有的生成效率。

然而,速度的提升并不意味著完美的答案。現(xiàn)有 dLLM 的解碼策略往往只關(guān)注最后一次迭代的生成結(jié)果,直接舍棄了中間多輪迭代中蘊(yùn)含的豐富語義與推理信息。這些被忽視的中間預(yù)測,實(shí)際上可能暗藏著更準(zhǔn)確、更接近真相的答案。一旦被丟棄,不僅造成信息浪費(fèi),還可能讓模型錯(cuò)失做對題目的最佳時(shí)機(jī)。

更令人意外的是,研究團(tuán)隊(duì)在數(shù)學(xué)推理任務(wù)中觀察到了一種「先對后錯(cuò)」的現(xiàn)象:模型先是得出了正確答案,卻在隨后的迭代中將其「推翻」,轉(zhuǎn)而采用錯(cuò)誤答案,最終導(dǎo)致整體回答錯(cuò)誤。以下圖為例,模型在第 55 步時(shí)明明已經(jīng)得到正確的 25,卻在后續(xù)生成中改成了 2,并一直堅(jiān)持到最后也未能修正。

正是基于這一關(guān)鍵觀察,來自浙江大學(xué)的研究團(tuán)隊(duì)從時(shí)序視角切入,提出了 Temporal Self-Consistency Voting 與 Temporal Consistency Reinforcement 兩種方法,對模型的性能進(jìn)行優(yōu)化與提升。


  • 論文標(biāo)題:Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models
  • 論文地址:https://arxiv.org/abs/2508.09138
  • 項(xiàng)目主頁:https://aim-uofa.github.io/dLLM-MidTruth/
  • Github:https://github.com/aim-uofa/dLLM-MidTruth
  • Huggingface Paper:https://huggingface.co/papers/2508.0913

Temporal Self-Consistency Voting:從時(shí)間維度「抓住」模型最靠譜的答案

在傳統(tǒng)的自回歸(AR)模型中,majority vote 通常需要針對同一個(gè) prompt 多次生成完整回答,再根據(jù)出現(xiàn)頻率選出最高票的答案。雖然這種方法在提升準(zhǔn)確率方面有效,但代價(jià)是成倍增加計(jì)算開銷,往往需要耗費(fèi)數(shù)倍的推理時(shí)間與資源。

而研究團(tuán)隊(duì)結(jié)合 dLLM 的迭代生成特性,提出了 Temporal Self-Consistency Voting (TCV) 方法。它不必額外生成多條回答,而是直接利用 dLLM 在去噪過程中每個(gè)時(shí)間步的中間結(jié)果,進(jìn)行一次「時(shí)間軸上的投票」來選出最終答案。考慮到 dLLM 在迭代去噪中理論上會(huì)逐漸趨于穩(wěn)定與確定,TCV 還為不同時(shí)間步的結(jié)果分配了不同權(quán)重,從而更精準(zhǔn)地捕捉最可靠的預(yù)測。

該方法的主要?jiǎng)?chuàng)新之處在于,它巧妙地將「多數(shù)投票」理念與 dLLM 的時(shí)間維度信息結(jié)合起來,實(shí)現(xiàn)了幾乎零額外計(jì)算成本的性能提升,同時(shí)充分挖掘了中間預(yù)測中的潛在價(jià)值。

Temporal Consistency Reinforcement:用時(shí)序一致性訓(xùn)練出更穩(wěn)的 dLLM

研究團(tuán)隊(duì)針對 dLLM 的中間預(yù)測結(jié)果,創(chuàng)造性地提出了 Temporal Semantic Entropy (TSE) 這一概念。TSE 通過計(jì)算模型在不同迭代步驟中預(yù)測結(jié)果的語義熵,來衡量生成過程中的一致性程度。直觀來說,熵越低,說明模型在迭代中越穩(wěn)定、越堅(jiān)定自己的選擇;熵越高,則意味著生成路徑搖擺不定、易于被干擾。

在實(shí)驗(yàn)分析中,他們發(fā)現(xiàn)了一些頗具規(guī)律性的現(xiàn)象:在相對簡單、模型準(zhǔn)確率較高的數(shù)據(jù)集(如 GSM8K 和 SVAMP)上,TSE 值普遍較低;而在同一個(gè)數(shù)據(jù)集中,模型答對的問題的 TSE 往往顯著低于答錯(cuò)的問題。這一發(fā)現(xiàn)表明,穩(wěn)定的生成路徑往往與更好的任務(wù)表現(xiàn)高度相關(guān)。

基于這一洞察,研究團(tuán)隊(duì)提出了 Temporal Consistency Reinforcement (TCR) 方法,將 TSE 直接作為獎(jiǎng)勵(lì)信號,引導(dǎo)模型在訓(xùn)練中主動(dòng)降低 TSE,從而提升生成路徑的穩(wěn)定性。進(jìn)一步地,他們還利用 scoring rule,將 TSE 與傳統(tǒng)的正確性獎(jiǎng)勵(lì)相結(jié)合,實(shí)現(xiàn)「雙重監(jiān)督」——既讓模型追求正確答案,又保持推理過程的一致性,最終訓(xùn)練出更穩(wěn)定、性能更優(yōu)的 dLLM。

實(shí)驗(yàn)結(jié)果

研究團(tuán)隊(duì)在三個(gè)主流數(shù)學(xué)推理數(shù)據(jù)集(GSM8K、MATH500、SVAMP)以及一個(gè)邏輯推理數(shù)據(jù)集(Countdown)上進(jìn)行了系統(tǒng)測試。結(jié)果顯示,Temporal Self-Consistency Voting 幾乎不增加額外計(jì)算成本,就能在多個(gè)數(shù)據(jù)集上穩(wěn)定帶來性能提升,驗(yàn)證了從中間迭代中挖掘信息的有效性。

與此同時(shí),Temporal Consistency Reinforcement 的表現(xiàn)同樣令人驚艷——僅僅利用 Temporal Semantic Entropy (TSE) 作為唯一獎(jiǎng)勵(lì)信號,就能在 Countdown 數(shù)據(jù)集上實(shí)現(xiàn) 24.7% 的顯著提升。更進(jìn)一步,當(dāng)將 TSE 與傳統(tǒng)的正確性獎(jiǎng)勵(lì)結(jié)合時(shí),不僅在 Countdown 上提升至 25.3%,在 GSM8K、MATH500、SVAMP 上也分別取得了 +2.0%、+4.3%、+6.6% 的絕對增幅,全面超越了僅依賴正確性獎(jiǎng)勵(lì)的效果。

訓(xùn)練后模型性質(zhì)分析

研究團(tuán)隊(duì)對訓(xùn)練后模型進(jìn)行分析發(fā)現(xiàn):模型生成更穩(wěn)定、輸出更簡潔。具體表現(xiàn)為:

  • 時(shí)間一致性提升:生成過程更穩(wěn),中間預(yù)測波動(dòng)減少;
  • 仍有提升空間:雖然表現(xiàn)更好,但模型在中間預(yù)測上仍有可優(yōu)化空間;
  • 輸出更精煉:有效 token 數(shù)下降,答案更簡短,可能也更不容易「自打臉」。

這表明,通過 Temporal Consistency Reinforcement,不僅讓模型跑得快,也更能穩(wěn)穩(wěn)抓住正確答案。

總結(jié)

總體來看,這項(xiàng)工作揭示了 dLLM 生成過程中的「先對后錯(cuò)」現(xiàn)象,并提出了兩種創(chuàng)新方法——Temporal Self-Consistency Voting 和 Temporal Consistency Reinforcement。它們利用中間預(yù)測的時(shí)間一致性和語義穩(wěn)定性,不僅顯著提升了模型在數(shù)學(xué)與邏輯推理任務(wù)上的表現(xiàn),也為未來挖掘 dLLM 潛力提供了全新的思路。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-10-14 08:58:00

2025-05-30 15:52:05

訓(xùn)練代碼推理

2017-10-09 16:51:34

機(jī)器學(xué)習(xí)No Free Lun

2024-03-14 09:57:35

華為模型

2025-11-03 08:40:00

2025-11-06 08:45:00

AI語言模型算法

2024-09-12 13:50:00

模型訓(xùn)練

2024-11-04 10:05:00

AI模型

2024-03-11 12:20:56

AI訓(xùn)練

2025-06-11 09:21:28

2025-05-28 03:30:00

AI人工智能大數(shù)據(jù)

2025-10-28 08:50:00

AI模型訓(xùn)練

2025-06-09 08:47:00

2025-02-18 13:00:00

2022-04-12 14:36:58

達(dá)摩院訓(xùn)練模型

2025-02-27 13:45:00

2025-03-17 11:35:36

LLaDALLM大型語言模型

2025-06-18 16:39:02

視頻生成AI模型

2025-06-04 08:35:00

2025-03-25 09:04:12

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

精品久久久久久| 精品一区二区三区在线播放| 亚洲色图偷窥自拍| 一道本在线免费视频| 香蕉视频在线看| 国产精品一区二区三区四区 | 亚洲一区二区三区xxx视频| 国产1区2区3区4区| 欧美美女黄色| 欧美美女视频在线观看| 9色porny| 国产乱理伦片a级在线观看| 国产一区二区美女诱惑| 亚洲午夜在线观看视频在线| 久久久一本精品99久久精品66 | 免费看的黄色录像| 香蕉成人app免费看片| 99精品国产99久久久久久白柏| 最新中文字幕亚洲| 日韩欧美一区二| 午夜伦理在线| 久久人人97超碰com| 91精品国产高清| 最新中文字幕av| 999国产精品一区| 亚洲日本青草视频在线怡红院 | 99精品视频在线免费观看| 国产精品色婷婷视频| 国产第一页在线播放| 欧美激情理论| 亚洲性xxxx| 日韩av手机在线播放| 国产亚洲久久| 欧美巨大另类极品videosbest| 熟女性饥渴一区二区三区| 日本大片在线播放| 亚洲日本青草视频在线怡红院| 日本成人黄色| 日本啊v在线| av成人免费在线| 国产精品久久波多野结衣| 99热这里只有精品5| 久久国内精品自在自线400部| 欧美专区中文字幕| 国产免费av一区| 国产精品亚洲综合久久| 91成人在线播放| 日本少妇在线观看| 亚洲天堂偷拍| 日韩精品久久久久久福利| av观看免费在线| 欧美另类老肥妇| 黄网站色欧美视频| 国产在线精品91| 中文在线资源| 国产精品午夜在线| 99电影网电视剧在线观看| 99热这里只有精品99| 狠狠色丁香婷综合久久| 成人福利在线观看| 欧美精品韩国精品| 欧美亚洲网站| 欧美在线视频导航| 日韩精品在线免费视频| 国产精品美女| 欧美在线观看日本一区| 日韩熟女精品一区二区三区| 激情欧美国产欧美| 国语自产在线不卡| 国产精品免费av一区二区| 怡红院精品视频在线观看极品| 欧美人与物videos| 久久久久亚洲AV| 亚洲国内自拍| 国内精品久久久久久| 日韩三级免费看| 亚洲综合日本| 国产精品18久久久久久首页狼| 国产精成人品免费观看| 精品国产一区一区二区三亚瑟| 日韩成人中文字幕在线观看| 欧美多人猛交狂配| 欧美一级精品片在线看| 日韩欧美精品在线视频| 日韩高清一二三区| 国产欧美在线观看| 日韩在线观看视频一区二区| 伊人久久大香线蕉综合四虎小说 | 国产精品亚洲人成在99www| 精品成人私密视频| 特大黑人巨人吊xxxx| 国产一区二区区别| 中文字幕亚洲在线| 精品无码一区二区三区蜜臀| 欧美在线二区| 国外成人性视频| 少妇久久久久久久| 久久国产日韩欧美精品| 99www免费人成精品| 日韩中文字幕免费观看| 久久久综合视频| 小说区图片区图片区另类灬| 黄污视频在线观看| 色8久久精品久久久久久蜜| 欧美日韩电影一区二区| 国产大学生校花援交在线播放| 国产精品久久看| 欧美久久在线观看| 电影在线观看一区二区| 日韩欧美一级精品久久| 久久国产精品影院| 国产精品毛片一区二区在线看| 久久免费视频观看| 中文字幕在线观看精品| 成人一级视频在线观看| 欧美一区二区三区在线免费观看| 国产三区视频在线观看| 狠狠色香婷婷久久亚洲精品| 久久国产激情视频| 欧美久久香蕉| 国产一区二区三区四区福利| 日韩av电影网址| 精品一区二区三区日韩| 免费成人av网站| 最新超碰在线| 日本一区二区动态图| 小泽玛利亚av在线| 九九热线视频只有这里最精品| 欧美一区午夜精品| 精品无人区无码乱码毛片国产 | 国产免费无码一区二区视频 | 伊人亚洲福利一区二区三区| 麻豆一区二区三区精品视频| 美女www一区二区| 精品视频第一区| av手机免费看| 欧美国产一区二区在线观看| 欧美精品久久久久久久免费| 不卡一区视频| 伊人av综合网| 在线天堂中文字幕| 99r精品视频| 国产情侣第一页| av在线播放一区二区| 国产亚洲一级高清| 欧美在线观看不卡| av在线一区二区三区| 国产免费xxx| 日本精品久久| 在线中文字幕日韩| 五月婷婷激情网| 91亚洲午夜精品久久久久久| 成人国产在线看| 国产精品1区| 日韩中文字在线| 最近日韩免费视频| 国产欧美精品在线观看| 日本在线视频www| 精品久久97| 91黄色8090| www.日日夜夜| 亚洲欧美福利一区二区| 国产女同无遮挡互慰高潮91| 久久中文字幕av| 国产精品无av码在线观看| 黄网在线观看| 色激情天天射综合网| 黑人巨大精品欧美| 午夜亚洲精品| 欧美一区亚洲二区| 另类中文字幕国产精品| 色偷偷888欧美精品久久久 | 久久九九99| 品久久久久久久久久96高清| 日韩在线影院| 视频在线观看一区二区| 91av久久久| 亚洲欧美日韩国产另类专区| gogo亚洲国模私拍人体| 亚洲午夜av| 精品乱色一区二区中文字幕| 91超碰在线播放| 亚洲石原莉奈一区二区在线观看| 无码人妻精品一区二区50| 国产日韩三级在线| 在线观看免费的av| 一级毛片免费高清中文字幕久久网| 95av在线视频| av福利在线导航| 亚洲视频视频在线| 午夜精品无码一区二区三区| 精品久久久久久久久国产字幕| 99久久人妻无码精品系列| 青青草伊人久久| 婷婷视频在线播放| 国产成人av毛片| 日本一区二区三区在线播放| 香蕉视频在线播放| 日韩欧美综合在线| 欧美日韩a v| 日韩高清不卡一区| 亚洲一区二区三区免费看| 美女久久精品| 欧美在线性视频| 麻豆传媒在线免费| 亚洲国产精品久久| 日本中文字幕久久| 亚洲一级二级在线| 秋霞网一区二区三区| 国产精品一区二区男女羞羞无遮挡| 免费看国产曰批40分钟| 久久资源中文字幕| 久久国产手机看片| 国产精品免费精品自在线观看| 久久久久中文字幕| 在线播放日本| 精品国产乱码久久久久久老虎 | 国产精品h片在线播放| 狂野欧美性猛交xxxxx视频| 亚洲香蕉成视频在线观看| 国产成人三级在线观看视频| 欧美日韩一区在线观看| 日本在线小视频| 国产精品久久777777| 亚洲精品乱码久久久久久久| 国产在线麻豆精品观看| 黄色免费视频大全| 99国产精品视频免费观看一公开 | 女生裸体视频一区二区三区| 久久婷婷开心| 99国产精品免费网站| 91精品国产自产在线老师啪| 伊人久久综合一区二区| 久久视频这里只有精品| 日本a级在线| 亚洲人成电影网站色www| 亚洲女同志亚洲女同女播放| 欧美日韩国产高清一区二区| 中文字幕69页| 天天综合日日夜夜精品| 日韩欧美a级片| 亚洲综合丝袜美腿| 91嫩草丨国产丨精品| 国产欧美一区二区精品性色超碰 | 欧美激情二区三区| 怡红院av久久久久久久| 中文字幕一区二区三区乱码在线| 色噜噜日韩精品欧美一区二区| 成人av电影在线观看| 欧美69精品久久久久久不卡 | 日本少妇xxx| 九一九一国产精品| 国产精品wwwww| 日韩精品亚洲一区| 欧在线一二三四区| 久久久蜜桃一区二区人| 黄www在线观看| 亚洲精品字幕| 久久综合九色综合88i| 日韩视频一区| av高清在线免费观看| 久久中文资源| 国产在线一区二区三区欧美| av不卡一区二区| 国产不卡一区二区在线观看 | 国产高清自拍一区| 一区二区三区视频免费视频观看网站| 国产精品日韩久久久久| 在线欧美激情| 51蜜桃传媒精品一区二区| 久久久精品区| 成人性色av| 国产主播性色av福利精品一区| 国产欧美综合精品一区二区| 牛牛精品成人免费视频| 国产色综合一区二区三区| 国产成人一区| 亚洲国产一区二区三区在线播| 日韩理论电影大全| 韩国黄色一级大片| 国产精品mm| 欧美二区在线视频| 日本欧美一区二区| 一区二区免费av| 国产jizzjizz一区二区| 日韩综合第一页| 久久久影院官网| 久久久免费看片| 亚洲精品欧美二区三区中文字幕| 男女男精品视频网站| 亚洲精品国产第一综合99久久| 国产一级特黄视频| 色综合天天综合狠狠| 中文字幕一区二区人妻| 日韩一级片在线观看| 午夜影院免费视频| 中文日韩在线观看| 伊人影院在线视频| 欧美性视频精品| 成人福利片在线| 国产传媒一区二区| 国产一区日韩| 在线看成人av电影| 国产精品免费看| 日本在线观看视频一区| 99久久婷婷国产精品综合| 极品人妻videosss人妻| 亚洲欧美国产高清| 无码人妻精品一区二区三区不卡| 欧美日韩一区小说| 日韩美女一级视频| 超碰精品一区二区三区乱码| 无遮挡在线观看| 91九色单男在线观看| 国产成人ay| 隔壁人妻偷人bd中字| 乱一区二区av| 无码人妻精品一区二区三应用大全| 一区在线中文字幕| 亚洲天堂视频网站| 91精品综合久久久久久| 免费观看成年在线视频网站| 欧美精品制服第一页| 播放一区二区| 精品91免费| 午夜国产欧美理论在线播放| 一女二男3p波多野结衣| 国产亚洲女人久久久久毛片| 精品肉丝脚一区二区三区| 欧美日韩午夜在线视频| 天堂中文网在线| 欧美美女18p| 九色精品蝌蚪| 日本黄网站色大片免费观看| 精品中文字幕一区二区小辣椒| 草草影院第一页| 亚洲午夜精品一区二区三区他趣| 亚洲一级片免费看| 亚洲一级免费视频| 成人精品三级| 欧美成人免费在线| 亚洲伦伦在线| 亚洲黄色小说在线观看| 亚洲日本护士毛茸茸| 国产精品色综合| 日韩中文字幕网址| 99riav视频一区二区| 欧美精品一区二区三区久久| 日韩一级精品| 大尺度在线观看| 精品国产电影一区| 天堂在线观看视频| 91精品国产高清久久久久久久久| 一区二区三区国产好| 亚洲中文字幕无码一区二区三区 | 国产成人拍精品视频午夜网站| 久久悠悠精品综合网| 欧美日韩一道本| 成人深夜福利app| 草久久免费视频| 亚洲精品一区久久久久久| 亚洲美女久久精品| 欧美乱偷一区二区三区在线| 免费精品视频| 国产传媒在线看| 51精品国自产在线| 尤物视频在线看| 国产精品久久亚洲7777| 亚洲国内欧美| 欧美一级片黄色| 在线视频中文字幕一区二区| 成人好色电影| 91精品国产综合久久香蕉最新版 | 日韩综合久久| 99精品视频网站| 国产成人午夜精品5599| 少妇久久久久久被弄高潮| 精品国产露脸精彩对白| 9999精品成人免费毛片在线看| 国产在线欧美日韩| 久久精品系列| 91传媒免费观看| 精品国产1区2区3区| 自拍偷拍欧美视频| 亚洲国产欧美不卡在线观看| 国产乱码精品1区2区3区| 久操免费在线视频| 亚洲国产女人aaa毛片在线| 成人教育av| 在线播放豆国产99亚洲| 国产高清不卡一区二区| 国产一级18片视频| 日韩在线播放视频| 成人涩涩网站| www.xxx亚洲| 亚洲精品视频在线看| 日本一区高清| 亚洲永久免费观看| 国产精品日韩| 国产视频精品免费|