精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

EMNLP 2025 | 動態壓縮CoT推理新方法LightThinker來了

人工智能 新聞
研究者們從人類的認知過程中汲取靈感。想象一下人類在解決一個復雜數學題時的情景。

隨著 AI 技術的飛速發展,從「快思考」到 「慢思考」,大語言模型(LLMs)在處理復雜推理任務上展現出驚人的能力。無論是我們熟知的思維鏈(CoT),還是更復雜的深度思考模式(Thinking),都讓 AI 的回答日益精準、可靠。

然而,這種性能的提升并非沒有代價。模型在推理過程中會產生大量的中間步驟和文本(tokens),這不僅極大地拖慢了計算速度,還對內存和計算資源造成了巨大的壓力。簡單來說,就是「想得越多,算得越慢,耗得越多」。

為了解決這一難題,研究者們從人類的認知過程中汲取靈感。想象一下人類在解決一個復雜數學題時的情景:我們通常會在草稿紙上寫下關鍵的計算步驟(如下圖 a 中的黃色高亮部分),而將一些輔助性的思考過程(非高亮部分)放在腦中。

圖 1:(a) 展示了一個典型的思維鏈推理過程,黃色部分為關鍵步驟。(b) 對比了傳統方案 Vanilla 與 LightThinker 的推理流程。

本文中,來自浙江大學、螞蟻集團等機構的研究者提出了 LightThinker,它模仿了這一高效的思考模式。它訓練 LLM 在推理過程中動態地將冗長的中間思考步驟壓縮成緊湊的表示(gist tokens /cache tokens),然后「扔掉」原始的、繁瑣的推理鏈,僅保留核心摘要以繼續下一步的思考。 這樣一來,存放在上下文窗口中的 tokens 數量被大幅削減,從而顯著降低了內存占用和計算成本。

  • 論文標題:LightThinker: Thinking Step-by-Step Compression
  • 論文鏈接: https://arxiv.org/abs/2502.15589 
  • 代碼鏈接: https://github.com/zjunlp/LightThinker

LightThinker 概覽

LightThinker 通過訓練的方式讓模型具備這種能力。這涉及到兩個關鍵問題:「何時壓縮?」和「如何壓縮?」。整個過程可以概括為以下三個關鍵步驟:

第一步:數據重構 —— 在思考流程中植入「壓縮指令」

LightThinker 的第一步就是改造訓練數據,讓 LLM 明白「壓縮」這個動作的存在和時機 。具體操作是:

  1. 步驟劃分:首先,將模型原本冗長的完整回答 Y,按照語義或段落(即一個完整的「想法」)切分成若干個思維步驟 S1, S2, S3, ...。
  2. 插入特殊指令符:在這些思維步驟之間,插入一組特殊的「指令令牌」4。這組指令符主要包含兩個部分:
  • 緩存令牌 (Cache Tokens, C):這是一組特殊的、用于存儲壓縮后信息的「摘要令牌」。它的作用就像是為即將產生的「思想摘要」預留的空白便簽。
  • 輸出令牌 (Output Token, [o]):這是一個強制性的輸出信號,它的作用是告訴模型:「好了,摘要寫完了,現在請基于這份摘要繼續你下一步的思考」 。

經過這樣的改造,原本一條完整的思考鏈,就變成了一個「思考步驟 1 S1 → 進行壓縮 → 繼續思考步驟 S2 → 再次壓縮 → ...」的全新格式。這等于是在模型的學習材料中明確地標注出了「何時」需要進行壓縮。

注意,研究者在具體實現中,采用換行符作為思維步驟的劃分,此處不存在任何數據精心構造的過程。

第二步:注意力改造 —— 學會壓縮與理解壓縮的內容

教會了模型「何時」壓縮,下一步就是最關鍵的如何壓縮。這主要通過一種名為 「Thought-based Attention Mask」的技術來實現,如圖 2 (b) 所示。精確地控制著模型在思考時 “能看什么” 和 “不能看什么” 。

這個過程分為兩個階段:

  • 壓縮階段(生成思維摘要):當模型需要將思維步驟 Si 壓縮進緩存令牌 C 時,注意力掩碼會強制這些 C 令牌只能「看到」三個東西:
  • 最初的問題 X;
  • 先前已經壓縮好的歷史摘要;
  • 當前正在處理的思維步驟 Si。

其他所有原始的、未壓縮的思維步驟都會被「遮蔽」。這迫使模型必須將 Si 中的所有關鍵信息高度濃縮并存儲到 C 中 。

  • 生成階段(基于摘要生成思維):當思維步驟 Si 被成功壓縮進 C 之后,更關鍵的一步來了。在生成下一個思緒片段 S (i+1) 時,注意力掩碼會徹底「遮蔽」掉原始的思維步驟 Si。此時,模型只能「看到」最初的問題 X 和包括剛剛生成的摘要在內的所有歷史摘要 。

通過這種方式,模型被迫學會僅依賴緊湊的「思想摘要」來進行連貫的、層層遞進的推理,而不是依賴越來越長的原始思考全文。

第三步:動態推理 ——「即用即棄」的高效循環

經過以上兩個步驟的訓練,LightThinker 模型在實際推理時,就會形成一種高效的動態循環,如圖 1 (b) 和圖 2 (c) 所示,清晰地展示了「生成→壓縮→拋棄」的動態循環過程。下面以圖 1 (b) 為例進行分析:

  1. 模型接收問題,生成第一段思考(Thought 1)。
  2. 觸發壓縮,將 Thought 1 中的核心信息壓縮成緊湊的摘要(CT1)。
  3. 拋棄原文,將冗長的 Thought 1 從上下文中丟棄。
  4. 模型基于問題和摘要(CT1),生成第二段思考(Thought 2)。
  5. 再次壓縮,將 Thought 2 壓縮為摘要(CT2),并丟棄 Thought 2 原文。
  6. 如此循環,直到問題解決。

通過這種「即用即棄」的機制,LightThinker 確保了模型的上下文窗口始終保持在一個非常小的尺寸,從而解決了因上下文過長導致的內存爆炸和計算緩慢問題,實現了效率與性能的完美平衡。

圖 3 展示了不同方法在推理過程中上下文長度的變化,其中曲線和坐標軸圍城的面積為我們定義的新指標 Dependency,其意義生成 token 時需要關注 token 的數量總和。

實驗結果

研究者在四個數據集和兩個不同的模型上對 LightThinker 進行了廣泛的測試,結果如表 1 所示。

表 1 主要實驗結果。Acc 為準確率,Time 為平均推理耗時,Peak 為平均峰值 token 占用數量,Dep 為生成 token 時需要關注 token 的數量總和(如圖 3)所示。

結果表明,在 Qwen 系列模型上,與傳統模型(Vanilla)相比:

  • 峰值內存使用減少 70%:LightThinker 極大地節約了寶貴的內存資源。
  • 推理時間縮短 26%:在保證結果準確性的前提下,思考速度得到了顯著提升。 
  • 取得了準確度和效率的平衡。

此外,在 Llama 上,也取得了準確度和效率的平衡。

相關工作

當前關于加速大語言模型(LLMs)推理過程的研究主要集中在四類方法:模型量化、輔助解碼、生成更少的 Token 和減少 KV 緩存。模型量化包括參數量化 [1-2] 和 KV 緩存量化 [3-4],輔助解碼主要包括投機采樣,本節將重點關注后兩類方法。

需要注意的是,生成長文本和理解長文本代表著不同的應用場景,因此,專門針對長文本生成階段的加速方法(例如,預填充階段加速技術如 AutoCompressor [5]、ICAE [6]、LLMLingua [7]、Activation Beacon [8]、SnapKV [9] 和 PyramidKV [10])不在此處討論。以下是后兩類方法的詳細概述。

生成更少的 Token

這一類別可以根據推理過程中使用的 token 數量和類型進一步分為三種策略:

  • 離散 Token 減少通過提示工程 Prompt [11-13]、指令微調 [14-15] 或強化學習 [16-17] 等技術來引導 LLM 在推理過程中使用更少的離散 token。例如,TALE [11] 提示 LLM 在預定義的 token 預算內完成任務。Arora 和 Zanette [16] 構建特定數據集并采用強化學習獎勵機制來鼓勵模型生成簡潔準確的輸出,從而減少 token 使用量。
  • 連續 Token 替換這些方法 [18-19] 探索使用連續空間 token 代替傳統的離散詞匯 token。一個代表性例子是 CoConut [18],它利用課程學習來訓練 LLM 使用連續 token 進行推理。
  • 無 Token 使用通過在模型層之間內化推理過程,在推理過程中直接生成最終答案而不需要中間 token [20-21]。

這三種策略都是在模型訓練后實施的,推理過程中不需要額外干預。從技術上講,這些方法的加速效果依次遞增,但代價是 LLM 的泛化性能逐漸下降。此外,第一種策略并不能顯著減少 GPU 內存使用。

減少 KV 緩存

這一類別可以分為兩種策略類型:基于剪枝的離散空間 KV 緩存選擇和基于合并的連續空間 KV 緩存壓縮。

  • 基于剪枝的策略設計特定的淘汰策略 [22-25] 在推理過程中保留重要的 token。例如,StreamingLLM [23] 認為初始的 sink token 和最近的 token 是重要的;H2O [22] 關注具有高歷史注意力分數的 token;SepLLM [24] 強調對應于標點符號的 token 是重要的。
  • 基于合并的策略引入錨點 token,訓練 LLM 將歷史重要信息壓縮到這些 token 中,從而實現 KV 緩存合并 [26]。

這兩種策略都需要在推理過程中進行干預。關鍵區別在于:第一種策略是無需訓練的,但對每個生成的 token 都要應用淘汰策略;而第二種策略是基于訓練的方法,允許 LLM 自主決定何時應用淘汰策略。

局限性

受限于自身的數據重構方案(目前分割思維步驟是依賴規則,而不是基于語義)和訓練數據(約 16K 訓練數據),本文方法在數學相關的任務上表現并不出色。

如下圖所示,展示了 LightThinker 在 GSM8K 上的一個 Bad Case。研究者觀察到,盡管 LLM 在思考過程中得出了正確答案(見上圖中的 Model's Thoughts 字段),但在最終輸出中卻出現了錯誤(見圖中的 Model's Solution 字段)。

具體來說,在 Model's Solution 字段的第三句話中,第一次出現的「4000」是錯誤的。這表明在第二次壓縮步驟中發生了信息丟失(理論上,「8000」、「4000」和「24000」都應該被壓縮,但 LLM 只壓縮了「4000」和「24000」),導致后續的推理錯誤。這類錯誤在 GSM8K 數據集中頻繁出現,表明當前的壓縮方法對數值的敏感度還不夠。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-08 13:30:00

2025-08-25 08:59:13

2021-09-27 10:12:42

欺騙防御rMTD網絡攻擊

2010-04-01 09:30:57

2015-08-21 09:14:40

大數據

2022-10-28 15:16:52

檢測數據

2025-09-19 14:53:34

2025-11-14 15:44:59

小紅書視頻時長EGMN

2018-10-07 07:00:59

2022-07-07 10:47:16

IngressKubernetes

2019-07-12 13:50:36

物聯網大數據安全

2025-02-25 10:04:10

2011-03-14 10:10:01

2010-06-18 09:48:22

2011-12-01 14:15:19

信息優化惠普

2024-10-23 19:47:54

2023-07-06 15:29:52

數據中心能源回收

2009-07-31 08:56:59

ASP.NET頁面刷新

2024-01-23 17:33:36

2025-08-29 08:40:21

點贊
收藏

51CTO技術棧公眾號

亚洲一区二区三区四区五区六区| 91日韩在线播放| japan高清日本乱xxxxx| a在线免费观看| 国产精品123| 欧美激情在线观看视频| 变态另类丨国产精品| 韩国主播福利视频一区二区三区| 国产欧美日韩三区| 91久久国产精品| 日本视频免费在线| 日韩欧美视频| 亚洲成av人片在线观看香蕉| 色综合av综合无码综合网站| 日本福利专区在线观看| 岛国精品在线播放| 国产成人高清激情视频在线观看| 日韩一卡二卡在线观看| 国产毛片久久久| 欧美视频一区在线| 你真棒插曲来救救我在线观看| 亚洲黄色小说网址| 久久综合中文| 欧美激情视频在线观看| av黄色在线免费观看| 成人在线分类| 一本一本大道香蕉久在线精品 | 亚洲欧美一区二区三区在线观看| re久久精品视频| 欧美草草影院在线视频| 国产小视频精品| 人在线成免费视频| 亚洲黄色在线视频| 伊人色综合影院| 精品国产999久久久免费| 亚洲精品四区| 久久精品人人爽| 国产sm调教视频| 国产伦精品一区二区三区在线播放 | 欧美videos极品另类| 91麻豆视频网站| 91久久久亚洲精品| 亚洲最大成人av| 小嫩嫩精品导航| 欧美成人性生活| 国产一区二区三区四区在线| 天堂一区二区三区四区| 欧美成人vr18sexvr| 手机av在线免费| 日韩成人影音| 欧美日韩在线视频观看| 欧美乱做爰xxxⅹ久久久| 91精品大全| 国产女同性恋一区二区| 久久精品国产第一区二区三区最新章节| 国产三级三级在线观看| 日韩中文字幕一区二区三区| 97不卡在线视频| 久久久无码一区二区三区| 国产精品久久久久久影院8一贰佰| 国产视频在线观看一区二区| 怡红院一区二区| av成人综合| 欧美成人一区二区三区片免费 | 日韩一区二区不卡| 天天干天天玩天天操| free欧美| 欧美在线一二三四区| 北条麻妃在线观看| 亚洲天堂资源| 色婷婷国产精品| 激情五月开心婷婷| 超级碰碰久久| 五月综合激情婷婷六月色窝| 欧洲精品视频在线| 日本乱理伦在线| 亚洲成人精品影院| 成人av一级片| 免费成人直播| 欧美视频在线一区| 天美一区二区三区| 日本一区二区乱| 欧美成人r级一区二区三区| 美女网站视频在线观看| 日韩精品社区| 国产亚洲欧美另类中文| 午夜三级在线观看| 欧美激情综合色综合啪啪| 久久久久久久久久久免费| 久久草视频在线| 久久久久久久欧美精品| 国产精品网站入口| 性猛交xxxx乱大交孕妇印度| 成人黄色综合网站| 精品一卡二卡三卡四卡日本乱码 | 99热这里只有成人精品国产| 91禁外国网站| 国产精品va无码一区二区三区| 日本伊人色综合网| yellow视频在线观看一区二区| 日本wwwxxxx| 国产偷国产偷亚洲高清人白洁| 日韩一区二区免费在线观看| 日韩精品久久一区二区| 91制片在线观看| 秋霞蜜臀av久久电影网免费| 欧美大黄免费观看| 人人妻人人藻人人爽欧美一区| 欧美第一精品| 97精品在线观看| 国产精品国产av| 97久久超碰国产精品电影| 久久婷婷开心| 国产盗摄在线观看| 色综合天天综合在线视频| 中文字幕22页| 亚洲区小说区图片区qvod按摩 | 超碰91人人草人人干| 日韩av电影网址| 久久精品72免费观看| 国产精品久久波多野结衣| 高h视频在线| 午夜电影一区二区| 无码无遮挡又大又爽又黄的视频| 久久久久久久久久久久电影| 亚洲精品视频在线播放| 精品99在线观看| 国产农村妇女精品一二区| 国产女同一区二区| 国产中文字幕在线播放| 亚洲国产精品精华液网站| 亚洲免费看av| 婷婷综合成人| 欧美激情一区二区三区高清视频 | 99精品免费| 成人夜晚看av| 成年午夜在线| 色综合久久综合| 亚洲一区二区在线免费| 永久91嫩草亚洲精品人人| 国产精品极品美女在线观看免费 | 久久人妻无码aⅴ毛片a片app| 国产婷婷精品| 国产精品日韩欧美一区二区| 国产一二区在线| 欧美性大战久久久久久久| 一级性生活毛片| 亚洲午夜在线| 91精品黄色| 国产精品va在线观看视色| 欧美中文字幕久久| 国产黄片一区二区三区| 国产精品视频久久一区| 风间由美久久久| 在线三级中文| 欧美一区二区久久| 日韩在线观看视频一区二区| 麻豆久久久久久| 亚洲欧洲一区二区在线观看| 精品欧美一区二区三区在线观看| 亚洲欧美国产日韩天堂区| 在线观看免费国产视频| av电影天堂一区二区在线| 艳母动漫在线观看| 精品国产一区二区三区性色av | 在线观看国产精品一区| 日韩在线一区二区三区| 日本三级中国三级99人妇网站 | 欧美激情在线视频二区| a级片免费观看| 亚洲国产一区二区三区| 69xxx免费视频| 亚洲精品欧洲| 久久影视中文粉嫩av| a国产在线视频| 亚洲欧美日韩爽爽影院| 欧美日韩在线视频播放| 国产精品丝袜久久久久久app| 一区二区三区网址| 99久久99热这里只有精品| 91视频8mav| 思思99re6国产在线播放| 欧美人伦禁忌dvd放荡欲情| 波多野结衣喷潮| 国产成人精品影视| 国产精品50p| av中字幕久久| 亚洲自拍av在线| 欧美人体视频xxxxx| 亚洲高清av在线| 在线观看你懂的网站| 国产精品不卡在线| 亚洲欧洲国产视频| 久久狠狠婷婷| 国产高清免费在线| 成人av婷婷| 国产成人精品亚洲精品| 婷婷在线视频观看| 精品国产乱码久久久久久牛牛| 亚洲日本韩国在线| 中文字幕在线不卡| 在线观看亚洲免费视频| 免费人成黄页网站在线一区二区| 日韩视频一二三| 伊人久久大香线蕉综合网蜜芽 | 久久久无码中文字幕久...| 欧美人妖视频| 国产精品久久久久久av福利软件| www免费在线观看| 亚洲人成网站免费播放| 国产又粗又大又爽视频| 精品国产91久久久久久老师| 国产3级在线观看| 99精品在线免费| 精品久久久99| 久久精品女人天堂| 欧洲精品视频在线| 日本道不卡免费一区| 国产综合第一页| 欧美在线se| 国产91精品久久久久| 黄色网页网址在线免费| 日韩第一页在线| 99国产精品一区二区三区| 色综合天天在线| 久久精品国产亚洲av无码娇色| 国产精品美女久久久久久久久| 亚洲一区二区三区四区av| 六月丁香综合在线视频| 国产肥臀一区二区福利视频| 天天操夜夜操国产精品| 欧洲高清一区二区| 国产精品毛片视频| 亚洲jizzjizz日本少妇| 亚洲综合av一区二区三区| 国产69精品久久久| 一二三四区在线观看| 中文字幕在线精品| 五月婷婷六月丁香综合| 精品久久久网站| 99热在线只有精品| 9191国产精品| 一区二区三区亚洲视频| 在线精品亚洲一区二区不卡| 日韩黄色在线播放| 狠狠久久五月精品中文字幕| 午夜爱爱毛片xxxx视频免费看| 国产欧美日韩另类视频免费观看| 亚洲成人av免费在线观看| 懂色av一区二区三区免费观看 | 都市激情亚洲一区| 97精品在线视频| 2020av在线| 国内免费久久久久久久久久久 | 乌克兰美女av| 日韩在线播放一区二区| 人妻熟女一二三区夜夜爱| 国产日韩欧美| 日b视频免费观看| 88国产精品视频一区二区三区| 一区二区不卡在线观看| 欧美wwwww| 日韩高清国产精品| 精品免费在线| 视频在线观看成人| 人人狠狠综合久久亚洲婷婷| 亚洲国产精品视频一区| 98精品视频| 综合视频在线观看| 欧美 亚欧 日韩视频在线 | 国内精品美女在线观看| 亚洲三区在线观看| 亚洲精彩视频| 亚洲第一精品区| 欧美91大片| 国产美女在线一区| 国产日韩一区| 美女黄色片视频| 久久aⅴ国产欧美74aaa| 久久久久亚洲av无码麻豆| 国产成人精品免费视频网站| 日韩精品视频一区二区| 久久综合九色欧美综合狠狠 | 亚洲欧美在线观看| fc2ppv在线播放| 一区二区三区在线高清| 国产精品999在线观看| 欧美在线免费观看亚洲| 在线免费看毛片| 欧美乱妇20p| 黑人乱码一区二区三区av| 日韩av影视综合网| 国产在线黄色| 久久精品国产亚洲精品2020| 国产盗摄精品一区二区酒店| 欧美影院久久久| 96sao精品免费视频观看| 国产在线一区二区三区播放| 91综合网人人| 无码aⅴ精品一区二区三区浪潮| 美女视频第一区二区三区免费观看网站| 色综合久久久无码中文字幕波多| 国产日韩欧美高清在线| 精品无码m3u8在线观看| 欧美日韩在线播放三区| 天天操天天爱天天干| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 日韩欧美一区二区三区在线| 免费在线黄色网址| 欧美精品www在线观看| 九七电影院97理论片久久tvb| 好吊色欧美一区二区三区视频| 91嫩草亚洲精品| 国产成人无码av在线播放dvd| 成人晚上爱看视频| 欧洲第一无人区观看| 欧美精品在线一区二区三区| 加勒比一区二区三区在线| 97在线免费观看| 中文字幕一区日韩精品| 糖心vlog在线免费观看| 美日韩一区二区| 日韩福利在线视频| 91国偷自产一区二区三区成为亚洲经典| 亚洲AV无码精品国产| 久久福利视频导航| 亚洲狼人综合| 偷拍盗摄高潮叫床对白清晰| 日本在线不卡一区| av在线不卡免费观看| 亚洲综合中文字幕在线观看| 成人女性视频| aaa毛片在线观看| 91蜜桃网址入口| 久久青青草视频| 亚洲精品国精品久久99热| 成人高潮aa毛片免费| 成人羞羞视频免费| 亚洲一本视频| 国产二级一片内射视频播放| 亚洲国产成人av好男人在线观看| 国产超碰人人模人人爽人人添| 久久精品国产亚洲精品| 国产日韩在线观看视频| 中文字幕欧美人与畜| 精品一区二区影视| 国产麻豆视频在线观看| 欧美一区二区三区四区久久 | 久久深夜福利免费观看| 日日夜夜一区| 路边理发店露脸熟妇泻火| 国产不卡视频在线播放| 国产一级aa大片毛片| 亚洲爱爱爱爱爱| 在线观看爽视频| 日本视频一区二区不卡| 奇米888四色在线精品| 91制片厂在线| 精品美女一区二区三区| www在线观看黄色| 美乳视频一区二区| 另类小说欧美激情| 欧美成人精品激情在线视频| 欧美videos中文字幕| 欧美gv在线| 偷拍视频一区二区| 国产麻豆精品95视频| 日韩欧美亚洲视频| 亚洲香蕉伊综合在人在线视看| 久久久人成影片一区二区三区在哪下载 | 亚洲国产精品国自产拍久久| 午夜精品一区二区三区在线视| 免费黄色成人| 国产欧美激情视频| 亚洲成人午夜影院| 国产理论电影在线观看| 亚洲最大福利网站| 国产精品日韩欧美一区| 黑人と日本人の交わりビデオ| 欧美一级夜夜爽| 色网在线免费观看| 制服丝袜综合日韩欧美| 波多野结衣91| 在线观看毛片网站| 国内成人精品一区| 色琪琪久久se色| 中国免费黄色片| 欧美日韩性生活| av免费不卡| 一区二区三区四区欧美日韩| 成人黄色a**站在线观看| 国产美女www| 久久久在线视频| 欧美国产小视频| 精品夜夜澡人妻无码av| 欧美一区二区在线播放| 精品3atv在线视频| 精品国产一区二区三区无码| 日本一区二区三区国色天香| 亚洲毛片在线播放|