精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI話癆終結者!UCSD清華提出「思維掃描術」Dynasor-CoT,推理巨省token

人工智能 新聞
推理模型在復雜任務上表現驚艷,缺點是低下的token效率。UCSD 清華等機構的研究人員發現,問題根源在于模型的「自我懷疑」!研究團隊提出了Dynasor-CoT,一種無需訓練、侵入性小且簡單的方法。實驗證明,Dynasor-CoT在保持準確性的同時,能減少高達29%的token消耗,且不增加推理延遲。

這段時間,諸如DeepSeek-R1和OpenAI o1/o3這類的CoT推理模型,在復雜任務上展現出了驚人的性能。

然而,與早期模型相比,它們的token效率卻非常之低。即,需要消耗更多的token才能達到相同的準確率。

下圖展示了傳統模型的token效率曲線比推理模型陡峭得多。

圖片

最近,來自加州大學圣地亞哥分校、清華等機構的研究人員揪出了罪魁禍首——「自我懷疑」。

圖片

論文地址:https://arxiv.org/abs/2412.20993

項目主頁:https://hao-ai-lab.github.io/blogs/dynasor-cot/

代碼地址:https://github.com/hao-ai-lab/Dynasor

Demo:https://hao-ai-lab.github.io/demo/dynasor-cot

換句話說就是,模型明明早就算出正確答案,卻要反復驗算糾結,白白耗費海量計算資源!

以一個簡單問題 (1+2i)*6-3i測試為例:傳統Qwen-7B用180個token輕松解題,而升級后的Deepseek版Qwen-7B雖在第340個token就得出正確答案,卻硬生生續寫1000+token反復驗證!

這種「學霸強迫癥」,讓DeepSeek等頂尖模型浪費了高達70%的算力!

圖片

為了解決模型的「自我懷疑」問題,研究團隊提出了Dynasor-CoT,一種無需訓練、侵入性最小且簡單的方法,用于長鏈式推理(CoT)。

這種方法結合了基于確定性的啟發式方法與「思維CT掃描術」技術,以動態確定(推理鏈的)終止點。在保持準確性的同時有效地截斷推理鏈。

實現了高達29%的token減少,同時不影響準確性,也不會給關鍵推理路徑帶來額外的延遲。

目前,團隊已將這款「AI話癆終結者」系統全面開源,快來看看你的AI能省多少token吧!

值得一提的是,本文的作者組USCD張昊實驗室還曾經推出過諸多知名研究項目,包括如今風靡全球的大模型競技場(LLM Arena、vLLM,Prefill-decode分離式服務架構等。

AI「思維CT掃描術」

為了系統地研究這個現象,研究人員開發了一種「思維CT掃描術」(Probe-In-The-Middle)。

通過在模型推理過程中插入特定提示(比如「啊!我悟了,答案是:」),來提取模型某一個中間思考節點的答案,從而確定到底模型最早在什么時候得到了正確答案。

就像考試時監考老師突然抽走草稿紙,逼迫AI提前交卷!

下圖展示了不使用和使用「思維CT掃描術」兩種方式的準確率對比分析。左邊采用標準推理。右邊使用「思維CT掃描術」技術提取早期答案,可以看出在50%的token減少下具有等效的準確性。

在相同的token預算下,綠色區域越早出現表示正確答案到達得越早——明顯更綠的右側面板表明模型實際上知道答案的時間比標準推理中顯示的要早得多。

圖片

以AMC23數據集為例,推理模型通常在早期就得到了正確答案(中位數:830個token),但由于「自我懷疑」會繼續生成不必要的token(中位數:2.7K個token)。

這種自我懷疑現象嚴重影響了token效率,因為模型即使內心已經對答案有一定把握,還是會繼續推理。

基于信心值的早停策略,巧妙減少token消耗!

想象一下,我們給AI裝了一個智能「話癆終結者」。每當AI說了一定數量的話(比如64個token),「思維CT掃描術」(probe-in-the-middle)就會悄悄啟動:

  1. 首先,像醫生做CT掃描一樣,給AI的思維來個「斷層掃描」,提取它當前的答案。
  2. 有趣的是,AI完全不知道自己被「掃描」了!它會繼續自顧自地推理,繼續寫解題步驟。
  3. 如果AI連續N次的「CT掃描」結果都顯示同一個答案,系統就會判定AI非常自信,并果斷按下停止鍵。堅定地告訴這位同學:「你已經答對了,不用再證明了!」

Dynasor-CoT通過三種關鍵機制提高長CoT LLM推理中的token效率:提取答案、確定性評估和生成后驗證。

下圖展示了Dynasor-CoT方法。如果模型回答比較確定則退出(案例 1),遇到有猶豫含義的詞匯(例如,等等)則繼續生成(案例 3),如果模型推理不足夠確定也繼續生成(案例 2)。

圖片

中間探針

研究人員在模型生成過程中引入了名為「中間探針」(probe-in-the-middle)的戰略干預。

他們在模型推理的中間階段添加精心設計的引導,以明確地提取出模型當前的答案。

這種方法利用了他們的觀察,即推理LLM通常在完成其完整的推理鏈之前就能達到正確答案。

當LLM已經在其內部得出結論時,這種早期提取技術顯著降低了計算成本。

通過答案一致性進行確定性評估

研究人員實現了一種動態確定性評估機制,該機制定期(例如每32、64或128個標記)監控模型的輸出。

在每個間隔內,探測模型以提取和存儲當前答案,然后允許LLM繼續其生成。重要的是,后續的生成不受探測標記的影響,從而實現答案提取和原始生成的并行執行。

當模型在多個間隔內產生一致的答案時,將其模式解釋為確定性的指標,遵循certaindex方法Dynasor。這種方法為模型的確定性提供了定量度量。

AI的微表情識別術:揪出不自信的時刻!

研究人員發現,AI也有自己的「微表情」!通過仔細觀察AI的語言習慣,他們找到了判斷AI是否自信的妙招:

  • 當AI說出「等等」、「嗯...」這樣的詞時,就像人類皺眉思考或撓頭的動作,說明它對自己的答案并不太有把握。
  • 這時候,即使「思維CT掃描」得到了答案,我們也要對它保持警惕,不能輕易相信一個支支吾吾的回答。
  • 這種語言習慣分析,就像是給AI裝了一個「情緒探測器」,能夠精準捕捉到它的不自信時刻!

總的說來,這種方法利用了模型在中間階段得出結論的能力,也保持了針對過早或不確定響應的強大保障措施。

Certaindex:一個更野心勃勃的目標!

這套基于信心值的策略遠不止于此,它還有更廣闊的應用前景:

  • 它可以推廣到各種高級推理算法中,比如自洽性檢驗(self-consistency)、蒙特卡洛樹搜索(MCTS)等。
  • 就像一個通用的「自信度測量儀」,能夠適應不同的思維方式。
  • 不管AI用什么方法思考,這個系統都能準確判斷:「嗯,這個答案它是真的有把握。」

通過這種方式,研究人員不僅讓AI變得更高效,還讓它的思維過程變得更透明、更可控。并且,還能知道什么時候該停下來,而不是無休止地解釋、驗證。

最重要的是,這個方法不需要重新訓練模型,可以直接應用到現有的AI系統中,堪稱即插即用的效率神器!

Dynasor:大模型推理的「調度大師」

簡單說,Dynasor就像是大模型推理任務的「智能調度系統」:

1. 智能資源分配

  • 基于Certaindex(信心值系統)動態分配計算資源
  • 像調度員一樣安排每個推理任務的優先級和資源

2. 結構化管理

  • 把復雜推理任務變成結構化的程序
  • 在應用層和系統層實現高效調度
  • 通過緩存優化提升性能

總之,它就是讓AI推理既快又準的效率神器!就像給大模型裝了個智能管家,讓推理過程更加高效有序。

下圖展示了該架構通過本地應用程序組件與服務器端系統管理之間的相互作用,實現了高效的資源分配。

圖片

實驗結果:大幅提升推理效率!

研究團隊在多個數學推理數據集(AIME24、AMC23和MATH500)上測試了這套系統,使用了不同規模的DeepSeek模型(7B、14B和32B)。

下圖評估了不同的探測間隔(如32、64等),這些間隔通過不同顏色的線條表示,并且最大token預算為16K。

對于每個間隔,研究人員調整了早期終止參數N(所需的連續一致答案的數量),從而生成每條線上的不同點。所有配置都實現了顯著的token節省,在保持與基準模型相當的準確度的同時,將token使用量減少了最多29%。

為了公平比較,適當的準確度閾值已根據模型規模進行校準——對于32B模型,使用嚴格的閾值標準,而對于較小的模型,則使用較低的閾值,同時在較簡單的任務中設置更高的目標,以便達到更高的準確度。

圖片

對于該方法在token減少方面表現最好的10%問題,研究人員觀察到AIME節省了34%的token,MATH500節省了53%。

在最優的1%問題中效果更加顯著——AIME節省了53%,MATH500節省了高達81%!

這種表現顯示了這種動態方法相對于固定token預算的優勢,因為不同問題在達到解決方案時對token的需求有所不同。

為了驗證可擴展性,研究人員將實驗擴展到更大的DeepSeek-R1模型。

下圖顯示了Dynasor-CoT在DeepSeek-R1上和較小蒸餾模型上表現一致,實現持續的效率提升:DeepSeek-R1在AIME問題上實現了12%的token節省,在AMC問題上實現了24%,同時保持了基線準確率水平。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2018-05-06 16:52:51

2012-09-10 09:28:51

2024-08-07 10:19:00

2011-09-06 14:36:34

觸摸菜單ipad應用電子點菜

2013-11-15 10:15:55

HA系統張振倫HypervisorH

2014-08-29 16:43:58

GitHubLinux

2015-12-09 10:41:51

2013-12-30 10:37:59

2017-11-13 09:00:44

寬帶服務DDoS

2009-08-24 15:22:37

云計算技術性工作

2010-09-09 15:10:56

2009-08-04 21:46:53

IBM動態架構DI

2016-01-15 11:39:46

物聯網互聯網

2021-08-28 09:04:54

死鎖順序鎖輪詢鎖

2011-10-11 10:02:48

2025-04-15 09:19:00

模型AI數據

2025-04-29 08:15:41

2009-03-21 10:16:46

微軟瀏覽器IE8

2017-01-19 09:36:02

2024-12-18 14:53:28

點贊
收藏

51CTO技術棧公眾號

国产午夜亚洲精品理论片色戒| 亚洲先锋成人| 欧洲亚洲精品| 亚洲精品97| 亚洲加勒比久久88色综合| 蜜臀久久99精品久久久酒店新书 | 日韩欧美在线123| 少妇av一区二区三区无码| 极品白浆推特女神在线观看| 国产一区二区福利视频| 97国产精品视频| 99自拍偷拍视频| 国产精品18hdxxxⅹ在线| 精品久久香蕉国产线看观看gif| 亚洲精品第一区二区三区| 亚洲黄色在线观看视频| 秋霞电影网一区二区| 久久噜噜噜精品国产亚洲综合 | www.精品久久| 欧美aⅴ一区二区三区视频| 欧美日本中文字幕| 久久久久久久久福利| 成人福利免费在线观看| 欧美电影一区二区| 99蜜桃臀久久久欧美精品网站| 羞羞网站在线免费观看| 国产欧美精品区一区二区三区 | 日韩av免费在线| 欧美日韩国产在线看| 国产福利久久精品| 国产精品人人爽| 久久三级福利| …久久精品99久久香蕉国产| 99热精品免费| 欧美hd在线| 亚洲另类欧美自拍| 99re久久精品国产| 亚洲精品v亚洲精品v日韩精品| 欧美综合一区二区三区| 欧美a在线视频| 9lporm自拍视频区在线| 亚洲精品视频在线观看网站| 亚洲永久激情精品| аⅴ资源新版在线天堂| 久久久久久日产精品| 久久99精品久久久久久久久久| www.狠狠干| 国产成人精品午夜视频免费| 亚洲资源在线看| av老司机久久| 韩国理伦片一区二区三区在线播放| 国产精品男女猛烈高潮激情| 中文字幕日本视频| 奇米一区二区三区av| 国产精品激情自拍| 中文字幕+乱码+中文| 视频在线观看一区| 国产精品久久av| 在线观看免费视频一区| 美女网站色91| 一区二区欧美视频| 色婷婷综合成人av| 四虎国产成人精品免费一女五男| 精品久久电影| 在线日韩欧美视频| 国产黄a三级三级| 久久精品国产大片免费观看| 日韩天堂在线视频| 极品魔鬼身材女神啪啪精品| 亚洲五月综合| 欧美另类暴力丝袜| 久久不卡免费视频| 黄色精品一区| 欧洲亚洲在线视频| 艳妇乳肉豪妇荡乳av无码福利| 青青草成人在线观看| 91久久精品在线| 亚洲男人天堂久久| 9色porny自拍视频一区二区| 免费日韩电影在线观看| yw视频在线观看| 国产精品电影一区二区三区| 成人国产一区二区三区| 国产夫妻在线| 欧美性感一区二区三区| 天堂网成人在线| 另类在线视频| 色偷偷偷亚洲综合网另类| 国产高清视频免费在线观看| 伊人久久综合| 国产精品三级网站| 国产自产一区二区| 中文字幕成人在线观看| 毛片在线视频观看| 欧美free嫩15| 日韩欧美亚洲一区二区| 97超碰在线资源| 欧美成人综合| 国产mv免费观看入口亚洲| 国产精品乱码久久久| 国产剧情av麻豆香蕉精品| 日韩国产高清污视频在线观看| 成人欧美在线观看| 成人激情四射网| 国产欧美精品在线观看| 屁屁影院ccyy国产第一页| 欧美日韩不卡| 精品999久久久| 国产精品18在线| aa级大片欧美三级| 亚洲www视频| 精品av中文字幕在线毛片| 一区二区三区产品免费精品久久75 | 国产91久久久| 中文字幕欧美一区| 黄色动漫在线免费看| 成人在线视频国产| 亚洲三级 欧美三级| 黄色小视频在线免费看| 久久成人免费网站| 欧美三级网色| 成人影音在线| 日韩一二三区视频| 国产三级aaa| 久久天堂成人| 精品国产一区二区三区免费| www.在线视频| 欧美日本国产一区| 熟女俱乐部一区二区视频在线| 亚洲电影成人| wwwxx欧美| 成人影院在线看| 欧美军同video69gay| 色婷婷av777| 国产精品视频| 黑人另类av| 岛国av在线网站| 精品国产免费人成电影在线观看四季| 人妻久久一区二区| 国产中文字幕精品| 午夜啪啪免费视频| 台湾天天综合人成在线| 中文字幕亚洲色图| 在线免费av片| 国产精品麻豆视频| 日韩一级理论片| 国产精品一区二区99| 青青久久aⅴ北条麻妃| 外国精品视频在线观看| 偷拍一区二区三区四区| 91丨porny丨对白| 最新成人av网站| 国内一区在线| 美女扒开腿让男人桶爽久久软| 亚洲精品不卡在线| 在线观看亚洲欧美| 91视频国产资源| 成年人免费在线播放| 成久久久网站| 国产精品免费看久久久香蕉| 色网站免费在线观看| 欧美日韩一区二区三区高清 | 亚洲乱码国产乱码精品精软件| 亚洲另类在线一区| 少妇伦子伦精品无吗| 欧美三级免费| 久久99九九| 91成人免费看| 91中文字幕在线| 久久久久久女乱国产| 色老综合老女人久久久| 欧美激情亚洲色图| 久久精品久久99精品久久| 国产福利片一区二区| 免费精品一区| 97久久久久久| 国产黄在线播放| 欧美高清视频一二三区| 欧美日韩成人免费观看| 狠狠网亚洲精品| 青青在线免费观看| 免费一区二区| 成人国产精品久久久| 亚洲91av| 亚洲丝袜av一区| 一级特黄特色的免费大片视频| 亚洲综合无码一区二区| 在线观看国产网站| 免费黄网站欧美| 国产成a人亚洲精v品在线观看| 丝袜av一区| 亚洲free性xxxx护士白浆| 川上优av中文字幕一区二区| 日韩在线小视频| 天天干,天天操,天天射| 欧美日韩在线观看一区二区| 男女免费视频网站| 亚洲国产精品传媒在线观看| 波多野结衣电影免费观看| 久久精品麻豆| 奇米777四色影视在线看| 亚洲精品国模| 亚洲综合大片69999| 成人软件在线观看| 欧美激情精品久久久久| sese一区| 日韩精品免费综合视频在线播放| 国产精品永久久久久久久久久| 午夜欧美一区二区三区在线播放| 小早川怜子一区二区的演员表| 99久久久久久99| 国产999免费视频| 久久av一区| 国产xxxx振车| 羞羞色午夜精品一区二区三区| 美日韩免费视频| 97se亚洲| 91久久国产精品91久久性色| 日韩伦理三区| 97久久精品人搡人人玩| 天天色天天射天天综合网| 深夜成人在线观看| 秋霞av在线| 亚洲精品乱码久久久久久按摩观| 国产高清视频免费观看| 欧美精品一卡二卡| 日韩成人在线资源| 懂色av蜜臀av粉嫩av喷吹| 一区二区三区小说| 欧美一级特黄高清视频| 国产日韩欧美激情| 亚洲欧洲久久久| 91视频在线看| 久久久老熟女一区二区三区91| 国产精品88av| 日本少妇一级片| 国产一区二区三区视频在线播放| 欧美三级午夜理伦三级富婆| 青青草成人在线观看| 五月天婷婷激情视频| 麻豆亚洲精品| 熟女性饥渴一区二区三区| 一区二区福利| 18禁男女爽爽爽午夜网站免费| 亚洲国产国产亚洲一二三| 国产成人永久免费视频| 欧美三级黄美女| 国产精品69久久久| 亚洲高清资源| 国产精品宾馆在线精品酒店| 国产欧美三级| 精品久久久久久久免费人妻| 日日摸夜夜添夜夜添精品视频| 无码无遮挡又大又爽又黄的视频| 日韩精品一级中文字幕精品视频免费观看 | www 日韩| x99av成人免费| 成人区精品一区二区不卡| 欧美老女人性视频| 少妇熟女视频一区二区三区| 久久黄色影视| 久久精品中文字幕一区二区三区 | 成人自拍视频| www日韩av| 丝袜美腿综合| 新呦u视频一区二区| 午夜免费一区| 欧妇女乱妇女乱视频| 亚洲精品裸体| 成人一区二区三| 精品制服美女久久| 能看毛片的网站| a在线欧美一区| 一级黄色片大全| 日韩美女精品在线| 精品午夜福利在线观看| 欧美日韩在线免费| 亚洲天天综合网| 精品国产自在久精品国产| 天堂v在线观看| 伊人久久综合97精品| 成人三级网址| 欧美一区第一页| 欧美成人免费全部网站| 国产成人看片| 国产成人影院| www国产免费| 老司机一区二区三区| 天天看片天天操| 99久久伊人久久99| 91动漫免费网站| 亚洲成人免费影院| 日本一区网站| 亚洲视频三区| 日本在线观看一区| 欧美日韩国内| 天天爽天天爽夜夜爽| 国产精品一二三区在线| 波多野结衣福利| 一区二区三区四区高清精品免费观看| 国产美女激情视频| 在线播放日韩导航| 欧美挠脚心网站| 色中色综合影院手机版在线观看| 午夜日韩成人影院| 成人毛片网站| 欧美高清视频手机在在线| 久久国产亚洲精品无码| 国产乱码精品一区二区三区忘忧草| 精品无码人妻一区| 亚洲一区二区精品3399| 一级做a爱片性色毛片| 亚洲乱码一区二区| 日本一本在线免费福利| 国产精品视频999| 国产尤物久久久| 欧美一级视频免费看| 国产一区不卡视频| ass极品国模人体欣赏| 精品国产精品自拍| 成人免费视频国产免费麻豆| www.亚洲一区| 国产情侣一区二区三区| 欧美 日韩 国产在线| 一本色道久久精品| 亚洲少妇一区二区三区| 亚洲欧美国产毛片在线| 自拍偷拍第八页| 国产亚洲xxx| 欧美7777| 麻豆视频成人| 国产麻豆综合| 亚洲精品乱码久久| 亚洲福利电影网| 亚洲美女综合网| 日韩一区在线播放| 国产又爽又黄ai换脸| 在线精品亚洲| 亚洲av午夜精品一区二区三区| **网站欧美大片在线观看| 亚洲影视一区二区| 日韩一二三在线视频播| 国语自产精品视频在线看抢先版结局 | 中文字幕视频在线免费欧美日韩综合在线看 | 日韩电影免费| 欧美亚洲成人网| 神马日本精品| caoporn超碰97| 欧美激情一二三区| 中文字幕视频免费观看| 最新69国产成人精品视频免费| 日韩一区二区三区在线免费观看 | 黄色精品免费| 青青草视频网站| 欧美日韩一区二区在线 | 国产精品丝袜久久久久久app| 久久精品五月天| 主播福利视频一区| 亚洲男人在线| 一二三四中文字幕| 成人亚洲一区二区一| 亚洲一区欧美在线| 国产丝袜一区二区三区| 欧美free嫩15| 综合久久国产| 成人性生交大片免费| 国产成人亚洲欧洲在线| 亚洲欧美激情一区| 成人福利片在线| 热久久最新地址| 93久久精品日日躁夜夜躁欧美 | 91精品在线麻豆| 手机在线免费观看av| 黑人中文字幕一区二区三区| 日韩主播视频在线| 久久精品亚洲a| 亚洲国产99精品国自产| 波多野结衣亚洲一二三| 色综合视频二区偷拍在线| 国产精品99久久久久久有的能看| 日产精品久久久久| 国产亚洲在线播放| 国产剧情一区二区在线观看| 久在线观看视频| 中文字幕一区在线观看视频| 亚洲AV无码乱码国产精品牛牛 | 91社区在线播放| 伊人网视频在线| 欧美激情一区二区三级高清视频| 久久99国产精品视频| 伊人成人免费视频| 欧美性xxxxhd| 高清全集视频免费在线| 精品一区二区三区国产| 久久激五月天综合精品| 久久午夜鲁丝片午夜精品| 亚洲性生活视频| ccyy激情综合| 精品国产乱码久久| 成人在线播放视频|