精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

低Token高精度!字節復旦推出自適應推理框架CAR

人工智能 新聞
來自字節、復旦大學的研究人員提出自適應推理框架CAR,能根據模型困惑度動態選擇短回答或詳細的長文本推理,最終實現了準確性與效率的最佳平衡。

過度依賴CoT思維鏈推理會降低模型性能,有新解了!

來自字節、復旦大學的研究人員提出自適應推理框架CAR,能根據模型困惑度動態選擇短回答或詳細的長文本推理,最終實現了準確性與效率的最佳平衡。

圖片

推理能力的進步極大提升了大語言模型(LLMs)和多模態大語言模型(MLLMs)在各類任務中的表現。

但已有研究發現,長CoT推理并非總能提升準確率,甚至會削弱模型處理簡單任務的能力(可能產生冗長輸出)。

為此,研究人員提出了CAR這一基于置信度的自適應推理框架,它首先生成簡短回答并評估困惑度,僅在模型置信度低(困惑度高)時觸發推理。

在多模態視覺問答、關鍵信息提取及文本推理等多個基準測試中,CAR超越了單純的短回答與長推理方法,在準確性與效率之間取得了最佳平衡。

先導實驗設置

這項研究聚焦文本密集型視覺問答(VQA)和關鍵信息抽取(KIE)領域,選取8個具有代表性的公開數據集開展先導實驗。

其中,DocVQA、InfoVQA、ChartQA、VisualMRC等4個數據集構成VQA數據集,覆蓋文檔、圖表、信息圖等多種視覺文本形態;SROIE、CORD、FUNSD、POIE等4個數據集組成KIE數據集,主要用于票據、表格等結構化信息抽取任務。

以這些數據集為基礎,研究對Qwen2.5-0.5B模型進行微調,并在域內(如DocVQA、ChartQA)和域外(如POIE、InfoVQA)數據集上開展性能評估。

評估過程中,要求模型分別生成簡短答案和包含長文本推理過程的答案兩種輸出形式。

實驗完成后,系統性統計各數據集的準確率(Accuracy)和回答的困惑度(Perplexity,PPL)——PPL 值越低,表明模型對生成答案的置信度越高。

圖片

實驗分析結果顯示,PPL與準確率之間存在顯著的強負相關性

從數據集層面分析,準確率與PPL呈現明顯的逆向關系(見圖1),即數據集整體準確率越高,其平均PPL值越低;深入數據集內部觀察,預測正確樣本的平均PPL分數顯著低于預測錯誤樣本(見圖2)。

基于上述發現,研究創新性提出一種基于PPL的動態推理決策機制。

具體而言,當模型輸出的PPL值超過設定閾值(研究以測試集PPL分布的75%分位數作為閾值)時,判定為低置信度場景,觸發長文本推理模式,以減少誤判風險;若PPL值低于閾值,則判定為高置信度場景,直接輸出簡短答案,提升推理效率。

實驗結果表明,采用該動態決策機制后,模型在絕大多數數據集上的性能均實現顯著提升。

以下為PPL取75%分位數為閾值下的性能對比:

圖片

提出自適應推理框架CAR

基于上述探索性的發現,這項研究工作擬開發一個使用困惑度(PPL)的動態推理決策框架Certainty-based Adaptive Reasoning(CAR),其目標是能夠在推理過程中自適應地在短文本推理和長文本推理之間切換。

如圖3(a)所示,研究人員首先使用包含簡短答案的示例和包含長文本推理解答的示例來訓練大語言模型(LLM)或多模態大語言模型(MLLM)。

隨后,借助訓練集的困惑度(PPL),估計正確和錯誤簡短答案的PPL分布,這些分布用于決策制定。

具體來說,如果估計的分布確定簡短答案是正確的,所提出的方法會直接輸出該正確答案。否則,它會執行長文本推理。推理過程如圖3(b)所示。

圖片

模型訓練

研究人員將同時包含簡短答案和長文本推理解答標注的訓練示例進行混合,構建新的數據集。隨后采用標準指令微調流程,模型接收由輸入文本和輸出文本組成的序列,優化目標為交叉熵損失:

圖片

模型訓練完成后,對訓練集中所有樣本進行短答案推理,生成預測答案并計算其困惑度值PPL。

Token序列的困惑度定義為:

圖片

高斯分布建模

設二元變量C表示短答案是否正確(C=1為正確,C=0為錯誤),假設正確與錯誤答案的PPL分布均服從高斯分布:

圖片

概率密度函數分別為:

圖片

最后,通過訓練數據估計其中參數(假設n1和n0分別為訓練集中正確與錯誤回答的數量):

圖片

推理過程

對新輸入x,推理步驟如下:

1、短回答推理:模型生成短回答,并計算相應的PPL為PPLnew

2、概率計算:根據貝葉斯定理,將PPLnew代入概率密度函數,計算后驗概率;

圖片

其中,先驗概率分別為:

圖片

3、決策規則:如果短回答的正確概率高于其可能錯誤的概率,直接輸出短回答;否則觸發模型的長推理。

實驗結果

下表展示了多模態數據集上的性能表現。

首先,CARQwen2VL相比CARShort和CARLong的優越性能,證明了使用困惑度(PPL)作為推理路徑選擇指標的有效性。

此外,所提出的方法保持了還使用了更少的輸出Token數量(平均86.9個token),僅為Qwen2-VLLong所使用Token數量的15%。

圖片

下表展示了基于文本的推理任務性能對比。

CAR方法表現出穩健的性能。具體地,使用Qwen2.5-7B模型時平均準確率達81.1%(上圖);使用Llama3.1-8B時達74.9%,均優于短答案基線模型以及長文本推理模型(下圖)。

此外,CAR的性能均優于TALE和COD等先進的Token縮減方法。

圖片圖片

小結一下,這項研究提出基于置信度的自適應推理框架(CAR),該框架可根據模型置信度動態切換短回答與長文本推理模式。

通過困惑度(PPL)量化模型對答案的置信度,CAR在高置信度時直接輸出短回答以提升效率,低置信度時觸發長文本推理以確保準確性。

按照研究團隊的說法,CAR打破了“長文本推理必然性能更好”的固有認知,為大模型推理提供了更靈活高效的解決方案,推動大模型推理向智能化、輕量化方向發展。

論文地址:https://arxiv.org/abs/2505.15154

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-02-19 09:17:48

微軟Edge瀏覽器

2025-05-26 17:16:51

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-01-21 08:00:00

自適應框架框架開發

2022-10-19 16:51:10

Linux優化

2024-10-21 12:30:52

2022-12-12 11:31:39

數據學習

2017-06-06 10:30:12

前端Web寬度自適應

2025-06-03 03:15:00

2025-06-09 09:17:44

2025-09-08 09:02:00

2024-11-04 08:30:00

2023-12-12 13:51:00

AI訓練

2012-05-09 10:58:25

JavaMEJava

2014-09-05 10:10:32

Android自適應布局設計

2010-08-30 09:52:03

DIV高度自適應

2010-08-30 10:26:20

DIV自適應高度

2023-07-31 08:24:34

MySQL索引計數

2024-09-13 15:36:36

點贊
收藏

51CTO技術棧公眾號

日本成人中文字幕在线| 欧洲亚洲一区二区| 麻豆国产尤物av尤物在线观看| www.成人网| 欧美性少妇18aaaa视频| 视频在线99re| 六月婷婷综合网| 国产无限制自拍| 欧美一区二不卡视频| 亚洲精品九九| 一本色道久久88精品综合| 竹内纱里奈兽皇系列在线观看| 欧美日韩国产在线一区| 精品国精品国产| 免费在线观看毛片网站| 欧美jizz18性欧美| 成人avav在线| 国产日韩欧美另类| 日韩特黄一级片| 99精品视频在线观看播放| 亚洲成人三级在线| 久热精品在线播放| 狼人综合视频| 亚洲黄色av一区| 色噜噜色狠狠狠狠狠综合色一| 黑人巨大精品欧美一区二区小视频 | 久久五月精品| 91美女片黄在线| 99国产高清| 97精品久久人人爽人人爽| 国产偷自视频区视频一区二区| 久久天天躁狠狠躁老女人| 亚洲理论片在线观看| 久久激情av| 日韩一区二区三区观看| 人人干人人视频| 毛片电影在线| 亚洲va韩国va欧美va精品| 艳母动漫在线免费观看| 中文字幕日本在线| 久久久精品国产免费观看同学| 国产乱码精品一区二区三区中文| 国产免费不卡av| 久久成人18免费观看| 国产精品极品在线| 欧美精品一二三四区| 9久re热视频在线精品| 色综合男人天堂| 九九热视频精品| 中文字幕一区二区三区欧美日韩| 中文字幕在线日韩 | 亚洲欧洲色图| 亚洲毛片在线观看| www.88av| 天堂一区二区三区四区| 亚洲激情第一页| 国产精品嫩草69影院| 一区二区三区亚洲变态调教大结局 | 国产不卡视频在线| av中文在线播放| 亚洲欧美久久久| 68精品久久久久久欧美| 日本中文字幕免费| 99热这里只有精品8| 国产69精品久久久久9999| 国产无遮挡免费视频| 一本久道久久久| 欧美亚洲激情视频| 无码人妻精品一区二区三区9厂| 久久中文在线| 国产精品美腿一区在线看| 国语对白做受69按摩| 男人的j进女人的j一区| 国产在线播放不卡| 国产视频aaa| 国产91精品久久久久久久网曝门| 国产成人免费观看| 色av男人的天堂免费在线| 久久久亚洲国产美女国产盗摄| 日韩中文不卡| 国产不卡在线| 午夜不卡av在线| 日本www.色| www一区二区三区| 欧美精品一区男女天堂| 国产精品三级在线观看无码| 精品av一区二区| 久久精品电影网| 日韩欧美亚洲国产| 久久一区国产| 91成人在线看| 亚洲 另类 春色 国产| 欧美国产精品中文字幕| 蜜桃网站在线观看| 自拍视频在线看| 制服丝袜中文字幕一区| 色婷婷精品久久二区二区密| 精品国产一区二区三区小蝌蚪 | 久久综合九九| 日韩子在线观看| 欧美日韩国产一区中文午夜| 欧美伦理片在线观看| **爰片久久毛片| 伊人久久免费视频| 免看一级a毛片一片成人不卡| 久久黄色网页| 99久久久久国产精品免费| 色av男人的天堂免费在线| 亚洲欧美一区二区三区国产精品| 久久久一本二本三本| 91麻豆精品一二三区在线| 亚洲精品久久久久中文字幕欢迎你| 国产农村妇女精品一区| 亚洲狠狠婷婷| 亚洲最大福利网| 高清性色生活片在线观看| 亚洲一区二区av电影| 自拍偷拍21p| 色吊丝一区二区| 欧美大奶子在线| 中文字幕一区二区人妻| www.亚洲在线| 日韩视频 中文字幕| 高清av一区| 日韩精品在线免费| 久久精品国产亚洲AV无码麻豆| 狠狠色狠狠色合久久伊人| 日本欧洲国产一区二区| 麻豆国产在线| 亚洲国产一区自拍| 久久精品一级片| 国产在线精品一区二区夜色| 视频一区视频二区视频三区视频四区国产| 99riav视频在线观看| 精品剧情在线观看| 欧美激情图片小说| 精品一区二区三区免费视频| 少妇免费毛片久久久久久久久| 欧美大胆成人| 亚洲欧美中文另类| 国产一区二区三区影院| www.66久久| 久久精品无码中文字幕| 亚洲精品午夜| 欧美国产激情18| 国产福利资源在线| 亚洲一区二区三区中文字幕| 国产黄色一区二区三区 | 欧美 丝袜 自拍 制服 另类| 波多野结衣欧美| 久久久久久网站| 成人久久久精品国产乱码一区二区| 亚洲欧美成人一区二区三区| 99九九99九九九99九他书对| 99久久综合| 91亚洲精品久久久| 宅男在线观看免费高清网站| 日韩欧美在线观看一区二区三区| 少妇影院在线观看| 国产白丝网站精品污在线入口| 欧美一级中文字幕| 盗摄牛牛av影视一区二区| 国产+成+人+亚洲欧洲| 神马久久久久| 欧美色爱综合网| 我要看黄色一级片| 国产老肥熟一区二区三区| 日韩国产小视频| 欧美理论电影在线精品| 日本亚洲欧美成人| seseavlu视频在线| 91精品国产入口| 国产精品suv一区二区69| 91蜜桃网址入口| 91插插插插插插插插| 久久精品青草| 狠狠色综合一区二区| 忘忧草在线www成人影院| 中文字幕日韩在线观看| www.五月婷| 欧美性极品xxxx娇小| 先锋影音av在线| 国产成人在线视频网站| 国产极品粉嫩福利姬萌白酱| 日韩在线二区| 国产精品国产精品国产专区蜜臀ah | 欧美日韩国产丝袜另类| 我要看一级黄色录像| 成人免费视频app| 欧美激情精品久久久久久小说| 久久久久国产精品| 韩国精品一区二区三区六区色诱| 日本在线精品| 国产69精品99久久久久久宅男| 福利视频在线看| 亚洲第一男人天堂| 在线观看国产一区二区三区| 亚洲国产日韩av| 国产真人真事毛片视频| 成人免费视频免费观看| 九九热精品在线播放| 国产精品社区| 国产乱人伦精品一区二区三区| 成人影院天天5g天天爽无毒影院| 俄罗斯精品一区二区三区| 青青伊人久久| 日本成人免费在线| 欧美黄色视屏| 日韩在线精品一区| 欧美成人片在线| 亚洲精品一区二区三区在线观看 | 精品久久久久久亚洲综合网| 国产精品国产精品国产| 亚洲v日本v欧美v久久精品| 黑鬼狂亚洲人videos| 国产欧美精品一区二区三区四区| 国产大尺度视频| 国内国产精品久久| 一区二区xxx| 国产精品亚洲综合久久| 国产精品成人久久电影| 香蕉国产精品| 亚洲国产一区在线| 一道在线中文一区二区三区| 国产中文一区二区| 动漫视频在线一区| 亚洲影院色在线观看免费| 欧美在线一级| 国产精品一区二区久久国产| 亚洲第一二三四区| 欧美亚洲国产视频| 中文av在线全新| 97香蕉超级碰碰久久免费的优势| 在线观看电影av| 久久成人精品视频| www.久久ai| 欧美成人激情视频免费观看| 久cao在线| 免费97视频在线精品国自产拍| 嫩草在线视频| 久久久国产在线视频| 国产原创在线观看| 久久久99免费视频| 免费大片黄在线| 久久在线免费观看视频| 免费网站看v片在线a| 久久精品2019中文字幕| 免费观看成人高潮| 久久久www成人免费精品| caoporn免费在线视频| 尤物tv国产一区| 亚洲欧美视频一区二区| 精品国模在线视频| 国产精品久久久久久福利| 久久精品一本久久99精品| 91亚洲天堂| 久久久久久有精品国产| 成人免费图片免费观看| 国产不卡av在线| 国产亚洲人成a在线v网站 | 蜜臀久久99精品久久久酒店新书 | 国产精品久久久久影院日本| 成人不卡视频| 91久久精品国产91性色| 香蕉免费一区二区三区在线观看 | 国产人妻精品久久久久野外| 高清在线不卡av| 免费成人蒂法网站| 久久精品人人做人人综合 | 在线精品观看| 久章草在线视频| 麻豆一区二区99久久久久| 亚洲av无一区二区三区久久| 成人高清视频在线| 日韩人妻一区二区三区| 国产精品久久久久一区| 69xx绿帽三人行| 欧美性xxxx极品hd满灌| 亚洲手机在线观看| 日韩欧美成人激情| 你懂的在线网址| 久久久www成人免费精品张筱雨| aa国产成人| 国产日韩av在线播放| 韩国福利在线| www高清在线视频日韩欧美| av在线免费观看网址| 国内精品在线一区| 户外露出一区二区三区| 国产精品伦理在线| 亚洲成a人无码| 91在线观看污| 蜜桃av乱码一区二区三区| 亚洲欧美日韩系列| 欧美成人一区二区三区高清| 亚洲中国最大av网站| 精品国产一区二区三区四| 欧美日韩精品免费| 蜜桃视频污在线观看| 成人一道本在线| 午夜剧场免费看| 国产日产欧美一区二区三区 | www国产精品| 亚洲欧洲一二三| 亚洲毛片在线| 久久无码人妻一区二区三区| 国产欧美日韩中文久久| 久久在线视频精品| 欧美日韩久久久| 青青国产在线| 久久久免费精品| 亚洲人成777| 午夜一区二区三区| 亚洲永久网站| 动漫美女无遮挡免费| 中文字幕一区二区三区精华液 | 刘亦菲国产毛片bd| 欧美午夜片在线免费观看| www.蜜臀av.com| 日韩一中文字幕| 成人在线黄色| 欧美专区一二三| 久久精品官网| 亚洲av无码一区二区三区网址 | 日韩欧美在线观看免费| 精品动漫一区二区三区在线观看| 日本韩国在线视频爽| 日本亚洲欧美成人| 中国av一区| 欧美极品欧美精品欧美| 波多野结衣在线aⅴ中文字幕不卡| 放荡的美妇在线播放| 91精品国产高清一区二区三区蜜臀| 福利片在线看| 国产精品毛片a∨一区二区三区|国| 香蕉一区二区| 六月丁香婷婷激情| 99久久久精品| 五月婷婷开心网| 亚洲激情成人网| 国产传媒在线| 久久一区二区三区av| 国产女优一区| 自拍偷拍视频亚洲| 91久久一区二区| 国产98在线| 国产精品一区二区女厕厕| 日韩精品久久| 性猛交ⅹ×××乱大交| 国产精品毛片大码女人| 一级淫片免费看| 久久久999精品免费| 国产美女亚洲精品7777| 日韩精品手机在线观看| 国产成人一区二区精品非洲| 久久综合色综合| 亚洲国产成人91精品| 欧美freesex黑人又粗又大| 玛丽玛丽电影原版免费观看1977| 国产精品一区毛片| 调教驯服丰满美艳麻麻在线视频| 在线观看91视频| 国产最新在线| 电影午夜精品一区二区三区| 99精品免费| 在线观看免费小视频| 制服丝袜av成人在线看| 欧美草逼视频| 蜜桃av久久久亚洲精品| 蜜臀久久99精品久久久画质超高清| 精品无码一区二区三区蜜臀| 欧美大片拔萝卜| 高清av不卡| 91免费视频黄| jiyouzz国产精品久久| www.久久久久久久| 久久精品视频导航| 狠狠一区二区三区| 久久久久免费精品| 亚洲男人的天堂在线观看| 日韩一级免费毛片| 国产精品免费视频久久久| 欧美日韩国产一区精品一区| 青青草福利视频| 91精品免费在线观看| 亚洲妇女成熟| 中文字幕久久一区| 不卡一区在线观看| 亚洲视频一区二区三区四区| 久久免费福利视频| 成人情趣视频| 久久久午夜精品福利内容| 欧美日韩免费视频| 黄色激情在线播放| 一本一本久久a久久精品综合妖精| 成人一区二区视频| 亚洲专区第一页| 欧美重口另类videos人妖| 亚洲精品小说| 国产sm调教视频|