精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓AI學著“看菜下碟”!港中大等新框架讓推理長度減少90%,準確率反增17%

人工智能 新聞
近日,香港中文大學聯合新加坡國立大學Show Lab的研究者提出了一種名為TON(Think Or Not)的新穎選擇性推理框架,讓視覺語言模型(VLM)可以自主判斷是否需要顯式推理。

人類在面對簡單提問時常常不假思索直接回答,只有遇到復雜難題才會認真推理。

如果AI模型也能像人一樣決定“要不要思考”,效率是否會大大提升?

近日,香港中文大學聯合新加坡國立大學Show Lab的研究者提出了一種名為TON(Think Or Not)的新穎選擇性推理框架,讓視覺語言模型(VLM)可以自主判斷是否需要顯式推理。

實驗表明,在不犧牲準確率的前提下,該方法顯著減少了生成的思考鏈長度,使模型推理過程更高效。

圖片

△圖1:“要不要思考”的示意

左側示例問題簡單,無需完整推理即可直接得出答案;而傳統方法如GRPO仍然生成了冗長的推理過程。右側示例問題復雜,需要逐步推理才能得到正確答案。

TON框架令模型能夠像人類一樣,對簡單問題直接作答(跳過冗余思考),對困難問題則給出詳盡的推理過程。

核心創新:引入“是否思考”的決策

TON框架的靈感源自人類決策過程:并非逢問必細想,而是視問題難易選擇思考或不思考

現有強化學習方法(如GRPO,Group Relative Policy Optimization)強調讓模型在回答前生成完整的推理鏈。這種“一刀切”的做法雖然提高了復雜任務的推理能力,但也導致對簡單任務的計算浪費——模型無論易題難題都冗長“自言自語”一番。

相比之下,TON的創新之處在于讓模型首先判斷“要不要思考”。這一選擇性推理策略意味著模型將推理與否視作一項獨立技能來學習,而非默認總是執行推理。

正如作者所言,他們關注的是“When to think”而非傳統方法研究的“How to think”。

圖片

△圖2: GRPO與TON的采樣過程對比示意圖

其中,q_1表示問題,{o_1, …, o_5}為生成的響應集合,每個響應包含思維過程T(圓形)和答案S(三角形)。TON方法能夠從空思維T_{\n\n}中進行采樣,從而GRPO顯著提升了響應多樣性。

為實現這一目標,研究者設計了兩階段訓練機制使模型掌握選擇性推理的本領。

第一階段是有監督微調(SFT)引入的“思想丟棄(Thought Dropout)”。具體來說,他們將模型訓練數據中原本的<think>推理過程</think>隨機替換為空內容<think>\\n\\n</think>

換言之,模型有約一半概率看到示例是不包含中間思考步驟的。這一步相當于教會模型輸出一種“不思考”的格式,讓模型知道直接回答也是允許的。

值得一提的是,研究者還用了一個“反向思考”策略來自行構造高質量的思考過程數據,以輔助模型學習何時可以跳過推理。

第二階段是強化學習的GRPO優化訓練。在這一階段,模型被鼓勵自主探索何時應該思考、何時跳過,以最大化任務獎勵。

具體做法是:模型針對同一輸入圖像和問題生成多個候選響應,其中有的包含完整思考鏈,有的為空想(即無思考過程直接回答)。

接著通過比較這些候選的結果正確性和格式,給予獎勵并用GRPO算法更新策略,引導模型學會在確保正確率的前提下盡量跳過不必要的推理。

經過這兩階段訓練,VLM模型便掌握了“一題一策”的選擇性思考能力:簡單題跳過推理,復雜題老老實實推理。

實驗結果:思考效率大幅提升,準確率不降反升

作者在多個具有不同推理難度的視覺-語言任務上驗證了TON的效果,包括CLEVR(簡單圖形推理)、GeoQA(數學幾何問答)以及AITZ(Mobile智能體導航任務)等。

在這些基準上,TON框架展現出驚人的效率提升——平均推理輸出長度最多減少了90%

例如,在CLEVR數據集上,TON將模型每次回答所需的生成文本長度減少了近九成,而在GeoQA上也減少了約65%。

值得注意的是,模型準確率不僅沒有下降,反而在某些任務上有所提高

以問答GeoQA為例,TON模型相比始終思考的GRPO基線,準確率提升了最高17個百分點

這意味著,讓模型學會“偷懶”跳過無用思考不僅節省計算,還可能帶來性能的“免費午餐”。

圖片

△圖3:TON和vanilla GRPO在CLEVR和GeoQA上的結果對比

TON平均推理長度最多減少了90%,并且準確率不降反升。

另外,研究人員對比了TON在AITZ的分布外數據集上面的效果,效果可以和vannila grpo保持一致,但是輸出長度從3k減少到了900,更加高效。

圖片

△圖4: TON在AITZ的不同domain測試集上面的表現。

由圖4可以看出效果保持一致,但是task level的長度從3k減少到了900。

研究人員進一步測試了訓練過程的更多指標,發現訓練過程中,TON輸出空內容<think>\\n\\n</think>的比例隨著reward的上升而增加,進而進一步降低了模型輸出的平均長度,但是輸出的有內容的思考過程的長度仍然維持不變。

圖片

△圖5: TON和vanilla GRPO在訓練過程中的reward可視化圖

圖片

△圖6: TON和vanilla GRPO在訓練過程中的輸出空思考的比例可視化圖

另外發現,簡單的任務更容易跳過思考(比如CLEVR),但是難的任務反而不容易跳過(比如GeoQA),展現出模型在強化學習的過程中,自適應的針對問題的難易程度,學習何時該思考合適不思考。

在不降低準確率的情況下減少將近九成的推理步驟,這對大型模型的實際部署帶來了切實的益處。

一方面,推理效率的提升意味著更快的響應速度和更低的算力消耗。這對于需要實時互動的多模態助手、機器人等應用尤為重要。

另一方面,TON 展現的“按需思考”模式讓AI更接近人類的思維習慣——該思考時就認真思考,該果斷時則不拖泥帶水。這種人性化的推理策略有望提升模型在推理任務上的通用性和可靠性。

總的來說,TON提出了一個值得關注的方向:并非一味追求更長的思維鏈,而是先問問自己“要不要思考?”。

未來,這類機制可能成為提升大模型實用性的一個重要途徑。

以下是兩個代表性的TON系列模型,它們在不同任務上展示了這一機制的實際應用效果。

例子1

圖片

△圖7: GRPO與TON在GUI agent AITZ上的對比

TON在多步移動導航過程中自適應跳過不必要的思考步驟,在保持任務準確性的同時實現了比GRPO更高的解碼效率(本例中節省了60%的token消耗)。

例子2

圖片

△圖8: CLEVR中思考模式與非思考模式的對比圖示

TON展示了選擇性激活推理的能力——僅在需要時啟動思考機制,而GRPO則不加區分地為所有情況生成推理軌跡。

論文地址:https://arxiv.org/abs/2505.16854代碼地址:https://github.com/kokolerk/TON

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-21 12:12:09

2024-01-16 14:00:00

2025-04-18 08:42:52

模型推理AI

2025-09-03 09:05:00

AI模型框架

2025-10-23 12:46:39

2023-12-12 13:51:00

AI訓練

2023-12-13 14:17:10

微軟變色龍框架

2024-01-05 08:44:52

2025-10-08 10:44:16

2019-07-21 22:22:37

圖像識別AI機器視覺

2023-05-14 17:21:04

2025-04-03 11:16:10

2025-05-26 08:33:00

2023-10-26 08:40:15

模型隱私推理

2022-01-10 23:57:36

人工智能語音識別技術

2023-06-28 13:49:12

AI人工智能

2018-11-14 10:01:30

谷歌開源機器學習

2023-10-14 17:24:49

2023-10-14 13:09:53

谷歌模型

2025-05-21 13:56:37

模型圖像AI
點贊
收藏

51CTO技術棧公眾號

国产91精品一区二区绿帽| 中文字幕国产精品| 国产极品粉嫩福利姬萌白酱| 欧美一区二区三区少妇| 麻豆精品视频在线观看免费| 久久99青青精品免费观看| 性欧美丰满熟妇xxxx性久久久| 久久精品女人天堂av免费观看 | 91短视频版在线观看www免费| 久久成人麻豆午夜电影| 国内伊人久久久久久网站视频| 日韩精品无码一区二区三区久久久| 999精品视频在线观看| 欧美日韩亚洲视频| 日本三日本三级少妇三级66| 欧美成人免费| 国产宾馆实践打屁股91| 国产精品人成电影| www欧美在线| 欧美大人香蕉在线| 精品亚洲精品福利线在观看| 性高潮久久久久久| 亚洲爱爱视频| 欧美特级www| www.男人天堂网| 秋霞午夜在线观看| 久久亚洲欧美国产精品乐播| 国产精品亚洲一区| 国产乱码一区二区| 免费一级欧美片在线观看| 91精品国产91久久久久久不卡| 午夜精品一区二区三区视频| 欧美丝袜一区| 亚洲天堂成人在线| 国产肉体xxxx裸体784大胆| 精品国模一区二区三区欧美| 欧美日韩高清在线| 黑鬼大战白妞高潮喷白浆| gogo高清在线播放免费| 一区二区三区加勒比av| 国产手机视频在线观看| 日本韩国在线视频爽| 久久精品一区蜜桃臀影院| 精品乱子伦一区二区三区| 亚洲黄色小说网| 国产精品996| 91免费的视频在线播放| 91禁在线观看| 精品制服美女丁香| 国产精品自拍偷拍| 伊人网免费视频| 免费精品视频最新在线| 国产97色在线|日韩| 久久精品视频5| 每日更新成人在线视频| 国产v综合ⅴ日韩v欧美大片| 日韩免费av网站| 视频一区国产视频| 国产精品亚洲精品| 中文字幕 亚洲视频| 久久99国产精品久久99| 亚洲伊人久久综合| 韩国av免费在线观看| www.av精品| 久久久婷婷一区二区三区不卡| 亚州男人的天堂| 国产亚洲一区字幕| 亚洲精品日韩精品| 黄网页免费在线观看| 亚洲欧美日韩中文字幕一区二区三区| 神马午夜伦理影院| 91超碰在线免费| 欧美视频在线看| 性生交免费视频| 99久久999| 亚洲第一精品电影| 免费污网站在线观看| 成人同人动漫免费观看| 美女黄色丝袜一区| 日韩黄色三级视频| 日韩av午夜在线观看| 91精品视频免费观看| 可以免费看毛片的网站| 久久久久久影视| 婷婷视频在线播放| 国产资源在线观看入口av| 91极品美女在线| 免费不卡av网站| 亚洲国产精品嫩草影院久久av| 中文字幕国产日韩| 久久久美女视频| 日本中文在线一区| 国产精品theporn88| 精品三级久久久久久久电影聊斋| 亚洲欧美激情小说另类| 日韩在线一级片| 99久久999| 亚洲乱码国产乱码精品精| 国产精品精品软件男同| 国产精品毛片| 亚洲伊人第一页| 国产在线黄色| 亚洲国产精品尤物yw在线观看| 538在线视频观看| 成午夜精品一区二区三区软件| 亚洲性无码av在线| 精品少妇久久久久久888优播| 日韩精品亚洲一区二区三区免费| 99在线热播| 天堂а√在线资源在线| 日韩欧美亚洲一二三区| 少妇精品无码一区二区| 日韩综合一区| 国产经典一区二区| 天堂在线观看视频| 国产精品久久久久婷婷| 精品少妇一区二区三区在线| 午夜日韩影院| 精品国产区一区二区三区在线观看| 97久久久久久久| 成人国产一区二区三区精品| ijzzijzzij亚洲大全| 成人日韩在线| 亚洲免费伊人电影在线观看av| 久久午夜鲁丝片午夜精品| 黄色小说综合网站| 少妇特黄a一区二区三区| 日韩激情电影| 亚洲黄色av女优在线观看| 青娱乐91视频| 国产精选一区二区三区| 在线观看成人一级片| 日韩中文在线播放| 亚洲网址你懂得| 国产免费一区二区三区四区五区| 99视频在线观看一区三区| 国产色一区二区三区| 亚洲精品a区| 麻豆成人在线看| 国产乱码精品一区二区| 亚洲婷婷国产精品电影人久久| 中日韩av在线播放| 日韩电影免费网址| 国产欧美精品一区二区| 2021av在线| 欧美日韩不卡一区| 三级av在线免费观看| 韩国一区二区视频| 天天操天天干天天玩| 视频欧美一区| 欧美精品video| 天天干天天插天天操| 天天色天天操综合| 野花社区视频在线观看| 久久狠狠一本精品综合网| 欧美黄色直播| 成人深夜福利| 久久久精品影院| 国产熟女一区二区丰满| 一区二区在线免费| 国产在线不卡av| 国产麻豆综合| 亚洲国产综合自拍| 国产精品中文| 久久久欧美一区二区| 欧美孕妇性xxxⅹ精品hd| 91久久精品日日躁夜夜躁欧美| 欧美成人短视频| 国产乱码精品一区二区三区忘忧草 | 国产一区私人高清影院| 黄在线免费看| 亚洲成人激情在线| chinese国产精品| 国产精品色婷婷| gogo亚洲国模私拍人体| 欧美午夜免费影院| 欧美激情www| 亚洲精品伊人| 98精品在线视频| 在线a免费看| 欧美va亚洲va在线观看蝴蝶网| 亚洲 欧美 日韩 综合| 中文字幕一区三区| 日本不卡视频一区| 日本视频免费一区| 亚洲精品婷婷| 久久er99热精品一区二区三区| 日本综合视频| 欧美激情xxxx性bbbb| 欧美日韩在线精品一区二区三区激情综 | 国产精品美女午夜爽爽| 欧美成人合集magnet| 视频二区在线| 欧美一卡二卡在线| 无码人妻精品一区二区三区9厂| 中文字幕永久在线不卡| 精品黑人一区二区三区观看时间| 日本女优在线视频一区二区| 女人被男人躁得好爽免费视频| 国产成人精品一区二区免费看京| 92裸体在线视频网站| 亚洲永久av| 欧美日韩爱爱视频| 草草影院在线观看| 亚洲国产精品一区二区三区| 96日本xxxxxⅹxxx17| 欧美日韩亚洲视频| 欧美成欧美va| 国产精品网曝门| www.色多多| 高清不卡在线观看av| 日本xxxx黄色| 久热综合在线亚洲精品| 日韩a∨精品日韩在线观看| 亚洲经典一区| 性欧美精品一区二区三区在线播放| 激情av综合| 1卡2卡3卡精品视频| 国产综合色激情| 日韩免费av片在线观看| 精品众筹模特私拍视频| 色综合视频一区中文字幕| 免费av毛片在线看| 免费毛片在线看片免费丝瓜视频 | 亚洲国产欧美日韩另类综合 | 午夜精品久久一牛影视| 欧美另类videoxo高潮| 欧美国产亚洲另类动漫| mm131美女视频| 99久久综合狠狠综合久久| 精人妻一区二区三区| 国产一区二区不卡| 亚洲精品mv在线观看| 麻豆久久一区二区| 亚洲免费一级视频| 青青草一区二区三区| 污污视频网站免费观看| 丝袜亚洲另类丝袜在线| 国产91在线视频观看| 亚洲一区久久| 日韩免费毛片视频| 亚洲综合日本| 无码无遮挡又大又爽又黄的视频| 噜噜噜久久亚洲精品国产品小说| 欧洲黄色一级视频| 午夜影院日韩| 免费在线观看的毛片| 久久这里只有| 国产日韩欧美久久| 激情欧美日韩一区二区| 日韩高清在线一区二区| 国产一区999| 日本少妇xxx| 成人免费视频一区| 97香蕉碰碰人妻国产欧美| av在线播放一区二区三区| 国产三级国产精品| 国产亚洲欧美在线| 在线观看天堂av| 亚洲精选一二三| 日韩伦理在线视频| 色综合色狠狠天天综合色| 亚洲视屏在线观看| 欧美一区二区三区四区在线观看| 国产区精品在线| 精品成人在线观看| 欧美视频综合| 日韩视频免费在线| 人交獸av完整版在线观看| 91高清视频在线免费观看| 日韩免费va| 亚洲r级在线观看| 巨人精品**| 一区二区三区四区视频在线观看 | 91精品国产成人| 97久久香蕉国产线看观看| 成人h视频在线观看播放| 2021年精品国产福利在线| 蜜桃传媒视频第一区入口在线看| 成人一区而且| 久久久久久久久久久综合| 久久久久久夜| 精品人妻人人做人人爽夜夜爽| 久久这里都是精品| 日本黄色免费片| 午夜视频在线观看一区| 中文字幕视频在线播放| 精品99一区二区| 91在线免费看| 97在线视频观看| 成人豆花视频| 欧美美乳视频网站在线观看| 亚洲欧洲中文字幕| 凹凸日日摸日日碰夜夜爽1| 国产精品99久久久| 在线观看日本中文字幕| 亚洲午夜免费视频| 成人免费一区二区三区| 亚洲精品成a人在线观看| 麻豆免费在线观看| 国产mv久久久| 好吊妞国产欧美日韩免费观看网站| 杨幂一区欧美专区| 午夜在线一区二区| 欧美午夜一区二区三区免费大片| 欧美成人一区二区视频| 亚洲精品久久久久久久久久久久久 | 国产高清无密码一区二区三区| 中文字幕高清视频| 亚洲一区二区在线观看视频| 在线观看色网站| 亚洲欧美日韩一区二区在线| 丰满诱人av在线播放| 国产日韩一区在线| 欧美日韩123| 欧美色图色综合| 高清成人免费视频| 中文字幕亚洲欧美日韩| 欧美视频在线一区| 欧美拍拍视频| 亚州精品天堂中文字幕| 韩漫成人漫画| 精品国产一区二区三区日日嗨| 欧美久久久久| 美女被艹视频网站| 综合久久久久久久| 又污又黄的网站| 永久555www成人免费| 最新中文字幕在线播放| 国内不卡一区二区三区| 最新成人av网站| 亚洲精品第二页| 午夜在线成人av| 黄色三级网站在线观看| 欧美激情一区二区三区在线视频观看 | 欧美一级片免费观看| 性欧美videos另类喷潮| 国产中文字幕一区二区| 精品免费在线视频| 婷婷色在线视频| 91精品国产免费久久久久久| 真实国产乱子伦对白在线| 国产精品伦一区| 怡红院成永久免费人全部视频| 亚洲亚裔videos黑人hd| 女生影院久久| 亚洲精蜜桃久在线| 久久爱www久久做| 久草手机视频在线观看| 欧美电影一区二区三区| 成人在线观看亚洲| 亚洲中国色老太| 黄色亚洲在线| 中文字幕第3页| 欧美日韩亚洲视频一区| 国产小视频免费在线网址| 国产精品xxx视频| 亚欧美无遮挡hd高清在线视频 | 成人一区二区视频| 日本学生初尝黑人巨免费视频| 亚洲激情免费观看| 韩国久久久久久| 亚洲视频sss| 国产乱子轮精品视频| 国产精彩视频在线观看| 精品视频一区在线视频| 成人免费av电影| 亚洲日本无吗高清不卡| 国产麻豆精品95视频| 国产精品白浆一区二小说| 亚洲精品一区二区在线| а√天堂资源国产精品| 日韩视频在线免费播放| 成人综合在线视频| 久久久久99精品成人片我成大片| 亚洲人午夜精品免费| 国产精品美女久久久久人| 在线观看免费成人| 欧美扣逼视频| 91免费高清视频| 91久久久久| 麻豆网址在线观看| 亚洲福利在线看| 成人在线视频免费| 久久综合久久久久| 国产欧美精品一区二区色综合| 国产夫妻性生活视频| 日韩av免费在线| 亚洲女同一区| 色哟哟精品观看| 欧美sm极限捆绑bd| 日本综合视频| 3d动漫一区二区三区| 国产精品久久久久久久岛一牛影视 | 久久成人麻豆午夜电影| 日韩精品乱码久久久久久| 日韩天堂在线视频| 久久99蜜桃| 中文字幕天堂av| 欧美丰满少妇xxxbbb|