精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超越O4-mini,多模態大模型終于學會回頭「看」:中科院自動化所提出GThinker模型

人工智能 新聞
來自中科院自動化研究所紫東太初大模型研究中心的研究者提出 GThinker,一個旨在實現通用多模態推理的新型多模態大模型。

盡管多模態大模型在數學、科學等結構化任務中取得了長足進步,但在需要靈活解讀視覺信息的通用場景下,其性能提升瓶頸依然顯著。現有模型普遍依賴基于知識的思維模式,卻缺乏對視覺線索的深度校驗與再思考能力,導致在復雜場景下頻繁出錯。

為解決這一難題,來自中科院自動化研究所紫東太初大模型研究中心的研究者提出 GThinker,一個旨在實現通用多模態推理的新型多模態大模型。

GThinker 的核心在于其創新的「線索引導式反思(Cue-Guided Rethinking)」模式,它賦予了模型在推理過程中主動校驗、修正視覺理解的能力。

通過精心設計的兩階段訓練流程,GThinker 在極具挑戰性的 M3CoT 綜合推理基準上取得了超越了最新的 O4-mini 模型,并在多個數學及知識推理榜單上展現出 SOTA 性能,證明了該方法的有效性和泛化能力。目前,論文、數據及模型均已開源。

圖片

  • 論文鏈接:https://arxiv.org/abs/2506.01078
  • 項目地址:https://github.com/jefferyZhan/GThinker
  • 開源倉庫:https://huggingface.co/collections/JefferyZhan/gthinker-683e920eff706ead8fde3fc0

慢思考的瓶頸:當模型在通用場景「視而不見」

當前,無論是開源的 Qwen2.5-VL,還是閉源的 GPT-4o,多模態大模型的能力邊界正在被不斷拓寬。尤其在引入了思維鏈(CoT)等慢思考策略后,模型在數學、科學等邏輯密集型任務上的表現得到了顯著增強。

然而,這些進步并未完全轉化為在通用多模態場景下的推理能力。與擁有明確答案和嚴格邏輯結構的數理任務不同,通用場景(如理解一幅畫的寓意、分析復雜的日常情景)往往涉及:

  • 高度的視覺依賴:答案強依賴于對圖像中多個、甚至有歧義的視覺線索的正確解讀。
  • 復雜的推理路徑:沒有固定的解題范式,需要模型根據具體問題靈活組織推理步驟。

現有方法,無論是基于結構化 CoT 的,還是基于結果獎勵強化學習的,都存在明顯的局限性。它們在推理中一旦對某個視覺線索產生誤判,往往會「一條道走到黑」,缺乏中途 「回頭看」、修正認知偏差的機制。

圖片

現有主流多模態推理方法的特點與局限性

GThinker:從 「思維鏈」 到 「再思考鏈」

為了打破這一瓶頸,研究團隊提出了 GThinker,其核心是一種全新的推理模式 ——「線索引導式反思」(Cue-Guided Rethinking)。該模式將推理過程升級為一種更接近人類思維的 「思考 - 反思 - 修正」 閉環,它不強制規定僵化的推理結構,而是要求模型在自由推理后,對關鍵視覺線索進行一次系統性的回溯驗證。

圖片

Cue-Rethinking核心流程,虛線框代表可能進行

整個過程分為三個階段:

1. 自由初始推理:模型根據問題和圖像內容,自由地進行一步步推理,同時使用 <vcues_*> 標簽標記出其所依賴的關鍵視覺線索。

2. 反思觸發:在初步推理鏈完成后,一個反思提示(如 「Let's verify each visual cue and its reasoning before finalizing the answer.」)被觸發,引導模型進入基于再思考階段。

3. 基于視覺線索的反思:模型逐一回顧所有標記的視覺線索,檢查其解釋是否存在不一致、錯誤或遺漏。一旦發現問題,模型會修正或補充對該線索的理解,并基于新的理解重新進行推理,最終得出結論。

圖片

GThinker推理模式示例

以上圖為例,GThinker 在初步推理中可能將圖形誤判為 「螃蟹」。但在再思考階段,它會發現 「紅色三角形更像蝦頭而非蟹身」、「藍粉組合更像蝦尾而非蟹鉗」,從而修正整個推理路徑,最終得出正確答案 「蝦」。這種機制使得 GThinker 能夠有效處理有歧義或誤導性的視覺信息,極大地提升了推理的準確性。

兩階段訓練法:如何教會模型進行再思考?

為了讓模型內化這種強大的反思能力,GThinker 設計了一套環環相扣的兩階段訓練框架。

圖片

GThinker 整體訓練流程示例圖

模式引導冷啟動

不同于數理領域在預訓練后自然涌現的反思能力,單純依靠來結果獎勵強化學習 「探索」 出如此復雜的再思考行為,不僅成本高昂且效率低下。因此,GThinker 首先通過監督微調的方式,為模型 「冷啟動」 構建基于視覺線索的再思考能力。

為此,首先通過「多模態迭代式標注」構建了一個包含 7K 高質量冷啟動樣本數據集:利用 GPT-4o、O1、O3 等多個先進模型的互補優勢,對覆蓋通用、數學、科學三大領域的復雜問題進行迭代式地推理和標注,生成了包含高質量再思考路徑的訓練數據。

在訓練時,GThinker 采用「模式引導選擇性格式化」策略,僅對那些基座模型會產生視覺誤判的樣本應用完整的 「反思鏈」 格式,其余則保留為標準推理格式。這使得模型能夠學會在 「需要時」才進行反思,而非機械地執行。

激勵強化學習

在掌握 「如何思考」 以及基于視覺線索進行 「再思考」 的能力基礎上,GThinker 進一步引入基于可驗證獎勵的強化學習方法,設計混合獎勵機制并構建覆蓋多種推理類型的多場景訓練數據,以持續激勵模型在多樣化任務中進行主動探索,從而實現思維模式的跨場景泛化遷移。

  • 多場景數據構建:廣泛收集開源推理數據,并通過 embedding 聚類的方式進行均衡和多樣性采樣,從中精選包含約 4K 條多場景、多任務的強化學習訓練數據集,為泛化能力的提升提供數據保障。
  • DAPO 訓練:相較于 GRPO,DAPO 采用動態采樣的方式,保證 batch 樣本的有效性,并應用無 KL 和 clip higher 等策略,更適用于長鏈思考和探索,使模型學會在不同場景下選擇最優推理方式。

圖片

  • 混合獎勵計算:針對選擇題、數學題等常見任務類型,分別采用精確匹配、Math-Verify 工具校驗的方式計算獎勵,對于通用場景下常見的開放式簡答題,通過加入格式化響應讓模型回答歸納到短語或單詞的形式,以應用精確匹配的計算方式,從而確保了獎勵信號的準確性和進一步拓展支持任務的多樣性。

結果

在復雜、多步及多領域的多模態推理基準 M3CoT 上,GThinker 在多個場景的測試中超過當前先進的開源多模態推理模型及 O4-mini。

圖片

在通用場景(MMStar、RealWorldQA)、多學科場景(MMMU-Pro)及數學基準測試中,GThinker 實現了優于或不遜于現有先進模型的表現,證明了 GThinker 所學的再思考能力并未造成 「偏科」,而是實現了整體通用能力提升。

圖片

盡管 GThinker 的數據均為復雜推理任務構建,但經過這一方法及數據的訓練后,當前最領先的開源模型依然能夠在通用指標上進一步提升。研究團隊選取了 OpenCompass 閉源多模態榜單中 10B 規模下最新排名前三的開源模型,在學術榜單上進行測試。結果顯示,GThinker 在這三款模型上均帶來約 1 個百分點左右的平均性能提升,進一步印證了其方法的有效性與泛化能力。

圖片

Demo

圖片

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-11 09:20:13

2025-02-08 13:30:00

2023-04-18 10:12:06

模型解碼

2024-06-05 09:22:43

2025-07-02 08:43:00

數據訓練模型

2023-05-15 12:14:02

ChatGPT語音模型

2025-03-11 13:49:20

2025-04-23 08:30:05

2022-11-22 10:07:32

研究模型

2025-11-20 12:51:07

2025-02-26 13:00:00

2025-05-09 08:40:00

2021-12-20 10:03:01

自動化人工智能 人臉識別

2023-05-30 10:23:45

模型研究

2023-12-04 13:23:00

數據訓練

2025-01-08 08:21:16

2024-12-31 09:10:00

2025-09-22 09:25:08

2022-06-20 15:00:04

神經網絡CV模型
點贊
收藏

51CTO技術棧公眾號

麻豆乱码国产一区二区三区| 欧美性淫爽ww久久久久无| 97久久天天综合色天天综合色hd| a级黄色片免费看| 欧美日韩一本| 欧美视频在线不卡| 日韩黄色片在线| 国产香蕉在线| 成人永久免费视频| 国产97在线亚洲| 妺妺窝人体色www聚色窝仙踪| 天堂资源在线亚洲| 6080午夜不卡| 午夜精品久久久内射近拍高清 | 国产一区二区精品在线观看| 久久久久久久久久久免费精品| 免费在线观看你懂的| 台湾佬中文娱乐久久久| 一区二区三区国产| 亚洲欧洲久久| 日韩电影免费| 成人午夜免费视频| 国产在线播放91| 欧美日韩乱国产| 欧美大片一区| 日韩中文字幕网| 中日韩精品一区二区三区| 国产精品国产亚洲精品| 在线中文字幕不卡| 黄色片网址在线观看| 国产cdts系列另类在线观看| 日本一区二区三区免费乱视频| 国产精品久久久久久免费观看| 91成年人视频| 日韩高清中文字幕一区| 97成人在线视频| 久久久无码精品亚洲国产| 日韩在线不卡| 在线观看亚洲区| 国产熟妇搡bbbb搡bbbb| 成人资源在线| 美女诱惑一区二区| 亚洲国产精品va| 亚洲在线观看网站| 国产激情欧美| 欧美在线你懂的| 成人在线激情网| 亚洲综合电影| 欧美午夜美女看片| 国产 福利 在线| 欧美日韩在线观看首页| 亚洲sss视频在线视频| 黄色一级片黄色| 亚洲羞羞网站| 亚洲一区二区三区中文字幕在线| 天堂v在线视频| 国产一二三区在线观看| 中文字幕制服丝袜成人av | 欧美做受高潮电影o| 日本一级一片免费视频| 国模吧视频一区| 国内精久久久久久久久久人| 中文字幕第28页| 亚洲精品乱码久久久久久蜜桃麻豆| 欧美寡妇偷汉性猛交| 久久久www成人免费毛片| 中文字幕午夜精品一区二区三区| 久久亚洲欧美日韩精品专区| 中文字幕亚洲欧美日韩| 欧美日韩天堂| 97视频在线观看成人| 成人免费视频毛片| 久久久久国产精品一区二区 | www.日本在线视频| 黑人玩欧美人三根一起进| 图片区日韩欧美亚洲| 日韩欧美精品在线观看视频| 日韩一级二级| 欧美精品丝袜中出| 丰满人妻一区二区三区大胸| 国内精品国产成人国产三级粉色| 国产视频精品自拍| 久久久精品成人| 在线电影一区二区| 高清欧美性猛交xxxx黑人猛交| 日韩成人在线免费视频| 日本欧美大码aⅴ在线播放| 国产日韩欧美一二三区| 亚洲av少妇一区二区在线观看| 成人免费视频网站在线观看| 欧美日韩亚洲在线| 黄色网页在线看| 亚洲大片在线观看| 女性隐私黄www网站视频| 99re久久| 亚洲第一天堂av| 国产激情av在线| 亚洲国内精品| 国产日韩在线视频| 五月婷婷在线播放| 国产精品久久综合| 午夜免费福利小电影| 婷婷丁香久久| 亚洲开心激情网| 精品无码一区二区三区蜜臀| 99精品热视频只有精品10| 国产精品无码专区在线观看 | 伊人男人综合视频网| 极品久久久久久| 免费在线成人| 99免费在线观看视频| 国产视频网站在线| 亚洲狠狠爱一区二区三区| 美女一区二区三区视频| 97人人澡人人爽91综合色| 色诱女教师一区二区三区| 日韩美女一级片| 国内精品在线播放| 日本免费高清一区| 爱搞国产精品| 日韩欧美成人一区| 国产一区第一页| 久久视频一区| 久久大香伊蕉在人线观看热2| 国产成人在线视频免费观看| 在线观看国产日韩| 亚洲av无码一区二区三区观看 | 漂亮人妻被中出中文字幕| 亚洲一区中文字幕永久在线| 国产精品一二三四五| 四虎影视永久免费在线观看一区二区三区 | 亚洲国产综合久久| 精品一区免费av| 亚洲视频在线二区| 欧美日韩精品一区二区三区视频| 日韩av中文字幕在线| 精品少妇一二三区| 国产精品自拍av| 99精品视频网站| 久久不卡日韩美女| 中文字幕亚洲无线码a| 在线永久看片免费的视频| av网站免费线看精品| 亚洲精品国产suv一区88| 成人影院网站ww555久久精品| 一区二区av在线| 欧美超碰在线观看| 国产日韩成人精品| 自拍偷拍 国产| 不卡一区综合视频| 国产精品小说在线| 第一页在线观看| 欧日韩精品视频| 色噜噜噜噜噜噜| 久久国产人妖系列| 一区二区三区四区五区视频| 欧洲亚洲精品| 久久99热精品这里久久精品| 成人午夜视频一区二区播放| 亚洲一区二区三区免费视频| 国模私拍在线观看| 国产亚洲精品自拍| 日本一区二区三区视频在线播放 | 在线视频国产一区| 老头老太做爰xxx视频| 蜜臀av一区二区在线免费观看| 亚洲图片小说在线| 国产精品免费精品自在线观看| 欧美精品在线免费| 亚洲人视频在线观看| 欧美丝袜美女中出在线| 亚洲欧美va天堂人熟伦| 久久国产精品无码网站| 强开小嫩苞一区二区三区网站| 亚洲欧美日本国产| 91wwwcom在线观看| 国产日本在线观看| 4438x成人网最大色成网站| 免看一级a毛片一片成人不卡| 成人app下载| 无需播放器的av| 中文字幕av亚洲精品一部二部| 成人永久免费| 二吊插入一穴一区二区| 日韩在线观看免费高清| 国产刺激高潮av| 色偷偷成人一区二区三区91| 亚洲一二三四五六区| 成人av在线影院| 日韩精品你懂的| 综合视频在线| 欧美久久久久久久| 精品一区二区三区视频在线播放 | 超薄肉色丝袜足j调教99| 精品网站aaa| 91精品久久久久久久久中文字幕| 国产一线二线在线观看| 一区二区在线免费视频| 亚洲av无码国产精品永久一区 | 视频一区中文| 91青青草免费在线看| 精品国产免费人成网站| 免费不卡在线观看av| 蜜桃视频在线观看网站| 欧美一区二区三区在线看 | 欧美一区二区性放荡片| av一级在线观看| 亚洲一二三区视频在线观看| 欧美性受xxxx黑人| 99国产精品久久| 精品人妻一区二区三| 首页国产欧美久久| 免费av手机在线观看| 91精品国产91久久久久久黑人| 蜜桃av噜噜一区二区三| 亚洲精品在线播放| 成人国产精品久久久| 日韩在线影院| 91精品国产自产91精品| 丝袜美女在线观看| www.色综合| 国产毛片在线看| 日韩av一区在线观看| va婷婷在线免费观看| 欧美日韩一区二区在线观看| 狠狠人妻久久久久久| 亚洲国产精品久久人人爱 | 欧美婷婷在线| 只有这里有精品| 欧美aaaa视频| 神马影院午夜我不卡影院| 欧美三级自拍| 国外成人在线视频网站| 凹凸av导航大全精品| 97碰碰视频| 日韩免费成人| 99国产在线视频| 136导航精品福利| 97人人模人人爽人人喊38tv| 豆花视频一区| 91天堂在线视频| 国产视频一区二| 91嫩草在线视频| 99热这里有精品| 91牛牛免费视频| 亚洲一二av| 国产精品区一区| 国产日韩三级| 国产综合动作在线观看| 欧美黑人巨大videos精品| 国产青春久久久国产毛片 | 亚洲国内在线| 91一区在线| 免费观看中文字幕| 欧美日韩一区二区国产| 久久艹国产精品| 亚洲人成在线影院| 青青视频在线播放| 日韩精品一级二级| 久久国产精品国产精品| 黄一区二区三区| 久久久久久久久久久影视| 国产成人av电影| 欲求不满的岳中文字幕| 国产午夜亚洲精品不卡| 任我爽在线视频| 亚洲永久免费视频| 久久久国产高清| 91成人免费在线视频| 一区二区三区www污污污网站| 91精品国产综合久久香蕉麻豆| а√中文在线资源库| 亚洲精品国产精品国产自| 国产在线视频网站| 精品国内自产拍在线观看| 金瓶狂野欧美性猛交xxxx| 国产91精品青草社区| 国产成人精品一区二区三区免费 | 亚洲国产精品二区| 日韩精品在线免费播放| 国产露出视频在线观看| 久久国产加勒比精品无码| 天堂在线中文网官网| 国产精品久久久久久久app| 日韩高清在线观看一区二区| 久精品国产欧美| 91精品国产福利在线观看麻豆| 国产自产在线视频| 美女视频黄频大全不卡视频在线播放| 亚洲成人手机在线观看| 91香蕉视频黄| 免费国产羞羞网站美图| 福利二区91精品bt7086| 国产精品欧美综合亚洲| 日韩精品在线私人| 国产午夜精品久久久久免费视| 69精品小视频| 久久精品免视看国产成人| 欧美极品色图| 中文字幕一区二区三区欧美日韩 | 欧美韩国亚洲| 成人18视频| 四虎成人av| 白嫩少妇丰满一区二区| 国产成人免费视频网站高清观看视频| 亚洲a v网站| 亚洲成人免费影院| 91av国产精品| 国产亚洲欧美日韩美女| 国产传媒在线| 懂色一区二区三区av片| 999成人网| 另类小说第一页| 91蝌蚪porny| 久久久久久久久久久网| 欧美日韩精品综合在线| 免费国产在线观看| 91黄色8090| 国产成人一二| 欧美黄色免费网址| 韩国一区二区在线观看| 亚洲一区 欧美| 91传媒视频在线播放| 性插视频在线观看| 欧美精品激情blacked18| 高清一区二区中文字幕| 一级日韩一区在线观看| 久久久人人人| 欧美性xxxx图片| 亚洲.国产.中文慕字在线| 亚洲AV无码一区二区三区少妇| 久久久国产一区二区| 久久久免费人体| 亚洲精品9999| 另类的小说在线视频另类成人小视频在线 | 久久久久久久久久久久久女国产乱| 91看片在线播放| 亚洲第一网站免费视频| 999av小视频在线| 国产欧美亚洲日本| 影音先锋中文字幕一区| 日本道中文字幕| 天天色综合天天| 婷婷开心激情网| 欧美一级片久久久久久久| 亚洲欧洲免费| 国产一级片黄色| 欧美激情综合五月色丁香| 国产成人av免费| 久久精品成人欧美大片| 麻豆精品在线| 99在线观看视频免费| av一二三不卡影片| 国产精品视频一区在线观看| 亚洲一级片在线看| 色999久久久精品人人澡69| 裸体裸乳免费看| 成人国产电影网| 国产专区第一页| 自拍偷拍免费精品| 成人日韩视频| 丁香婷婷综合激情| 26uuu色噜噜精品一区二区| 无码人妻丰满熟妇区五十路| 日韩在线中文字幕| 久久久久亚洲精品中文字幕| 美女扒开大腿让男人桶| 久久只精品国产| 在线观看免费中文字幕| 欧美高清无遮挡| 亚洲都市激情| 九九热免费在线观看| 亚洲曰韩产成在线| 久久天堂电影| 亚洲综合精品一区二区| 亚洲国产专区校园欧美| 人与嘼交av免费| 精品嫩草影院久久| 台湾佬成人网| 久久久久久久久久久综合| 91麻豆产精品久久久久久| 怡红院男人的天堂| 久久久久久久久久国产精品| 九一成人免费视频| 欧美激情第一区| 日韩欧美亚洲一二三区| 麻豆传媒免费在线观看| 国产在线精品一区二区三区| 免费xxxx性欧美18vr| 国产一级片视频| 丝袜美腿亚洲一区二区| 国产精品超碰| 亚洲天堂网2018| 欧美日韩中文在线观看| 黄色片免费在线观看| 美国av一区二区三区| 国产精品自拍毛片| 中文字幕二区三区| 午夜精品久久久99热福利| 99精品电影|