精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源復現o3圖像思考!快手讓AI不再被動看圖,模型自主生成代碼調用工具

人工智能 新聞
Kwai Keye團隊提出Thyme (Think Beyond Images)的新范式,并圍繞它構建了一整套技術方案。

在Openai 發布o3后,think with image功能得到了業界和學術界的廣泛關注。

Kwai Keye團隊提出Thyme (Think Beyond Images)的新范式,并圍繞它構建了一整套技術方案。旨在突破現有方法的限制,賦予開源模型一種更強大、更自主、功能更全面的“超越圖像思考”的能力。

其主要貢獻可以概括為以下幾點:

提出了一個全新的多模態交互范式Thyme:

核心思想:讓多模態大模型不再局限于被動地“看圖”,而是能夠主動地通過生成并執行代碼,來調用各種工具完成復雜的圖像處理和數學計算。

功能豐富:模型可以即時進行裁剪、旋轉、縮放、對比度增強等多種圖像操作,還能處理復雜的數學問題。

高度自主:模型能自主判斷何時需要使用工具、使用何種工具,并動態生成代碼來執行,無需人工為特定任務進行干預。

設計了一套高效的兩階段訓練策略 SFT + RL:

監督微調 (SFT) 階段:利用精心構建的約 50 萬條高質量樣本數據集,快速教會模型生成代碼來執行各種操作。這個階段僅需約 200 GPU 小時,性價比極高。

強化學習 (RL) 階段:在 SFT 的基礎上,通過 RL 進一步優化模型的決策能力。為了解決 RL 階段的挑戰,研究者還:構建了高質量 RL 數據集:手動收集和標注了 1 萬張高分辨率、高難度的圖像問答對,以增強模型在復雜場景下的感知能力。

提出了創新的RL算法GRPO-ATS:該算法能為文本生成代碼生成設置不同的采樣溫度(temperature)。具體來說,為文本使用較高的溫度以鼓勵探索和創造性,為代碼使用極低的溫度(0.0)以確保生成代碼的精確性和可執行性,巧妙地平衡了推理的靈活性和代碼的穩定性。

構建并開源了完整的配套資源:

高質量數據集:開源了用于 SFT 和 RL 階段的全部數據集,包括超過 400 萬的原始數據源和精心篩選標注的數據。

安全的沙箱環境:開發了一個可以安全執行模型生成的代碼并返回結果的沙箱。這個沙箱還簡化了代碼生成的難度,能自動處理格式、變量定義等問題,提高了代碼的可用性。

完整的代碼庫:將所有訓練代碼、模型和工具鏈全部開源,旨在推動整個社區在該方向上的發展和應用。

總言,Thyme 通過賦予模型“代碼生成與執行”的能力,極大地擴展了多模態模型的工具使用范圍和自主決策水平,并在近 20 個基準測試中取得了顯著且穩定的性能提升,尤其在處理高分辨率圖像和復雜推理任務上表現出色。

Thyme推理樣本展示

裁剪+放大

Thyme首先評估了標志的大小和距離,判斷出裁剪并放大對應區域可以提高可見性。接著,它編寫代碼來裁剪并放大包含標志的區域。最后準確地定位了標志的位置,成功地裁剪并放大了該區域,并正確地回答了問題。

對比度增強

在OCR任務中,Thyme會適時的增強圖像對比度,讓需要識別的文字更加清晰。

圖像旋轉

Thyme意識到輸入圖像的方向不正確,因此它使用Python代碼執行旋轉操作來調整輸入圖像的角度,最后進行讀取。

復雜計算

Thyme可以將復雜計算操作,轉化為代碼,避免模型直接預測計算結果。

Thyme工作流程

1 模型接收用戶輸入問題,輸出推理思路。2 模型判斷問題復雜度,決定是否生成Python代碼執行圖像處理或計算任務。3 若無需代碼(簡單問題或先前代碼已解決),直接輸出答案。4 生成代碼后,交付給外部沙箱安全執行,沙箱負責格式校驗、參數調整、錯誤修正等處理。5 沙箱返回執行結果(圖像或數值),模型基于結果繼續推理,多輪交互直至輸出最終答案。

在這里作者強調了MLLM的外部沙盒需要做的一些事情,主要包括一些自動糾錯機制,來盡量保證代碼的可用性。

  • 使用autopep8模塊格式化代碼,統一縮進和風格。
  • 利用ast解析代碼變量,自動調整圖像裁剪坐標邊界,避免越界錯誤。
  • 預置必要變量及模塊導入(如cv2、image_path),保證環境一致。
  • 記錄代碼分段變量依賴,解決多段代碼執行時上下文丟失問題。

Thyme-SFT

訓練數據

SFT主要構造了三類任務:

  • 無需代碼直接答復:簡單問題直接回答,訓練模型判定是否需要代碼生成。
  • 基于代碼的圖像操作和計算:包含裁剪、旋轉、對比度增強、數學計算等。
  • 多輪交互數據:針對圖像操作失敗的錯誤修正、連續增強等多輪迭代任務。

對代碼生成樣本進行嚴格執行與語義審核,剔除不執行或執行結果錯誤的代碼片段,提高訓練樣本有效性。

手工構建多輪對話數據,教會模型基于上一輪代碼執行結果調整策略,具備錯誤糾正能力。

訓練策略

訓練過程模型基于輸入圖片(I)和問題(Q)生成推理流程(T)及可選代碼(C),通過沙箱執行代碼獲得結果(S),多輪循環迭代直到生成最終答案(a):[X = { (I, Q); ([T_0, C_0, S_0], …, [T_t, a]) }]

使用了一些SFT策略保證多種功能能被成功激活:

  • 強制模型僅學習輸出最終一輪的有效推理和代碼,早期輸出輪次內容被遮蔽,避免模型過度依賴第二輪糾正。
  • 訓練時排除沙箱執行輸出標簽,防止模型直接模仿沙箱結果,提高推理過程質量。
  • 對數學計算數據采用退火訓練策略:初始階段訓練圖像操作數據,再用較低學習率微調數學推理數據,避免數據不均衡問題。

Thyme-RL

數據構造

出了從開源數據進行搜集和篩選外,額外補充了10k的人工標注數據,標注的任務包括OCR識別、屬性識別、數量識別等多種任務,這些任務要求模型能夠從高分辨率圖像中提取細節信息并正確回答相關問題,增強感知難度。

訓練策略 GRPO-ATS

采用on policy的GRPO。獎勵函數包括:

  • 結果獎勵:比較模型輸出與地面真值答案的匹配程度,確保模型輸出的正確性。
  • 一致性獎勵:檢查推理過程是否與最終答案一致,以確保推理步驟的合理性。
  • 格式獎勵:確保輸出符合嚴格的結構規范,增強推理過程的可解釋性。

適應性溫度采樣:

溫度調整:對于代碼生成任務,如圖像處理和計算任務,使用低溫度(τ = 0)進行采樣,以確保代碼生成過程的準確性和一致性。對于推理過程,使用較高的溫度(τ = 1)來鼓勵模型探索更多的解決方案。

這一策略有效避免了模型在生成代碼時的過度多樣化問題,提高了代碼生成的穩定性,并使得推理過程更加靈活多樣。

采樣優化:

為了減少計算資源浪費,運用Rabin-Karp滾動哈希算法檢測過多重復內容;當重復子串長度超過輸出長度50%,立即判定為重復并提前終止當前軌跡采樣,有效避免資源浪費。

在訓練中還強制限制了最大對話輪次,避免模型陷入無意義的循環,從而提高了訓練效率。

實驗效果

感知,推理,通用任務全面提升

訓練基于32塊NVIDIA H800 GPU,強化學習階段耗時超1200 GPU小時。

在多個基準任務上,Thyme表現出相較于其他多模態模型的優勢,尤其是在感知任務上,Thyme即使在與更大規模的模型Qwen-2.5-VL-32B對比時,也依然顯示出了顯著的優勢。這表明,僅僅通過增加模型的規模并不能有效解決感知任務中的挑戰,相反,Thyme在測試時的擴展策略對感知任務十分有效。

在推理任務中,通過將復雜的計算轉化為可執行代碼,Thyme在推理能力上取得了顯著的提升。然而,在這一領域,模型規模的擴展帶來的優勢更為顯著,表明推理和邏輯推理能力主要依賴于模型本身的知識量。

由于感知與推理能力的提升,Thyme在許多通用任務中取得了顯著的進展,尤其是在減少幻覺現象(hallucination)方面。

深入探討感知任務

以MME-RealWorld為例,它包括許多現實場景中的高分辨率感知任務。表4展示了Thyme與基線模型在不同任務上的表現。

可以看到,對于基線模型已表現良好的任務,如OCR、圖表和表格(準確率超過60%,甚至接近90%),Thyme的提升相對較小。然而,對于更困難的任務,如監控與自動駕駛,在這些任務上Qwen-2.5-VL-7B的感知能力較弱時,Thyme的感知和推理任務的提升超過了25%,尤其是在推理任務中,提升更為顯著。

論文鏈接:https://arxiv.org/abs/2508.11630

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-09-15 14:42:55

o3視覺推理開源

2025-04-17 06:10:57

2025-05-07 13:47:43

強化學習AI智能體

2012-01-17 10:04:07

2025-06-03 08:28:00

2025-06-10 05:00:00

2025-05-28 00:00:00

2025-04-17 09:02:00

2025-04-17 09:12:00

2025-04-23 08:30:05

2023-02-14 09:28:35

2024-12-24 16:15:04

2024-03-27 09:09:57

模型AI開源

2024-06-04 14:09:00

2025-11-21 08:29:14

2019-04-17 16:25:39

2025-06-13 14:22:04

AI工具模型

2025-06-04 04:25:00

Claude 4ChatGPT o3模型

2025-05-26 03:00:00

Linux內核零日漏洞

2025-08-06 07:33:29

點贊
收藏

51CTO技術棧公眾號

欧美 日本 国产| 激情视频小说图片| 国产第一页在线观看| 欧美激情偷拍自拍| 日韩欧美电影在线| 国产成人精品视频免费看| av在线免费播放网站| 国产又粗又猛又爽又黄91精品| 久久久久久成人精品| 全黄一级裸体片| 成人自拍视频| 色综合天天视频在线观看| 中国黄色录像片| 日韩a在线观看| 国产伦精品一区二区三区视频青涩 | 国产成人精品免费久久久久| av激情在线观看| 久久99国产精品视频| 日韩一级精品视频在线观看| 黑人糟蹋人妻hd中文字幕| 黄色网址在线免费播放| 91香蕉视频在线| 97超级碰碰| 日本一区二区三区久久| 欧美性久久久| 美女国内精品自产拍在线播放| 蜜桃传媒一区二区亚洲av| 欧美专区一区| 欧美另类变人与禽xxxxx| 黄色动漫在线免费看| 亚洲国产精品精华素| 中文字幕欧美激情一区| 久久手机视频| 神马午夜在线观看| 国产黄色精品视频| 国产精品久久久久7777婷婷| 成人精品在线看| 天天精品视频| 自拍偷拍亚洲区| 日本性高潮视频| 四虎5151久久欧美毛片| 精品国产乱码久久久久久浪潮 | 午夜毛片在线观看| 国产精品videosex极品| www亚洲精品| 18精品爽国产三级网站| 精品视频国产| 中日韩午夜理伦电影免费| 国产特级黄色录像| 日韩福利视频一区| 日韩成人高清在线| 91精品小视频| 神马香蕉久久| 亚洲女人被黑人巨大进入al| 国产精品一级黄片| 久久porn| 精品视频—区二区三区免费| 亚洲图片综合网| 黄色免费大全亚洲| 亚洲精品国产suv| 熟女丰满老熟女熟妇| 欧美成人一区在线观看| 日韩精品高清在线观看| asian性开放少妇pics| 最新亚洲精品| 日韩在线精品一区| 性色av无码久久一区二区三区| 91偷拍一区二区三区精品| 日韩一中文字幕| 免费成年人视频在线观看| 亚洲最大黄网| 欧美精品video| 波多野结衣国产| 久久亚洲精品伦理| 国产欧美在线看| 99久久久久久久| 成人妖精视频yjsp地址| 久久婷婷开心| xxxxx日韩| 亚洲欧美一区二区三区孕妇| www.成年人视频| 欧美××××黑人××性爽| 在线观看免费视频综合| 黄色一级片免费的| jizz18欧美18| 精品一区二区三区四区在线| 久久久久久成人网| 一区二区三区国产精华| 性欧美激情精品| 在线观看不卡的av| 高清国产一区二区三区| 欧美一区二区三区成人久久片| 免费大片在线观看www| 亚洲一区在线观看免费| 欧美日韩一区二区在线免费观看 | 亚洲国产一区二区精品专区| 欧美一区二粉嫩精品国产一线天| 91超薄丝袜肉丝一区二区| 国产主播一区二区| 久久亚洲午夜电影| caoporm免费视频在线| 欧美午夜丰满在线18影院| 国产3p在线播放| 希岛爱理av免费一区二区| www.亚洲男人天堂| www.国产一区二区| 国产精品亚洲人在线观看| 日本午夜精品一区二区| 天堂av中文在线| 欧美日韩一二区| 国产福利短视频| 亚洲五月综合| 国产美女久久精品香蕉69| 午夜视频在线播放| 亚洲精品国产一区二区精华液| 国产一区亚洲二区三区| 成人免费91| 中国日韩欧美久久久久久久久| 一区二区三区福利视频| 国产成人av一区| 在线视频不卡国产| 日韩不卡视频在线观看| 日韩av在线播放资源| 久久精品免费av| 国产在线播放一区三区四| 日韩精品一区二区三区色偷偷 | 99riav国产精品视频| 欧洲三级视频| 欧美综合一区第一页| 国产刺激高潮av| 亚洲欧美日韩国产综合| 亚洲xxxx2d动漫1| 最新国产一区| 国产va免费精品高清在线观看| 欧美一级在线免费观看| 伊人开心综合网| 麻豆网站免费观看| 青青草综合网| 国产精品99久久久久久白浆小说| 视频一区二区三区在线看免费看| 亚洲aⅴ怡春院| 国产国语老龄妇女a片| 欧美日韩综合| 99久热re在线精品视频| 羞羞的视频在线看| 欧美一区二区三区视频| 日本少妇高清视频| 国产毛片精品国产一区二区三区| 在线观看日韩羞羞视频| 日本亚洲欧洲无免费码在线| 色噜噜久久综合伊人一本| 中国a一片一级一片| 国产欧美日韩精品一区| 青青青在线视频免费观看| 精品久久久亚洲| 国产精品网址在线| 日本www在线观看| 制服丝袜亚洲播放| 国产一二三四在线| www.av精品| 99蜜桃臀久久久欧美精品网站| 狠狠做深爱婷婷综合一区| 国产精品久久久久久久久借妻| 都市激情在线视频| 欧美日韩中文一区| 少妇久久久久久被弄高潮| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 91精品国产色综合久久不卡98口| 五月婷婷激情在线| 色婷婷av一区二区| 国产精品视频看看| 国产传媒久久文化传媒| 国产婷婷一区二区三区| 国产aⅴ精品一区二区三区久久| 国产精品91久久久| 久久综合网导航| 337p日本欧洲亚洲大胆色噜噜| 免费看日韩毛片| 亚洲国产成人一区二区三区| 伦伦影院午夜理论片| 一本不卡影院| 亚洲日本精品国产第一区| 欧美另类中文字幕| 欧美一区二区三区免费视| 一级毛片视频在线| 欧美tickling挠脚心丨vk| 精品免费囯产一区二区三区 | 成人国产精品一区二区免费麻豆| 久久久精品一区二区| 人人妻人人玩人人澡人人爽| 在线看国产一区二区| 在线播放日韩专区| 素人fc2av清纯18岁| 蜜臀久久99精品久久久久久9| 成人免费看片视频在线观看| 欧美爱爱网站| 成人日韩av在线| 色综合桃花网| 久久综合色88| 国产一级片在线播放| 精品剧情v国产在线观看在线| 337p粉嫩色噜噜噜大肥臀| 亚洲综合一区二区三区| 午夜时刻免费入口| 国产成a人亚洲| 中文字幕一区二区三区四区在线视频| 欧美日韩中文| 亚洲最大免费| 蜜桃成人av| 不卡日韩av| 岛国一区二区| 欧美壮男野外gaytube| 欧美性video| 精品国产一区二区三区久久久狼 | 国产91对白在线观看九色| 青青青国产在线视频| 亚洲视频免费| 成人性做爰片免费视频| 国产一区二区三区四区大秀| 国产精品美女诱惑| 亚洲a成人v| 国产高清在线不卡| 丝袜老师在线| 久久久久久噜噜噜久久久精品| 91福利在线视频| 亚洲视频在线免费看| 四虎在线观看| 亚洲成人网av| 丰满人妻熟女aⅴ一区| 678五月天丁香亚洲综合网| 无码人妻丰满熟妇奶水区码| 亚洲第一搞黄网站| 久草免费新视频| 一区二区三区中文字幕电影 | 亚洲激情婷婷| 777久久精品一区二区三区无码 | 欧美激情一区二区三级高清视频| 香蕉视频免费在线播放| 亚洲欧美变态国产另类| 亚洲av成人精品毛片| 精品99久久久久久| 亚洲精品一区二区三区蜜桃| 欧美一区二区三区视频在线| 91一区二区视频| 538在线一区二区精品国产| 97人妻人人澡人人爽人人精品 | 国产精品久久占久久| 日韩精彩视频| 日本精品黄色| 艳色歌舞团一区二区三区| 日韩精品一区二区三区免费观影| 日韩欧美精品一区二区| 国产欧美日韩在线观看视频| 欧美一区二视频在线免费观看| 男男gay无套免费视频欧美| 久久伊人资源站| 免费电影一区二区三区| 日本视频一区二区不卡| 久久人人88| 看一级黄色录像| 国产在线日韩| 国产在线精品91| 久久久xxx| 久久久久久久久久一区二区| 国产综合成人久久大片91| 美女被艹视频网站| 成人av电影在线观看| 9.1成人看片| 国产女人aaa级久久久级| 极品尤物一区二区| 亚洲日穴在线视频| 国产一级在线播放| 欧美午夜无遮挡| 亚洲天堂网在线视频| 欧美一区二区视频在线观看2022| 亚洲高清精品视频| 国产视频自拍一区| 99精品老司机免费视频| 欧美成人精品影院| 桃色av一区二区| 国产日韩精品在线| 国产美女撒尿一区二区| 日本一区二区视频| 欧美伊人久久| 丝袜老师办公室里做好紧好爽| 美女尤物国产一区| 久草免费资源站| 欧美激情综合网| 精品午夜福利视频| 在线免费观看日韩欧美| www.热久久| 国产小视频91| 伊人精品影院| 国产精品久久久久久久久久三级| 欧美特黄色片| 久久综合伊人77777麻豆| 中文字幕免费一区二区| 欧美黑人经典片免费观看| 另类小说欧美激情| 欧产日产国产精品98| 国产精品毛片久久久久久久| 国产极品美女高潮无套嗷嗷叫酒店| 91国产免费观看| 黄色成人一级片| 日韩视频―中文字幕| 毛片电影在线| 丁香婷婷久久久综合精品国产 | 国产一区二区av| 2020国产在线| 91亚洲永久免费精品| 国产91精品对白在线播放| a天堂资源在线观看| 蜜臀av性久久久久av蜜臀妖精| 亚洲一区二区三区四区av| 《视频一区视频二区| 久久久黄色大片| 精品999久久久| 四虎影院观看视频在线观看| 国产精品一区二区在线| 亚洲老女人视频免费| 可以看毛片的网址| 国产精品一区二区久久精品爱涩| 欧美激情久久久久久久| 欧美性猛xxx| 色欲av永久无码精品无码蜜桃| 欧美成人免费va影院高清| 国产精品麻豆成人av电影艾秋| 免费99视频| 国产精品久久777777毛茸茸| 日本美女视频网站| 亚洲精品videosex极品| 国产又粗又黄又爽的视频| 一区二区三区美女xx视频| 欧美人与性动交xxⅹxx| 久久99精品久久久久久久久久| 国内在线观看一区二区三区| 中文字幕第三区| 亚洲精品成人天堂一二三| 国产又粗又猛又爽又黄91| 中文字幕不卡在线视频极品| 欧美男女交配| 日本高清一区| 免费人成在线不卡| 国产探花视频在线播放| 欧美视频中文一区二区三区在线观看| 九色在线免费| 国产精品777| 久久中文视频| 亚洲第一色av| 亚洲摸摸操操av| 国精品人妻无码一区二区三区喝尿| 欧美国产亚洲视频| 成人午夜大片| av免费观看大全| 久久久久久久一区| 国产成人a v| 日韩在线观看免费全集电视剧网站| 色诱色偷偷久久综合| 伊人久久大香线蕉成人综合网| 狠狠色丁香婷婷综合久久片| www.99re7| 亚洲国产精品久久91精品| 久久男人av资源站| 欧美国产综合视频| 免费在线成人网| www深夜成人a√在线| 欧美大黄免费观看| 成人bbav| 色一情一乱一伦一区二区三欧美| 免费高清成人在线| 九九九久久久久| 国产婷婷97碰碰久久人人蜜臀| 欧美影视资讯| 亚洲欧美一二三| 不卡视频免费播放| aaaaaa毛片| 久久精品99久久香蕉国产色戒| www.国产精品一区| 99久久久无码国产精品6| 国产精品久久久久久久裸模| 国产高清视频免费观看| 91精品国产91| 欧美电影免费播放| 永久免费未满蜜桃| 欧亚一区二区三区| 少妇视频在线| 欧美日韩一区二区视频在线观看| 看国产成人h片视频| 久久精品免费在线| 社区色欧美激情 | 红杏视频成人| 中文字幕精品一区二区三区在线| 亚洲福利一二三区| 成人福利在线| 国产偷国产偷亚洲高清97cao| 日一区二区三区| 日干夜干天天干| 日韩在线激情视频| 日本一道高清一区二区三区| 日本一二三四区视频|