精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLaVA-OneVision-1.5全流程開源,8B模型預訓練只需4天、1.6萬美元

人工智能 新聞
靈感實驗室團隊聯合 LMMs-Lab 圍繞「高性能 — 低成本 — 強復現」三大目標,在 LLaVA-OneVision 體系上推出完整開放的概念均衡 85M 預訓練數據集(LLaVA-OV-1.5-Mid-Training-85M)與精篩 22M 指令數據集(LLaVA-OV-1.5-Instruct-22M)。

LLaVA 于 2023 年提出,通過低成本對齊高效連接開源視覺編碼器與大語言模型,使「看圖 — 理解 — 對話」的多模態能力在開放生態中得以普及,明顯縮小了與頂級閉源模型的差距,標志著開源多模態范式的重要里程碑。

LLaVA 用低成本對齊打通「視覺編碼器 + 大語言模型」起步,LLaVA?1.5 以更大更干凈的數據與高分辨率輸入強化理解,LLaVA?NeXT 拓展 OCR / 數理與多場景任務;隨后分支為 LLaVA?NeXT?Video 處理時序視頻、多幀推理,及 LLaVA-NeXT-Interleave 支持交替多圖文與跨圖聯推;最終在 LLaVA?OneVision 匯聚為統一接口,覆蓋圖像 / 文檔 / 圖表 / 多圖 / 視頻,兼顧效果與效率。

盡管多模態對齊的接口與架構趨于收斂,真正「可復現」的開源路徑仍與「僅開放權重」存在間距。Qwen2.5?VL、InternVL3.5 在 OCR、文檔理解、數理與跨圖推理上樹立高基線,但完整的數據清單、清洗與混合比例,以及對齊 / 采樣與訓練日程多為部分披露,難以端到端重現。Molmo 以更干凈的數據流水線與精細化設計,在多項評測與偏好中逼近閉源強基線;Open?Qwen2VL 則表明在更高效范式下,即便原始多模態 token 占比較低亦能取得強對比性能。當前主要鴻溝在于 「配方與工程細節的可復現性」,而非單一的模型架構選擇。

靈感實驗室團隊聯合 LMMs-Lab 圍繞「高性能 — 低成本 — 強復現」三大目標,在 LLaVA-OneVision 體系上推出完整開放的概念均衡 85M 預訓練數據集(LLaVA-OV-1.5-Mid-Training-85M)與精篩 22M 指令數據集(LLaVA-OV-1.5-Instruct-22M),并沿用緊湊的三階段流程(語言–圖像對齊 Stage?1、概念均衡與高質量知識注入 Stage?1.5、指令微調 Stage?2),結合離線并行數據打包(最高約 11× padding 壓縮)與 Megatron?LM + 分布式優化器,將 8B 規模 VL 模型的 Stage?1.5 預訓練在 128 張 A800 上控制在約 4 天內完成,預算控制在 1.6 萬美元。

在此基礎上,我們提出 LLaVA?OneVision?1.5,繼承并擴展 LLaVA 系列:引入 RICE?ViT 支持原生分辨率與區域級細粒度語義建模、強化圖表 / 文檔 / 結構化場景理解,延續緊湊三階段范式以避免冗長 curriculum,構建并強調「質量 — 覆蓋 — 均衡」的 85M 預訓練與 22M 指令集合,并真正意義上實現全鏈條透明開放(數據、訓練與打包工具鏈、配置腳本、日志與可復現評測命令及其構建與執行細節),以確保社區低成本復現與可驗證拓展。

實驗結果顯示,LLaVA?OneVision 在多項公開多模態基準上較 Qwen2.5?VL 展現出競爭性乃至更優性能(詳見技術報告)。

  • 論文標題:LLaVA-OneVision-1.5: Fully Open Framework for Democratized Multimodal Training
  • 代碼地址:https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5
  • 技術報告地址:https://arxiv.org/abs/2509.23661
  • 數據 / 模型地址:https://huggingface.co/collections/lmms-lab/llava-onevision-15-68d385fe73b50bd22de23713
  • Demo:https://huggingface.co/spaces/lmms-lab/LLaVA-OneVision-1.5

數據構建要點

用于通用視覺語言的預訓練集(85M)與指令微調數據集(22M)。其中 85M 預訓練數據融合 COYO-700M、Obelics、DataComp-1B、LAION-CN、ImageNet-21K、SAM-1B、MINT、Zero250M 等 8 大異構來源,形成約 2,000 萬中文與 6,500 萬英文圖文對。

為破解長尾概念稀疏與原始 caption 噪聲 / 缺失問題,我們不再依賴原始文本詞頻,而是采用特征驅動的「概念均衡」策略:利用 MetaCLIP 編碼器將全部圖像與 50 萬規模概念詞嵌入共享向量空間,對每張圖像檢索 Top-K 最相似概念,統計概念頻次后按逆頻加權重采樣,抑制高頻背景類并提升罕見細粒度實體、屬性與場景占比,顯著平坦化長尾分布;隨后使用高質量 Captioner 生成對齊的中英文增強描述。系統實驗表明,在相同或更低 token 預算下,擴大高質量數據規模并結合概念均衡采樣,可在多模態理解、長尾識別與指令泛化等核心指標上獲得顯著且可復現的性能提升。

指令數據 22M 覆蓋八大類別:Caption、Chart & Table、Code & Math、Domain-specific、General VQA、Grounding & Counting、OCR、Science。通過多源聚合、格式統一、指令重寫、雙語互轉、模板去同質化與安全篩除,保持類別與難度分布均衡。并且我們的指令數據疊加 FineVision 數據集之后,結果會繼續增加。

訓練策略

1. 視覺編碼器預訓練

為了讓模型在 OCR、表格 / 文檔、區域理解與后續指令推理上具有更高的下限,我們在 LLaVA-OneVision-1.5 中采用自研的 MVT v1.5(RICE-ViT) 作為視覺主干。

相較僅做全局對齊的 CLIP / SigLIP 類對比模型,RICE-ViT 針對「實例只用單一全局向量」這一結構性瓶頸,引入統一的 Region Cluster Discrimination 機制:在 4.5 億圖像與 24 億候選區域上訓練,利用區域聚類判別 + 區域感知注意力顯式建模局部實體 / 文本塊與上下文關系,并結合 2D 旋轉位置編碼(2D RoPE)實現多分辨率原生支持。

與 SigLIP2 依賴多套專用損失(SILC、TIPS、LocCa 等)不同,我們用單一聚類判別范式同時強化通用語義、OCR 識別與定位能力,訓練與推理鏈路更簡潔、可維護性更高。在多模態融合階段,通過輕量投影與后續全參數聯合訓練,將這一細粒度語義底座無縫接入語言模型,減少冗余適配模塊并提升跨任務遷移效率。

2. 三階段學習流程

  • Stage-1:語言–圖像對齊

使用 LLaVA-1.5 558K 數據集訓練視覺投影層,將視覺編碼輸出映射到語言模型詞嵌入空間。此階段控制參數更新范圍以快速穩定收斂。

  • Stage-1.5:高質量知識中期預訓練

在概念均衡的 85M 預訓練數據上進行全參數訓練,注入廣域視覺語義與世界知識,強調數據質量與覆蓋而非盲目擴張 token 規模。

  • Stage-2:視覺指令對齊

基于 22M 指令數據與 FineVision 等多源視覺指令語料繼續全參數訓練,提升任務泛化、推理組織與響應格式控制能力。

3. 離線并行數據打包

為降低多模態樣本長度差異帶來的 padding 浪費、提升有效 token 利用率,我們采用離線并行數據打包:先按樣本長度或長度區間進行哈希桶聚類,減少全局排序與掃描成本;再在數據準備階段以多線程將多條短樣本拼接為接近目標長度的定長序列。該流程一次性處理全量語料,具備確定性與可復現性,避免在線動態打包引入的運行時不穩定與額外 CPU 開銷。

在 85M 規模的預訓練樣本上,相比原始方案可實現最高約 11× 的 padding 有效壓縮(定義:原始方案總 padding token / 打包后總 padding token)。

4. 混合并行與長上下文高效訓練,訓練端采用混合并行與長上下文優化

張量并行(TP)+ 流水并行(PP)+ 序列 / 上下文并行(Sequence/Context Parallel)與分布式優化器協同,以在大規模集群中同時提升算力利用與顯存效率;同時采用原生分辨率策略,保留圖表、文檔與密集文本區域的結構細節,避免統一縮放帶來的信息損失。

在 128×A800 集群上,8B 規模模型的 Stage?1.5(85M 樣本、原生分辨率)約 3.7 天完成,兼顧吞吐與成本。

結論

LLaVA-OneVision-1.5 證明:依托概念均衡的 85M 預訓練數據與高質量指令數據,結合 RICE?ViT 細粒度視覺底座和緊湊的三階段策略(對齊–高質量知識注入–指令泛化),再配合離線并行打包(最高約 11× padding 減少)與混合并行 / 原生分辨率等工程優化,8B 規模即可在更低 token 與算力成本下,對標乃至部分超越主流開源與部分閉源多模態模型,體現「高質量結構化數據 + 系統效率協同」相較單純堆量的優勢。

這是一次非常簡單的復現工作:我們完整開放數據、工具鏈、腳本、配置、日志與評測配方,復現路徑清晰、依賴明確,無需復雜調參即可跑通。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-17 10:03:23

2024-05-27 09:16:37

2012-05-23 10:05:49

工作效率效率程序員

2009-05-27 19:18:10

2025-07-29 02:12:00

大模型8B模型性能

2012-02-10 09:34:02

2024-03-18 10:02:00

AI開源

2023-10-08 13:43:00

模型數據

2023-09-28 12:03:01

2024-12-31 15:18:42

2024-07-02 01:09:02

2020-08-10 15:05:02

機器學習人工智能計算機

2013-08-09 09:41:04

2013-04-23 14:20:44

創業創業者

2012-08-23 16:41:10

陌陌投資

2021-08-19 11:13:08

融資機器人Rapid Robot

2025-08-24 09:24:07

2024-06-17 18:04:38

2021-10-11 14:07:28

比特幣虛擬貨幣加密貨幣
點贊
收藏

51CTO技術棧公眾號

y111111国产精品久久婷婷| 久久精品一区中文字幕| 日韩欧美精品在线观看视频| 国产一级在线观看| 激情图区综合网| 午夜免费久久久久| 国产农村妇女精品一区| 永久免费精品视频| 91久久奴性调教| 波多野结衣av一区二区全免费观看| 黄色在线免费观看大全| 国产精品12区| 日本高清久久天堂| 欧美日韩免费做爰视频| 青青草国产免费一区二区下载| 日韩精品一区二区在线| 性刺激的欧美三级视频| 9765激情中文在线| 日韩一区中文字幕| 欧美二区在线看| 亚洲av综合色区无码一区爱av| 久久蜜桃精品| 国产做受高潮69| 99自拍视频在线| 深夜福利久久| 日韩大陆毛片av| ass极品水嫩小美女ass| 欧美aaa级| 91久久精品一区二区三| jizzjizz国产精品喷水| 日本在线视频www鲁啊鲁| 成人欧美一区二区三区在线播放| 欧美亚洲另类在线一区二区三区 | 激情久久综合| 最好看的2019的中文字幕视频| 日本黄色片在线播放| 蜜桃精品视频| 欧美久久久久久久久久| 在线观看亚洲色图| 91看片一区| 日韩欧美国产中文字幕| 国产a级一级片| 2018av在线| 五月激情综合婷婷| 欧美黄色免费网址| 在线观看电影av| 亚洲人成精品久久久久| a级黄色片网站| 日本中文字幕在线播放| 中文字幕精品三区| 日韩三级电影网站| 99青草视频在线播放视| 欧美激情在线看| 亚洲激情图片| 免费的黄网站在线观看| 综合av第一页| 国产成人亚洲综合无码| 超碰97免费在线| 午夜精品久久久久久久99水蜜桃| 97视频久久久| 蜜桃麻豆影像在线观看| 高跟丝袜欧美一区| 日日碰狠狠丁香久燥| 亚洲第一会所| 欧美精品一级二级| 亚洲第一区第二区第三区| 欧美不卡在线观看| 欧美成人精品福利| 国产白嫩美女无套久久| 亚洲春色h网| 在线播放亚洲激情| 永久免费看mv网站入口| 精品成人在线| 日韩av成人在线观看| 国产精品无码一区| 韩国女主播成人在线| 99久久99久久精品国产片| 污污网站在线免费观看| 久久老女人爱爱| 一本一本久久a久久精品综合妖精| 国产原创精品视频| 亚洲成人在线网站| 激情综合网俺也去| 久久国产精品免费一区二区三区| 精品成人在线观看| 成人性生交大片免费看无遮挡aⅴ| 色小子综合网| 久久久久久久999| 国产一区二区视频网站| 国产美女精品在线| 精品国产一区二区三区麻豆小说| 黄色av网址在线免费观看| 亚洲欧洲国产专区| 欧美三级一级片| 日韩黄色碟片| 亚洲经典中文字幕| 国产探花在线视频| 国产色综合网| 亚洲综合在线做性| 青青青手机在线视频观看| 成人免费一区二区三区在线观看| 日韩精品视频在线观看视频| xxxxx.日韩| 亚洲国产精品资源| 国产免费嫩草影院| 国产精品视频| 9a蜜桃久久久久久免费| 91精彩视频在线观看| 亚洲va在线va天堂| 一级淫片在线观看| 国产一区二区三区四区| 97色在线视频| 国产麻豆精品一区| 欧美激情一区在线观看| 阿v天堂2017| 中文字幕一区二区三区中文字幕| 中文字幕九色91在线| 国产免费观看av| 国产成人免费av在线| 亚洲三区视频| 最新日韩三级| 日韩精品视频中文在线观看| 欧美精品xxxxx| 精品一区二区日韩| 天堂资源在线亚洲视频| 亚洲第一av| 亚洲高清福利视频| 男人资源在线播放| 国产精品自拍网站| 日韩欧美亚洲在线| 成人av三级| 亚洲精品白浆高清久久久久久| 少妇被躁爽到高潮无码文| 视频一区视频二区中文| 久久精品日产第一区二区三区乱码 | 六月婷婷中文字幕| 国产精品青草久久| 亚洲性生活网站| 成人高清av| 国产xxx69麻豆国语对白| 亚洲av无码一区二区三区性色| 综合激情成人伊人| 在线播放av中文字幕| 久久国产中文字幕| 国产精品日本精品| youjizz在线播放| 在线亚洲人成电影网站色www| 国产老熟女伦老熟妇露脸| 精品99视频| 精品一区久久久| 在线观看爽视频| 亚洲欧美三级伦理| 人人妻人人爽人人澡人人精品| 2020国产精品自拍| 中文字幕欧美人妻精品一区| 国内精品伊人久久久| 国产精品成人v| av一本在线| 欧美日韩国产首页在线观看| 欧美88888| 国产自产高清不卡| 亚洲色婷婷久久精品av蜜桃| 亚洲国产视频二区| 国外视频精品毛片| 你懂的视频在线免费| 91国模大尺度私拍在线视频| 刘亦菲国产毛片bd| 国产盗摄一区二区三区| 欧美a v在线播放| 精品国精品国产自在久国产应用| 国产免费一区二区三区在线能观看 | 久久亚洲不卡| 视频一区二区三区免费观看| 深夜视频一区二区| 麻豆国产va免费精品高清在线| 国产免费一区二区三区免费视频| 伊人夜夜躁av伊人久久| 捆绑凌虐一区二区三区| 日韩av电影免费观看高清完整版| youjizz.com亚洲| 国产精品毛片久久久| 国产精品96久久久久久| 18视频在线观看网站| 日韩不卡在线观看| 国产一区二区三区成人| 亚洲第一综合色| 性少妇xx生活| 99久精品国产| 黄色一级片免费的| 激情偷拍久久| 亚洲欧洲国产精品久久| av不卡一区二区| 国产精品精品久久久| 七七久久电影网| 国产一区二区三区中文| 国内老熟妇对白xxxxhd| 色婷婷综合久久久中文字幕| 欧美在线视频第一页| 久久久电影一区二区三区| 欧美日韩理论片| 日韩成人免费电影| 国产视频在线观看网站| 日韩精品久久| 久久久精彩视频| 天堂精品久久久久| 国产精品三级网站| 亚洲优女在线| 久久99视频免费| 最近高清中文在线字幕在线观看| 日韩国产在线看| 囯产精品一品二区三区| 在线不卡欧美精品一区二区三区| 台湾佬中文在线| 亚洲成人手机在线| 男人的天堂久久久| 国产精品乱码一区二三区小蝌蚪| 国产精品jizz| 成人av中文字幕| 在线a免费观看| 蜜桃av噜噜一区| 久久九九国产视频| 老鸭窝91久久精品色噜噜导演| www.欧美黄色| 欧美黄色一区二区| 国产女人18毛片| 99视频精品全国免费| 视频三区二区一区| 国产欧美日韩影院| 欧美午夜欧美| 欧美极品在线观看| 免费成人av网站| 日本一区福利在线| 国产三级精品在线不卡| ccyy激情综合| 成人免费观看网站| 亚洲天堂中文字幕在线观看| 91免费看片在线| 蜜桃在线一区| 999热视频| 一区二区三区四区视频免费观看| 91免费观看网站| 欧美9999| 国产精品久久久久久久小唯西川 | 亚洲香蕉伊综合在人在线视看| 性xxxfllreexxx少妇| 精品国产一区a| 蜜桃视频久久一区免费观看入口| 欧美videos大乳护士334| www.看毛片| 欧美草草影院在线视频| 性色av蜜臀av| 亚洲第一精品夜夜躁人人爽| 日本精品久久久久| 日韩成人av网址| 免费在线稳定资源站| 一区二区三区视频观看| 波多野结衣在线网站| 日韩有码在线电影| av毛片在线播放| 久久久久久久网站| 神马久久午夜| 国产精品观看在线亚洲人成网| 日韩高清在线| 亚洲a级在线观看| 国产乱人伦精品一区| 欧美不卡1区2区3区| 成人在线国产| 日本国产中文字幕| 亚洲在线免费| 免费一区二区三区在线观看| 国产在线视频不卡二| 大尺度在线观看| 久久精品一二三| 亚洲最大的黄色网址| 午夜精品久久久久久久99樱桃| 69xxxx国产| 3d动漫精品啪啪一区二区竹菊| 好男人www在线视频| 亚洲丝袜av一区| 91精品久久| 欧美一区第一页| 国产日本亚洲| 欧美aaaaa喷水| 亚洲精品一区二区在线看| 800av在线免费观看| 三级亚洲高清视频| 91欧美一区二区三区| 26uuu久久综合| 国产精品视频一区二区三 | 日本午夜精品| 中文字幕一区二区三区最新| 99精品免费| 天天影视色综合| 久久嫩草精品久久久精品一| 国产成人av免费在线观看| 欧美日韩国产一区二区三区| 91tv国产成人福利| 日韩电视剧在线观看免费网站| 求av网址在线观看| 欧美影院久久久| 一区二区亚洲视频| 亚洲精美视频| 亚洲综合精品四区| 99热这里只有精品2| 国产视频一区二区三区在线观看 | 夜夜精品视频| 久久出品必属精品| 欧美激情一区二区三区| 日韩免费观看一区二区| 日韩一级片网址| av免费观看一区二区| 日本一本a高清免费不卡| 亚洲不卡在线| 中文字幕在线观看一区二区三区| 香蕉视频成人在线观看| 天堂www中文在线资源| ...xxx性欧美| 中文字幕一区二区三区四区视频| 亚洲精品美女久久久| 色爱综合区网| 亚洲一区美女视频在线观看免费| 残酷重口调教一区二区| 777久久久精品一区二区三区| 国产成人在线免费| 成人做爰视频网站| 欧美挠脚心视频网站| youjizz在线播放| 国产精品扒开腿做爽爽爽男男| 亚州国产精品| www.com毛片| 不卡av电影在线播放| 精品在线视频免费观看| 日韩三级视频中文字幕| 超碰在线最新| 91视频88av| 亚洲成人二区| 久久6免费视频| 亚洲视频网在线直播| 91成品人影院| 久久久国产精品免费| 91麻豆精品国产综合久久久 | av成人免费网站| 91精品国产美女浴室洗澡无遮挡| 免费在线看a| 成人免费激情视频| 欧美日本不卡| 一区二区免费在线观看视频| 婷婷成人激情在线网| 午夜视频www| 日韩免费中文字幕| av在线不卡顿| 亚洲天堂伊人网| 亚洲精品乱码久久久久久黑人| 国产黄色大片网站| 欧美高清电影在线看| 加勒比视频一区| 欧美色图另类小说| 国产三级三级三级精品8ⅰ区| 国产乡下妇女三片| 日韩中文字幕在线看| 一区二区免费| 精品久久一二三| 久久久国产精品午夜一区ai换脸| 中文字幕在线播放av| 欧美成人午夜免费视在线看片 | 日本三级理论片| 亚洲美女黄色片| 国产在视频一区二区三区吞精| 五月天男人天堂| 成人午夜激情影院| 日韩精品一区二区亚洲av| 中文字幕精品av| jizz国产精品| 成人免费毛片播放| 一区二区三区中文在线观看| 少妇一区二区三区四区| 国产精品激情自拍| 欧美区日韩区| 一本加勒比北条麻妃| 欧美日韩国产一区| 爱啪啪综合导航| 亚洲一卡二卡三卡| 丁香五精品蜜臀久久久久99网站 | 91精品综合久久久久久| 精精国产xxxx视频在线野外| 无码免费一区二区三区免费播放| 国产一区二区伦理片| 国产成人精品片| 日韩一区二区三区在线播放| 美女视频亚洲色图| 国内国产精品天干天干| 午夜精品久久久久久久久久久| 在线观看国产原创自拍视频| 国产一区高清视频| 久久se这里有精品| 国产成人无码一区二区三区在线 | 免费av在线一区二区| 国产毛片精品国产一区二区三区| 欧美一区二区三区网站| 欧美精品一区三区|