精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

登上NeurIPS,Genesis開創無需OCC引導的多模態生成新范式,在視頻與激光雷達指標上達到SOTA水平

人工智能 新聞
為了以結構化語義引導生成過程,本文引入了 DataCrafter,可提供場景級與實例級的信息描述。在 nuScenes 基準數據集上的大量實驗表明,Genesis 在視頻與激光雷達指標上均達到了當前 SOTA 水平。

由華中科技大學與小米汽車提出了業內首個無需 OCC 引導的多模態的圖像 - 點云聯合生成框架 Genesis。該算法只需基于場景描述和布局(包括車道線和 3D 框),就可以生成逼真的圖像和點云視頻。


  • 論文題目:Genesis: Multimodal Driving Scene Generation with Spatio-Temporal and Cross-Modal Consistency
  • 論文鏈接:https://arxiv.org/abs/2506.07497
  • Github 鏈接:xiaomi-research/genesis

Genesis 采用兩階段架構:第一階段基于透視圖投影的布局和場景描述等條件,利用基于 DiT 的擴散模型學習 3D 變分自編碼器編碼的環視圖特征; 第二階段將第一階段多視角視頻序列轉到鳥瞰圖的特征空間,并結合場景描述和布局等條件,學習 2D 自編碼器編碼的點云特征。

為了以結構化語義引導生成過程,本文引入了 DataCrafter (一個基于 VLM 的數據標注模塊),可提供場景級與實例級的信息描述。在 nuScenes 基準數據集上的大量實驗表明,Genesis 在視頻與激光雷達指標上均達到了當前 SOTA 水平。

本文的主要貢獻總結如下:

  • 統一的多模態生成架構。Genesis 采用統一的 pipeline,視頻和 LiDAR 分支都在共享相同的條件輸入,包括場景描述和布局等,這確保了生成的多模態數據的一致性。為進一步保證點云和圖像背景的信息一致性,我們將 RGB 透視圖轉到鳥瞰圖視角下的特征下,并把該特征作為條件輸入到基于點云擴散模型中,從而加強兩種模態的一致性,該過程無需依賴 occupancy 或體素等中間體。
  • 通過 DataCrafter 進行結構化語義信息提取。為了提高語義可控性,本文引入了 DataCrafter,這是一個基于視覺語言模型構建的 caption 數據處理模塊。它提取多視圖、場景級和實例級描述,這些描述融合到密集的語言引導式先驗中。這些 caption 數據為視頻和 LiDAR 生成器提供了詳細的語義指導,從而產生不僅逼真而且可解釋和可控的輸出。

引言

在自動駕駛技術向高階邁進的進程中,構建多樣化、高擬真度的駕駛場景數據集,已成為不可或缺的關鍵環節。合成數據因為其可編輯,易泛化的特點得到了廣泛的關注。現有研究雖在視頻生成、LiDAR 序列合成領域取得顯著進展,但如何實現視覺與幾何模態間的深度協同與一致性表達,仍屬亟待攻克的前沿課題。

如圖 1,當前主流的駕駛場景生成方案,多聚焦于 RGB 視頻或 LiDAR 點云的單模態數據生成。這些方法雖極大推動了場景生成技術的發展,卻未能充分挖掘多模態融合的協同優勢。在處理 RGB 視頻與其他傳感器數據時,模態間的對齊精度不足,導致生成結果難以滿足實際應用需求。許多方法采用基于 BEV 地圖或 3D 框的 “布局 - 數據” 單步生成模式,這種依賴粗略空間先驗的架構,在捕捉復雜交通動態與精細語義細節時存在天然缺陷。

盡管 UniScene 等研究嘗試引入占用網格實現多模態生成,但實際自動駕駛場景中 OCC 標簽的獲取是非常昂貴的,這嚴重限制了生成模型在工業界的應用。另外,現有多模態生成方案多依賴粗略標簽或通用標題模型提供語義標簽,未能有效利用現代視覺語言模型(VLM)的細粒度語義解析能力。這種語義標簽的缺失,直接影響生成場景的真實性、可控性,以及時空邏輯的連貫性。

具體工作

DataCrafter 模塊

本文提出 DataCrafter, 一個專為多視角自動駕駛視頻設計的 Caption 數據生成模塊,旨在實現以下兩項核心功能:

(1) 訓練階段數據篩選:借助預訓練視覺語言模型的圖像理解能力,對原始訓練片段進行評估,僅篩選高質量片段用于訓練。(2) 結構化語義提?。豪靡曈X語言模型對多視角視頻片段提取細粒度語義信息,為多模態生成任務提供豐富的結構化語義條件。

具體流程如下:首先,將多視角輸入視頻分割為片段,每個片段都由基于視覺語言模型的模塊進行評分:

其中項表示由視覺語言模型得出的子分數,為固定權重。

評分體系涵蓋三類關鍵視覺屬性:(1) 圖像清晰度:如模糊、畸變、臟污等;(2) 結構合理性:如遮擋程度、結構混亂、場景完整性等;(3) 美學特性:如逆光、過暗過亮、曝光異常、色彩偏差等。

僅得分高于設定閾值的片段會被保留用于訓練,并進一步進行語義標注。相較于現有方法僅使用單視角圖像進行標注或將多視角圖像拼接后統一標注的策略,前者容易造成信息缺失,后者則常出現語義冗余、視角沖突以及跨視角信息不一致等問題,本文為確保多視圖間的一致性,多視角場景描述經預訓練 VLM 的語言編碼器和冗余消除函數處理,去除冗余并生成統一語義表示。最終,每個片段生成層次化場景描述。

其中編碼全局場景語境 (如天氣、道路類型、時間), 每個物體實例由類別、邊界框 和有根據的描述構成。通過該模塊的結構設計,模塊能夠生成具備跨視角一致性的語義表征,從而為視頻與 LiDAR 模態的聯合生成提供細粒度的語義引導。

視頻生成模型

如圖 2 中 camera_branch,Genesis 的視頻生成模塊以 DiT 為骨干,引入 3D-VAE 編碼與結構化語義先驗,構建出具備時空一致性的生成架構。Camera 分支將場景布局信息與語言描述通過注意力機制深度耦合,使生成的視頻不僅具備視覺真實感,更能遵循語義邏輯。

我們發現,目前自動駕駛場景視頻生成的疼點在于行人難以清晰地生成,為此,我們創新性地利用 YOLOv8x-Pose 檢測行人姿態并投影到各視角,以此增強動態場景的語義表達。

具體實現上,我們首先構建包含車道段和 3D 邊界框的結構化場景布局,將其投影到各視角 2D 圖像平面形成語義控制圖,再通過 Control-DiT 模塊的交叉注意力機制在每個去噪時間步融入這些結構化先驗,實現對生成過程的引導。

在隱空間編碼方面,借助 3D VAE 將多幀 BEV 圖壓縮為隱空間表示,解碼器從去噪詞元中重建 BEV 語義。訓練目標函數為:

通過交叉熵損失、KL 散度和 Lovasz 損失的聯合優化,確保語義信息的準確捕捉。此外,通過 DataCrafter 模塊生成的場景描述經 T5 編碼器處理為文本嵌入,與 BEV 圖編碼后的特征共同作為條件輸入 DiT 塊,通過交叉注意力實現高階語義對生成的調制:

最后,模塊集成的語義對齊控制 Transformer 通過控制注意力將語義特征注入擴散塊早期階段,并結合空間自注意力、跨視角注意力和時間注意力機制,全面保障多視角視頻生成的時空連貫性與語義保真度。

激光雷達生成模型

如圖 2 中 lidar_branch,激光雷達生成模塊致力于生成幾何精確且時空連貫的點云序列,通過點云自動編碼器與時空擴散模塊的協同設計,結合跨模態語義條件實現多傳感器數據的一致性生成。

如圖 4,首先,點云自動編碼器將稀疏點云體素化為 BEV 網格,利用 Swin Transformer 骨干網絡壓縮為隱空間特征,再通過 Swin 解碼器與 NeRF 渲染模塊重建點云,過程中采用空間跳躍算法減少空網格誤差,并通過深度 L1 損失、占用損失和表面正則化損失優化訓練,同時引入后處理過濾噪聲點。

時空擴散模塊以自動編碼器的隱空間特征為基礎,采用雙 DiT 網絡結合 ControlNet 架構,集成場景描述、道路圖等語義條件,以及 3D 邊界框幾何條件;為保證跨模態一致,通過 LSS 算法將視頻分支的 RGB 圖像轉為 BEV 特征,與道路圖特征拼接后輸入 ControlNet。擴散過程中,隱空間詞元通過交叉注意力融合語義與幾何嵌入,交叉注意力操作的公式為:

其中,嵌入值分別來自道路草圖和三維邊界框。為確保時間一致性,STDiT-Block-L 采用了多頭自注意操作。給定輸入,標記更新為

在無首幀條件設定下,本文的方法實現了 83.10 的多幀 FVD 和 14.90 的多幀 FID,優于 DriveDreamer-2 等先前的工作。在有首幀條件設定下,本文的方法進一步提升至 16.95 的 FVD 和 4.24 的 FID,與 MiLA 相比展現出具有競爭力的結果,同時保持了時間一致性和結構保真度。在有噪聲隱空間設定下,在 6019 個樣本上實現了 67.87 的 FVD 和 6.45 的 FID,超過了 UniScene 報告的先前最佳結果。

LiDAR 生成結果

表 2 展現了先前最先進的方法與本文提出的 Genesis 框架在激光雷達序列生成性能方面的定量比較。評估標準遵循 HERMES 的設定進行,在水平面 [?51.2, 51.2] 米以及高度 [?3, 5] 米的空間范圍內,使用 Chamfer distance 作為主要指標。在短期和長期預測方面,Genesis 始終優于現有方法。在預測時長為 1 秒時,它的 Chamfer distance 達到 0.611,比之前的最佳值(HERMES 的 0.78)高出 21%。在預測時長為 3 秒時,優勢擴大到相對減少 45%(從 1.17 降至 0.633)。

下游任務實驗

本文的方法在多個下游感知任務上評估了生成數據的效用。如表 5 所示,本文的方法在 BEVFormer 3D 目標檢測中取得了最佳的平均交并比(38.01)和平均精度均值(27.90)。如表 6 所示,本文評估了生成數據在 BEVFusion 3D 目標檢測框架上的有效性。在所有設置中,本文的方法都取得了一致的改進,mAP 從 66.87 提高到 67.78,NDS 從 69.65 提高到 71.13。攝像頭和激光雷達模態的聯合生成實現了的最高增益(+0.91 mAP / +1.48 NDS),證明了多模態生成的互補優勢。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-07 09:31:19

自動駕駛3D

2023-09-06 09:59:12

雷達技術

2025-09-16 10:28:57

2025-11-11 02:05:00

多模態ROCSOTA

2025-08-27 09:08:00

AI視覺模型

2022-01-13 13:38:29

激光雷達車燈

2023-09-08 11:55:19

雷達視覺

2022-02-16 10:56:32

雷達4D汽車

2024-04-24 11:29:54

模型雷達

2019-04-24 23:02:25

激光雷達3D檢測

2025-02-10 08:40:00

訓練數據模型

2024-05-21 07:54:30

視頻多模態語義檢索算法

2023-05-22 10:00:09

雷達激光

2023-04-25 11:49:28

3D視覺

2024-03-25 12:40:19

訓練模型

2023-06-16 09:55:29

2023-05-16 10:32:33

雷達技術
點贊
收藏

51CTO技術棧公眾號

国产97在线播放| 亚洲国产精品中文| 欧美性视频在线播放| 午夜精品小视频| 校园春色综合网| 精品国产一区二区三区久久久狼| 四虎成人免费视频| 日韩中文在线播放| 亚洲国产精品久久久久婷婷884| 欧美极品一区| 国产 欧美 自拍| 老司机精品视频导航| 97热精品视频官网| 男人天堂资源网| 色综合久久中文| 3d动漫精品啪啪1区2区免费| 国产精品-区区久久久狼| 黄色成人在线观看| 国产三级欧美三级| 精品国产免费人成电影在线观...| 中文天堂在线播放| 国产日韩欧美一区在线| 久久成人这里只有精品| 欧美黄色高清视频| 日韩欧美美女在线观看| 日韩欧美的一区| 色一情一区二区| 久久青青视频| 调教+趴+乳夹+国产+精品| 国产精品亚洲天堂| 在线视频1区2区| 91色视频在线| 国产一区免费在线| 精品国产999久久久免费| 蜜桃久久av一区| 国产精品pans私拍| av网站中文字幕| 亚洲精品看片| 午夜精品福利在线观看| 久草视频在线资源| 最新精品国产| 久久久精品国产| 美国一级片在线观看| 色男人天堂综合再现| 国产午夜精品美女视频明星a级| 国产乱了高清露脸对白| 免费成人蒂法| 亚洲高清色综合| 国产精品久久AV无码| 女仆av观看一区| 亚洲精品一区二区三区不| 亚洲欧美日韩色| 久久影院资源站| 亚洲国产小视频在线观看| 日韩精品视频一区二区| 国产欧美一区二区三区米奇| 精品国产百合女同互慰| 老司机午夜免费福利| 精品欧美午夜寂寞影院| 日韩电影网在线| www.色天使| 精品国产一区二区三区av片| 深夜福利一区二区| 少妇被躁爽到高潮无码文| 欧美另类专区| 国外视频精品毛片| av黄色在线播放| 男女男精品视频| 成人有码视频在线播放| 亚洲狼人综合网| 97se狠狠狠综合亚洲狠狠| 欧美日韩精品免费观看视一区二区| 久草视频视频在线播放| 中文字幕制服丝袜一区二区三区 | 亚洲成人一二三| 91猫先生在线| 欧美videos粗暴| 日韩欧美一卡二卡| 毛茸茸多毛bbb毛多视频| 欧美热在线视频精品999| 色偷偷av亚洲男人的天堂| 538精品在线观看| 午夜亚洲激情| 国产欧美va欧美va香蕉在| 精品人妻av一区二区三区| 99久久综合国产精品| 日韩欧美激情一区二区| 污视频在线看网站| 色综合天天综合| 污污视频在线免费| 米奇777超碰欧美日韩亚洲| 日韩性生活视频| 欧美激情亚洲综合| 另类人妖一区二区av| 国产成人免费电影| 3p视频在线观看| 午夜伊人狠狠久久| 97超碰人人爽| 欧美猛男男男激情videos| zzjj国产精品一区二区| 欧美一二三区视频| 国产一区二区福利| 欧美性xxxx69| wwww亚洲| 69堂成人精品免费视频| 久久久久国产精品区片区无码| 99精品视频在线| 欧美与欧洲交xxxx免费观看| 国产福利视频导航| 国产精品视频麻豆| 日本少妇高潮喷水视频| 宅男噜噜噜66国产精品免费| 亚洲美女视频网站| 国产大片中文字幕| 国产资源精品在线观看| 日韩色妇久久av| 筱崎爱全乳无删减在线观看 | 国产精品一区二区三区久久久 | 91九色成人| 亚洲欧洲成视频免费观看| 精品在线视频免费观看| 狠狠色伊人亚洲综合成人| 先锋影音网一区| 日韩大尺度黄色| 日韩精品黄色网| 三级影片在线看| 国产呦萝稀缺另类资源| 亚洲精品高清视频| 素人一区二区三区| 亚洲三级 欧美三级| 国产精品21p| 2020国产精品| av免费中文字幕| 久久综合五月婷婷| 性欧美xxxx视频在线观看| 丰满人妻av一区二区三区| 亚洲综合精品自拍| 2025中文字幕| 韩国亚洲精品| 国产一区高清视频| 蜜臀久久精品| 精品无人区乱码1区2区3区在线| 日韩精品无码一区二区| 丁香天五香天堂综合| 99在线免费视频观看| 成人盗摄视频| 欧美亚洲在线播放| 欧洲成人av| 日本高清不卡一区| 亚欧精品视频一区二区三区| 免费国产亚洲视频| 亚洲一区3d动漫同人无遮挡 | 成人午夜激情影院| 亚洲精品久久久久久久蜜桃臀| 4438全国亚洲精品观看视频| 久久91精品国产91久久久| 精品人妻一区二区三区换脸明星| 亚洲自拍偷拍麻豆| 国产ts丝袜人妖系列视频 | 欧美午夜激情在线| av男人的天堂av| 美女免费视频一区| 黄色网址在线免费看| 视频二区欧美| 性金发美女69hd大尺寸| 大片免费播放在线视频| 欧美午夜不卡在线观看免费| 国产黄色录像片| 高清不卡在线观看av| a级黄色一级片| 欧美少妇xxxx| 亚洲精品日韩av| 草草视频在线观看| 中文字幕一精品亚洲无线一区| 国产裸体永久免费无遮挡| 亚洲午夜久久久| 免费看污片网站| 国产真实乱对白精彩久久| 毛片av在线播放| 久久99国产成人小视频| 成人免费视频97| xxxx成人| 久久久成人精品视频| 天堂网av在线播放| 欧美日韩一区二区三区高清| 国产一级在线观看视频| 久久精品一区二区三区四区| 四川一级毛毛片| 久久男女视频| 黑人巨茎大战欧美白妇| 亚洲成在人线免费观看| 91久久综合亚洲鲁鲁五月天| 中文在线中文资源| 久久中国妇女中文字幕| 久久精品a一级国产免视看成人| 欧美顶级少妇做爰| 色一情一乱一伦| 一区二区三区成人| 特级西西www444人体聚色| 成人亚洲一区二区一| 在线观看免费污视频| 99综合精品| 国产欧美久久久久| 日韩欧美大片| 日本黄网免费一区二区精品| 99re8这里有精品热视频免费| 国产精品午夜国产小视频| 2001个疯子在线观看| 久久av红桃一区二区小说| 东凛在线观看| 亚洲欧美综合区自拍另类| 日本激情一区二区| 6080yy午夜一二三区久久| 一级片在线观看免费| 性欧美大战久久久久久久久| 色欲一区二区三区精品a片| 国产日韩欧美综合在线| 午夜av免费看| 成人高清av在线| 老司机av网站| 国产在线视频不卡二| 亚洲欧美自偷自拍另类| 久久久久久色| 哪个网站能看毛片| 国产亚洲毛片在线| 国产一区二区在线视频播放| 韩国一区二区三区在线观看| 久久www视频| 午夜日韩激情| av日韩在线看| 欧美激情五月| 成人免费a级片| 欧美特黄一级| 欧洲精品在线播放| 亚洲天堂偷拍| 福利视频一二区| 夜夜嗨网站十八久久| av免费观看国产| 一本色道久久综合亚洲精品不卡| 热99这里只有精品| 亚洲欧美日韩视频二区| 欧美亚洲国产成人| 噜噜爱69成人精品| 日韩毛片在线免费看| 可以看av的网站久久看| 人妻熟女一二三区夜夜爱| 久久久天天操| 天天操天天爽天天射| 理论电影国产精品| 国产一级片中文字幕| 国产成人av一区二区三区在线观看| 成人亚洲免费视频| 国产高清精品在线| 国产伦精品一区二区免费| 91在线视频免费观看| 一级黄色录像毛片| 综合电影一区二区三区| 国产精品成人免费观看| 精品久久香蕉国产线看观看gif| 欧美三日本三级少妇99| 欧美午夜片在线免费观看| 波多野结衣二区三区| 欧美日韩在线精品一区二区三区激情| 国产一区二区三区中文字幕 | 欧美色图校园春色| 高清不卡一区二区| 在线观看av中文字幕| 国产三级精品三级| 婷婷伊人五月天| 亚洲成人在线免费| 亚洲精品91天天久久人人| 51精品视频一区二区三区| 老牛影视av牛牛影视av| 亚洲欧美精品伊人久久| 黄网页免费在线观看| 欧美黑人又粗大| 全亚洲第一av番号网站| 91免费高清视频| 欧美电影在线观看免费| 亚洲国产日韩综合一区| 精品1区2区3区4区| 杨幂毛片午夜性生毛片 | 中文字幕av久久爽一区| 亚洲精品成人少妇| 国产伦精品一区二区三区视频网站| 欧美日本一区二区在线观看| 人妻偷人精品一区二区三区| 在线观看欧美视频| 精灵使的剑舞无删减版在线观看| 日本乱人伦a精品| 九九99久久精品在免费线bt| 久久资源亚洲| 欧美成人久久| 超碰在线播放91| 白白色亚洲国产精品| 91ts人妖另类精品系列| 精品国产成人在线| 国产精品欧美久久久久天天影视| 日韩精品视频观看| 亚洲综合图区| 国产精品美女免费| 欧美日韩大片免费观看| 看一级黄色录像| 蜜桃视频在线一区| 我和岳m愉情xxxⅹ视频| 一区二区三区免费看视频| 中文字幕av片| 亚洲欧洲一区二区三区在线观看| 日本欧美电影在线观看| 国产在线a不卡| 日本大胆欧美| 欧美日韩在线成人| 91亚洲大成网污www| 麻豆changesxxx国产| 欧美理论片在线| 国产日产精品久久久久久婷婷| 国内精品久久久| 视频精品一区二区三区| 一级黄色免费在线观看| 日本成人超碰在线观看| 性久久久久久久久久| 亚洲五月六月丁香激情| www.黄色片| 不卡av在线播放| 亚洲精品三区| 亚洲一区二区高清视频| 日韩电影一区二区三区| 波多野结衣a v在线| 狠狠色香婷婷久久亚洲精品| 农村少妇久久久久久久| 久久久在线视频| 国产毛片精品| 欧美黑人经典片免费观看| 成人免费观看视频| 精品久久免费视频| 亚洲第一男人天堂| 美女av在线免费看| 久久国产精品亚洲va麻豆| 精品白丝av| 一区二区视频观看| 狠狠色噜噜狠狠狠狠97| 邻居大乳一区二区三区| 日韩av不卡电影| 欧美日韩久久精品| 亚洲久久中文字幕| 亚洲日韩欧美一区二区在线| 国产精品久久久久久久一区二区 | 色一区二区三区| 久久久久久久久四区三区| 午夜亚洲福利在线老司机| 精品国产av无码| 欧美日韩国产首页| 看黄网站在线| 国产福利久久精品| 亚洲欧洲一区| 中文字幕免费视频| 欧美久久久久久久久中文字幕| 免费黄色网址在线观看| 91精品在线影院| 亚洲福利专区| 加勒比一区二区| 欧美色涩在线第一页| 成人午夜在线影视| 国产一区二区三区无遮挡| 午夜在线播放视频欧美| 久久久久麻豆v国产| 欧美xingq一区二区| 一区二区乱码| 影音先锋欧美资源| 成人精品视频.| 亚洲av无码不卡| 久久久精品999| 亚州综合一区| 在线观看av网页| 亚洲制服欧美中文字幕中文字幕| 日本亚洲一区| 成人黄色影片在线| 亚洲精品影视| 懂色av蜜臀av粉嫩av永久| 精品国产乱子伦一区| 黄瓜视频成人app免费| 400部精品国偷自产在线观看| av色综合久久天堂av综合| 超碰在线免费97| 欧美极品少妇与黑人| 少妇精品久久久一区二区三区| aaa一级黄色片| 欧美日韩国产综合视频在线观看中文 | 日韩高清在线| 国产aaa免费视频| 欧美高清一级片在线观看| 亚洲国产综合一区| 国产精品专区h在线观看| 在线精品一区| 亚洲国产精品一区二区久久hs| 日韩精品久久久久久福利| 国产精区一区二区| 日韩福利视频在线| 亚洲成av人片一区二区三区| 免费观看在线黄色网|