精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理延展到真實物理世界,英偉達Cosmos-Reason1:8B具身推理表現超過OpenAI ο1

人工智能 新聞
近日,英偉達發布了一系列針對物理常識推理進行了專門優化的新模型:Cosmos-Reason1。從實際結果看,該模型的表現確實不錯。

在基于物理世界的真實場景進行視覺問答時,有可能出現參考選項中沒有最佳答案的情況,比如以下例子:

根據視頻中本車的動作,它接下來最有可能立即采取的行動是什么?

A:右轉,B:左轉,C:換到右車道,D:換到左車道

圖片

很顯然,這里最佳的答案應該是直行,但預先提供的 4 個選項中并沒有這個答案。也因此,目前的大多數 AI 在面臨這個問題時往往并不能識別題中陷阱,會試圖從選項中找到正確答案。比如下面展示了 ChatGPT 的回答:

圖片

當然,在日常的視覺問答任務中,這樣的錯誤無傷大雅,但一旦涉及到真實的任務場景(比如真正的自動駕駛),這樣的錯誤就是無法容忍的了。

而要正確解答這類問題,物理常識必不可少。

近日,英偉達發布了一系列針對物理常識推理進行了專門優化的新模型:Cosmos-Reason1。從實際結果看,該模型的表現確實不錯。比如針對以上問題,該模型經過一番推理后,認為給出的選項都不對,因此沒有給出選擇。

圖片

Cosmos-Reason1 針對以上視覺問答問題輸出的思考過程和答案。

據介紹,Cosmos-Reason1 不僅包含模型,更是英偉達開發的一個包含模型、本體(ontologies)和基準的套件,其目標是讓多模態 LLM 能夠生成有物理依據的響應。

目前他們已經發布了兩個多模態 LLM:Cosmos-Reason1-8B 和 Cosmos-Reason1-56B。

這兩個模型都經過了四個階段的訓練:視覺預訓練、通用 SFT物理 AI SFT 和物理 AI 強化學習。此外,他們還為物理常識和具身推理定義了本體,并構建了用于評估多模態 LLM 的物理 AI 推理能力的基準。

圖片

下面我們就來具體看看英偉達的這項研究成果。

圖片

  • 論文標題:Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning
  • 論文地址:https://arxiv.org/abs/2503.15558
  • 代碼地址:https://github.com/nvidia-cosmos/cosmos-reason1

物理 AI 推理

物理 AI(Physical AI)并不是一個新概念,但肯定算是英偉達近段時間最為推崇的發展方向之一 —— 在黃仁勛前些天的 GTC 2025 大會 Keynote 演講中,物理 AI 也是核心關鍵詞之一。

根據英偉達官網的定義:物理 AI 是指使用運動技能理解現實世界并與之進行交互的模型,它們通常封裝在機器人或自動駕駛汽車等自主機器中。

在今天介紹的這篇論文中,英偉達首先定義了物理常識(physical common sense)的本體論(ontology)。

圖片

可以看到,其中包含三大類別:空間、時間和其它基本物理。這三大類又被進一步分為 16 類,如下表 1 所示。

圖片

此外,該團隊也定義了具身推理的本體論,其中涉及處理復雜的感官輸入、預測動作效果、尊重物理約束、從互動中學習;詳見下表。

圖片

Cosmos-Reason1

下面將介紹 Cosmos-Reason1 的多模態架構以及 LLM 主干選擇。

多模態架構

為了構建多模態 LLM,現在已經有多種不同的架構選擇。常用的架構是僅解碼器架構(例如 LLaVA)和基于交叉注意力的架構(例如 Flamingo 和 Llama 3-V)。

英偉達采用了類似于 LLaVA 和 NVLM-D 的僅解碼器架構,因為它簡單且可通過將其它模態 token(圖像或視頻)對齊到文本 token 嵌入空間來統一處理所有模態。

具體來說,該模型的架構首先是一個視覺編碼器,然后是包含下采樣兩層 MLP 的 projector,然后是僅解碼器的 LLM 主干。

圖片

具體選擇上,英偉達這里使用了 InternViT-300M-V2.5 作為 Cosmos-Reason1-8B 和 Cosmos-Reason1-56B 的視覺編碼器。

對于每張輸入圖像,該架構會動態調整圖像以達到預定義的寬高比,并將其分割成 1 到 12 個圖塊,每個圖塊的尺寸為 448 × 448 像素,具體取決于圖像的分辨率。此外,還會生成一個縮略圖圖塊 —— 完整圖像的縮小版本,以保留全局上下文。

對于每段輸入視頻,則以最高每秒 2 幀的速率均勻采樣最多 32 幀,并將每幀的大小調整為 448 × 448 像素。對于每個 448×448 視頻幀輸入,視覺編碼器會生成 1,024 個視覺 token,其圖塊大小為 14×14,然后使用 PixelShuffle 將其下采樣 2×2 倍,通過將空間維度轉換為通道維度將其減少到 256 個 token。

來自多個圖塊的圖像 token 與交錯的圖塊 ID 標簽連接在一起,而來自多個幀的視頻 token 則會直接連接在一起。

Cosmos-Reason1 的 LLM 主干采用了混合 Mamba-MLP-Transformer 架構設計。

表 3 總結了其模型配置:

圖片

混合 Mamba-MLP-Transformer 主干

最近英偉達發布了不少 Mamba-Transformer 混合架構的研究成果,事實上我們昨天就正巧介紹過其中兩個:Nemotron-H 和 STORM。

而今天我們介紹的 Cosmos-Reason1 系列模型則采用了 Mamba-MLP-Transformer 混合架構,如下圖所示。

圖片

在訓練時,Cosmos-Reason1-8B 模型采用了 4 的張量并行化(TP=4),而 Cosmos-Reason1-56B 模型則采用了 8 的張量并行化和 2 的管道并行化(TP=8, PP=2)—— 可支持更長視頻的訓練。

實驗表現

下面我們簡單看看 Cosmos-Reason1 系列模型的實驗表現。有關實驗的更多詳細設置和討論請閱讀原論文。

物理 AI 監督式微調的效果

首先來看經過物理 AI 監督式微調后,Cosmos-Reason1 的物理常識表現。如表 7 所示,Cosmos-Reason1-8B 和 Cosmos-Reason1-56B 在各自的主干網絡基礎上都有明顯提升,其中 56B 版本的準確度表現最好,甚至略微超過了 OpenAI ο1。

圖片

要知道,這個結果是在強化學習訓練之前取得的。這彰顯了該團隊精心挑選的常識數據集的有效性,為進一步的 RL 改進奠定了堅實的基礎。

接下來看看經過物理 AI 監督式微調后,Cosmos-Reason1 的具身推理表現。從表 8 可以看到,Cosmos-Reason1 模型在此基準上取得了比所有基線模型明顯更好的結果,8B 和 56B 變體與各自的主干 VLM 相比均有超過 10% 的提升。

圖片

那 Cosmos-Reason1 的直覺物理理解能力如何呢?該團隊觀察到,許多 VLM 在基本物理推理方面存在困難。該團隊針對三個任務對模型的能力進行了測試,包括時間箭頭、空間拼圖和物體持久性。

表 10 展示了測試結果,可以看到在時間箭頭和物體持久性任務上,現有模型的表現和胡亂猜測差不多。而在空間拼圖任務上,GPT-4o 和 OpenAI o1 的表現卻比隨機亂猜好得多。

圖片

這表明當前的多模態模型在推理空間關系方面比推理時間動態方面更熟練。鑒于這些模型通常在 MMMU 等標準基準上表現良好,這說明現有評估其實無法體現它們對物理世界的理解能力。

然而,該團隊精心設計的直覺物理數據集可使 8B 模型能夠在所有三個任務上有顯著提升,就展現 Cosmos-Reason1 在直覺物理推理方面的基本能力。

物理 AI 強化學習的效果

對于上面得到的模型,該團隊又進行了進一步的后訓練,以進一步增強它們的物理 AI 推理能力。為此,該團隊構建了自己的 RL 基礎設施,并基于其針對物理常識、具身推理和直覺物理推理任務對模型進行了后訓練。注意,這里并沒有使用復雜獎勵,都是簡單的、基于規則的可驗證獎勵。

首先來看在物理常識和具身推理任務上的結果,如表 9 所示。

圖片

可以看到,物理 AI RL 后訓練可以提高模型在大多數基準上的性能,但 RoboFail 是個明顯的例外。

不過該團隊表示這并不奇怪,因為 RoboFail 是經過精心設計的人工整編的基準,具有測試「動作可供性(action affordance)」和「任務完成驗證」的高難度現實場景。該基準的難度源于幾個因素:(1) 需要高度觀察的感知或全面的時間上下文處理的樣本,(2) 與 RoboVQA 中的問題不同,可供性問題涉及動作執行中的復雜物理約束。

該團隊認為,在 RoboFail 上的表現不提升的主要原因是代表性訓練數據不足。

該團隊還發現了一個有趣現象:新提出的模型學會了仔細評估所提供的選項,如果問題不明確,則會全部拒絕。如本文開始時舉的例子所示,該模型會評估每個選項的可行性,并在出現歧義時采取不在選擇范圍內的保守行動。

最后,在直覺物理推理任務上,如上表 10 所示,通過精心的監督式微調數據整編和針對性訓練,Cosmos-Reason1-8B 在所有任務上都取得了顯著的進步,而物理 AI RL 能夠進一步增強模型的空間拼圖和物體持久性能力。然而,推理時間箭頭仍然很困難。

整體來說,物理 AI RL 可以提升模型在空間、時間和物體持久性方面的推理能力。

圖 9 展示了在 RL 前后 Cosmos-Reason1 的時間推理能力的差異??梢钥吹?,該模型能夠識別反物理的運動 —— 例如粉末違背重力上升到碗中,同時不受視頻中靜止干擾物的影響。這表明它的推理不僅僅是感知。

圖片

類似地,在圖 10 中可以看到,有 RL 的模型傾向于將空間問題與時間推理混淆。雖然他們可以感知到第二幀與第一幀缺乏相似性,但它們固有的偏見會導致它們遵循默認的視頻順序,這表明它們更多地依賴于時間線索而不是真正的空間理解。

圖片

使用空間謎題來進行 RL 可讓模型從第一幀中提取關鍵特征,并在多幀之間系統地比較它們,從而準確地確定空間關系。

最后,圖 11 表明,即使 CoT 較長,沒有物理 AI RL 的模型也會難以理解物體持久性,經常難以推理物體的出現和消失。相比之下,經過 RL 的模型可通過直接而簡潔的推理快速得出結論。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-13 09:03:00

2025-03-19 09:52:50

2025-07-30 09:05:00

2024-09-24 11:01:03

2025-03-19 10:10:43

2025-03-07 10:24:43

2024-08-28 13:34:13

2024-12-26 11:45:48

2025-06-04 13:56:06

英偉達訓練模型

2022-06-01 16:47:53

AI模型開源

2025-02-03 14:06:32

2025-08-19 09:14:44

2024-08-16 12:46:08

2025-10-28 09:16:38

2025-10-27 08:54:00

2023-03-22 13:53:26

芯片英偉達

2025-05-12 09:02:00

2022-02-19 18:39:34

AI數據訓練

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達
點贊
收藏

51CTO技術棧公眾號

成人观看高清在线观看免费| 亚洲欧美日韩视频一区| 91麻豆精品国产91久久久更新时间| 亚洲精品视频久久| 五月婷婷激情久久| 日本在线视频网址| 国产亚洲欧美一级| 91成人伦理在线电影| 草久久免费视频| 久久视频国产| 日韩成人av一区| 拔插拔插华人永久免费| 久草在线资源福利站| 国产精品免费免费| 国产伦视频一区二区三区| 一区二区三区麻豆| 亚洲第一毛片| 日韩在线观看高清| 在线免费观看成年人视频| www.久久久.com| 色婷婷精品大在线视频| 中文精品无码中文字幕无码专区| 国产在线观看免费网站| 丁香婷婷综合激情五月色| 国产精品美女在线观看| 可以免费看的av毛片| 91精品国产成人观看| 亚洲男人天堂网站| 中文字幕乱码在线| 清纯唯美激情亚洲| 欧美亚洲综合另类| 国产精品视频一区二区三区四区五区 | 午夜精品毛片| 亚洲午夜精品视频| 中文字幕丰满孑伦无码专区| 一区二区三区四区视频免费观看 | 99在线观看免费| 日韩电影在线观看电影| 51精品在线观看| 唐朝av高清盛宴| 久久精品久久久| 日韩在线视频国产| 国产农村妇女精品一区| 国产精品一在线观看| 日韩av中文字幕在线| 亚洲成人福利视频| 亚洲精品国产九九九| 欧美一级理论性理论a| 九九热免费在线观看| 日本精品裸体写真集在线观看| 日韩欧美极品在线观看| 少妇无码av无码专区在线观看| 青青草原av在线| 亚洲一线二线三线视频| 黄色一级片av| 91网址在线观看| 亚洲午夜在线视频| 日本一级黄视频| 丁香花在线影院| 亚洲成人自拍网| 欧美日韩成人免费视频| 天天综合av| 色婷婷综合在线| 亚洲福利精品视频| 成人黄色91| 日韩女优av电影| 日本性生活一级片| 天天躁日日躁成人字幕aⅴ| 日韩精品在线免费播放| 91久久免费视频| 国产一区二区三区电影在线观看| 亚洲天堂久久av| 亚洲一级片在线播放| 国产精品99久久精品| 粗暴蹂躏中文一区二区三区| 久久久久久久久久久网| 99精品国产福利在线观看免费| 91av视频在线免费观看| 久久精品五月天| 久久国产欧美日韩精品| 91手机在线视频| 无套内谢的新婚少妇国语播放| 久久一二三国产| 亚洲精品一区二| 视频在线这里都是精品| 精品国产福利视频| 天堂av在线网站| 日韩在线精品强乱中文字幕| 日韩av综合网站| 精品丰满少妇一区二区三区| 欧美精品不卡| 日本sm极度另类视频| 一本色道久久综合无码人妻| 国产91对白在线观看九色| 久久综合色一本| 男人资源在线播放| 亚洲大片在线观看| 一个色综合久久| 在线观看视频一区二区三区| 亚洲女人被黑人巨大进入| 免费精品在线视频| 亚洲一级网站| 国产精品吴梦梦| 特黄视频在线观看| 国产精品大尺度| 国产免费观看高清视频| 巨大黑人极品videos精品| 精品成人一区二区三区四区| 久久久视频6r| 在线精品一区二区| 成人免费淫片视频软件| 欧美女子与性| 一区二区三区久久久| 牛夜精品久久久久久久| 另类图片第一页| 久久久精品一区二区| 无码视频在线观看| 粉嫩一区二区三区性色av| 一本久道久久综合| av高清不卡| 亚洲精品一区二区三区蜜桃下载 | 五月婷婷久久丁香| 亚洲一区二区三区观看| 国精一区二区| 欧美一性一乱一交一视频| 精品国产伦一区二区三| 国产精品成人网| 国产成人久久777777| 久草精品视频| 欧美激情国产日韩精品一区18| 一本大道伊人av久久综合| 国产午夜亚洲精品不卡| 亚洲国产精品久久久久婷蜜芽| 欧美专区一区| 久久在线视频在线| 亚洲在线精品视频| 国产欧美久久久精品影院| 欧美性大战久久久久xxx| 9l视频自拍蝌蚪9l视频成人| 久久色在线播放| 在线观看国产精品视频| 亚洲国产高清在线| 黄色三级视频在线| 欧美日韩性在线观看| 国产成人精品日本亚洲专区61| 午夜福利视频一区二区| 午夜精品久久久久| 在线免费播放av| 亚洲激情一区| 精品九九九九| 女人高潮被爽到呻吟在线观看| 精品国产三级a在线观看| 国精品无码一区二区三区| 韩国av一区二区| 久久精品在线免费视频| 7m精品国产导航在线| 久久久久久久久久久久久久久久久久av | av电影高清在线观看| 在线成人av网站| 中文字幕在线有码| 国产福利一区在线观看| 国产一区二区片| 丁香五月缴情综合网| 97精品免费视频| 日韩精品系列| 欧美中文字幕一二三区视频| 九一在线免费观看| 精品一区二区三区在线播放| 国产一二三四区在线观看| 在线播放一区二区精品视频| 91精品国产乱码久久久久久蜜臀| 免费a级毛片在线观看| 在线精品视频一区二区三四| 黄大色黄女片18免费| 国产麻豆精品theporn| 女人色极品影院| 狠狠久久伊人| 国产91色在线免费| 老司机在线视频二区| 日韩美女主播在线视频一区二区三区 | 亚洲电影第三页| 在哪里可以看毛片| 精品一区二区三区日韩| 国产av熟女一区二区三区| 校花撩起jk露出白色内裤国产精品| 国产精品第8页| 黄色成人在线观看| 亚洲国产一区自拍| 在线观看国产成人| 午夜视频在线观看一区二区三区| 欧美熟妇一区二区| 极品少妇xxxx精品少妇| www.av中文字幕| 日韩成人综合| 国产麻豆一区二区三区在线观看| 欧美成人影院| 欧美激情一级二级| 91在线视频免费看| 精品国产乱码久久久久久图片| 无码人妻精品一区二区三区9厂 | 972aa.com艺术欧美| 免费看污污网站| 亚洲日本视频| 免费观看国产视频在线| 国产精品一线天粉嫩av| 国产精品国产精品国产专区蜜臀ah| 欧美电影免费观看| 午夜精品蜜臀一区二区三区免费| 91精品国产综合久久久久久豆腐| 精品1区2区在线观看| 中文字幕你懂的| 黑人巨大精品欧美一区二区免费| 91香蕉视频污在线观看| 91网页版在线| jjzzjjzz欧美69巨大| 久久99热这里只有精品| 丰满少妇被猛烈进入高清播放| 欧美va天堂在线| 亚洲日本精品国产第一区| 欧美电影在线观看完整版| 91亚洲永久免费精品| 写真福利精品福利在线观看| 韩日欧美一区二区| 色图在线观看| 另类色图亚洲色图| 夜级特黄日本大片_在线 | 在线免费看黄视频| 成人av在线电影| 无人码人妻一区二区三区免费| 日本午夜一区二区| 国产精品欧美激情在线观看| 亚洲一级黄色| 亚洲 欧美 综合 另类 中字| 亚洲国产精品久久久久蝴蝶传媒| 一本久久a久久精品vr综合| 精品免费一区二区| 日本视频精品一区| 少妇精品久久久一区二区| 精品一卡二卡三卡四卡日本乱码| 一区二区三区四区高清视频| 97av影视网在线观看| 日本在线视频一区二区三区| 91网站免费观看| 懂色av色香蕉一区二区蜜桃| 成人久久久久久久| 国产 日韩 欧美| 91免费看蜜桃| swag国产精品一区二区| 国产精品久久久久久久免费大片 | 中文字幕精品一区日韩| 久久高清精品| 国产四区在线观看| 欧美成人日韩| 一卡二卡三卡视频| 91久久午夜| 日韩视频第二页| 肉肉av福利一精品导航| www欧美激情| 激情欧美一区二区三区在线观看| 国产成人美女视频| 国产精品自在欧美一区| 国产精品99精品无码视亚| 国产寡妇亲子伦一区二区| 国产人妻精品午夜福利免费| 成人涩涩免费视频| 一出一进一爽一粗一大视频| 久久蜜桃av一区二区天堂| 天天舔天天操天天干| 国产精品成人在线观看| 国产一级特黄毛片| 欧美性色视频在线| 亚洲永久精品视频| 欧美tk—视频vk| 桃花色综合影院| 中文字幕在线看视频国产欧美在线看完整 | 欧美韩国日本在线观看| 超碰97在线看| 宅男噜噜噜66一区二区| 国产无套粉嫩白浆内谢的出处| 久久国产人妖系列| 完美搭档在线观看| 国产亚洲精品资源在线26u| 国产精品麻豆免费版现看视频| 怡红院av一区二区三区| 国产高清中文字幕| 91精品黄色片免费大全| 日韩一区二区三区不卡| 一区二区三区四区在线观看视频| www.久久久久.com| 欧美在线一级va免费观看| 日韩av黄色| 久久99精品久久久久久久青青日本| 国产最新精品| youjizz.com在线观看| 日韩电影免费在线看| 精品人妻在线视频| 国产精品美女久久久久久久网站| 久久中文字幕在线观看| 欧美亚一区二区| 天堂v在线观看| 久久精彩免费视频| 综合在线影院| 国产精品免费一区二区三区在线观看 | 日韩中文字幕一区二区高清99| 成人午夜碰碰视频| 免费黄色a级片| 欧美经典一区二区| 日本三级欧美三级| 91精品国产入口在线| 精品999视频| 国模gogo一区二区大胆私拍| 24小时成人在线视频| 欧美国产综合视频| 激情另类综合| 免费人成视频在线播放| 国产欧美精品一区二区色综合| 国产无码精品在线播放| 3d动漫精品啪啪一区二区竹菊| 精品久久久久一区二区三区| 欧美黄色片免费观看| 高清欧美日韩| 欧美一区二区视频17c| 亚洲看片一区| 91超薄肉色丝袜交足高跟凉鞋| 国产精品久久毛片av大全日韩| 五月婷婷激情视频| 亚洲国产私拍精品国模在线观看| 任你弄在线视频免费观看| 成人性生交大片免费看小说 | 国产极品嫩模在线观看91精品| 快播亚洲色图| 99日韩精品| 久久久久9999| 五月天欧美精品| 日本wwwxxxx| 午夜精品久久久久久99热软件| **爰片久久毛片| 超碰97在线看| 成人美女视频在线观看18| 男女免费视频网站| 日韩欧美精品在线| 怡红院在线观看| 成人看片在线| 99国产一区| 李宗瑞91在线正在播放| 色综合久久九月婷婷色综合| 日本ー区在线视频| 青青草原一区二区| 国产精品中文字幕亚洲欧美| 男人亚洲天堂网| 国产日韩一级二级三级| 中文字幕+乱码+中文乱码www| 中文国产成人精品久久一| 高清在线一区| 强开小嫩苞一区二区三区网站| 国产乱子伦视频一区二区三区| 日本一级二级视频| 精品日产卡一卡二卡麻豆| 金瓶狂野欧美性猛交xxxx| 精品一区日韩成人| 久久最新视频| 中国1级黄色片| 日韩欧美综合一区| 爱啪啪综合导航| 人禽交欧美网站免费| 久久国产免费看| 久久久国产成人| 亚洲精品电影在线| 天然素人一区二区视频| 亚洲 欧洲 日韩| 懂色av噜噜一区二区三区av| www..com国产| 日韩在线观看网站| 136国产福利精品导航网址应用| 国产青青在线视频| 国产欧美视频一区二区三区| 136福利视频导航| 欧美—级高清免费播放| 亚洲区小说区图片区qvod| 色国产在线视频| 一区2区3区在线看| 黄上黄在线观看| 91中文在线视频| 国产视频一区欧美| 操她视频在线观看| 亚洲精品电影网| 国产亚洲精品精品国产亚洲综合| 久久久无码中文字幕久...| 91麻豆123| 国产手机av在线| 欧洲精品在线视频| 欧美成人一区二免费视频软件| aaaaa一级片| 欧美大肚乱孕交hd孕妇| 欧美freesex| 久草免费福利在线| 亚洲国产精品二十页| 人妻一区二区三区| 成人h猎奇视频网站| 裸体素人女欧美日韩|