精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

人工智能
本文的PhysVLM模型在所有7B模型中表現優越。令人驚訝的是,作為7B模型,PhysVLM-SFT和PhysVLM-DPO在整體表現上分別比 34B 模型 LLaVA-NeXT-Video提高了3.2%和3.8%的絕對值。通過比較PhysVLM-SFT和PhysVLM-DPO,團隊發現,使用所提出的PhysDPO數據進行 DPO訓練在短視頻和長視頻上的表現都有所提升,而在中等長度的視頻上的表現略

融合物理知識的大型視頻語言模型PhysVLM,開源了!

它不僅在 PhysGame 基準上展現出最先進的性能,還在通用視頻理解基準上(Video-MME, VCG)表現出領先的性能。

在這項研究之前,想讓AI像人類兒童一樣,通過觀察世界理解基本的物理常識,是一個主要挑戰。

圖片圖片

對于現實世界的視頻來說,全面覆蓋和解釋所有正常的物理現象既困難又不必要。

相比之下,游戲視頻(gameplay videos)通常包含違反物理常識的“故障現象”(glitches),這有助于簡化物理常識理解的定義和評估,即專注于解釋物理常識的違反現象,而不是試圖列舉所有存在的正常物理現象。

為此,PhysVLM在專門整理的一套數據集上訓練,包括用于評估的PhysGame benchmark、用于監督微調的PhysInstruct數據集和用于偏好對齊的PhysDPO數據集。

PhysGame benchmark 設計

如圖所示, PhysGame包含880個含有故障現象的游戲視頻,每個視頻都配有一個高質量的多項選擇題,專門針對故障現象的性質進行標注。

圖片圖片

△PhysGame類別分布

PhysGame涵蓋了四個關鍵的物理領域(即力學、運動學、光學和材料屬性),并細分為12個具體類別(如重力和速度)。

  • 力學(Mechanics):該類別涉及力與力矩及其對運動的影響,提供了解釋和分析視頻中物體運動的基礎原理。典型案例包括重力、彈性和摩擦力。
  • 運動學(Kinematics):該領域研究不考慮力的情況下的運動,涉及精細分類,如隨時間變化的速度和加速度。
  • 光學(Optics):該領域關注光的行為與特性及其與物質的相互作用,包括反射、折射以及吸收與透射。
  • 材料屬性(Material properties):該領域指的是物質固有的特性,包括顏色、剛性、物體形狀以及人體姿態。

PhysGame benchmark構建

視頻收集和過濾:

PhysGame中的視頻主要從Reddit頁面抓取,該頁面包含帶有異常事件和故障現象的游戲視頻。為了平衡不同的類別,團隊還通過關鍵詞搜索從 YouTube增強視頻數據。團隊根據以下兩項標準進行人工篩查:

  • 重復檢查:Reddit論壇可能會多次引用同一視頻,導致重復下載。團隊手動檢查,確保PhysGame benchmark中的視頻不存在重復;
  • 內容檢查:下載的視頻可能包含非游戲元素,團隊對這些內容進行了嚴格篩選,確保它們不被納入PhysGame benchmark中。

選項生成:

本文以多項選擇題的形式創建問答對。具體來說,正確選項描述了視頻中違反物理常識原則的特定故障現象。為了增強干擾選項的可信度,本文要求干擾選項中的故障現象應與視頻中觀察到的個體或動作高度相關,這使視頻LLM理解故障內容,而不僅僅通過識別包含的物體或動作來選擇答案。

質量控制: 

為了保證數據集的質量,本文進行了一項包括人工檢查和自動LLM輔助檢查在內的雙重質量控制過程:

  • 人工檢查:所有初步標注的問答對都經過不同人工標注人員的嚴格交叉檢查。對于正確選項,檢查人員必須評估它們是否全面準確地描述了所有存在的物理常識違反實例。對于干擾選項,檢查人員需評估它們是否足夠具有迷惑性;
  • LLM 輔助檢查: 團隊去除那些僅憑問題和選項,不需要查看視頻就能由GPT-4o正確回答的問答對。

圖片圖片

△PhysGame示例

PhysInstruct&PhysDPO數據集構建

PhysInstruct:

為了提升視頻LLM的物理常識理解能力,團隊開發了PhysInstruct數據集用于監督微調。視頻收集過程與PhysGame中的流程相同。為了防止數據泄漏,團隊嚴格排除任何已包含在PhysGame中的視頻。團隊遵循Self-instruct范式通過提示GPT-4o來構建PhysInstruct。

PhysDPO:

團隊構建了偏好對齊數據集PhysDPO,以提供更可信和可靠的回答。如圖3所示,團隊將PhysInstruct 數據集中生成的答案視為preferred回答,而dis-preferred回答則通過元信息篡改(meta-information hacking)、時間篡改(temporal hacking)和空間篡改(spatial hacking)生成。團隊用誤導性的元信息以及減少幀數和降低幀分辨率的視頻幀來提示 GPT-4o。

以下是PhysDPO數據集構建流程圖:

圖片圖片

模型評估與分析

PhysGame benchmark 實驗結果:

  • 在所有專有模型中,GPT-4o和Gemini-1.5-pro表現最佳,分別達到了56.1%和55.2%的平均準確率。在所有細分領域中,GPT-4o在摩擦和加速度方面表現優越。相比之下,Gemini-1.5-pro在理解與重力、彈性、反射、吸收與透射、顏色和剛性相關的物理常識方面表現更強。
  • 現有的開源模型遠遠落后于專有模型。即便是表現最好的開源模型 LLaVA-OneVision,其平均準確率僅為47.7%。相比之下,本文提出的PhysVLM在所有專有和開源模型中都達到了最先進的性能。與開源方法相比,本文的PhysVLM在12個評估領域中的6個領域達到了最高性能。值得注意的是,PhysVLM-DPO在平均準確率這一指標上比最佳表現的專有模型GPT-4o超出了3.4%。

PhysGame benchmark實驗結果PhysGame benchmark實驗結果

Video-MME benchmark實驗結果:

本文的PhysVLM模型在所有7B模型中表現優越。令人驚訝的是,作為7B模型,PhysVLM-SFT和PhysVLM-DPO在整體表現上分別比 34B 模型 LLaVA-NeXT-Video提高了3.2%和3.8%的絕對值。通過比較PhysVLM-SFT和PhysVLM-DPO,團隊發現,使用所提出的PhysDPO數據進行 DPO訓練在短視頻和長視頻上的表現都有所提升,而在中等長度的視頻上的表現略有下降。

圖片圖片

△Video-MME benchmark實驗結果

VCG benchmark實驗結果:

在僅使用SFT的模型中,本文的PhysVLM-SFT在平均得分方面表現最佳。在四個子類別的評估中,PhysVLM-SFT在信息正確性和一致性類別上表現尤為出色。與使用DPO或PPO訓練的PPLLaVA和LLaVA-Next-Video相比,本文的PhysVLM-DPO也展現出卓越的性能,進一步驗證了所提出的PhysVLM模型在通用視頻理解中的出色能力。

VCG benchmark實驗結果VCG benchmark實驗結果


PhysVLM相關論文、代碼、數據均已開源:

pre-prints: https://arxiv.org/abs/2412.01800
代碼鏈接: https://github.com/PhysGame/PhysGame
leaderboard: https://physgame.github.io/#leaderboard

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-09-24 13:00:00

大語言模型AI

2025-03-03 07:39:23

2016-08-12 16:20:30

2015-12-04 14:49:21

ios9

2025-05-26 08:33:00

2019-11-17 22:45:12

谷歌Android開發者

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI

2024-08-02 13:14:51

2025-05-06 15:32:23

模型AI測試

2009-01-08 09:26:53

AMD拆分AMD股份AMD股票

2025-03-11 13:42:19

2023-10-14 17:24:49

2023-10-14 13:09:53

谷歌模型

2015-09-13 09:29:52

百分點

2017-07-12 15:30:59

人工智能知識圖譜深度學習

2024-06-20 10:43:15

2025-11-17 10:51:05

2024-06-18 12:54:39

2024-01-03 13:37:00

模型數據
點贊
收藏

51CTO技術棧公眾號

九七久久人人| 国产真实夫妇交换视频| 91成人在线| 亚洲人午夜精品天堂一二香蕉| 91久久精品www人人做人人爽| 亚洲综合网在线| 色88888久久久久久影院| 欧美日韩中文另类| 无码粉嫩虎白一线天在线观看 | 欧美色爱综合网| 国产免费内射又粗又爽密桃视频| 三级毛片在线免费看| 蜜桃一区二区三区四区| 久久久久久久久久久免费 | 奇米成人av国产一区二区三区| 亚洲色图100p| 日韩欧美中文字幕电影| 欧美一区二区在线免费播放| 37pao成人国产永久免费视频| av免费网站在线| 国产欧美综合在线观看第十页| 99久久综合狠狠综合久久止| 最新中文字幕免费| 免费视频一区二区三区在线观看| 欧美裸身视频免费观看| 亚洲欧美va天堂人熟伦| 任你躁在线精品免费| 欧美一区二区网站| 免费看污污网站| 伊人久久视频| 精品美女永久免费视频| 国产91porn| 免费在线观看黄| 国产欧美日韩在线观看| 免费在线一区二区| 天天干视频在线| 国产不卡在线视频| 91久久极品少妇xxxxⅹ软件| 亚洲天堂一二三| 日韩电影在线免费看| 98精品国产高清在线xxxx天堂| 99视频只有精品| 97久久夜色精品国产| 有码中文亚洲精品| 九九九视频在线观看| 在线日韩一区| 亚洲人精选亚洲人成在线| 毛片网站免费观看| 日韩高清成人在线| 日韩av综合中文字幕| 在线xxxxx| 国产图片一区| 日韩久久午夜影院| 97超碰在线免费观看| 欧美久久香蕉| 日韩精品在线视频美女| 亚洲成人网在线播放| 国产一区二区区别| 国产亚洲成精品久久| 熟女少妇内射日韩亚洲| 欧美日韩中文一区二区| 在线视频日本亚洲性| 99久久99久久精品免费看小说. | 国产一区二区动漫| 老头老太做爰xxx视频| 日本一本不卡| 欧美成人久久久| 国产在线视频卡一卡二| 在线视频免费在线观看一区二区| 国产69精品久久久久久| 日韩人妻精品中文字幕| 蜜臀久久久99精品久久久久久| 91精品国产综合久久久久久久久 | 色中色综合成人| 日本在线免费播放| 一区二区在线电影| r级无码视频在线观看| 在线看的毛片| 精品视频999| 丰满少妇一区二区三区专区| 久久资源综合| 一夜七次郎国产精品亚洲| 少妇高潮在线观看| 黑人一区二区| 欧美中文在线字幕| 91激情在线观看| 成人免费av网站| 婷婷久久青草热一区二区 | 日韩欧美自拍| 色综合男人天堂| 91午夜精品亚洲一区二区三区| 久久99久久久久久久久久久| 高清视频一区二区三区| 日色在线视频| 亚洲男同1069视频| 无码aⅴ精品一区二区三区浪潮 | 日本免费网站视频| 亚洲区国产区| 国产日本欧美在线观看| 日本高清视频在线| 国产精品乱码人人做人人爱| 97免费视频观看| 偷拍中文亚洲欧美动漫| 制服丝袜成人动漫| 三叶草欧洲码在线| 久久精品免费一区二区三区| 国产91成人在在线播放| 国产伦一区二区| 久久婷婷国产综合精品青草| 国产女人18毛片| 国产成人精品123区免费视频| 日韩欧美美女一区二区三区| 九九热免费在线| 翔田千里一区二区| 痴汉一区二区三区| 超碰在线观看免费版| 在线亚洲高清视频| 国产麻豆剧传媒精品国产av| 亚洲精品网址| 国产精品稀缺呦系列在线| 四虎影院在线域名免费观看| 一区二区久久久久久| 久久久久久久久久久久91| 午夜先锋成人动漫在线| 欧美激情影音先锋| a天堂在线视频| 国产精品第13页| 欧美午夜性生活| 自拍偷拍精品| 日本免费久久高清视频| 天天av天天翘| 亚洲韩国精品一区| 99热超碰在线| 国产一区亚洲| 97久草视频| 午夜伦理在线视频| 欧美一级黄色片| 777777国产7777777| 久久丁香综合五月国产三级网站| 青青成人在线| 国产精品久久亚洲不卡| 亚洲色图av在线| 亚洲午夜无码久久久久| 久久精品视频在线看| 99精品免费在线观看| 一本色道久久综合狠狠躁的番外| 国内偷自视频区视频综合| 亚洲免费不卡视频| 亚洲国产一区二区a毛片| 少妇熟女视频一区二区三区 | 中文字幕精品在线不卡| 国产裸体免费无遮挡| 精品久久久亚洲| 国产精品久久久久久亚洲影视| 高h视频在线| 欧美日韩一本到| 很污很黄的网站| 国产资源精品在线观看| 日韩中文字幕亚洲精品欧美| 日本一区二区乱| 欧美激情视频在线观看| 色窝窝无码一区二区三区| 精品国产91久久久久久老师| 中文字幕在线观看的网站| 久久九九国产| 中文字幕一区二区三区有限公司| 95精品视频| 欧美日本中文字幕| 丝袜视频国产在线播放| 欧美最新大片在线看| 国产传媒视频在线| 国产成人精品综合在线观看| 国产精品无码一区二区在线| 国产精品嫩草影院在线看| 国产精品久久一区主播| www在线免费观看视频| 亚洲成人a级网| 激情网站在线观看| 亚洲精品久久7777| 91黄色免费视频| 蜜臀av在线播放一区二区三区| 欧美日韩一区二区三区电影| 国语一区二区三区| 国产成人涩涩涩视频在线观看| 色老头视频在线观看| 日韩精品自拍偷拍| 无码视频在线观看| 一区二区三区av电影| 少妇按摩一区二区三区| 久久99精品国产麻豆不卡| 日本一本中文字幕| 成人精品影视| 国产精品久久久久av福利动漫| 电影久久久久久| 欧美国产中文字幕| 成人网视频在线观看| 欧美成人r级一区二区三区| 神马久久久久久久| 亚洲人吸女人奶水| 久久久久久国产精品无码| 国产一区二区不卡老阿姨| 久久久久人妻精品一区三寸| 亚洲人体av| 日韩黄色影视| 卡通动漫国产精品| 亚洲淫片在线视频| 视频精品导航| 97在线观看免费| 制服丝袜中文字幕在线| 在线视频亚洲欧美| 牛牛影视精品影视| 亚洲国产精品成人va在线观看| 亚洲在线视频播放| 在线免费视频一区二区| 国产性猛交普通话对白| 中文字幕日韩av资源站| 色欲av无码一区二区三区| 丁香婷婷深情五月亚洲| 免费av不卡在线| 七七婷婷婷婷精品国产| 欧美成人xxxxx| 精品不卡视频| 成人毛片100部免费看| 99精品美女| 日韩精品一区二区三区色偷偷| 老司机凹凸av亚洲导航| 国产传媒一区| 911亚洲精品| 亚洲精品免费网站| 亚洲人体在线| 国产精品一区二区久久久久| 欧美在线va视频| 国产精品成人v| 日韩久久一区二区三区| 日本精品一区二区三区在线| 春色校园综合激情亚洲| 久久久久久久一区二区| 在线电影福利片| 欧美老少配视频| 影音先锋男人在线资源| 欧美大尺度激情区在线播放| 国产精品扒开做爽爽爽的视频| www国产91| 91香蕉在线观看| 欧美俄罗斯乱妇| 欧美性爽视频| 久久久久中文字幕2018| 国产在线xxx| 性欧美在线看片a免费观看| 97超碰在线免费| 91精品国产色综合| 美女18一级毛片一品久道久久综合| 2019精品视频| **欧美日韩在线观看| 国产精品美女在线| 成人久久精品| 成人91视频| 色天天色综合| 视频一区视频二区视频| 久久精品高清| a级片一区二区| 999在线观看精品免费不卡网站| 日韩国产欧美亚洲| 日韩中文字幕av电影| 天天干天天爽天天射| 国产精品一区二区在线观看不卡 | 国产日韩久久久| 欧美日韩国产精品成人| av网站免费播放| 日韩高清av一区二区三区| 国产小视频福利在线| 日韩在线观看免费全| 男女视频在线| 欧美中文字幕视频在线观看| 国产福利亚洲| 91在线高清免费观看| 久久综合另类图片小说| 午夜精品一区二区在线观看 | 国产精品久久久久aaaa| 黑人巨大精品一区二区在线| 亚洲成人精品一区| 免费看av在线| 精品国产一区二区国模嫣然| 深夜福利视频一区| 久久九九国产精品怡红院| xxx.xxx欧美| 国产精品女主播视频| 91麻豆精品国产91久久久久推荐资源| 免费亚洲精品视频| 欧美日本一区二区高清播放视频| 免费在线观看的av网站| 国产乱码精品一区二区三区av| 日韩片在线观看| 日韩美女啊v在线免费观看| 伦av综合一区| 日韩欧美电影在线| 国产亚洲依依| 97香蕉超级碰碰久久免费的优势| 日韩免费在线电影| 欧美日产一区二区三区在线观看| 亚洲色图二区| 手机视频在线观看| 2022国产精品视频| 久操免费在线视频| 欧美日韩一区视频| 日韩一级片免费| 久久精品99无色码中文字幕| www.日韩| 国产精品中出一区二区三区| 国产精品久久久久久久久妇女| 日本福利视频在线| 成人丝袜18视频在线观看| 日韩精品久久久久久久的张开腿让| 午夜久久久久久| 99久久国产热无码精品免费| 一区二区三区四区视频| 人在线成免费视频| 国产成人一区二区三区免费看| 97视频精品| 中文字幕永久有效| 中文字幕第一区第二区| 亚洲精品男人的天堂| 亚洲成人aaa| 国产精品蜜臀| 成人欧美一区二区三区视频xxx| 99精品综合| 欧美精品久久久久久久久25p| 久久久久国产精品麻豆| 欧美精品亚洲精品日韩精品| 日韩精品在线网站| 青青在线视频| 97国产超碰| 精品白丝av| av2014天堂网| 岛国av一区二区三区| 五月色婷婷综合| 7777免费精品视频| 免费一区二区三区视频导航| 欧美视频在线播放一区| 91色.com| 成人免费毛片男人用品| 亚洲精品综合久久中文字幕| 亚洲天堂av在线| 欧美日韩无遮挡| 视频一区二区中文字幕| 91精品人妻一区二区三区| 色先锋资源久久综合| 九色视频成人自拍| 国产精品吊钟奶在线| 日本久久精品| 在线免费看v片| 亚洲第一主播视频| 免费一级毛片在线观看| 国产精品电影观看| 97国产精品| 亚洲熟女乱综合一区二区| 亚洲伊人色欲综合网| 天堂av手机版| 国产xxx69麻豆国语对白| 日本a口亚洲| 国产免费无码一区二区| 欧美日韩国产丝袜美女| 国产污视频在线| 成人午夜在线影院| 狠色狠色综合久久| 一本加勒比北条麻妃| 欧美日本一区二区| 丝袜美腿av在线| 鲁丝一区二区三区免费| 青青草伊人久久| 欧美人妻一区二区| 日韩成人在线视频观看| 精品亚洲美女网站| 一区二区在线高清视频| 国产+成+人+亚洲欧洲自线| 日韩久久中文字幕| 日韩在线观看免费全集电视剧网站| 欧美在线在线| 欧美xxxxx在线视频| 亚洲素人一区二区| 天堂在线视频免费观看| 国产精品中文在线| 亚洲激情黄色| 麻豆视频免费在线播放| 欧美本精品男人aⅴ天堂| 日韩av大片站长工具| 最新视频 - x88av| 国产亚洲人成网站| 亚洲国产精品久久久久久久| 欧洲美女7788成人免费视频| 欧美国产小视频| 在线观看国产三级| 制服.丝袜.亚洲.中文.综合| 深夜成人在线| 天堂av在线中文| 久久久国际精品| 国产 欧美 自拍| 成人av在线网址| 天堂久久一区二区三区| 天天看片中文字幕|