精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

空間智能版ImageNet來了!李飛飛吳佳俊團隊出品

人工智能 新聞
HourVideo,一個用于評估多模態模型對長達一小時視頻理解能力的基準數據集,包含多種任務。

空間智能版ImageNet來了,來自斯坦福李飛飛吳佳俊團隊!

HourVideo,一個用于評估多模態模型對長達一小時視頻理解能力的基準數據集,包含多種任務。

通過與現有模型對比,揭示當前模型在長視頻理解上與人類水平的差距。

圖片

2009年,李飛飛團隊在CVPR上首次對外展示了圖像識別數據集ImageNet,它的出現極大推動計算機視覺算法的發展——懂CV的都是知道這里面的門道有多深。

現在,隨著多模態迅猛發展,團隊認為“現有的視頻基準測試,大多集中在特定領域或短視頻上”,并且“這些數據集的平均視頻長度較短,限制了對長視頻理解能力的全面評估”。

于是,空間智能版ImageNet應運而生。

HourVideo包含500個來自Ego4D數據集的第一人稱視角視頻,時長在20到120分鐘之間,涉及77種日常活動。

評測結果表示,人類專家水平顯著優于目前長上下文多模態模型中最厲害的Gemini Pro 1.5(85.0%對37.3%)

在多模態能力上,大模型們還任重而道遠。

HourVideo如何煉成?

之所以提出HourVideo,是因為研究人員發現目前長視頻理解越來越重要,而現有評估benchmark存在不足。

多模態越來越卷,人們期待AI被賦予autonomous agents的類似能力;而從人類角度來看,由于人類具備處理長時間視覺處理的能力,因此能在現實視覺中感知、計劃和行動。

因此,長視頻理解對實現這一目標至關重要。

而當前的多模態評估benchmark,主要還是集中在評測單張圖像或短視頻片段(幾秒到三分鐘),對長視頻理解的探索還有待開發。

不可否認的是,AI評估長視頻理解面臨諸多挑戰,譬如要設計任務、避免通過先驗知識或簡短片斷回答等。

因此,團隊提出HourVideo

這是一個為長視頻理解而設計的基準數據集。

為了設計出需要長期理解的任務,團隊首先提出了一個新的任務對應套件,包含總結、感知(回憶、跟蹤)、視覺推理(空間、時間、預測、因果、反事實)和導航(房間到房間、對象檢索)任務,共18個子任務。

其中,總結任務要求模型對視頻中的關鍵事件、主要交互等進行概括性描述,例如總結出脖子上掛了個相機的人在超市中有什么關鍵交互行為。

圖片

感知任務由兩部分構成,

一個是回憶任務,包括事實回憶(比如脖子上掛了個相機的人,在超市拿起的乳制品)和序列回憶(比如那個人在超市稱完西紅柿過后做了什么),以及對時間距離的判斷(比如吃了多久的披薩才扔掉盒子)

還有一個是跟蹤任務,主要用來識別脖子上掛了個相機的人在特定場景(比如超市、藥店)中互動的獨特個體。

圖片

接下來是視覺推理任務,分為空間推理和時間推理。

空間推理負責判斷物體之間的空間關系、空間接近度(如微波爐與冰箱或水槽相比是否更近)以及空間布局(如選擇正確描繪脖子上掛相機的人的公寓的布局圖)

時間推理則包括對活動持續時間的比較、事件發生頻率的判斷、活動的先決條件、預測(如洗完衣服后最可能做的活動)、因果關系(如第二次離開車庫的原因)以及反事實推理(如用烤箱做土豆泥會怎樣)

圖片

導航任務包含了房間到房間的導航、對象檢索導航。

以上每個任務有精心設計的問題原型,以確保正確回答問題需要對長視頻中的多個時間片段進行信息識別和綜合,從而有效測試模型的長期理解能力。

圖片

與此同時,研究人員通過pipeline來生成了HourVideo數據集。

第一步,視頻篩選。

團隊從Ego4D數據集中手動審核1470個20到120分鐘的視頻,讓5位人類專家選擇了其中500個視頻,

至于為啥要從Ego4D中選呢,一來是其以自我為中心的視角與autonomous agents和助手的典型視覺輸入非常一致;二來是它具有廣泛的視覺敘述,有助于創建多樣化的題;三來Ego4D的訪問許可非常友好。

第二步,候選MCQ生成。

這需要在長視頻中跨多個時間片段,進行信息分析和合成。

具體來說,研究人員以20分鐘為間隔分割了視頻,提取信息轉化為結構化格式供大模型處理。最終一共開發了25個特定任務的prompts。

第三步,LLM優化與人工反饋。

在這個階段,團隊實現了一個人工反饋系統,7名經驗豐富的人員人工評估每個問題的有效性、答案準確性、錯誤選項合理性。最終收集了400多個小時的人工反饋,然后設計prompt,自動優化 MCQ?得到 MCQ?。

第四步,盲選。

這一階段的目標是消除可以通過大模型先驗知識的問題,或者消除那些可以在不用視頻中任何信息就可以回答的問題。

團隊用兩個獨立的大模型——GPT-4-turbo和GPT-4,對MCQ?進行盲篩,確保剩余 MCQ?高質量且專門測試長視頻語言理解。

第五步也是最后一步,專家優化。

這一步是用來提升MCQ?質量,將寬泛問題精確化,經此階段得到高質量 MCQ?。

4個專家干的事be like,把 “掛著相機的人把鑰匙放在哪里了?” 精確成“掛著相機的人購物回家后,把自行車鑰匙放在哪里了?”

如上pipeline中,研究圖納隊使用了GPT-4來遵循復雜的多步驟指令,同時還使用了CoT提示策略。

此外,pipeline中涉及大模型的所有階段的問題被設為0.1。

圖片

據統計,HourVideo涵蓋77種日常生活場景,包含500個Ego4D視頻,視頻時長共381個小時、平均時長45.7分鐘,其中113個視頻時長超過1小時。

每個視頻有約26個高質量五選一題,共計12976個問題。

除因果、反事實和導航任務外,問題在任務套件中均勻分布。

圖片

最好表現仍遠低于人類專家水平

在實驗評估方面,HourVideo采用五選多任務問答(MCQ) 任務,以準確率作為評估指標,分別報告每個任務以及整個數據集的準確率。

由于防止信息泄露是評估長視頻中的MCQ時的一個重要挑戰——理想情況下,每個MCQ應獨立評估,但這種方法計算成本巨高,且十分耗時。

因此,實際評估中按任務或子任務對問題進行分批評估,對于預測任務,提供精確的時間戳以便對視頻進行有針對性的剪輯,從而平衡計算成本和評估準確性。

研究團隊比較了不同的多模態模型在零鏡頭設置下理解長視頻的性能。

主要評估了三類模型,所有這些模型都在一個通用函數下運行:

盲LLM:

指是指在評估過程中,不考慮視頻內容,僅依靠自身預先訓練的知識來回答問題的大型語言模型。

實驗中以GPT-4為代表。它的存在可以揭示模型在多大程度上依賴于其預訓練知識,而不是對視頻中實際視覺信息的理解。

蘇格拉底模型:

對于大多數當前的多模態模型,直接處理非常長的視頻存在困難。

因此,采用Socratic模型方法,將視頻(總時長為t分鐘)分割成1分鐘的間隔,每個間隔獨立加字幕,然后將這些字幕聚合形成一個全面的基于語言的視頻表示,并與通用任務無關的提示一起作為輸入進行長視頻問答。

實驗中分別使用GPT-4和LLaVA- NEXT-34-DPO 為視頻字幕生成器,并最終使用GPT-4進行實際問題回答。

原生多模態模型:

像Gemini 1.5 Pro這樣的原生多模態模型,在多模態數據(包括音頻、視頻、圖像和文本)上聯合訓練,能夠處理非常長的上下文長度*((2M +),適合直接對HourVideo進行端到端評估。

圖片

為了與模型性能進行對比,實驗人員從基準數據集中選取了14個視頻,涵蓋>18種場景,包括手工制作/繪畫、烹飪、建筑/裝修、園藝、清潔/洗衣和庭院工作等。

然后邀請了3位人類專家,對上述總時長11.2小時的視頻內容進行進行評估,共涉及213個MCQ。

為確保評估的公正性,參與評估的人類專家未參與過這些視頻的早期注釋工作。

最終,人類專家在評估中的準確率達到了85.0% 。

而盲LLM的準確率為19.6%,Socratic模型準確率略高,原生多模態模型準確率最高,達到了37.3%,仍然遠低于人類專家水平。

圖片

此外,獨立評估每個MCQ與按任務級別評估相比,性能下降2.1%,但成本增加3倍以上,證明了任務級評估方法的效率和有效性。

最后,團隊表示未來計劃擴展基準測試,包括更多樣化的視頻來源(如體育和YouTube視頻),納入音頻模態支持,并探索其他感官模態。

同時強調在開發模型時需考慮隱私、倫理等問題。

團隊成員

HourVideo項目來自斯坦福李飛飛和吳佳俊團隊。

論文共同一作是Keshigeyan Chandrasegaran和Agrim Gupta。

Keshigeyan Chandrasegaran是斯坦福大學計算機科學博士二年級學生,從事計算機視覺和機器學習研究,導師是李飛飛和斯坦福視覺與學習實驗室(SVL)聯合主任胡安·卡洛斯·尼貝萊斯。

圖片

共同一作Agrim Gupta是斯坦福大學計算機科學專業的博士生,2019年秋季入學,同樣是李飛飛的學生。

此前,他曾在微軟、DeepMind,有Meta的全職經歷,也在Google做過兼職。2018年時,他就跟隨李飛飛一同在CVPR上發表了論文。

目前,Agrim的Google Scholar論文被引用量接近6400次。

圖片

李飛飛是大家熟悉的AI教母,AI領域內最具影響力的女性和華人之一。

她33歲成為斯坦福計算機系終身教授,44歲成為美國國家工程院院士,現任斯坦福以人為本人工智能研究院(HAI)院長。

計算機視覺領域標桿成果ImageNet亦是由她一手推動。

此前,李飛飛也曾短暫進入工業界,出任谷歌副總裁即谷歌云AI首席科學家。她一手推動了谷歌AI中國中心正式成立,這是Google在亞洲設立的第一個AI研究中心。并帶領谷歌云推出了一系列有影響力的產品,包括AutoML、Contact Center AI、Dialogflow Enterprise等。

今年,李飛飛宣布創辦空間智能公司World Labs,公司成立不到4個月時間,估值突破10億美元。

所謂空間智能,即“視覺化為洞察;看見成為理解;理解導致行動”。

圖片

吳佳俊,現任斯坦福大學助理教授,隸屬于斯坦福視覺與學習實驗室(SVL)和斯坦福人工智能實驗室(SAIL)

他在麻省理工學院完成博士學位,本科畢業于清華大學姚班,曾被譽為“清華十大學神”之一。

同時,他也是李飛飛創業公司World Labs的顧問。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-20 14:24:21

2024-05-21 12:23:00

模型訓練

2024-11-15 09:36:07

2023-11-10 12:58:00

模型數據

2025-04-10 09:10:00

模型AI評測

2024-12-13 14:20:00

AI模型訓練

2025-11-13 09:02:54

2025-09-24 11:24:42

2024-11-29 16:35:50

模型訓練

2024-09-03 14:30:00

機器人模型

2024-08-07 13:00:00

2025-07-02 18:15:02

李飛飛AGI智能

2024-01-22 12:31:18

模型訓練

2025-06-03 14:14:59

智能技術AI

2024-05-06 07:10:00

李飛飛智能空間

2024-12-05 09:53:18

智能體AI

2024-05-16 12:44:30

模型訓練

2024-12-23 13:50:00

數據訓練模型

2024-09-23 15:20:00

2025-09-17 09:18:56

點贊
收藏

51CTO技術棧公眾號

欧美四级电影在线观看| 国产一区二区成人久久免费影院| 日韩av在线最新| 丰满少妇被猛烈进入高清播放| 日本啊v在线| 青娱乐精品视频| 欧美成人免费观看| 在线观看福利片| 国产色99精品9i| 色综合天天综合狠狠| 99精品一级欧美片免费播放| 色哟哟中文字幕| 麻豆国产精品视频| 91精品国产91久久| 午夜精品福利在线视频| 亚洲第一论坛sis| 欧美一级淫片007| 国产熟人av一二三区| 在线中文字幕视频观看| 久久久久久久久久久电影| 91视频免费在线观看| 免费av中文字幕| 欧美私人啪啪vps| 在线看福利67194| av鲁丝一区鲁丝二区鲁丝三区| www999久久| 91国产福利在线| 国产免费观看高清视频| 国产精品久久久久久久久久久久久| 黑人无套内谢中国美女| 欧美精选视频一区二区| 亚洲高清在线视频| avove在线观看| 成年网站在线| 久久久精品一品道一区| 国产日韩久久| 国产黄色大片网站| 狠狠色丁香九九婷婷综合五月| 日本在线精品视频| 午夜精品三级久久久有码| 欧美日韩视频一区二区三区| 精品激情国产视频| 国产三级黄色片| 国产一区不卡| 亚洲性生活视频在线观看| 国产全是老熟女太爽了| 人人精品视频| 日韩国产欧美精品在线| 黄色在线免费播放| 久久久免费毛片| 欧美一区二区精美| 秋霞午夜鲁丝一区二区| 国产精品一区二区美女视频免费看| 欧美日韩一级片在线观看| 亚洲男人天堂色| 蜜桃视频成人m3u8| 欧美在线一二三| 精品久久久久久久无码| 成人一级视频| 欧美日韩精品一区二区三区| 永久免费的av网站| 在线不卡一区| 欧美一卡二卡在线| 国产欧美视频一区| 美女主播精品视频一二三四| 亚洲福利在线播放| 一区二区三区免费在线观看视频 | 调教+趴+乳夹+国产+精品| 国产一线二线三线女| 牛牛精品一区二区| 色哟哟一区二区三区| 欧美理论片在线观看| 国产精品免费在线| 国产女18毛片多18精品| 国产福利精品一区| 韩国一区二区三区美女美女秀| 五月婷婷在线观看视频| 国产色产综合色产在线视频| 亚洲一区不卡在线| 欧美性猛片xxxxx免费中国| 亚洲6080在线| 999在线免费视频| 动漫一区二区三区| 亚洲国产欧美精品| 中文字幕欧美激情极品| 91成人网在线观看| 欧美性做爰毛片| 亚洲中文一区二区三区| 成人激情午夜影院| 亚洲成人自拍视频| 欧美人与禽性xxxxx杂性| 色中色一区二区| 91 视频免费观看| 女一区二区三区| 色噜噜亚洲精品中文字幕| 九九久久免费视频| 视频一区二区中文字幕| www 成人av com| 国产网站在线播放| 亚洲在线视频网站| 国产一区二区在线免费播放| jazzjazz国产精品久久| 一个色综合导航| 国产一级特黄aaa大片| 日本中文一区二区三区| 国产精品一区二区av| av网在线观看| 福利微拍一区二区| 91香蕉国产线在线观看| 精品理论电影在线| 国内精品久久久| 国产日韩欧美一区二区东京热| 久久综合丝袜日本网| 成年丰满熟妇午夜免费视频| 国产成人精品亚洲日本在线观看| 亚洲精品一区二区三区影院| 免费看一级黄色| 玖玖在线精品| 国产欧美一区二区三区另类精品| 久久精品欧美一区二区| 欧美成人影院| 精品福利视频一区二区三区| av黄色免费在线观看| 国产日韩一区二区三区在线| aa日韩免费精品视频一| 欧美videos极品另类| 欧美怡红院视频| 中文字幕高清视频| 99精品欧美| 成人av网站观看| a级在线观看| 欧美久久久久久蜜桃| 538精品视频| 日韩精彩视频在线观看| 欧美大香线蕉线伊人久久国产精品| 欧美videossex另类| 日韩欧美在线网站| 91日韩中文字幕| 国产在线播放一区| 黄黄视频在线观看| 亚洲网一区二区三区| 久久福利视频导航| av小说天堂网| 一区二区三区日韩精品视频| 久久出品必属精品| 中文字幕一区二区三区欧美日韩 | 波多野结衣av一区二区全免费观看| 亚洲欧洲二区| 久久的精品视频| 国产黄色av片| 亚洲一区二区三区免费视频| 国产在线观看免费播放| 亚洲网站视频| 国产自产精品| 丝袜美腿诱惑一区二区三区| 亚洲无限av看| 中文在线最新版天堂| 中文字幕亚洲不卡| 无码人妻丰满熟妇区毛片蜜桃精品 | 波多野结衣黄色| 中文字幕精品在线不卡| 精品综合久久久久| 欧美精品福利| 国产尤物99| 成人自拍视频网| 日韩在线观看免费网站| 成人黄色免费看| 精品人妻久久久久一区二区三区 | 免费不卡在线观看av| 午夜精品久久久久久久96蜜桃| 亚洲一区二区精品视频| 水蜜桃av无码| 日韩激情中文字幕| 樱花www成人免费视频| 亚洲成人五区| 国产91色在线免费| 女女色综合影院| 欧美tickling挠脚心丨vk| 国产精品黄色网| 国产精品视频一二| 97免费公开视频| 乱人伦精品视频在线观看| 五月婷婷综合色| 伊人久久影院| 国产精品久久不能| 波多野在线观看| 最近2019年中文视频免费在线观看| 91成人在线免费| 亚洲va中文字幕| 99精品欧美一区二区| 成人网在线免费视频| 亚洲少妇第一页| 极品中文字幕一区| 亚洲国产精品视频一区| 97久久综合区小说区图片区| 日韩免费观看视频| 久草在线资源站资源站| 一区二区三区国产在线观看| 国产aⅴ爽av久久久久成人| 丁香五六月婷婷久久激情| 国产美女久久久久久| 26uuu亚洲| 性感美女一区二区三区| 免费成人在线观看视频| 男人添女荫道口图片| 国产精品久久久乱弄 | 色综合天天综合网国产成人综合天| 人人澡人人澡人人看| 久久综合久久久久88| 宇都宫紫苑在线播放| 免费观看在线综合色| 欧美日韩在线一| 欧美a级在线| 亚洲制服欧美久久| 九九视频免费观看视频精品| 国产精品一区二区欧美| 自拍偷拍一区二区三区| 成人激情久久| 国产精品日日摸夜夜添夜夜av| 丁香花在线观看完整版电影| 日韩中文字幕国产精品| 九色在线免费| 日韩精品视频免费在线观看| 亚洲av无码一区二区乱子伦| 精品视频免费看| 国产乱码77777777| 欧美性videos高清精品| 欧美黑吊大战白妞| 亚洲欧美自拍偷拍色图| 国产黄a三级三级| 国产精品欧美经典| 国产真人做爰视频免费| 久久色在线观看| 全黄一级裸体片| 97久久人人超碰| 久久久久久久无码| 99久久国产免费看| 中文视频在线观看| 成人av电影在线| 国产真实乱人偷精品| va亚洲va日韩不卡在线观看| 日本人妻一区二区三区| 国产不卡视频一区| 精品国产乱码久久久久夜深人妻| 国产黑丝在线一区二区三区| 午夜诱惑痒痒网| 国产毛片一区二区| 国产裸体视频网站| 国产激情视频一区二区在线观看| 中文字幕人妻无码系列第三区| 国产精品一区二区在线观看网站 | 亚洲精品成人一区| 成人免费网视频| www欧美在线观看| av成人午夜| 欧美一区二区三区红桃小说| 麻豆av福利av久久av| 国产区精品区| 9999在线观看| 欧美人成在线| 国产乱子伦农村叉叉叉| 丝袜亚洲精品中文字幕一区| 男人插女人下面免费视频| 美女www一区二区| 激情成人在线观看| 成人av在线影院| 日本xxxxxxxxx18| 中文字幕亚洲电影| 亚洲国产综合久久| 色88888久久久久久影院野外| 中文字幕+乱码+中文字幕明步 | 亚洲综合激情在线| 国产精品色呦呦| 成人一区二区三区仙踪林| av成人动漫在线观看| 国产免费一区二区三区网站免费| 中文字幕的久久| 久久黄色免费网站| 色老汉av一区二区三区| 国产一区二区自拍视频| 精品福利在线导航| 成人三级黄色免费网站| 久久国产天堂福利天堂| 黄色软件视频在线观看| 国产欧美日韩精品在线观看| 99精品中文字幕在线不卡| 欧美一区亚洲二区| 综合激情一区| 乱子伦视频在线看| 国产精品66部| 黄色片网站免费| 亚洲电影第三页| 在线观看黄色网| 亚洲国产另类久久精品| 91精品专区| 97碰碰碰免费色视频| 欧美激情喷水| 国产视频在线观看一区| 日韩国产欧美一区二区| 少妇av一区二区三区无码| 精品在线免费视频| 草草影院第一页| 一区二区三区四区五区视频在线观看| av网站中文字幕| 日韩精品最新网址| 日本三级视频在线观看| 青青草成人在线| 国产成人aa在线观看网站站| 一本一道久久a久久精品综合| 宅男噜噜噜66国产日韩在线观看| 91亚洲精品久久久蜜桃借种| 91麻豆.com| 亚洲一区 视频| 日韩一二三四区| 欧洲不卡av| 国产精品国产亚洲伊人久久| 高清日韩中文字幕| 亚洲色欲久久久综合网东京热| 久久99久久久欧美国产| 国产jjizz一区二区三区视频| 午夜成人免费电影| 亚洲精品视频91| 九九热99久久久国产盗摄| 国产一区高清| 亚洲aⅴ天堂av在线电影软件| 国产精品日韩| 中文字幕在线永久| 亚洲一区二区三区视频在线播放| 国产成人三级一区二区在线观看一| 一区二区三区视频在线| 三上悠亚激情av一区二区三区| 精品久久久久亚洲| 99国产精品99久久久久久粉嫩| 成人做爰www看视频软件| 樱花影视一区二区| 国产成人精品毛片| 欧美高跟鞋交xxxxxhd| 日本免费精品| 男人日女人的bb| v片在线观看| 欧美国产一区二区三区| 欧美另类中文字幕| 国产精品国三级国产av| 国产不卡一区视频| 日韩av女优在线观看| 亚洲精品xxx| 涩涩av在线| 日本精品一区二区三区视频| 日韩高清电影一区| 2019男人天堂| 欧美福利电影网| av毛片在线免费| 99re在线国产| 国产亚洲在线| 欧美18—19性高清hd4k| 欧美日韩一级片网站| 免费av网站在线观看| 91麻豆国产精品| 欧美视频导航| 国产偷人妻精品一区| 日本韩国欧美在线| 日本免费在线观看| 99久热re在线精品视频| av成人天堂| 久久久精品成人| 日韩欧美中文一区二区| 韩国成人二区| 亚洲.欧美.日本.国产综合在线 | 亚洲精品一区二区18漫画| 亚洲激情一二三区| 五月婷婷六月激情| 国产精品久久久久久久午夜| 一本到12不卡视频在线dvd| 秘密基地免费观看完整版中文| 色综合天天综合网天天看片| 巨大荫蒂视频欧美大片| 国产精品久久久久av福利动漫| 亚欧成人精品| 国产精品国产精品88| 亚洲精品福利在线观看| 国产一区影院| 精品无码一区二区三区在线| 国产清纯美女被跳蛋高潮一区二区久久w | 午夜激情电影在线播放| 一道精品一区二区三区| 成人午夜激情在线| 在线观看黄色网| 2019中文字幕在线观看| 久久一区91| 51调教丨国产调教视频| 欧美欧美欧美欧美首页| yellow在线观看网址| 亚洲人成网站在线播放2019| 国产成人午夜精品5599| 国产精品sm调教免费专区| 久久免费国产精品1| 婷婷激情综合| 国产成人无码精品久久二区三| 91精品国产免费| 69堂精品视频在线播放|