精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源視頻版GPT-4o?快速記憶,實時問答,拿下CVPR'24長視頻問答競賽冠軍

人工智能 新聞 開源
大模型產(chǎn)業(yè)發(fā)展,需要可信中立的數(shù)據(jù)深加工平臺,如何填補空白?
  • 張顥繼:清華大學本科生,師從唐彥嵩老師,主要研究方向為視頻理解。
  • 王逸欽:清華大學深圳國際研究生院碩士生,師從唐彥嵩老師,主要研究方向為多模態(tài)學習。
  • 唐彥嵩博士:清華大學深圳國際研究生院助理教授,主要研究方向為計算機視覺與模式識別。
  • 劉鏞:清華大學深圳國際研究生院博士生,師從唐彥嵩老師,主要研究方向為視覺分割、視頻理解。
  • 馮佳時博士:字節(jié)跳動視覺研究的負責人,他的研究領域包括深度學習及其在計算機視覺中的應用。
  • 代季峰博士:清華大學電子工程系副教授,主要研究方向為視覺基礎模型與自動駕駛。
  • 項目 Leader,靳瀟杰博士:現(xiàn)就職于字節(jié)跳動美國研究院,研究方向包括多模態(tài)基礎模型、生成式學習、視頻編輯等。

基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大語言模型(Large Language Models,LLMs)的強大理解、生成和推理能力,多模態(tài)大模型(Large Multimodal Models,LMMs)在圖片視覺理解任務上取得了成功,如 MiniGPT-4、LLAVA [4, 5, 6] 等等。更進一步地,一些工作將 LMM 強大的圖片理解能力遷移到視頻領域,使得視頻內(nèi)容理解和推理成為可能,例如 Video-ChatGPT、Vista-LLaMA [7, 8] 等。

然而,大多數(shù)多模態(tài)模型僅能對較短的離線視頻數(shù)據(jù)進行文本描述或問答,對于長視頻和在線視頻流的理解能力比較有限。讓模型具有理解長視頻的能力是通往更智能的模型甚至達到 AGI 的路徑。這一研究空白限制了多模態(tài)大模型在許多在線場景中的實際應用,如具身人工智能、智能監(jiān)控系統(tǒng)等。

針對這點,一些工作 [9, 10] 開始研究如何增強對長視頻的理解能力,大多基于幀采樣和特征融合的方法。然而,現(xiàn)有的方法存在以下缺點:1) 顯存開銷和回答延遲隨輸入幀數(shù)量增長,這為長視頻理解帶來困難,只能使用稀疏采樣等方式,而這會顯著影響模型性能。2) 無法處理在線視頻流,只能將在線視頻流進行分段處理,難以處理新輸入的視頻片段與舊視頻片段之間的信息交互,阻礙了 LMM 對長視頻流整體的理解能力。

為了解決此問題,字節(jié)跳動聯(lián)合清華大學的研究人員仿照人類的感知和記憶機制,提出了首個針對長視頻流的在線理解多模態(tài)大模型 Flash-VStream

在具體介紹它之前,先來體驗一下 Flash-VStream 的實時問答能力:

我們可以看到模型對長視頻上下文有比較好的記憶能力,能夠給出符合視頻情景的回復。例如在 56:00 時刻提問抓取面粉(發(fā)生在十幾分鐘之前)之后主人公做了什么動作,模型能夠迅速給出正確而詳細的回答。Flash-VStream 模型能夠處理針對大時間跨度的視頻問題,反映了模型具有高效記憶長視頻視覺信息的能力

相比之前的工作,F(xiàn)lash-VStream 的優(yōu)勢在于:

  • 能夠在線處理極長的視頻流數(shù)據(jù),快速記憶重要信息,實時回答用戶提問
  • 隨著輸入幀數(shù)量的增加,顯存開銷和回答延遲幾乎沒有變化,實現(xiàn)了高效的長視頻理解。
  • 利用 STAR 記憶機制對不同粒度語義信息進行高效融合,在多個長視頻問答 benchmark 上達到 SOTA。

圖片

圖片

Flash-VStream 不僅在多個長視頻理解 benchmark 上表現(xiàn)優(yōu)秀,還獲得了 CVPR'24 長視頻問答競賽 Long-Term Video Question Answering Challenge @ CVPR 2024 Workshop 的冠軍

地址:https://sites.google.com/view/loveucvpr24/track1

更進一步,為了支持這一研究領域的模型評價和改進,研究團隊在 Ego4D [11] 和 Movienet [12] 的基礎上,借助 GPT-4V 構(gòu)建了一個面向在線視頻流問答場景的數(shù)據(jù)集 VStream-QA,它包含總計 21h 的視頻,平均長度為 40min,每個問答對都基于特定的已標注的時間區(qū)間。在評價時,要求模型在多個時間點,基于到當時刻為止的視頻片段回答問題。

圖片


  • 項目主頁:https://invinciblewyq.github.io/vstream-page
  • 論文鏈接:https://arxiv.org/abs/2406.08085
  • 代碼倉庫:https://github.com/IVGSZ/Flash-VStream
  • 在線體驗:https://huggingface.co/spaces/IVGSZ/Flash-VStream-demo

圖片

不同于傳統(tǒng)視頻理解 LMM,F(xiàn)lash-VStream 將視覺信息感知記憶和問答交互解耦,使用多進程系統(tǒng)實現(xiàn)了對長視頻流的實時處理。那么這項研究具體是如何做的呢?

模型核心:STAR 記憶機制

圖片

如論文中的框架圖所示,F(xiàn)lash-VStream 架構(gòu)十分簡潔,由幀處理進程和問題處理進程組成,其模型包括四個主要部分:1) 預訓練的 CLIP-ViT 視覺編碼器;2) 大語言模型;3)STAR 記憶機制;4)特征緩沖區(qū)。其中,后兩者是 Flash-VStream 的核心。STAR 記憶包括 “空間”、“時間”、“抽象”、“檢索” 四種記憶模塊,用于高效融合不同粒度的語義信息,實現(xiàn)了幀級別的信息聚合。特征緩沖區(qū)輔助檢索記憶,類似于人類回憶起印象深刻的事件一樣,從歷史視頻中檢索出關鍵信息,以提高模型對長視頻中重要事件細節(jié)的理解能力。

其中,空間記憶和檢索記憶每幀具有最多的 token 數(shù)量,時間記憶次之,抽象記憶每幀僅用 1 個 token 表示。這種設計高效表示了從最具體到最抽象的視覺特征。為了得到更小的特征圖,F(xiàn)lash-VStream 在空間維度使用平均池化操作。

圖片

根據(jù)研究人員的描述,STAR 記憶采用了四種簡潔高效的記憶更新機制:

  • 對于空間記憶和特征緩沖區(qū),通過 FIFO(First-In-First-Out)隊列更新。隊列維護了最新的若干幀,確保模型對最新的細粒度空間信息有較強的感知能力。
  • 對于時間記憶,當輸入 token 數(shù)量超過記憶容量時,采用加權(quán) K-means 聚類算法進行幀級別的特征聚合。該算法將時間記憶的 token 和新輸入的 token 一起聚類為一些簇(簇的數(shù)量就是記憶容量,簇的大小是其所包含幀的數(shù)量),并用這些簇的質(zhì)心作為新記憶,代表相應的關鍵事件信息。這種方法可以簡潔高效地存儲時序相關的上下文信息。
  • 對于抽象記憶,引入了語義注意力模型(Semantic Attention),將空間與時間特征抽象成最高層次的語義特征。該模型用基于注意力和動量的方式更新抽象記憶,使其始終表示視頻級別的高層次語義信息。
  • 對于檢索記憶,通過識別關鍵幀特征進行更新。首先從時間記憶中選擇出最大的若干簇,然后從特征緩沖區(qū)中檢索出與這些簇的質(zhì)心 L2 距離最近的幀的特征,以此作為關鍵事件的回憶,為時間記憶補充相應的細粒度信息。

Flash-VStream 憑借其創(chuàng)新性的 STAR 記憶機制,不僅能夠高效融合不同粒度的語義信息,還能通過特征緩沖區(qū)的輔助,精確地回憶和檢索長視頻中重要事件的細節(jié)信息,從而顯著提升模型的理解能力與性能。

VStream-QA 數(shù)據(jù)集

有了上述實現(xiàn)方案,還需要有合適的測試數(shù)據(jù)來評價模型對在線視頻流的理解能力。回顧現(xiàn)有的長視頻問答數(shù)據(jù)集,它們的主要目的大多是評價模型的描述性問答能力、時序理解能力、電影理解能力等,均屬于離線理解能力。并且它們的視頻平均長度局限在 4 分鐘以內(nèi)。

圖片

為了解決這些問題,研究團隊篩選了 Ego4d 和 Movienet 中的一部分視頻片段,為每個視頻片段標注了多個問答對,并標記了答案所在的視頻區(qū)間。在測試時,要求模型在多個時間點,基于到當時刻為止的視頻片段回答問題,以此測試模型的在線視頻流理解能力。這就是 VStream-QA 數(shù)據(jù)集,其樣例如下圖所示:

圖片

和主流的開放詞典離線視頻問答數(shù)據(jù)集相同,VStream-QA 數(shù)據(jù)集也采用基于 GPT-3.5 的評價指標。具體來說,向 GPT-3.5 輸入問題、標準答案、模型的預測三元組,由 GPT 模型來判斷該答案是否準確回答,以及可信度分數(shù)是多少。統(tǒng)計所有問題的指標即為準確率(Acc.)和可信度分數(shù)(Sco.)。

算法測評

研究團隊在新提出的在線視頻流問答 Real-time VStream-QA Benchmark 上評測了 Flash-VStream 的實時視頻理解性能,包括 RVS-Ego 和 RVS-Movie 兩個子集。得益于 STAR 記憶機制的高效設計,F(xiàn)lash-VStream 具有極低的回答延遲和顯存占用,并且?guī)缀醪浑S輸入幀的數(shù)量變化,為實時問答的性能提供保障。

圖片

同時,為了評價 Flash-VStream 模型對于離線視頻的理解能力,研究團隊在四個離線視頻問答 Benchmark 上評測了 Flash-VStream 的視頻理解性能。此外,還在離線版 VStream-QA 數(shù)據(jù)集進行了測試,分為 VS-Ego 和 VS-Movie 兩個子集。離線版 VStream-QA 數(shù)據(jù)集針對每個問題,只輸入該問題答案所在的視頻片段并進行提問,相比于在線版 Real-time VStream-QA 難度較低。

圖片

在六個 benchmark 的準確率和可信度分數(shù)上,F(xiàn)lash-VStream 的性能均優(yōu)于其他方法,證明其強大的離線視頻理解能力。

感興趣的小伙伴可以關注一波,代碼已經(jīng)開源啦~

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-08-14 14:30:00

AI訓練

2024-06-21 13:04:43

2024-08-30 14:35:00

2025-04-08 02:26:00

2025-05-26 09:05:00

2025-04-03 09:34:36

2025-08-07 14:05:40

OpenAI大模型開源

2025-11-06 08:55:00

2024-05-24 15:37:42

2024-05-21 12:23:17

2024-06-05 08:29:35

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2024-09-24 11:13:14

2024-09-23 15:10:00

2024-05-14 11:29:15

2024-05-14 07:20:49

模型AI

2025-08-05 09:15:15

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

2024-06-07 08:25:16

點贊
收藏

51CTO技術(shù)棧公眾號

欧美性猛交xxxx黑人交| 日本老熟俱乐部h0930| 国产综合精品视频| 亚洲影视资源| 亚洲全部视频| 欧美精品久久久久久久多人混战| 精品日本一区二区| 日韩视频中文字幕在线观看| 秋霞国产精品| 久久综合色之久久综合| 欧美国产日韩一区| 亚洲黄色av片| 亚洲欧美视频一区二区| 亚洲精品aaaaa| 亚洲高清视频在线| 97人人澡人人爽| 91传媒免费观看| 久久精品国产精品亚洲毛片| 欧美激情一区二区三区全黄| 日韩美女视频在线观看| 荫蒂被男人添免费视频| 羞羞污视频在线观看| 久久99精品久久久| 一区二区av在线| 日韩无套无码精品| 你懂的视频在线观看| 亚洲一区国产| 欧美一区二区三区在线观看 | 欧美日韩一本| 亚洲国产日韩a在线播放性色| 色一情一区二区三区四区| 99热99热| 欧美美女操人视频| 日本在线播放一区二区| se在线电影| 日韩av在线发布| 亚洲精品福利在线观看| 久久99中文字幕| 日韩中文字幕免费在线观看| 综合激情视频| 精品福利在线导航| 日本a级片免费观看| 国外av在线| 麻豆91精品91久久久的内涵| 久久久999精品| av在线天堂网| 九九热线视频只有这里最精品| 国产视频一区二区在线观看| 国产精品亚洲欧美导航| 日本中文在线视频| av毛片精品| 91国偷自产一区二区三区成为亚洲经典| 日韩欧美手机在线| 国产女人18毛片水真多| 欧美特黄一区| 亚洲精品中文字幕女同| 不卡的在线视频| 78精品国产综合久久香蕉| 亚洲欧美激情小说另类| 国产伦精品一区二区三区照片91| 久久精品视频5| 久久久久久久久久久久久久久久久久| 精品国产一区二区三区久久久蜜月 | 亚洲妇女屁股眼交7| 性生活免费观看视频| 东京干手机福利视频| 久久国产精品亚洲77777| 中文字幕日韩免费视频| 麻豆tv在线观看| 日韩精品视频在线看| 粉嫩老牛aⅴ一区二区三区| 亚洲精品免费在线看| 亚洲精品无遮挡| 热久久免费视频| 国产啪精品视频网站| 午夜影院在线看| 亚洲成人tv| 九九久久久久久久久激情| 18岁成人毛片| 精久久久久久| 久久久99久久精品女同性| 日韩黄色免费观看| 亚洲精品视频啊美女在线直播| 77777亚洲午夜久久多人| 天海翼在线视频| 欧美精品国产| 欧美亚洲另类视频| 青青草原在线免费观看视频| 精品一区二区三区在线| 亚洲国产精品高清久久久| 亚洲小视频网站| 91综合精品国产丝袜长腿久久| 日韩电影大全免费观看2023年上 | 国产成人综合在线播放| 国产成人亚洲综合91精品| 一区二区三区免费高清视频| 午夜激情久久| 亚洲最新av在线网站| 国产传媒免费在线观看| 日韩亚洲国产精品| 欧美多人乱p欧美4p久久| 国产午夜在线播放| 麻豆精品视频在线观看| 国产九色精品| 成在在线免费视频| 亚洲一区二区三区四区不卡| 国产日韩第一页| 男女污污视频在线观看| 最新国产の精品合集bt伙计| 亚洲va韩国va欧美va精四季| 婷婷丁香在线| 欧美性videosxxxxx| 深田咏美中文字幕| 国产 日韩 欧美 综合 一区| 欧美成人乱码一区二区三区| 真实乱偷全部视频| 免费观看亚洲天堂| 日韩女同互慰一区二区| 国产精品久久久久野外| 欧美自拍视频| 欧美国产第一页| 亚洲香蕉在线视频| 精品一区二区三区香蕉蜜桃| 久久婷婷人人澡人人喊人人爽| 性色av蜜臀av| 国产91精品一区二区| 国产精品日韩一区二区三区| 成人在线免费观看| 欧美日韩国产限制| 久久久久国产免费| 欧美五码在线| 欧美激情综合色综合啪啪五月| 国产第100页| 先锋a资源在线看亚洲| 91成人免费视频| 日本精品在线| 欧美日本国产视频| 免费看三级黄色片| 国产精品久久久久无码av| 国产精品h在线观看| 欧洲毛片在线| 亚洲日本韩国一区| 福利视频一区二区三区四区| 免费一级欧美在线大片| 久久精品国产欧美激情| 91国内精品视频| 成人国产在线观看| 日本一区二区三区免费观看| 免费高清完整在线观看| 亚洲影院理伦片| 26uuu国产| 国产精品hd| 国产精品区一区二区三含羞草| 欧美男男video| 色哦色哦哦色天天综合| xxxx日本免费| 欧美在线黄色| 国产成人一区三区| 你懂的视频在线| 欧美吻胸吃奶大尺度电影| 制服 丝袜 综合 日韩 欧美| 午夜精品影院| 成人av免费在线看| 97人人在线视频| 欧美精品久久一区| 乱h高h女3p含苞待放| 国产激情视频一区二区三区欧美 | 麻豆传媒一区| 亚洲www啪成人一区二区| 宅男66日本亚洲欧美视频| 艳妇乳肉豪妇荡乳av无码福利| 国产酒店精品激情| 欧美日韩在线一二三| 18+激情视频在线| 欧洲一区在线观看| 免费看黄色片的网站| 亚洲精选成人| 日本不卡二区高清三区| 日韩色性视频| 亚洲色图17p| 日本少妇全体裸体洗澡| 精品在线亚洲视频| 国产一级不卡视频| 996久久国产精品线观看| 免费91在线视频| 中文字幕男人天堂| 久久久久久久国产精品影院| 免费超爽大片黄| 国产最新精品| 日本伊人精品一区二区三区介绍| av在线第一页| 欧美成人国产一区二区| 亚洲影院在线播放| 亚洲欧美日韩国产一区二区三区| 亚洲熟女一区二区| 另类的小说在线视频另类成人小视频在线| 青青草影院在线观看| 日韩av网站在线免费观看| 国产欧美一区二区三区在线看| 爱情岛亚洲播放路线| 欧美一卡二卡三卡四卡| 国产精品美女久久久久av爽| 本田岬高潮一区二区三区| 97超碰人人爱| 亚洲人成精品久久久| 欧美一乱一性一交一视频| 午夜在线小视频| 亚洲精品中文字幕有码专区| 亚洲精品97久久中文字幕| 日本韩国精品在线| 国产无精乱码一区二区三区| 国产精品久久久久影视| 手机视频在线观看| 日韩黄色大片| 成人xxxxx| av在线播放国产| 精品国产乱码久久久久久闺蜜 | 欧美激情专区| 中文无码日韩欧| 欧美激情视频播放| 在线观看黄av| 在线不卡欧美精品一区二区三区| 中国一级免费毛片| 亚洲一区二区av在线| 亚洲天堂网av在线| 欧美特黄aaaaaaaa大片| 久久狠狠亚洲综合| 欧美变态另类刺激| 欧美美女在线直播| 成人做爽爽免费视频| 黄色免费在线看| 日韩欧美色综合| 一级黄色小视频| 欧美亚洲动漫另类| 国产性生活视频| 国产精品天干天干在线综合| 玖玖爱视频在线| 日韩和欧美一区二区| 成人观看免费完整观看| 色偷偷综合网| 视频一区视频二区视频三区高| 亚洲图区在线| 日本不卡一区| 精品精品99| 神马影院一区二区| 欧美精选视频在线观看| 欧美一区二区在线| 国产成人久久| 视频在线观看成人| 久久免费精品视频在这里| 国产不卡一区二区三区在线观看| 成人欧美magnet| 不卡av在线网站| 亚洲av成人精品一区二区三区在线播放 | 天天综合日日夜夜精品| 亚洲永久精品ww.7491进入| 99久久伊人网影院| 少妇特黄一区二区三区| 久久国产人妖系列| 中文字幕在线视频精品| 韩国毛片一区二区三区| 欧美黄色免费影院| 美女国产精品| 亚洲欧洲日本精品| 亚洲国产美女| 欧美性大战久久久久xxx| 男女精品网站| 簧片在线免费看| 中文精品视频| 国产又大又硬又粗| 蜜芽一区二区三区| 成人在线免费在线观看| 视频一区在线播放| 日日摸日日碰夜夜爽无码| 四季av在线一区二区三区| 一区二区三区四区五区精品| 日本一区二区三区播放| 国产精品免费一区二区三区四区 | 精品国产伦一区二区三区观看方式 | a在线视频播放观看免费观看| 夜夜夜精品看看| 天堂网av2018| 国产亚洲女人久久久久毛片| 欧美亚洲色综久久精品国产| 97久久人人超碰| 91精品人妻一区二区三区四区| 菠萝蜜视频在线观看一区| 成人免费毛片糖心| 欧美国产精品久久| 免费看一级一片| 日本高清免费不卡视频| 国产三级三级在线观看| 亚洲精品动漫久久久久| 永久免费av在线| 性色av一区二区三区红粉影视| 亚洲奶水xxxx哺乳期| 8090成年在线看片午夜| 久久亚洲国产精品尤物| 国产精品一区二区在线观看| 欧美理论在线播放| 国产欧美日韩小视频| 欧美另类专区| 久久黄色免费看| 国产成人精品亚洲日本在线桃色| 69视频在线观看免费| 久久久久国产精品人| 欧美日韩综合一区二区| 一本色道久久加勒比精品| 天天操中文字幕| 欧美一二区视频| 超碰在线人人干| 一区二区福利视频| 天堂资源在线| 国产成人在线一区| 成功精品影院| 五月天综合婷婷| 欧美三级在线| 天堂av在线网站| 99精品国产91久久久久久| 日本黄色片免费观看| 91国偷自产一区二区三区观看 | 久久久青草青青国产亚洲免观| 亚洲色图综合区| 欧美日精品一区视频| 亚洲熟女乱色一区二区三区久久久| 亚洲第一国产精品| 黄色网址在线免费播放| 国产精品69精品一区二区三区| 天天操夜夜操很很操| 欧美色图麻豆| 中文字幕免费观看一区| 亚洲国产精品成人无久久精品| 91精品国产91热久久久做人人| porn亚洲| 国产精品h在线观看| 免费视频国产一区| 欧美亚洲另类色图| 日韩国产大片| 欧美自拍资源在线| 亚洲欧美日韩国产综合精品二区| 污污免费在线观看| 一区二区成人在线观看| av一区二区三| 日韩精品专区在线影院重磅| 男人资源在线播放| 国产美女精品视频免费观看| 欧美美女一区| 污污视频网站免费观看| 久久久精品人体av艺术| 成人在线免费看视频| 亚洲精品有码在线| 456亚洲精品成人影院| 日韩免费av一区二区三区| 视频一区国产视频| 国产午夜福利一区| 欧美调教femdomvk| 91欧美在线视频| 91欧美精品成人综合在线观看| 五月开心六月丁香综合色啪| 中文字幕一区二区三区四| 91免费精品国自产拍在线不卡| 污污视频网站在线免费观看| 欧美视频日韩视频| 欧美极品视频| 99九九视频| 亚洲美女一区| 天天躁日日躁aaaa视频| 欧美午夜精品久久久久久孕妇| 日韩av中文| 99久久99久久精品国产片| 在线看片一区| av中文字幕免费观看| 欧美日韩在线播放三区| av香蕉成人| 久久免费看av| 九色porny丨国产精品| 黄色一级视频免费观看| 日韩av中文字幕在线免费观看 | 国产精品7m凸凹视频分类| 欧美性受xxxx黒人xyx性爽| 亚洲午夜电影在线| 免费在线稳定资源站| 91久久久久久国产精品| 亚洲精品系列| 免费黄色激情视频| 精品捆绑美女sm三区| 亚洲精品一级二级| 337p亚洲精品色噜噜狠狠p| 久久久国产精品一区二区中文| 国产视频不卡在线| 欧美成人精品二区三区99精品| 奇米777日韩| 男人天堂网站在线| 久久青草国产手机看片福利盒子| 日韩精品在线一区二区三区| 亚洲欧美变态国产另类| av在线私库| 亚洲欧美国产不卡| 波多野结衣在线一区| 中文字幕永久免费视频|