精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Stream-Omni:同時支持各種模態組合交互的文本-視覺-語音多模態大模型

人工智能 新聞
中國科學院計算技術研究所自然語言處理團隊提出了文本-視覺-語音多模態大模型——Stream-Omni,其能同時支持各種模態組合下的交互。

GPT-4o式的多模態大模型(LMMs)展現出在文本、視覺和語音模態上的全能能力,其在線語音服務還能在語音交互過程中同步提供中間文本結果(即用戶輸入和模型響應的轉錄內容),為用戶提供“邊看邊聽”的靈活交互體驗。因此,如何構建支持文本、視覺和語音三種模態的多模態大模型成為近期研究熱點。現有的多模態大模型通常利用多個編碼器提取各個模態的表示,然后將各模態表示沿序列維度拼接并輸入至大語言模型基座中以生成回復。這些基于拼接的方法簡化了模態集成過程,但它們在很大程度上依賴大規模數據,以數據驅動的方式學習模態對齊。此外,這種基于拼接的維度對齊方式缺乏足夠的靈活性,無法像 GPT-4o 那樣在語音交互過程中同時生成中間文本結果。

圖片

為應對這一挑戰,中國科學院計算技術研究所自然語言處理團隊提出了文本-視覺-語音多模態大模型——Stream-Omni,其能同時支持各種模態組合下的交互。通過對各模態間的關系進行更有針對性的建模,Stream-Omni實現了更加高效和靈活的文本-視覺-語音模態對齊。僅依賴包含2.3萬小時語音的多模態數據,Stream-Omni即可具備文本交互、語音交互、基于視覺的語音交互等各種模態上的交互能力。與此同時,依賴于創新的語音建模方式,Stream-Omni能在語音交互過程中像GPT-4o一樣同步輸出中間文本轉錄結果,為用戶提供全方位的多模態交互體驗。

圖片

  • 論文題目:Stream-Omni: Simultaneous Multimodal Interactions with Large Language-Vision-Speech Model
  • 論文鏈接:https://arxiv.org/abs/2506.13642
  • 開源代碼:https://github.com/ictnlp/Stream-Omni
  • 模型下載:https://huggingface.co/ICTNLP/stream-omni-8b

Stream-Omni的模態對齊

圖片

現有多模態大模型中的模態對齊(如左圖所示):在序列維度上將三種模態的表示進行拼接,輸入至大語言模型基座

為了減輕對大規模三模態數據的依賴,Stream-Omni更有針對性地建模各模態之間的關系,即語音與文本應在語義上高度一致,而視覺則在語義上對文本形成互補關系。因此,Stream-Omni對不同模態采用不同對齊方式(如右圖所示):

  • 視覺-文本對齊:序列維度的視覺文本拼接
  • 語音-文本對齊:層級維度的語音文本映射

實現上,Stream-Omni 以大語言模型(LLM)為核心,并在其底部和頂部引入語音層,通過連接時序分類(Connectionist Temporal Classification,CTC)建模語音到文本的映射,此建模方式的優勢在于:

  • 支持通過語音模態進行外部交互,同時利用文本模態在內部控制生成的內容;
  • 基于CTC的語音-文本映射為語音文本在表示和結構的對齊上提供更加直接的監督,因此Stream-Omni 能夠在僅使用少量語音數據的情況下,將 LLM 主干的文本能力遷移至語音模態。
  • 層級維度映射使得Stream-Omni 在語音交互過程中還能同步輸出中間文本結果(即指令和回復的轉錄文本),為用戶提供更全面的多模態體驗。

Stream-Omni

圖片

Stream-Omni以大語言模型作為主干,逐步將視覺和語音與文本對齊,高效地構建了一個支持文本、視覺和語音的多模態大模型。在視覺-文本對齊方面,Stream-Omni采用視覺編碼器和投影模塊提取視覺表示,并將其與文本表示進行拼接。在語音-文本對齊方面,Stream-Omni在 LLM 主干的底部和頂部分別引入若干語音層,用于將語音映射到文本以及基于文本生成語音。

視覺模態

基于視覺模態與文本模態之間具有語義互補性,Stream-Omni 采用LLaVA架構中的序列維度拼接的方式進行視覺-文本對齊。

語音模態

(1)語音離散化:Stream-Omni采用CosyVoice Tokenizer對語音輸入進行離散化,編碼為若干離散的語音單元(<Audio_72>< Audio_965>…)。

(2)語音到文本映射:為了充分利用LLM的能力,Stream-Omni在LLM的底部引入語音層,用于學習語音與文本之間的映射關系,從而將 LLM 中的文本能力遷移到語音模態中。Stream-Omni利用在ASR任務上的CTC損失直接監督底部語音層語音表示,將其與文本模態對齊。

(3)文本生成:LLM基于輸入的視覺表示和語音表示,生成文本回復。

(4)文本到語音生成:Stream-Omni通過頂部語音層來完成文本到語音生成。為了在生成文本的同時生成語音單元,Stream-Omni在頂部語音層中引入了alignment-based fusion模塊。Alignment-based fusion沿用了StreamSpeech等實時生成研究中的同步生成策略,利用CTC對齊來指導同步生成過程。

任意模態組合下的多模態交互

Stream-Omni能夠通過靈活組合視覺編碼器、底部語音層、LLM、頂部語音層來實現任意模態組合下的交互。同時,由于層級維度語音文本映射,Stream-Omni能夠在語音到語音生成過程中提供中間的文本結果。

實驗結果

視覺理解能力

圖片

Stream-Omni和相同規模和數據量級的視覺大模型取得相當的表現。

語音交互能力

圖片

在事實性的語音交互上,Stream-Omni相比于現有方法具有優勢,源于層級維度的語音文本映射將LLM的文本能力遷移到語音模態上。

基于視覺的語音交互能力

圖片

在本實例中,在指令分別通過文本和語音輸入的情況下,VITA-1.5 給出了兩個相互矛盾的回答:“不允許前往二樓”和“直接通往二樓”。這一在面對不同模態指令時產生的矛盾回應,源于沿序列維度拼接視覺、語音和文本表示來實現多模態對齊的方法,并未對語音與文本模態之間的語義進行嚴格對齊建模。相比之下,Stream-Omni 引入語音到文本的映射機制,實現了語音與文本表示之間更精確的語義對齊。因此,Stream-Omni 在不同模態下表現更加一致,無論指令是通過文本還是語音輸入,都能生成相似的響應。另外,Stream-Omni還能生成高質量的語音回復,更多實例請在https://github.com/ictnlp/Stream-Omni體驗。

總結

  • Stream-Omni是一個GPT-4o式的文本-視覺-語音多模態大模型,能夠支持多種模態組合下的多模態交互。
  • Stream-Omni能夠在語音交互過程中輸出中間文本結果,為用戶提供更全面的多模態交互體驗。
  • Stream-Omni關注如何構建模態對齊,語音表現力等方面的增強不是本研究的重點,因此其在擬人化、音色多樣性等方面存在局限性。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-13 09:39:13

2025-01-08 08:21:16

2024-05-17 16:02:00

2025-02-27 09:51:04

2025-04-14 00:20:00

2024-07-23 10:34:57

2025-11-07 01:25:00

美團全模態大模型

2024-12-18 18:57:58

2025-09-16 09:35:52

2024-12-30 00:01:00

多模態大模型Python

2025-02-26 13:45:00

2025-03-27 09:40:59

2025-03-12 13:09:16

2024-03-25 12:30:18

AI訓練開源

2024-09-25 14:53:00

2025-05-21 08:47:00

2025-11-05 08:51:33

2025-01-06 10:00:00

模型視覺生成
點贊
收藏

51CTO技術棧公眾號

丁香婷婷综合激情| 麻豆国产精品官网| 久久这里只有精品首页| 中文字幕亚洲无线码a| 成人精品福利视频| 免费无码一区二区三区| caopo在线| 精品国产一区二区三区噜噜噜 | av免费在线观| 日韩中文字幕91| 日韩精品免费在线视频观看| 日本免费成人网| 国产女人18毛片水真多| 日韩综合一区| 欧美视频在线一区| 日韩精品无码一区二区三区| 久久亚洲精品国产| 欧美成人基地| 天天综合天天综合色| 亚洲一区二区三区久久| 日韩一区二区三区四区视频| 欧美va视频| 欧美激情一区二区三区不卡| 国产成人精品片| 亚洲天堂成人av| 在线观看免费视频你懂的| 成人不卡免费av| 欧美精品18videos性欧美| 国产高清999| 免费在线观看黄色网| 久久精品国产精品青草| 91黑丝在线观看| 真人bbbbbbbbb毛片| www.久久99| 亚洲欧美一区二区三区极速播放| 91精品中国老女人| 麻豆精品一区二区三区视频| 精品久久国产一区| 亚洲一区自拍偷拍| 国产欧美日韩综合精品二区| 亚洲精品国产精品乱码| 亚洲国产一区二区三区在线播放| 日韩无一区二区| 日韩日韩日韩日韩日韩| 你懂的在线网址| 天堂精品中文字幕在线| 日韩在线小视频| 精品人妻一区二区乱码| 九色porny视频在线观看| xfplay精品久久| 国产精品大片wwwwww| 超碰人人干人人| 欧美中文高清| 日韩欧美在线国产| 国产日韩视频在线播放| 六月婷婷综合网| 老司机精品视频网站| 2018日韩中文字幕| 免费看日韩毛片| 99日韩精品| 尤物精品国产第一福利三区 | 欧美/亚洲一区| 亚洲第一免费播放区| www.亚洲天堂网| 黄网站app在线观看| 95精品视频在线| 成人激情视频在线| 国产精品视频a| 亚洲毛片视频| 日韩日本欧美亚洲| 亚洲成人日韩在线| 亚洲国产合集| 精品国产自在久精品国产| www.国产二区| 91九色美女在线视频| 中文字幕欧美日本乱码一线二线 | 日本妇乱大交xxxxx| 欧美日韩亚洲一区在线观看| 国产亚洲精品美女久久久久| 波多野结衣电影免费观看| 一区二区日韩| 51精品久久久久久久蜜臀| 日韩网址在线观看| abab456成人免费网址| 一区二区成人在线观看| 亚洲午夜久久久影院伊人| 三级小视频在线观看| 经典三级在线一区| 国产精品国产三级国产aⅴ9色| 成人午夜精品视频| 精品影视av免费| 国产成人在线一区| 青青青国产在线| 亚洲国内自拍| 国产精品激情自拍| 国产黄色免费大片| 精品一区二区三区在线观看| 999精品视频一区二区三区| 伊人影院中文字幕| 首页欧美精品中文字幕| 成人啪啪免费看| 五月激情六月婷婷| 成人性生交大片免费看中文| 91色p视频在线| 亚洲欧洲成人在线| 亚洲欧洲精品天堂一级| 中国一区二区三区| 日本不卡不卡| 欧美日韩亚洲激情| 日本精品久久久久久久久久| 黄色网页在线免费看| 五月激情综合网| 日韩a一级欧美一级| 蜜桃tv一区二区三区| 亚洲加勒比久久88色综合| 国产精品果冻传媒| 91精品国产自产在线丝袜啪| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 欧美一区二区三区精品电影| 欧美日韩免费做爰视频| 可以看av的网站久久看| 成人区精品一区二区| 后进极品白嫩翘臀在线视频| 国产精品毛片久久久久久久| 亚洲国产精品综合| 日本不卡不卡| 在线观看日韩毛片| av中文字幕网址| 精品国产一区二| 日韩中文字幕第一页| 7799精品视频天天看| 三级成人在线视频| 国产视色精品亚洲一区二区| 国产区在线观看| 欧美日韩免费高清一区色橹橹 | 激情综合色播五月| 日日噜噜噜噜夜夜爽亚洲精品| 91精品国产综合久久久久久豆腐| 中文字幕中文在线不卡住| 午夜啪啪福利视频| 成人三级高清视频在线看| 91豆麻精品91久久久久久| 中文字幕久久av| av在线不卡顿| 国产精品久久久久久av福利软件| 日韩a在线观看| 国产精品水嫩水嫩| 日韩一级片播放| 高清不卡一区| 亚洲精品久久久久久久久久久| 91高清免费观看| 亚洲黄页一区| 国产私拍一区| 在线天堂资源| 91精品婷婷国产综合久久| 精品一区二区三孕妇视频| 你懂的成人av| 99久久国产免费免费| 免费在线视频你懂得| 日本久久电影网| 久久精品三级视频| 久久99精品国产.久久久久久| 夜夜爽www精品| av在线国产精品| 欧美精品videosex牲欧美| 国产 欧美 自拍| 狠狠干狠狠久久| 日本二区在线观看| 亚洲调教视频在线观看| 国产精品色悠悠| 神马午夜电影一区二区三区在线观看| 亚洲无线码一区二区三区| 人妻丰满熟妇av无码久久洗澡 | av亚洲免费| 成人欧美一区二区三区在线湿哒哒 | 日韩欧美中文字幕一区二区三区| 欧美日本高清一区| 欧美另类高清videos的特点| 国产精品网站一区| a级大片免费看| 欧美激情黄色片| 日本欧美爱爱爱| 好男人www在线视频| 日韩欧美极品在线观看| 日本在线观看网址| 国产成人免费在线| 中国人体摄影一区二区三区| 4438全国亚洲精品观看视频| 88xx成人精品| 免费在线看a| 日韩精品免费视频| 97超碰国产在线| 国产三级一区二区三区| 日韩av一二三四区| 精品视频高潮| 欧美精品videos另类日本| 日本成人一区二区三区| 欧美人动与zoxxxx乱| 国产无套粉嫩白浆内谢| 国产不卡一区视频| 欧美精品在欧美一区二区| 亚洲精品亚洲人成在线| 92看片淫黄大片欧美看国产片| a在线视频v视频| 日韩三级影视基地| 欧美91精品久久久久国产性生爱| 欧美一级欧美三级在线观看| 欧美日韩一级黄色片| 亚洲主播在线播放| 久久久久久久麻豆| 国产一二精品视频| 潘金莲一级淫片aaaaa免费看| 青青一区二区| 91丨九色丨国产| 在线成人视屏| 欧美性受xxx| 色呦呦久久久| 欧美精品一区二区三| 日本一区二区三区久久| 欧美日韩美女在线| 亚洲激情视频一区| 91亚洲精华国产精华精华液| 天堂av2020| 欧美一区二区| 亚洲在线观看一区| 精品国产美女| 久久久久久久久久码影片| 欧美××××黑人××性爽 | 97se在线视频| 日本久久二区| 色综合色综合网色综合| 丰满人妻一区二区| 欧美一级高清大全免费观看| 在线免费观看一区二区| 亚洲精品老司机| 好吊色视频一区二区三区| 亚洲东热激情| 日韩欧美亚洲精品| 欧美美女在线| 日韩成人在线资源| 国产精品一区二区av日韩在线 | 给我免费播放片在线观看| 欧美精品综合| 四虎4hu永久免费入口| 久久精品国产亚洲5555| 成人羞羞视频免费| 亚洲一区二区三区日本久久九| 亚洲r级在线观看| 成人午夜888| 51国偷自产一区二区三区| 亚洲一区二区三区久久久| 91精品美女在线| 国产精品一区二区三区av| 91啪国产在线| 成人精品毛片| 91精品久久久久久综合乱菊| 人人精品久久| 91一区二区三区| 成人免费在线电影网| 精品无码久久久久国产| 国产精品一区二区三区www| 91亚洲永久免费精品| 国模大尺度视频一区二区| 97超碰最新| 露出调教综合另类| 欧洲精品一区色| 精品三级av| 欧美性bbwbbwbbwhd| 一区二区在线视频观看| 国产精品一区二区三区在线观 | 一本到一区二区三区| 成人免费视频国产免费观看| 久久亚洲综合色| 国产精品www爽爽爽| 亚洲三级在线播放| 国产在线精品观看| 在线欧美日韩国产| 国产日韩一级片| 日韩欧美电影在线| 国产免费不卡av| 欧美精品一区二区在线观看| 国产中文字幕在线播放| 亚洲精品久久久一区二区三区 | 亚洲免费观看视频| 女人十八毛片嫩草av| 自拍偷自拍亚洲精品播放| 欧美日韩综合一区二区| 天天免费综合色| 中文字幕第2页| 精品国产网站在线观看| 国产美女性感在线观看懂色av| 亚洲精品乱码久久久久久按摩观| 国产一区二区影视| 欧美肥婆姓交大片| 少妇一区视频| 成人在线看片| 久久视频在线| 日本免费不卡一区二区| 精久久久久久久久久久| av无码av天天av天天爽| 亚洲色图另类专区| 亚洲黄色激情视频| 欧美久久久久久久久久| 在线观看免费高清视频| 亚洲第一精品夜夜躁人人爽| 日本不卡在线| 日韩美女视频在线观看| 亚洲伊人影院| 精品日韩在线播放| 日韩一区精品字幕| 精品国产av色一区二区深夜久久| 中文字幕一区二区视频| 亚洲成人第一网站| 精品裸体舞一区二区三区| 欧美成人二区| 国产成人自拍视频在线观看| aiai久久| 欧美大片免费播放| 精品一区二区在线播放| 最近中文字幕在线mv视频在线| 久久久精品中文字幕麻豆发布| 玖玖爱在线观看| 久久久久久久性| 日韩少妇高潮抽搐| 日韩一级免费观看| 欧美激情视频在线播放| 欧美一区二区.| 午夜a一级毛片亚洲欧洲| 日本欧美色综合网站免费| 一区二区毛片| 日本五十肥熟交尾| 亚洲一区二区不卡免费| 亚洲成人中文字幕在线| 日韩高清av一区二区三区| 免费在线午夜视频| 国产精品免费观看在线| 欧美亚洲国产一区| 黄网站色视频免费观看| 国产真实精品久久二三区| а天堂中文在线资源| 欧美日韩一区二区三区四区 | 亚洲一区二区三区色| 日本欧美一区二区三区乱码| 99视频在线观看视频| 国产精品久久久久久久久晋中 | 久久99精品国产麻豆不卡| 在线观看亚洲大片短视频| 色欧美88888久久久久久影院| 青青草超碰在线| 日本高清视频一区| 精品国产鲁一鲁****| 一区二区三区四区久久| 国产一区二区三区四| 曰本女人与公拘交酡| 日韩精品一区二区三区在线| 男女在线观看视频| 国产精品海角社区在线观看| 欧洲毛片在线视频免费观看| www午夜视频| av中文字幕一区| 国产在视频线精品视频| 在线成人免费视频| av在线免费观看网址| 成人动漫在线观看视频| 在线看片一区| 中文字幕第4页| 欧美日韩亚洲综合一区二区三区| 欧美日本一道| 国产精品12| 久久亚洲视频| 色老板免费视频| 亚洲电影成人av99爱色| 欧美亚洲韩国| 亚洲黄色网址在线观看| 不卡一区在线观看| 国产99免费视频| 日韩极品精品视频免费观看| 亚洲欧洲自拍| 手机看片日韩国产| 成a人片国产精品| 婷婷激情五月综合| 久久成人av网站| 日韩深夜福利网站| 黄色三级中文字幕| 久久九九久久九九| 99久久久久成人国产免费| 4438全国成人免费| 天天影视天天精品| 校园春色 亚洲色图| 久久久国际精品| 99久久一区二区| 日韩免费视频在线观看| 夜间精品视频| 亚洲欧美天堂在线| 五月天视频一区| 黄色一级大片在线免费看产| 久久精品国产第一区二区三区最新章节 | 97国产成人精品视频| 18国产精品| 999精品视频在线|