精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述 原創(chuàng)

發(fā)布于 2025-9-25 10:56
瀏覽
0收藏

首先從源碼角度看Qwen3VL的改進,核心圍繞增強多模態(tài)融合深度(DeepStack)、優(yōu)化視覺特征處理、提升時序建模精度(視頻時間戳編碼)以及精細化歸一化設(shè)計(文本專用RMSNorm),整體更注重多模態(tài)任務(wù)中的特征對齊與深層交互。然后概述DeepStack用于多模態(tài)大模型的核心思想。

Qwen3VL源碼側(cè)改進點

代碼側(cè)改動如下:

1.??hidden_act="silu"??? -> ??hidden_act="gelu_pytorch_tanh"??

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述-AI.x社區(qū)

2.Qwen3VLProcessor引入??Qwen3VLVideoProcessor??,更加適配視頻處理

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述-AI.x社區(qū)

3.視覺塊歸一化層調(diào)整

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述-AI.x社區(qū)

  • Qwen2.5VL:視覺塊(??Qwen2_5_VLVisionBlock???)使用??Qwen2RMSNorm??作為歸一化層(一種RMSNorm變體)。
  • Qwen3VL:視覺塊(??Qwen3VLVisionBlock???)改用??nn.LayerNorm??(標準層歸一化)。這一調(diào)整可能是為了更好地適配視覺特征的分布特性,提升訓練穩(wěn)定性或特征表達能力。

4.引入DeepStack多模態(tài)融合機制

  • Qwen3VL在文本模型(??Qwen3VLTextModel??)中新增了DeepStack機制(DeepStack機制能讓視覺信息更深度地參與文本解碼過程,提升多模態(tài)理解的連貫性。),通過??_deepstack_process???方法將視覺特征(??deepstack_visual_embeds??)融入解碼器的多個隱藏層。在解碼器層的前向傳播中,會在指定層將視覺特征疊加到對應(yīng)位置的文本隱藏狀態(tài)上:

# Qwen3VLTextModel.forward
if deepstack_visual_embeds is not None and layer_idx in range(len(deepstack_visual_embeds)):
    hidden_states = self._deepstack_process(
        hidden_states, visual_pos_masks, deepstack_visual_embeds[layer_idx]
    )
  • Qwen2.5VL視覺特征僅在輸入嵌入階段替換占位符 token,未在解碼器深層進行融合。

5.視頻時序位置編碼優(yōu)化

  • Qwen2.5VL:在??get_rope_index???中,視頻的時序位置編碼基于絕對時間間隔(如??second_per_grid_t * tokens_per_second??),直接計算時序索引。
  • Qwen3VL:修改了視頻時序處理邏輯,通過時間戳(而非絕對時間位置)區(qū)分視頻幀,將??video_grid_thw???重復展開并強制時序維度為1(??video_grid_thw[:, 0] = 1??),時序信息通過外部時間戳 token 傳遞:

# Qwen3VLModel.get_rope_index
if video_grid_thw is not None:
    video_grid_thw = torch.repeat_interleave(video_grid_thw, video_grid_thw[:, 0], dim=0)
    video_grid_thw[:, 0] = 1  # 時序維度固定為1,依賴時間戳區(qū)分

6.視覺特征分層輸出與融合

  • Qwen3VL:視覺模型(??Qwen3VLVisionModel???)的??get_image_features???和??get_video_features??不僅返回最終視覺嵌入,還返回分層視覺特征(??deepstack_image_embeds/deepstack_video_embeds??),用于DeepStack機制在解碼器多層融合:

# Qwen3VLModel.get_image_features
image_embeds, deepstack_image_embeds = self.visual(pixel_values, grid_thw=image_grid_thw)
  • Qwen2.5VL:僅返回單一視覺嵌入,無分層特征輸出。分層特征融合能讓不同層級的視覺信息(如低級紋理、高級語義)分別參與文本解碼,提升多模態(tài)對齊精度。

7.文本RMSNorm的獨立優(yōu)化

  • Qwen3VL:新增??Qwen3VLTextRMSNorm???類,專門針對文本部分優(yōu)化??RMSNorm???,明確注釋其與T5LayerNorm等效,并通過??@use_kernel_forward_from_hub("RMSNorm")??引入可能的 kernel 優(yōu)化:

@use_kernel_forward_from_hub("RMSNorm")
class Qwen3VLTextRMSNorm(nn.Module):
    def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
        input_dtype = hidden_states.dtype
        hidden_states = hidden_states.to(torch.float32)
        variance = hidden_states.pow(2).mean(-1, keepdim=True)
        hidden_states = hidden_states * torch.rsqrt(variance + self.variance_epsilon)
        return self.weight * hidden_states.to(input_dtype)
  • Qwen2.5VL:文本和視覺共享??Qwen2RMSNorm???,未針對文本單獨優(yōu)化。文本??RMSNorm??的獨立設(shè)計可更精細地適配文本特征分布,提升語言建模能力。

DeepStack

大多數(shù)多模態(tài)模型通過將視覺 token 作為序列輸入到LLM的第一層來實現(xiàn)。這種架構(gòu)雖然簡單,但顯著增加了計算 和內(nèi)存成本,因為其輸入層需要處理大量額外的 token。DeepStack考慮到 LMMs 中語言和視覺 Transformer 的 N 層,將視覺 token 堆疊成 N 組,并將每組從下到上依次輸入到其對應(yīng)的 Transformer 層.

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述-AI.x社區(qū)

  • 如上左圖:傳統(tǒng)的大型多模態(tài)模型將所有視覺 token 串接成一個序列,適用 于高分辨率和低分辨率圖像。
  • 中間圖: DeepStack LMMs 將 token 堆疊成網(wǎng)格,并自下而上地將其注入到 Transformer 的前幾層和中間層,僅通過殘差連接實現(xiàn)。
  • 右圖:將 DeepStack 應(yīng)用于 Vicuna-7B(DeepStack-L)和 CLIP ViT-L(DeepStack-V),模型能夠接受 4× 倍的視覺 token,在相同的上下文長度下顯著超 越序列式 LMM,并在廣泛的基準測試中與使用更長上下文的模型相媲美。

架構(gòu)

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述-AI.x社區(qū)

主要創(chuàng)新在于 DeepStack 策略(通過將圖像特征抽取分為兩個流來實現(xiàn)這一點:一個全局視圖流用于捕捉全局信息,另一個高分辨率流通過在不同層的大模型中堆疊擴張的高分辨率圖像特征來增強全局信息。),該策略將視覺 token 注入到不同的層中。大白話:DeepStack 的本質(zhì)是利用 Transformer 的分層架構(gòu)特性,將視覺 token 的 “整合過程” 分散到 LLM 的多層中

  • 左圖:用于大模型的 DeepStack :給定輸入圖像,將從低分辨率版本中提取的 token 輸入到大模型的輸入層。考慮到圖像的二維特性,從高分辨率版本中提取相鄰區(qū)域,并將其重新組織為DeepStack ,然后將其輸入到大模型的后續(xù)層中。
  • 右圖:用于 ViTs 的 DeepStack :采用類似的采樣策略,但將視覺 token 輸入到視覺編碼器的 ViT 層中。DeepStack-V 的適配邏輯:利用 ViTs 的編碼器分層結(jié)構(gòu),將高分辨率視覺 token 注入 ViTs 的中間層,而非僅在輸入層(PatchEmbed)處理,增強 ViTs 的細粒度特征提取能力。

多模態(tài)大模型基于投影的連接模塊獲得了視覺標記,DeepStack策略就是如何在保持多模態(tài)處理有效的同時提供信息豐富的視覺標記。

DeepStack PyTorch偽代碼:

Qwen3VL源碼側(cè)改進點及DeepStack核心思想概述-AI.x社區(qū)

def forward(H0, Xstack, lstart, n, vis_pos):
    H = H0  # LLM初始隱藏態(tài)(含全局視覺token+文本token)
    for (idx, TransformerLayer) in enumerate(self.layers):
        # 滿足條件時,注入高分辨率堆疊token(殘差連接)
        if idx >= lstart and (idx - lstart) % n == 0:
            stack_idx = (idx - lstart) // n  # 對應(yīng)Xstack的索引
            H[vis_pos] += Xstack[stack_idx]  # vis_pos:視覺token在隱藏態(tài)中的位置
        # 正常執(zhí)行LLM的Transformer層計算
        H = TransformerLayer(H)
    return H

參考文獻


本文轉(zhuǎn)載自??大模型自然語言處理??   作者:余俊輝

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
已于2025-9-25 10:59:54修改
收藏
回復
舉報
回復
相關(guān)推薦
国内在线观看一区二区三区| 欧美极品少妇无套实战| 中文字幕天天干| 亚洲精品国产精| heyzo久久| 午夜精品在线看| 久久99国产精品自在自在app | 欧美自拍偷拍| 亚洲成人av一区二区三区| 91精品视频播放| www..com.cn蕾丝视频在线观看免费版| 91黄页在线观看| 欧美日本一区| 欧美一区二区成人| 黄色免费高清视频| 91久久精品无码一区二区| 欧美一级淫片| 欧美精品一区二区久久婷婷| 久久久久久久久久久综合| 国产视频二区在线观看| 视频一区视频二区中文字幕| 亚洲欧美制服中文字幕| 亚洲精品中文字幕无码蜜桃| 久久精品色图| 欧美日韩精品一本二本三本| 亚洲天堂av女优| 国产乱淫av麻豆国产免费| 在线中文字幕视频观看| 国产精品一区二区久久不卡| 美女精品视频一区| 91porn在线| 亚洲热av色在线播放| 亚洲欧洲综合另类在线| 91免费视频国产| 国产美女www| 国产精品99一区二区三| 欧美一区三区四区| 亚洲第一狼人区| 蜜桃av在线播放| 久久久www免费人成精品| 国产精品久久久久高潮| 天堂а√在线中文在线鲁大师| 欧美aaa视频| 日韩一区日韩二区| 亚洲最大av在线| 日韩黄色三级视频| 香蕉久久精品| 欧美撒尿777hd撒尿| 99久re热视频精品98| 欧美一级特黄aaaaaa| 久久成人在线| 日韩视频永久免费观看| 麻豆网站免费观看| 自拍在线观看| 亚洲天堂成人在线观看| 一区二区三区欧美成人| 亚洲精选一区二区三区| 国产精品亚洲一区二区三区在线| 91免费版网站入口| 亚洲第一色视频| 成人综合婷婷国产精品久久蜜臀 | 手机在线免费看片| 亚洲不卡在线| 欧美性videos高清精品| 一区二区在线不卡| 午夜视频1000| 久久精品国产在热久久| 97视频在线观看网址| 亚洲一区二区三区日韩| 午夜日韩影院| 亚洲аv电影天堂网| 性囗交免费视频观看| 亚洲精品无播放器在线播放| 91.麻豆视频| 激情综合网婷婷| 色婷婷视频在线观看| 国产免费观看久久| 久久精品人成| av老司机久久| 蜜桃av噜噜一区| 55夜色66夜色国产精品视频| 久久国产波多野结衣| 午夜精品偷拍| 丝袜美腿亚洲一区二区| 91av在线免费| 亚洲精品在线国产| 精品视频免费在线| 日日夜夜精品视频免费观看| 国产图片一区| 日韩欧美的一区| 91丨九色丨蝌蚪| 嫩草伊人久久精品少妇av杨幂| 亚洲一卡二卡三卡四卡无卡久久 | 精品久久久久一区二区| 4438五月综合| 精品久久久久av影院 | 成人免费三级在线| 欧美一区二区影视| 日韩永久免费视频| 中文字幕乱码日本亚洲一区二区| 免费国产一区| 色视频在线观看免费| 成人免费av网站| 少妇精品久久久久久久久久| 女人天堂在线| 一区二区视频在线看| 在线视频一二三区| 色偷偷偷在线视频播放| 欧美久久免费观看| 中文字幕22页| 欧美人体视频| 亚洲免费av网址| 国产熟妇搡bbbb搡bbbb| 日韩丝袜视频| 欧美精品在线免费播放| 毛片在线免费播放| 97久久精品人人爽人人爽蜜臀| 国产自产在线视频一区| 天天干视频在线| www.av亚洲| 久久99国产精品99久久| 免费一级在线观看播放网址| 亚洲综合一区二区精品导航| 国产一二三在线视频| 免费在线小视频| 欧美一区二区福利在线| 一级片久久久久| 天天射综合网视频| 国产成人精品电影久久久| 波多野结衣视频观看| 成人av高清在线| 麻豆传媒一区二区| 2021天堂中文幕一二区在线观| 69堂成人精品免费视频| 亚洲女人毛茸茸高潮| 视频一区二区三区在线| 久久99久久99精品蜜柚传媒| bl视频在线免费观看| 日韩午夜在线影院| 婷婷五月精品中文字幕| 女人香蕉久久**毛片精品| 国产精品一区二区久久久久| 国产乱码精品一区二三区蜜臂 | 国产精品入口免费视| 最新中文字幕在线观看视频| 久久国产精品99精品国产 | 国产精品美女久久久久aⅴ| 99精品视频网站| 日本成人在线网站| 亚洲白拍色综合图区| 久久久久久福利| 久久精品三级| 日本不卡二区| 91天天综合| 欧美精品一区二区三区四区| 免费一级全黄少妇性色生活片| 中文一区在线| 成人国产精品免费视频| 午夜av免费观看| 欧美视频在线观看免费| 亚洲一级av无码毛片精品| 日韩亚洲精品在线| 国产在线拍偷自揄拍精品| 欧美少妇bbw| 天天影视色香欲综合网老头| 亚洲欧美aaa| 一区二区三区国产精华| 国产成人高潮免费观看精品| 国产视频第一区| 这里只有精品电影| 久久久久无码国产精品不卡| av资源网一区| 日本成人黄色网| 成人看片爽爽爽| 久久在线免费观看视频| 亚洲GV成人无码久久精品| 国产精品一区不卡| 欧美图片激情小说| 色天天色综合| 国产美女久久精品| 欧洲在线视频| 欧美日本一道本在线视频| 少妇特黄一区二区三区| 免费在线观看视频一区| ijzzijzzij亚洲大全| 红杏一区二区三区| 九色精品免费永久在线| 天天综合网在线观看| 欧洲生活片亚洲生活在线观看| 日本国产在线视频| 日韩在线a电影| 欧美日韩亚洲在线| 天堂网在线最新版www中文网| 国产一区二区三区在线观看视频| 精品在线播放视频| 粉嫩av亚洲一区二区图片| 老司机av福利| 欧美黄色影院| 91久久久精品| xxx欧美xxx| 国产视频综合在线| 久草视频在线观| 波多野结衣视频一区| 在线免费视频a| 精品国产一区二区三区噜噜噜| 91免费在线视频| 日韩精品美女| 九九九久久久久久| 高清毛片在线看| 亚洲高清色综合| 国产成人一区二区三区影院在线 | 中文字幕第69页| av中文字幕一区| 亚洲精品一二三四| 亚洲欧美伊人| 无遮挡亚洲一区| 日韩啪啪网站| 高清视频一区| 三级在线看中文字幕完整版| 久久亚洲精品一区| 风间由美一区| 国产视频精品久久久| 成人午夜视频一区二区播放| 亚洲国产人成综合网站| 国产小视频你懂的| 久久久国产午夜精品| 免费日本黄色网址| 成人自拍视频在线| 性折磨bdsm欧美激情另类| 精品制服美女丁香| 奇米影音第四色| 老牛国产精品一区的观看方式| 黄色成人在线看| 国产欧美一区| 91丝袜美腿美女视频网站| 日韩一区二区三区在线免费观看| 久久久亚洲福利精品午夜| 青青草av免费在线观看| 亚洲的天堂在线中文字幕| 精品人妻一区二区三区日产乱码| 亚洲国产精品久久人人爱| 国产极品国产极品| 99在线热播精品免费| 日本wwwwwww| 老司机精品视频网站| 国产最新免费视频| 国产精品99在线观看| 在线国产伦理一区| 91视频久久| 国产综合色一区二区三区| 亚洲三区欧美一区国产二区| julia一区二区中文久久94| xx欧美xxx| 国产成人中文字幕| 成人啊v在线| 国产精品久久久久久久久久久新郎 | 亚洲男人的天堂av| 菠萝菠萝蜜网站| 91浏览器在线视频| 1314成人网| 国产成人综合在线观看| 日本久久精品一区二区| 日韩电影一二三区| 国产乱女淫av麻豆国产| 米奇777在线欧美播放| 欧在线一二三四区| 美女视频免费一区| 中文字幕欧美视频| 99久久国产综合精品色伊| 一二三不卡视频| 欧美国产一区二区| 国产大学生自拍| 亚洲国产激情av| 国产免费久久久久| 亚洲一区二区三区在线看| 欧美日韩综合在线观看| 色老汉一区二区三区| 久久国产一级片| 狠狠躁夜夜躁人人躁婷婷91 | 精品久久久久久中文字幕| 成人午夜视频在线播放| 一区二区三区日韩精品视频| 九九九国产视频| 亚洲精品成a人| 日韩欧美三级在线观看| 欧美亚洲日本国产| aaaaaa毛片| 制服视频三区第一页精品| 神马午夜一区二区| 色一区av在线| 91桃色在线观看| 国产一区二区在线免费| 欧美大胆视频| 青少年xxxxx性开放hg| 国产精品综合色区在线观看| 国产三级精品三级在线| av一区二区三区| 午夜国产福利一区二区| 狠狠综合久久av一区二区小说| 国产精品视频在线观看免费| 日韩久久精品电影| 国产91在线视频蝌蚪| 日韩中文字幕国产精品| 国产99在线观看| 2019中文字幕免费视频| 国产精品美女久久久久人| 亚洲影院在线看| 久久99国产成人小视频| 欧美一区二区三区精美影视 | 成人一区二区三| 国产成人综合亚洲91猫咪| 成人在线手机视频| 精品久久久免费| 草逼视频免费看| 日韩一级黄色av| 欧美日韩免费观看视频| 国产伦精品一区二区三区免 | 欧美电影免费观看高清完整| 欧美最近摘花xxxx摘花| 精品无人乱码一区二区三区 | 国产精品xxx视频| 欧美黑人巨大videos精品| www.日本三级| 国产一区不卡精品| 日本wwwwwww| 亚洲免费大片在线观看| 伊人网站在线观看| 日韩午夜小视频| 免费成人黄色| 欧美激情在线狂野欧美精品| caoprom在线| 成人av免费电影| 欧美.www| 日本中文字幕在线不卡| 中文字幕亚洲视频| 久久精品一级片| 日韩一区二区三区av| 欧美成人视屏| 91精品久久久久久综合乱菊| 日本不卡高清| 波多结衣在线观看| 中文无字幕一区二区三区 | 亚洲资源在线网| 蜜乳av一区二区三区| 五月婷婷六月香| 亚洲国产精品久久不卡毛片| 亚洲不卡免费视频| 欧美国产乱视频| 成人视屏在线观看| 欧美一区二区福利| 日本不卡中文字幕| 久久精品无码专区| 亚洲国产一区二区三区| 黄色www视频| 5566日本婷婷色中文字幕97| 婷婷成人综合| 99草草国产熟女视频在线| 欧美国产综合一区二区| 97人妻精品一区二区三区视频 | 午夜老司机精品| 麻豆成人av在线| 久久久久久久久毛片| 亚洲精品一区二区三区福利| 国产乱码午夜在线视频| 日本日本精品二区免费| 久久精品72免费观看| 欧美黄色免费观看| 亚洲国产欧美自拍| 菠萝蜜视频国产在线播放| 99在线视频首页| 亚洲欧美清纯在线制服| 91丨porny丨九色| 亚洲一区二区三区视频在线| 亚洲av成人无码网天堂| 国产精品69精品一区二区三区| 91亚洲国产高清| 少妇极品熟妇人妻无码| 欧美性生交xxxxx久久久| 99中文字幕一区| 国产精品成人免费视频| 欧美第一精品| 国产精品久久久久久久无码| 欧美亚洲自拍偷拍| 日韩精品卡一| 日韩免费一区二区三区| 亚洲一区不卡| 国产福利在线导航| 欧美哺乳videos| 欧美性片在线观看| 国产精品自拍合集| 国产拍揄自揄精品视频麻豆| www.色呦呦| 国产精品久久在线观看| 精品成人一区| 成年人小视频在线观看| 色综合久久久久综合体桃花网| 五月婷婷在线播放| 成人午夜两性视频| 午夜影院日韩| 欧美黑吊大战白妞|