精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling 原創(chuàng)

發(fā)布于 2025-5-8 06:48
瀏覽
0收藏

在《??多模態(tài)大模型輕量化探索-視覺大模型SAM的視覺編碼器???》介紹到,縮小視覺編碼器的尺寸,能夠有效的降低多模態(tài)大模型的參數(shù)量。再來看一個(gè)整體的工作,從視覺側(cè)和語言模型側(cè)綜合考量模型參數(shù)量的平衡模式,進(jìn)一步降低參數(shù)量,甚至最小達(dá)256M參數(shù)量,推理時(shí)顯存占用<1GB。下面來看看,僅供參考。

模型架構(gòu)

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

SmolVLM 架構(gòu)。圖像被分割成子圖像,從視頻中采樣幀,然后編碼成視覺特征。這些特征首先通過像素重排,然后通過MLP投影映射到LLM輸入空間作為視覺標(biāo)記。然后,視覺標(biāo)記與文本嵌入(橙色/紅色)連接/交錯(cuò)。這個(gè)組合序列被傳遞給LLM進(jìn)行文本輸出。

那么,如何設(shè)計(jì)一個(gè)高效的小型多模態(tài)模型架構(gòu)?

Q1: 如何在視覺和語言模型之間分配計(jì)算?

傳統(tǒng)大型VLMs(如Flamingo)將90%以上參數(shù)分配給語言模型(LM),但SmolVLM發(fā)現(xiàn):小規(guī)模LM需重新平衡視覺與語言的計(jì)算資源。

研究方法:將三種不同規(guī)模的SmolLM2變體(135M、360M和1.7B參數(shù))與兩種SigLIP編碼器(一個(gè)緊湊的93M SigLIP-B/16和一個(gè)較大的428M SigLIP-SO400M)進(jìn)行配對。

發(fā)現(xiàn):通常情況下,較大的VLM會不均衡地將參數(shù)分配給語言模型,但在小型模型中,這種分配方式不再適用。當(dāng)使用大型編碼器與最小的LM(135M)時(shí),性能顯著下降,表明這種配置效率低下。在中等規(guī)模的LM(360M)中,較大的編碼器可以提高性能,但會增加66%的參數(shù)。只有在最大的LM(1.7B)中,較大的編碼器僅增加10%的參數(shù)。

結(jié)論:緊湊的多模態(tài)模型受益于平衡的編碼器-LM參數(shù)分配,使得較小的視覺編碼器在效率上更具優(yōu)勢。即:模型越小,視覺編碼器應(yīng)更輕量,避免“頭重腳輕”。當(dāng)使用具有最小LM(135M)的大編碼器時(shí),性能顯著下降,突顯了編碼器-LM平衡效率低下。在中等LM規(guī)模(360M)時(shí),較大的編碼器將性能提高了11.6%,但這也伴隨著參數(shù)增加了66%,使得緊湊型編碼器更可取。只有在最大的LM規(guī)模(1.7B)時(shí),較大的編碼器僅代表參數(shù)增加了10%。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

Q2: 如何有效地將圖像傳遞給語言模型?

如何支持長上下文與對視覺token進(jìn)行壓縮?為了提高模型的上下文處理能力,采用了自注意力架構(gòu),其中視覺Token與文本token連接,并由語言模型共同處理。這種方法需要比SmolLM2的2ktoken限制更多的上下文。

研究方法:通過增加RoPE基數(shù)從10k到273k來擴(kuò)展上下文容量,并在長上下文數(shù)據(jù)(如Dolma書籍和The Stack)和短上下文數(shù)據(jù)(如FineWeb-Edu、DCLM和SmolLM2的數(shù)學(xué)數(shù)據(jù))上進(jìn)行微調(diào)。

發(fā)現(xiàn):擴(kuò)展上下文窗口對緊湊VLM有顯著的好處。對于1.7B的LM,微調(diào)在16ktoken時(shí)表現(xiàn)穩(wěn)定,但對于較小的模型(135M和360M),在超過8k token時(shí)表現(xiàn)不佳。因此,研究者們?yōu)镾molVLM采用了16k token的上下文,并為較小的變體設(shè)定了8k token的限制。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

像素重排:重新排列編碼圖像,以增加通道深度為代價(jià)換取空間分辨率。這減少了視覺標(biāo)記數(shù)量,同時(shí)保持信息密度。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

原理:將2×2空間區(qū)域重組為通道維度(上圖),token數(shù)減少4倍(r=2時(shí))。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

較小的VLMs從更激進(jìn)的壓縮(r = 4)中受益,因?yàn)闇p少的token數(shù)減輕了注意力開銷并改善了長上下文建模

對比基線:InternVL等使用r=2,但SmolVLM證明小模型需更激進(jìn)壓縮。

結(jié)論:小型VLM顯著受益于擴(kuò)展的上下文長度。

Q3: 如何有效地編碼圖像和視頻?

在多模態(tài)建模中,平衡圖像和視頻之間的token分配至關(guān)重要。圖像通常需要更高的分辨率和更多的token來保持質(zhì)量,而視頻則需要更少的token來高效處理長序列。

研究方法:采用了一種圖像分割策略,靈感來自UReader和SPHINX,將高分辨率圖像分割成多個(gè)子圖像,并保留原始圖像的縮小版本。這種方法在不增加過多計(jì)算開銷的情況下保持了圖像質(zhì)量。

視頻處理:對于視頻,發(fā)現(xiàn)幀平均策略會負(fù)面影響性能(下圖)。因此,選擇不采用幀平均策略,而是將視頻幀重新縮放到圖像編碼器的分辨率。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

結(jié)論:對于小型模型,圖像分割增強(qiáng)了視覺任務(wù)的表現(xiàn),而視頻幀平均則不適用。

數(shù)據(jù)策略

數(shù)據(jù)配比:最終訓(xùn)練集含14%文本、33%視頻、53%圖像

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

視覺(左側(cè))和視頻(右側(cè))的訓(xùn)練數(shù)據(jù)集詳情,按模態(tài)和子類別細(xì)分

性能

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

衍生模型-端到端的PDF解析多模態(tài)模型SmolDocling

模型結(jié)構(gòu):就是SmolVLM

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

訓(xùn)練數(shù)據(jù)(該模型核心):訓(xùn)練數(shù)據(jù)構(gòu)造上,引入了一種新的文檔標(biāo)記格式DocTags,用于標(biāo)準(zhǔn)化文檔轉(zhuǎn)換,這個(gè)是核心意義。DocTags定義了一個(gè)明確的標(biāo)簽和規(guī)則集,以分離文本內(nèi)容和文檔結(jié)構(gòu),從而提高圖像到序列模型的性能,如下圖:

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

對應(yīng)的語法

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

從上面類XML標(biāo)簽語法看來,感覺設(shè)計(jì)的非常冗余。整體上結(jié)合模型架構(gòu)也沒什么特殊的創(chuàng)新點(diǎn),并且,之前被自媒體吹得性能很強(qiáng),實(shí)際上,該模型還是demo玩具。個(gè)人使用后觀點(diǎn)。

參考文獻(xiàn):SmolVLM: Redefining small and efficient multimodal models,https://arxiv.org/pdf/2504.05299

開源地址:https://github.com/huggingface/smollm


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/2ZQKauOyMCDdXkzbFoDMhw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2025-5-8 06:48:33修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产女人精品视频| 在线精品国产欧美| 福利视频一区二区三区四区| 涩涩视频免费看| 国产精品嫩草99av在线| 亚洲最新av在线| 制服下的诱惑暮生| 欧美艳星kaydenkross| 中文字幕一区二区三区精华液 | 久99久在线| 久草热在线观看| 欧美精品自拍| 亚洲色图在线观看| 欧洲成人午夜精品无码区久久| jizzjizz中国精品麻豆| 久久久午夜精品理论片中文字幕| 成人亚洲欧美一区二区三区| 欧美精品亚洲精品日韩精品| 久久亚洲精品中文字幕蜜潮电影| 精品国产成人在线影院 | 欧美高清性xxxxhd| av免费在线观看不卡| 免费永久网站黄欧美| 久久夜色精品国产亚洲aⅴ| 中国极品少妇xxxx| 电影91久久久| 欧美视频在线播放| 精品人妻一区二区三区四区在线| 国产写真视频在线观看| 国产亚洲精品精华液| 国产一区二区高清不卡| 国产精品美女一区| 日韩高清欧美激情| 欧美一级成年大片在线观看 | 伊人五月天婷婷| 日韩av福利| 精品国产乱码久久久久酒店| www.一区二区.com| 久热国产在线| 国产精品超碰97尤物18| 欧美三日本三级少妇三99| 欧美视频一二区| 国产精品一二二区| 国产在线精品成人一区二区三区| 日韩精品一区不卡| 国产麻豆综合| 91精品国产九九九久久久亚洲| 久久机热这里只有精品| 亚洲精品网址| 另类色图亚洲色图| 四虎影院中文字幕| 久久久久久影院| 日韩色av导航| 欧美一级片在线视频| 99久久99久久精品国产片果冰| 亚洲夜晚福利在线观看| 91激情视频在线观看| 国产探花一区二区| 国产亚洲精品激情久久| 免费视频91蜜桃| 精品久久综合| 最近2019中文字幕第三页视频| 亚洲女同二女同志奶水| 99热国内精品永久免费观看| 日韩资源在线观看| 真实国产乱子伦对白在线| 综合久久婷婷| 午夜精品久久久久久久99黑人| 日韩三级一区二区三区| 久久国产日本精品| 国产精品永久免费视频| 一区二区 亚洲| 国产精品一区一区| 国产精品加勒比| 日韩一区av| 国产午夜精品一区二区三区视频| 性欧美.com| 欧美另类极品| 亚洲图片自拍偷拍| 成人一级片网站| 日韩一级特黄| 精品剧情v国产在线观看在线| www.17c.com喷水少妇| 欧美女王vk| 久久久av网站| 国产在线精品观看| 日日摸夜夜添夜夜添亚洲女人| 国产精品青青在线观看爽香蕉| 国产麻豆精品一区| 99视频精品免费视频| 性欧美videosex高清少妇| 高潮毛片在线观看| 欧美日韩国内自拍| 国产成人在线综合| 日本成人中文| 日韩在线观看av| 男女视频免费看| 另类欧美日韩国产在线| 国产精品久久久久久久天堂第1集| 三级av在线播放| 亚洲免费资源在线播放| aⅴ在线免费观看| 日韩精品免费视频一区二区三区| 亚洲成在人线av| 日本 欧美 国产| 91久久黄色| 国产欧美日韩免费看aⅴ视频| 开心激情综合网| 国产精品美女久久久久久久网站| 久久综合久久网| 在线免费成人| 日韩精品视频中文在线观看| 欧美xxxooo| 西西人体一区二区| 国产精品成人观看视频免费| jizz视频在线观看| 丁香五六月婷婷久久激情| 一级淫片在线观看| 国产影视一区| 4p变态网欧美系列| 亚洲国产精品成人久久蜜臀| 国产欧美日韩三级| 国产精品va无码一区二区| 精品一区二区三区视频在线播放| 亚洲午夜精品久久久久久性色 | 天天做天天摸天天爽国产一区| 日韩欧美国产片| 久久99蜜桃| 午夜精品久久久久久久99热浪潮 | 男人的天堂久久久| 奇米888四色在线精品| 久久久精品有限公司| 波多野结衣中文在线| 91精品蜜臀在线一区尤物| 中国毛片在线观看| 亚洲一区日韩在线| 国产精品永久入口久久久| 黄色av电影在线播放| 欧美日韩国产一级二级| 少妇无套高潮一二三区| 久久午夜激情| 免费日韩av电影| 新版的欧美在线视频| 亚洲黄页网在线观看| 久久久久黄色片| 国产**成人网毛片九色 | 精品1区2区3区4区| 亚洲free性xxxx护士白浆| 无遮挡的视频在线观看| 欧美日韩电影在线播放| 很污很黄的网站| 麻豆精品久久久| 亚洲v国产v| 成人av色网站| 中文字幕欧美视频在线| 亚洲在线观看av| 亚洲视频你懂的| 一级黄色高清视频| 欧美日本一区二区视频在线观看 | 国产精品美女久久福利网站| 国产精品亚洲二区在线观看| 欧美女王vk| 国产精品久久久久久久app| 福利在线播放| 欧美日韩1234| 免费在线一级片| 99国内精品久久| 久草资源站在线观看| 国产一区二区三区四区五区| 国产精品第一区| 黄网站免费在线播放| 日韩一区二区免费电影| 日韩成人高清视频| 国产欧美一区二区三区网站| 性生生活大片免费看视频| 欧美va天堂| 精品一区久久| 国模私拍国内精品国内av| 久久久国产在线视频| 色窝窝无码一区二区三区成人网站| 黄色一区二区在线| 嘿嘿视频在线观看| 国产成人午夜精品影院观看视频| 亚洲熟妇av日韩熟妇在线| sdde在线播放一区二区| 亚洲自拍偷拍一区| 无码小电影在线观看网站免费| 一区二区日韩精品| 国产极品久久久| 色呦呦国产精品| 欧美肥妇bbwbbw| 91丨porny丨户外露出| 欧美伦理片在线观看| 在线播放不卡| 亚洲人成网站在线播放2019| 操欧美女人视频| 国产精品久久二区| 白白色在线观看| 亚洲天堂男人的天堂| www.av网站| 在线观看日韩毛片| 国产亚洲自拍av| 中文字幕一区免费在线观看| 亚洲一区二区乱码| 国产精一区二区三区| 成人在线激情网| 欧美视频二区| 在线观看日韩片| 日韩精品免费一区二区夜夜嗨| 91精品国产综合久久久久久蜜臀| 精精国产xxxx视频在线播放| 久久精品亚洲94久久精品| 欧洲综合视频| 精品国产乱码久久久久久图片 | 蜜桃av噜噜一区| 欧美成人三级在线视频| 最新国产精品| 亚洲免费精品视频| 要久久爱电视剧全集完整观看| av资源站久久亚洲| 成人久久精品| 国产精品视频一区二区三区四| av中文在线资源库| 欧美高清一级大片| 国产精品va在线观看视色| 国产一区二区三区在线播放免费观看 | 欧美一区二区麻豆红桃视频| 国产亚洲欧美一区二区| 年轻的保姆91精品| 成人精品网站在线观看| 日韩免费小视频| 欧美亚洲另类制服自拍| a天堂资源在线| 欧美激情奇米色| 亚洲小说区图片区都市| 久久天堂av综合合色| 最新97超碰在线| 一区二区成人av| 国产在线电影| 曰本色欧美视频在线| 激情小说 在线视频| 亚洲精品影视在线观看| 日韩在线观看视频一区| 精品日产卡一卡二卡麻豆| 国产精品熟女久久久久久| 欧美另类z0zxhd电影| 中国老头性行为xxxx| 在线观看一区二区视频| 免费av中文字幕| 欧美专区日韩专区| 久久久久精彩视频| 欧美日韩一区二区三区在线 | 黄色香蕉视频在线观看| 中文字幕亚洲不卡| 四虎精品免费视频| 亚洲欧美一区二区三区孕妇| 91日韩中文字幕| 亚洲综合区在线| 日韩视频免费观看高清| 欧美日韩国产精品一区| 色av性av丰满av| 在线观看精品一区| 一级黄色免费看| 欧美一级午夜免费电影| 精品久久国产视频| 亚洲国产成人久久综合一区| 视频在线观看你懂的| 国产一区二区三区欧美| 秋霞a级毛片在线看| 九色精品美女在线| 国产网站在线| 国产精品久久电影观看| www.成人| 精品视频在线观看| 欧美亚洲激情| 欧美日韩dvd| 嫩草成人www欧美| 免费看污黄网站| 国产乱色国产精品免费视频| 日本黄色录像片| 国产丝袜在线精品| 欧美成人aaa片一区国产精品| 亚洲国产精品久久一线不卡| 久久久久久不卡| 日韩一区二区在线看| 少妇精品视频一区二区| 在线观看91久久久久久| 日本h片在线观看| 日本亚洲精品在线观看| 国产一区 二区| 久久久久久艹| 一区二区中文| 日韩毛片在线免费看| 国产一区二区三区在线观看免费| 日韩无码精品一区二区| 中文字幕高清不卡| 亚洲国产精一区二区三区性色| 在线看国产日韩| 日本精品999| www.亚洲一区| 高清不卡亚洲| www 成人av com| av一区二区高清| 欧美乱大交xxxxx潮喷l头像| 久久爱www久久做| 欧美高清性xxxx| 亚洲激情六月丁香| 日本妇乱大交xxxxx| 亚洲国产一区二区三区四区| 免费黄色在线看| 国产成人精品网站| 伊人www22综合色| 亚洲一区不卡在线| 久久国产毛片| 欧美一级片黄色| 亚洲精品免费在线| 亚洲天堂一二三| 亚洲人成毛片在线播放| 51漫画成人app入口| 成人免费网站在线看| re久久精品视频| 欧美视频免费播放| 成人国产精品免费观看动漫| www欧美com| 欧美精品一二三区| eeuss影院www在线观看| 97久久精品视频| 中文字幕一区二区三区四区久久| 亚洲人一区二区| 日韩av网站免费在线| 日韩精品卡通动漫网站| 亚洲一区成人在线| 精品国产av一区二区三区| 日韩在线观看免费高清完整版| 日本高清不卡一区二区三区视频| 精品卡一卡二| 一区二区三区国产在线| 精品国产一区在线| 亚洲丰满少妇videoshd| 亚洲精品久久久蜜桃动漫 | 三上悠亚作品在线观看| 欧美亚洲国产bt| 精品久久久久一区二区三区 | 久久精品在线免费视频| 精品一区二区综合| 亚洲精品自拍视频在线观看| 精品视频在线免费看| av小片在线| 国产男人精品视频| 久久久久亚洲| 欧美体内she精高潮| 一区二区三区免费观看| 精品乱子伦一区二区| 欧美另类极品videosbestfree| 精品久久国产一区| 国产一区 在线播放| 风间由美性色一区二区三区| 国产一级一片免费播放| 亚洲丁香久久久| 色是在线视频| 奇米888一区二区三区| 久久一区中文字幕| 超碰97av在线| 日韩一区和二区| 欧美a级在线观看| 日韩国产一区久久| 精品一区二区在线播放| 激情视频在线播放| 日韩第一页在线| 欧美成人精品三级网站| 一区二区三区四区免费视频| 国产一区二区三区免费播放| 免费人成年激情视频在线观看| 亚洲高清不卡av| 偷拍精品精品一区二区三区| 亚洲欧美成人一区| 国产成人在线看| 国产综合精品视频| 日韩在线观看网站| 亚洲精品不卡在线观看| 国产最新免费视频| 国产精品久久免费看| 午夜精品久久久久久久99老熟妇| 91av在线不卡| 91一区二区| 精品国产av色一区二区深夜久久 | www.色偷偷.com| 日韩一区在线免费观看| 日本wwwxxxx| 国产精品一区电影| 亚洲二区视频| 日本成人午夜影院| 日韩美女一区二区三区四区| 345成人影院| 欧洲美女和动交zoz0z| va亚洲va日韩不卡在线观看| 中文字幕观看在线| 国语对白做受69| 国产精品99一区二区三| www.免费av|