精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

探索 mcdse-2b-v1:全新高效的多語言文檔檢索模型 原創(chuàng)

發(fā)布于 2024-11-15 10:35
瀏覽
0收藏

01、概述

在信息時代的浪潮中,各類數(shù)據(jù)以驚人的速度不斷產(chǎn)生,涵蓋文檔、演示文稿、圖像等多種格式。這些信息的多樣性為有效檢索帶來了巨大的挑戰(zhàn)。傳統(tǒng)的檢索模型在處理純文本查詢時表現(xiàn)良好,但面對復(fù)雜的多模態(tài)內(nèi)容(如截圖或幻燈片)時,卻往往力不從心。這對于需要從包含文本和視覺元素的文檔中提取信息的企業(yè)、研究人員和教育工作者來說,尤為棘手。因此,迫切需要一種能夠高效處理這些多樣化內(nèi)容的模型。

02、引入 mcdse-2b-v1:文檔檢索的新方法

今天,我們要向大家介紹 mcdse-2b-v1,這是一款全新的人工智能模型,能夠嵌入頁面或幻燈片截圖,并通過自然語言進行查詢。與依賴文本進行索引和搜索的傳統(tǒng)檢索系統(tǒng)不同,mcdse-2b-v1 讓用戶可以處理包含文字、圖片和圖表的截圖或幻燈片,這為經(jīng)常處理非純文本文檔的用戶打開了新的可能性。用戶只需截取一張演示文稿的截圖或信息圖文檔,將其嵌入模型中,就能通過自然語言搜索獲得相關(guān)信息。

mcdse-2b-v1 架起了傳統(tǒng)文本查詢與更復(fù)雜視覺數(shù)據(jù)之間的橋梁,非常適合那些需要頻繁分析演示文稿、報告或其他視覺文檔內(nèi)容的行業(yè)。這一能力使得該模型在信息豐富的環(huán)境中顯得尤為重要,因為手動瀏覽這些視覺密集的文檔往往耗時且效率低下。與其費力尋找那一張?zhí)囟ǖ幕脽羝蚴侵痦摲喢芗膱蟾妫蝗缋米匀徽Z言直接搜索嵌入內(nèi)容,既節(jié)省了時間,又提升了工作效率。

03、技術(shù)細節(jié)與優(yōu)勢

mcdse-2b-v1(??)基于 MrLight/dse-qwen2-2b-mrl-v1,并采用 DSE 方法進行訓練。它是一款高效、可擴展且多語言的文檔檢索模型,能夠無縫處理混合內(nèi)容源。該模型提供了一種嵌入機制,有效捕捉文本與視覺成分,使得在多模態(tài)數(shù)據(jù)類型之間進行強大的檢索操作成為可能。

mcdse-2b-v1 最顯著的特點之一是其資源效率。例如,它可以在僅 10 GB 的空間內(nèi)嵌入 1 億個頁面。這種優(yōu)化水平使其非常適合數(shù)據(jù)存儲緊張的應(yīng)用場景,如本地解決方案或邊緣計算部署。此外,該模型的體積可以縮小至原來的六分之一,且性能損失極小,這使其能夠在資源有限的設(shè)備上運行,同時保持高檢索準確性。

另一個優(yōu)勢是 mcdse-2b-v1 與常用框架如 Transformers 或 vLLM 的兼容性,這使得其對廣泛用戶而言變得更加可及。這種靈活性使得開發(fā)者和數(shù)據(jù)科學家可以輕松將該模型集成到現(xiàn)有的機器學習工作流中,無需進行大幅修改,極大地方便了使用。

#如何使用

初始化模型和處理器

from transformers import AutoProcessor, Qwen2VLForConditionalGeneration
from PIL import Image
import torch
import math

model = Qwen2VLForConditionalGeneration.from_pretrained(
    'marco/mcdse-2b-v1',
    attn_implementation="flash_attention_2",
    torch_dtype=torch.bfloat16,
    device_map="cuda:0"
).eval()

min_pixels = 1 * 28 * 28
max_pixels = 960 * 28 * 28

processor = AutoProcessor.from_pretrained(
    'marco/mcdse-2b-v1',
    min_pixels=min_pixels,
    max_pixels=max_pixels
)

model.padding_side = "left"
processor.tokenizer.padding_side = "left"

document_prompt = "<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>What is shown in this image?<|im_end|>\n<|endoftext|>"

query_prompt = "<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>Query: %s<|im_end|>\n<|endoftext|>"

對查詢進行編碼

def encode_queries(queries: list[str], dimension: int):
    dummy_image = Image.new('RGB', (56, 56))
    inputs = processor(
        text=[query_prompt % x for x in queries],
        images=[dummy_image for _ in queries],
        videos=None,
        padding='longest',
        return_tensors='pt'
    ).to('cuda:0')

    cache_position = torch.arange(0, len(queries))
    inputs = model.prepare_inputs_for_generation(
        **inputs, cache_position=cache_position, use_cache=False)

    with torch.no_grad():
        output = self.model(
            **inputs,
            return_dict=True,
            output_hidden_states=True
        )
    
    embeddings = output.hidden_states[-1][:, -1]
    return torch.nn.functional.normalize(embeddings[:, :dimension], p=2, dim=-1)

對文檔進行編碼

def round_by_factor(number: float, factor: int) -> int:
    return round(number / factor) * factor

def ceil_by_factor(number: float, factor: int) -> int:
    return math.ceil(number / factor) * factor

def floor_by_factor(number: float, factor: int) -> int:
    return math.floor(number / factor) * factor

def smart_resize(height: int, width: int) -> tuple[int, int]:
        h_bar = max(28, round_by_factor(height, 28))
        w_bar = max(28, round_by_factor(width, 28))
        if h_bar * w_bar > max_pixels:
            beta = math.sqrt((height * width) / max_pixels)
            h_bar = floor_by_factor(height / beta, 28)
            w_bar = floor_by_factor(width / beta, 28)
        elif h_bar * w_bar < min_pixels:
            beta = math.sqrt(min_pixels / (height * width))
            h_bar = ceil_by_factor(height * beta, 28)
            w_bar = ceil_by_factor(width * beta, 28)
        return h_bar, w_bar

def resize(image: Image.Image):
    new_size = smart_resize(image.height, image.width)
    return image.resize(new_size)

def encode_documents(documents: list[Image.Image], dimension: int):
    inputs = processor(
        text=[document_prompt] * len(documents),
        images=[resize(x) for x in documents],
        videos=None,
        padding='longest',
        return_tensors='pt'
    ).to('cuda:0')

    cache_position = torch.arange(0, len(queries))
    inputs = model.prepare_inputs_for_generation(
        **inputs, cache_position=cache_position, use_cache=False)

    with torch.no_grad():
        output = self.model(
            **inputs,
            return_dict=True,
            output_hidden_states=True
        )
    
    embeddings = output.hidden_states[-1][:, -1]
    return torch.nn.functional.normalize(embeddings[:, :dimension], p=2, dim=-1)

對比結(jié)果

探索 mcdse-2b-v1:全新高效的多語言文檔檢索模型-AI.x社區(qū)

04、mcdse-2b-v1 的重要性

mcdse-2b-v1 的意義不僅在于其高效的信息檢索能力,更在于它如何使復(fù)雜文檔分析變得更加平易近人。傳統(tǒng)的文檔檢索方法往往需要精確的結(jié)構(gòu)化,并且常常忽視現(xiàn)代文檔中豐富的視覺元素。而 mcdse-2b-v1 的出現(xiàn),讓用戶可以像進行文本查詢一樣,輕松訪問嵌入在圖表、圖示及其他非文本組件中的信息。

初步結(jié)果顯示,即使在壓縮至原始大小的六分之一時,mcdse-2b-v1 依然能夠持續(xù)提供高檢索準確率。這種性能使其適合于大規(guī)模部署,而不必擔心典型的計算開銷。此外,其多語言能力意味著它可以為全球范圍內(nèi)的用戶提供服務(wù),對于在多個語言環(huán)境中運作的跨國組織或?qū)W術(shù)機構(gòu)而言,尤其寶貴。

對于那些從事多模態(tài)檢索增強生成(RAG)工作的人員來說,mcdse-2b-v1 提供了一種可擴展的解決方案,能夠為包含文本和視覺內(nèi)容的文檔提供高性能的嵌入。這種結(jié)合增強了下游任務(wù)的能力,如回答復(fù)雜用戶查詢或從多模態(tài)輸入中生成詳細報告。

05、結(jié)語

mcdse-2b-v1 通過嵌入頁面和幻燈片截圖,具備了可擴展性、效率和多語言能力,從而解決了多模態(tài)文檔檢索的挑戰(zhàn)。它簡化了與復(fù)雜文檔的互動,使用戶免于繁瑣的手動搜索過程。用戶將獲得一種強大的檢索模型,有效處理多模態(tài)內(nèi)容,認識到現(xiàn)實數(shù)據(jù)的復(fù)雜性。這一模型重新定義了我們?nèi)绾卧L問和與嵌入文本和視覺知識互動,為文檔檢索設(shè)定了新的標準。

通過以上的介紹,相信大家對 mcdse-2b-v1 有了更深入的了解。這一模型不僅將推動文檔檢索技術(shù)的發(fā)展,也將改變我們處理信息的方式,讓知識獲取變得更加高效和便捷。歡迎大家繼續(xù)關(guān)注這一領(lǐng)域的最新動態(tài)!

參考:

  1. ??https://huggingface.co/marco/mcdse-2b-v1??



本文轉(zhuǎn)載自公眾號Halo咯咯 作者:基咯咯

原文鏈接:??https://mp.weixin.qq.com/s/JKLE-CuZzBvG53gJKxDScw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
久久三级视频| 欧美日韩有码| 欧美午夜久久久| 日本不卡久久| 亚洲风情第一页| 三级在线观看一区二区 | 欧美三级电影一区二区三区| 国产成人精品免费网站| 日韩美女激情视频| 欧美毛片在线观看| 色男人天堂综合再现| 亚洲国产精品yw在线观看| 国产精品区在线| 美女露胸视频在线观看| 亚洲人成伊人成综合网小说| 久久超碰亚洲| www.爱爱.com| 美女在线一区二区| 日本一区二区在线免费播放| 懂色av懂色av粉嫩av| 国产欧美日韩一区二区三区四区| 91麻豆精品国产自产在线 | 不卡电影免费在线播放一区| 国产精品一区二区三| 国产福利拍拍拍| 久久精品亚洲人成影院 | 国产精品99久久久久久成人| 香蕉人人精品| 337p日本欧洲亚洲大胆精品| 亚洲综合123| 福利一区二区三区视频在线观看| 午夜精品久久久久久久 | 久久一综合视频| 高清欧美性猛交xxxx| 国产老头老太做爰视频| 色综合天天爱| 在线视频一区二区| 亚洲av综合一区二区| 老牛影视av一区二区在线观看| 欧美日韩激情一区| 国产精品久久久久9999小说| xxxxxx欧美| 狠狠爱在线视频一区| av免费观看大全| h片在线观看视频免费| 亚洲自拍偷拍麻豆| www.亚洲视频.com| 26uuu亚洲电影在线观看| 亚洲人成在线播放网站岛国| 一区二区三区四区久久| 无遮挡动作视频在线观看免费入口| 国产婷婷一区二区| 日本一区免费在线观看| 欧美人体大胆444www| 久久综合给合久久狠狠狠97色69| 精品国产一二| 日韩大胆视频| 国产日产欧美一区二区视频| 欧洲亚洲一区二区三区四区五区| 邻家有女韩剧在线观看国语| 久久久影院官网| 免费久久久一本精品久久区| 久草视频在线看| 欧美极品少妇xxxxⅹ高跟鞋 | 欧美 日韩 国产一区二区在线视频 | 第一页在线视频| 国产精品毛片视频| 亚洲精品一区二三区不卡| 好吊视频在线观看| 日韩中文首页| 欧美乱大交xxxxx另类电影| 久草资源在线视频| 亚洲欧美日本日韩| 国产精品高潮视频| 99久久免费国产精精品| 成人综合婷婷国产精品久久免费| 国产一区二区三区奇米久涩| 久久久久久久久亚洲精品| 国产欧美精品区一区二区三区| 亚洲丰满在线| 天堂亚洲精品| 色94色欧美sute亚洲线路一ni | 成人毛片老司机大片| 狠狠色综合网站久久久久久久| 天堂а√在线8种子蜜桃视频| 久久精品夜色噜噜亚洲aⅴ| 亚洲日本精品一区| 国产第一页在线| 在线精品观看国产| 亚洲欧美激情一区二区三区| 天堂俺去俺来也www久久婷婷| 亚洲午夜久久久久久久| 五月婷婷一区二区| 噜噜噜躁狠狠躁狠狠精品视频| 国产乱人伦真实精品视频| 不卡的日韩av| 日本一区二区三区高清不卡| 日本香蕉视频在线观看| 国产综合色区在线观看| 日韩午夜激情电影| 制服 丝袜 综合 日韩 欧美| 中文字幕免费一区二区三区| 欧美一级bbbbb性bbbb喷潮片| 国产又粗又大又爽视频| 91色视频在线| 日本大胆人体视频| 91精品国产经典在线观看| 精品免费国产一区二区三区四区| 国产aaaaaaaaa| 尤物网精品视频| 成人精品视频在线| 你懂的视频在线播放| 亚洲免费av在线| 婷婷激情四射五月天| 精品久久97| 久久中文字幕国产| 国产成人无码专区| caoporm超碰国产精品| 91九色国产ts另类人妖| 国产第一亚洲| 亚洲人av在线影院| 欧美三级韩国三级日本三斤在线观看| 国产一区二区导航在线播放| 欧美日韩电影一区二区| 97超碰在线免费| 日韩你懂的电影在线观看| 无码人中文字幕| 玖玖精品视频| 久久精品magnetxturnbtih| 欧美hdxxx| 日韩美一区二区三区| 国产激情无码一区二区三区| 免费日本视频一区| 日本不卡在线播放| 欧美一区久久久| 日韩精品极品在线观看| 日产电影一区二区三区| 国产a视频精品免费观看| 男女激烈动态图| 国产精品成人**免费视频| 色偷偷av亚洲男人的天堂| 免费看一级视频| 久久女同精品一区二区| 日本毛片在线免费观看| 日韩手机在线| 亚州精品天堂中文字幕| 少妇一级淫片免费看| 亚洲第一av色| 久久久久国产精品区片区无码| 国产精品美女久久久浪潮软件| 国产亚洲情侣一区二区无| av免费不卡国产观看| 亚洲第一网站男人都懂| 日本在线观看视频网站| 97成人超碰视| 爱情岛论坛成人| 日韩欧美视频在线播放| 成人a视频在线观看| 日本在线观看视频| 日韩欧美国产一二三区| 国产在线观看你懂的| 成人av在线电影| 免费在线激情视频| 成人一二三区| 亚洲一区美女视频在线观看免费| 色呦呦在线观看视频| 亚洲电影免费观看高清| 日本中文字幕第一页| 欧美激情中文字幕一区二区| 天堂av手机在线| 激情久久一区| 日本亚洲自拍| 亚洲综合伊人| 午夜精品久久17c| yjizz视频网站在线播放| 4438x成人网最大色成网站| 久久网一区二区| 久久综合久久久久88| 亚洲黄色小视频在线观看| 91精品国产视频| 激情视频一区二区| 视频精品导航| 欧美激情小视频| 国产无套粉嫩白浆在线2022年| 4438x亚洲最大成人网| 中文字幕一区二区三区精品| 亚洲国产精品精华液ab| ass极品水嫩小美女ass| 久久久999| 无码毛片aaa在线| 国产精品一国产精品| 91嫩草在线视频| 成人国产二区| 欧美高跟鞋交xxxxxhd| 美丽的姑娘在线观看免费动漫| 欧美电影在线免费观看| 亚洲日本韩国在线| 国产精品成人一区二区三区夜夜夜| 老熟女高潮一区二区三区| 日本成人中文字幕在线视频| 99国产精品白浆在线观看免费| 精品国产一区二区三区| 国产精品污www一区二区三区| 黄色精品视频| 国自在线精品视频| 国产一区久久精品| 亚洲男女性事视频| 丰满少妇高潮在线观看| 欧美日韩成人综合| 国产又黄又猛又粗又爽| 亚洲综合清纯丝袜自拍| 日本女人性生活视频| 久久久精品免费免费| 无码人妻aⅴ一区二区三区玉蒲团| 日本不卡高清视频| 免费av观看网址| 激情成人综合| 日本xxxxx18| 久久久综合色| 日韩免费电影一区二区| 日本精品影院| 国产成人女人毛片视频在线| 91视频亚洲| 国产精品自拍小视频| 亚洲电影观看| 26uuu日韩精品一区二区| heyzo中文字幕在线| 久久夜色精品国产亚洲aⅴ| 成人在线高清视频| 国产一区二区黑人欧美xxxx| 天天影院图片亚洲| 亚洲国产又黄又爽女人高潮的| 国产黄a三级三级三级| 91麻豆精品国产91久久久使用方法 | 日韩国产伦理| 九九视频精品全部免费播放| 激情五月综合色婷婷一区二区| 成人动漫视频| 国产精品久久久久久久久婷婷| 视频欧美一区| 波多野结衣成人在线| 久久综合偷偷噜噜噜色| 91中文精品字幕在线视频| www欧美在线观看| 成人激情免费在线| 国产精品视频一区二区三区综合| 国产在线观看一区二区三区 | 永久免费网站在线| 久久夜精品香蕉| 性网站在线观看| 欧美国产精品日韩| 国产网站在线| 日本精品久久久久久久| yw.尤物在线精品视频| 国产精品免费久久久| 欧美91在线|欧美| 成人中文字幕在线观看| 亚洲精品一二三**| 国产午夜精品在线| 蜜桃精品噜噜噜成人av| 日韩欧美一区二区三区四区五区 | 99在线观看视频免费| 国产综合自拍| 99精品人妻少妇一区二区| 视频精品一区二区| 色天使在线观看| 国产精品99精品久久免费| 国产精品一区二区人妻喷水| 久久久久久久久久久久久久久99| 亚洲精品一区二区三区影院忠贞| 国产精品久久久久久久岛一牛影视 | 综合色天天鬼久久鬼色| 久久9999久久免费精品国产| 欧美日韩一区二区三区在线免费观看| 蜜臀尤物一区二区三区直播| 欧美日韩日日夜夜| 男人天堂综合网| 国产一区二区三区毛片| 99热国产在线| 奇米影视亚洲狠狠色| 久久久久伊人| 国产伦精品一区二区三区免费视频| 美女少妇全过程你懂的久久| 综合操久久久| 一道本一区二区| 手机视频在线观看| 成人国产精品免费网站| 五月天综合视频| 亚洲午夜三级在线| 国产精品51麻豆cm传媒| 欧美本精品男人aⅴ天堂| 国产尤物视频在线| 欧美黄色片在线观看| 搜成人激情视频| 91手机在线观看| 成人羞羞网站| 美女日批免费视频| 国产最新精品精品你懂的| 一女三黑人理论片在线| 亚洲欧美日韩精品久久久久| 久久久久久久久久久久久av| 777xxx欧美| 韩日视频在线| 久久久久久91| 大胆国模一区二区三区| 欧美一区二区三区四区在线观看地址| 偷偷www综合久久久久久久| 免费在线激情视频| 成人黄色大片在线观看 | 国模精品一区二区| 久久久免费观看| 只有精品亚洲| 亚洲7777| 久久精品官网| 成人免费毛片日本片视频| 亚洲欧美日韩在线| 亚洲视频在线观看一区二区| 亚洲精品视频免费| 高清电影在线观看免费| 成人久久一区二区| 欧美韩日一区| 我看黄色一级片| 久久日一线二线三线suv| 国产一级一片免费播放放a| 这里只有精品电影| 美女羞羞视频在线观看| 国产精品日日摸夜夜添夜夜av| 亚洲传媒在线| av动漫在线观看| 久久天天做天天爱综合色| 日本学生初尝黑人巨免费视频| 欧美sm美女调教| 污视频在线免费观看网站| 91精品网站| 真实国产乱子伦精品一区二区三区| 国产又大又黄又粗的视频| 久久久久久99精品| 日韩三级一区二区| 亚洲视频免费一区| 偷拍视频一区二区三区| 欧美日韩亚洲在线| 日韩精品电影在线| 少妇一级黄色片| 欧美性大战久久| 午夜伦全在线观看| 亚洲xxxx3d| 欧美日本不卡高清| 成人免费看片载| 亚洲成年人网站在线观看| 视频一区 中文字幕| 欧美有码在线观看| 国产一区二区三区电影在线观看| 99视频在线免费| 国产精品久久久久9999吃药| 91极品身材尤物theporn| 久久精品亚洲94久久精品| 精品久久亚洲| 成人免费观看在线| 91麻豆国产自产在线观看| 激情视频网站在线观看| 一个人www欧美| 国产精品1区| 欧美精品卡一卡二| 99国产精品99久久久久久| 成人h动漫精品一区二区下载| 亚洲色图五月天| 成人在线视频区| 成 年 人 黄 色 大 片大 全| 91丨九色丨国产丨porny| 在线视频 91| 欧美国产日韩xxxxx| 欧美影院天天5g天天爽| 日韩视频免费在线播放| 亚洲视频免费在线| 无码精品在线观看| 国产精品网站视频| 狠狠干成人综合网| 亚洲精品色午夜无码专区日韩| 欧美色电影在线| av大片在线| 蜜桃麻豆91| 国产精品一二三在| 亚洲 欧美 日韩 在线| 久久久国产精品免费| 久久午夜影院| xx欧美撒尿嘘撒尿xx| 亚洲成人午夜影院| 一区二区三区视频网站| 国产伦精品一区二区三区高清| 免费在线观看精品| 在线免费观看毛片| 日韩在线视频导航| 天堂成人娱乐在线视频免费播放网站| 最新免费av网址| 精品久久久久久久久中文字幕| 国产在线观看av| 日本不卡久久| 99久久免费精品| 99久久99久久久精品棕色圆| 国产成人精品免费视频|