精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM2CLIP:使用大語言模型提升CLIP的文本處理,提高長文本理解和跨語言能力

人工智能
在人工智能迅速發展的今天,多模態系統正成為推動視覺語言任務前沿發展的關鍵。CLIP(對比語言-圖像預訓練)作為其中的典范,通過將文本和視覺表示對齊到共享的特征空間,為圖像-文本檢索、分類和分割等任務帶來了革命性突破。

在人工智能迅速發展的今天,多模態系統正成為推動視覺語言任務前沿發展的關鍵。CLIP(對比語言-圖像預訓練)作為其中的典范,通過將文本和視覺表示對齊到共享的特征空間,為圖像-文本檢索、分類和分割等任務帶來了革命性突破。然而其文本編碼器的局限性使其在處理復雜長文本和多語言任務時顯得力不從心。

大型語言模型(LLM),如 GPT-4 和 LLaMA,則展示了卓越的語言理解和生成能力。這種強大的語言能力能否與 CLIP 結合,解決其文本編碼器的短板?微軟團隊提出的 LLM2CLIP 框架便是這一創新的成果。

該論文提出了一種創新的方法,通過將 LLM 強大的語言知識與 CLIP 的視覺能力相結合,顯著提升多模態任務的性能。通過整合 LLM 和 CLIP,LLM2CLIP 解決了傳統 CLIP 在文本理解、語言支持和任務泛化方面的瓶頸。

方法創新

字幕對比微調(Caption Contrastive Fine-tuning)

  • 核心問題:LLM 的原生文本特征缺乏區分性,難以直接用于多模態任務。
  • 創新點:通過監督對比損失函數,將同一圖像的字幕作為正樣本,將其他字幕作為負樣本,從而顯著增強 LLM 的文本編碼能力。

凍結 LLM 梯度

  • 目的:保留 LLM 的開放世界知識,降低計算成本。
  • 方法:僅微調適配器和投影層,實現多模態對齊。

高效訓練策略

  • 使用 LoRA 技術進行輕量級訓練,在計算資源有限的情況下優化模型性能。
  • 預提取文本特征,減少推理階段的計算負擔。

開放世界知識的利用

  • LLM 的廣泛訓練語料使其能夠處理復雜字幕,甚至支持多語言任務。

LLM2CLIP 的關鍵特性

  1. 增強文本理解:LLM2CLIP 能夠處理超過 CLIP 原生限制的長文本和復雜描述。
  2. 跨語言支持:通過 LLM 的知識遷移,即使僅使用英語數據訓練,仍可在中文等多語言任務中實現卓越表現。
  3. 高效計算:通過凍結梯度和輕量級適配器優化計算開銷。

詳細改進描述

處理長字幕和復雜文本: LLM 的更大的上下文窗口和更強的語言理解能力使得 LLM2CLIP 能夠有效地處理長字幕和復雜文本,而無需像之前的工作那樣進行文本截斷或分段。

融入開放世界知識: LLM 在大規模文本語料庫上進行預訓練,因此擁有豐富的開放世界知識。LLM2CLIP 將這些知識融入到 CLIP 的視覺表示中,從而提高了其在各種下游任務中的性能。

跨語言能力: LLM2CLIP 的跨語言能力使其成為構建多語言多模態系統的強大工具,無需為每種語言單獨訓練模型。

高效訓練: 通過凍結 LLM 的權重和預先提取文本特征,LLM2CLIP 的訓練成本與微調原始 CLIP 模型相當。

實驗結果

結果展示

LLM2CLIP 在多個基準測試中表現優異,在短文本、長文本以及跨語言任務中的性能顯著提升,尤其在中文任務中,其表現甚至超越了專用中文數據集訓練的模型。

  • 圖像-文本檢索 (I2T 和 T2I): 在 Flickr30k、COCO、ShareGPT4V、Urban-1k 和 DOCCI 等數據集上進行評估。
  • 跨語言圖像-文本檢索:  在 Flickr30K-CN 和 COCO-CN 數據集上進行評估。
  • 視覺問答 (VQA): 使用 LLaVA 1.5 框架進行評估。
  • 字幕檢索準確率 (CRA):  用于評估文本模型區分字幕的能力。

如何開始使用 LLM2CLIP

以下是快速上手 LLM2CLIP 的完整代碼教程:

1. 安裝依賴環境

pip install llm2vec
 git clone https://github.com/microsoft/LLM2CLIP.git && cd LLM2CLIP
 pip install -r requirements.txt

2. 配置 Jupyter Notebook

如果需要交互式環境:

conda install -c conda-forge --override-channels notebook
 conda install -c conda-forge --override-channels ipywidgets -y jupyter notebook

3. 導入必要庫

from PIL import Image
 from transformers import AutoModel, AutoConfig, AutoTokenizer
 from transformers import CLIPImageProcessor
 import torch
 from llm2vec import LLM2Vec

4. 加載模型

# 圖像處理器
 processor = CLIPImageProcessor.from_pretrained("openai/clip-vit-large-patch14-336")
 
 # 加載 CLIP 模型
 model_name_or_path = "microsoft/LLM2CLIP-Openai-L-14-336"
 model = AutoModel.from_pretrained(
     model_name_or_path,
     torch_dtype=torch.float16,
     trust_remote_code=True
 ).to('cuda').eval()
 
 # 加載微調后的 LLM 模型
 llm_model_name = 'microsoft/LLM2CLIP-Llama-3-8B-Instruct-CC-Finetuned'
 config = AutoConfig.from_pretrained(llm_model_name, trust_remote_code=True)
 llm_model = AutoModel.from_pretrained(llm_model_name, config=config, trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained(llm_model_name)
 
 # 初始化 LLM2Vec
 l2v = LLM2Vec(llm_model, tokenizer, pooling_mode="mean", max_length=512, doc_max_length=512)

5. 圖像和字幕預處理

captions = ["a diagram", "a dog", "horses"]
 image_path = "path_to_image/horses.png"
 
 image = Image.open(image_path)
 input_pixels = processor(images=image, return_tensors="pt").pixel_values.to('cuda')

6. 提取特征并匹配字幕

with torch.no_grad(), torch.cuda.amp.autocast():
     image_features = model.get_image_features(input_pixels)
     text_features = l2v.encode(captions, convert_to_tensor=True).to('cuda')
     text_features = model.get_text_features(text_features)
 
     # 歸一化特征
     image_features /= image_features.norm(dim=-1, keepdim=True)
     text_features /= text_features.norm(dim=-1, keepdim=True)
 
     # 計算匹配概率
     text_probs = (100.0 * image_features @ text_features.T).softmax(dim=-1)
 
 print("匹配結果:", text_probs)

輸入圖像為上面的馬照片時,輸出為:

匹配結果: tensor([[3.425e-08, 1.0911e-06, 1.000e+00]], device='cuda:0')

這表明模型預測圖像對應的字幕為“horses”,匹配概率為 100%。

再試一張更復雜的圖片:

captions = ["a sunset over a mountain range", "a group of people hiking on a trail", "a peaceful lake surrounded by trees"]
 image_path = "hiking_trail.jpg"
 
 image = Image.open(image_path)
 input_pixels = processor(images=image, return_tensors="pt").pixel_values.to('cuda')
 
 with torch.no_grad(), torch.cuda.amp.autocast():
    image_features = model.get_image_features(input_pixels)
    text_features = l2v.encode(captions, convert_to_tensor=True).to('cuda')
    text_features = model.get_text_features(text_features)
 
    image_features /= image_features.norm(dim=-1, keepdim=True)
    text_features /= text_features.norm(dim=-1, keepdim=True)
 
    text_probs = (100.0 * image_features @ text_features.T).softmax(dim=-1)
 
 print("Label probs:", text_probs)

輸出為:

匹配結果:: tensor([[1.122e-06, 9.998e-01, 1.243e-04]], device='cuda:0')

模型可以匹配出更準確的文字。

總結

LLM2CLIP 為多模態學習提供了一種新的范式,通過整合 LLM 的強大功能來增強 CLIP 模型。其在圖像-文本檢索、跨語言應用和長文本理解方面的出色性能,突顯了其作為構建更強大、更通用的多模態系統的潛力。未來的研究可以進一步探索 LLM2CLIP 在更廣泛的應用場景中的潛力,例如視頻理解、多模態對話和具身智能。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2024-11-27 14:00:00

模型訓練

2024-11-06 17:04:47

AWK編程

2024-09-12 17:39:27

2024-04-01 07:25:00

AI框架

2013-10-30 10:35:29

Linux命令文本處理

2010-07-21 10:05:13

Perl文本處理模塊

2024-12-30 13:13:35

2013-08-20 16:14:46

pythonpython文本處理

2021-01-28 08:12:15

Linux命令技巧

2017-03-02 18:10:20

LinuxShell命令

2024-01-11 16:24:12

人工智能RAG

2025-05-29 08:30:00

LLM大語言模型AI

2023-03-19 17:21:31

CLIP架構人工智能

2024-04-12 12:14:39

Rust字符串代碼

2010-01-06 17:12:26

.Net Framew

2023-09-27 07:39:57

大型語言模型MiniGPT-4

2023-01-03 15:42:29

機器學習視頻搜索

2025-04-29 09:21:00

2025-07-03 09:49:43

2023-04-27 13:46:08

語言模型ChatGPT人工智能
點贊
收藏

51CTO技術棧公眾號

久久影视中文字幕| 女人18毛片毛片毛片毛片区二| 交100部在线观看| 久久精品一区蜜桃臀影院| 国产欧美精品一区二区三区介绍 | 91天堂素人约啪| 国产在线观看不卡| 国产精品第9页| 99精品在线观看| 日韩av在线免费观看| 中文字幕成人在线视频| 国产美女一区视频| 中文字幕欧美区| 国产伦精品一区二区三区照片| 性色av一区二区三区四区| 在线成人h网| 久久久极品av| av手机在线播放| 久久久久久毛片免费看 | 38少妇精品导航| 欧美日韩在线观看成人| 日韩精品久久久久久久电影99爱| 精品国产免费视频| www.成年人| 天堂久久午夜av| 亚洲1区2区3区视频| 特级黄色录像片| 成人在线二区| 久久久久国产一区二区三区四区| 国产精品国色综合久久| 国产情侣自拍小视频| 蜜臀av在线播放一区二区三区| 69视频在线播放| 国产精品1000| 一区二区亚洲精品| 色在人av网站天堂精品| 成人无码精品1区2区3区免费看 | 高潮毛片又色又爽免费 | 天堂一区在线观看| se01亚洲视频| 色综合视频在线观看| 五月丁香综合缴情六月小说| 五月天激情在线| 亚洲色图欧美偷拍| 亚洲精品偷拍视频| 尤物yw193can在线观看| 亚洲免费高清视频在线| 五月天男人天堂| 麻豆av在线免费看| 亚洲欧美日韩一区二区三区在线观看| 亚洲图片欧洲图片日韩av| 丁香婷婷在线| 中文字幕av在线一区二区三区| 欧洲一区二区日韩在线视频观看免费| 亚洲 国产 欧美 日韩| 91亚洲大成网污www| 欧美韩国日本精品一区二区三区| 天堂av在线播放| 欧美三级一区| 日韩亚洲欧美在线| 亚洲成年人av| 另类在线视频| 精品视频中文字幕| 亚洲AV无码成人精品区明星换面 | 丁香婷婷深情五月亚洲| 国产成人av一区二区三区| 天天干天天干天天干| 久久先锋资源网| 日韩欧美在线电影| 精品国产丝袜高跟鞋| 一区二区三区欧美亚洲| 加勒比成人在线| 五月天av在线| 欧美午夜宅男影院| 国产精品中文久久久久久| 91九色鹿精品国产综合久久香蕉| 日韩经典第一页| 91av手机在线| 亚洲国产午夜| 国产成人在线视频| 99精品国产99久久久久久97| av电影天堂一区二区在线观看| 欧美三级网色| 超碰在线免费公开| 精品人伦一区二区三区蜜桃网站| 久久久精品麻豆| 日韩中文在线| 亚洲一二三区不卡| http;//www.99re视频| 高h震动喷水双性1v1| 久久久久久久综合| 中文字幕欧美日韩一区二区| 欧美人体视频xxxxx| 一本久久精品一区二区| 欧美xxxxxbbbbb| 亚洲三级网页| 美女性感视频久久久| 久久一区二区三区视频| 黄一区二区三区| 久久国产精品 国产精品| 黄色在线视频网站| 91国偷自产一区二区三区成为亚洲经典| 中文字幕成人免费视频| 亚洲丝袜啪啪| 欧美激情在线观看视频| 亚洲天堂视频在线| 久久久国产精品麻豆| 精品免费久久久久久久| 日本在线中文字幕一区二区三区| 精品区一区二区| 四虎国产成人精品免费一女五男| 亚洲国产片色| 91高跟黑色丝袜呻吟在线观看| 黄色在线视频观看网站| 亚洲午夜电影网| 视频免费1区二区三区| 国产探花一区| 97在线视频免费| 性生交生活影碟片| 最新中文字幕一区二区三区| 国产精品第12页| 全国精品免费看| 久久久久久久久久久人体| 在线视频播放大全| 国产欧美视频在线观看| 女人天堂av手机在线| 给我免费播放日韩视频| 久国内精品在线| www.久久成人| 亚洲欧洲日本在线| xxx国产在线观看| 欧美中文字幕一区二区| 国产不卡精品视男人的天堂| 天堂av在线免费| 亚洲午夜激情av| www.啪啪.com| 亚洲国产美女| 国产无套精品一区二区| 成人在线黄色电影| 亚洲国产精品久久精品怡红院| 麻豆精品一区二区三区视频| 国模大尺度一区二区三区| 中文字幕剧情在线观看一区| 奇米视频888战线精品播放| 羞羞视频在线观看不卡| 欧美一级日韩一级| 国产va在线播放| 国产精品18久久久久久久网站| 国产三级中文字幕| 日韩精品视频在线看| 欧美精品在线免费| 成人免费公开视频| 亚洲.国产.中文慕字在线| 亚洲av无码一区二区三区观看| 国产模特精品视频久久久久| 麻豆av一区二区三区久久| 成人亚洲欧美| 亚洲最新中文字幕| 这里只有精品9| 亚洲激情欧美激情| zjzjzjzjzj亚洲女人| 99成人在线| 日韩一本精品| 国产剧情一区二区在线观看| 色在人av网站天堂精品| 午夜激情小视频| 欧美午夜宅男影院| 日韩欧美中文字幕视频| 成人精品亚洲人成在线| 欧美日韩在线不卡视频| 日韩成人三级| 91精品黄色| 高清在线视频不卡| 中文字幕成人精品久久不卡| 国产成人精品免费看视频| 久久高清免费| 欧美精品tushy高清| 免费一级肉体全黄毛片| 91丨九色porny丨蝌蚪| 国产成人黄色网址| 亚洲一级网站| 性高潮久久久久久久久| 亚洲午夜精品| 国产成人亚洲综合| 午夜dj在线观看高清视频完整版| 亚洲精品久久视频| 中文字幕在线观看1| 亚洲国产精品影院| 超薄肉色丝袜一二三| 国产精品一区二区果冻传媒| 日韩免费毛片视频| 欧美黄色aaaa| 亚洲第一综合| 激情av综合| 成人激情视频在线| 周于希免费高清在线观看| 久久久精品视频成人| 巨骚激情综合| 欧美成人激情免费网| 中文字幕人妻精品一区| 天天射综合影视| 粉嫩av性色av蜜臀av网站| 久久综合色综合88| 国产精品91av| 久久99精品久久久久久久久久久久| 欧美日韩二三区| 亚洲精品网址| 亚洲精品久久久久久一区二区| 精品国产一区二区三区成人影院| 3d动漫精品啪啪| a级黄色片免费| 欧洲激情视频| 免费国产一区二区| 国产区精品视频在线观看豆花| 国产精品影院在线观看| 国产免费不卡| 隔壁老王国产在线精品| 国产精品刘玥久久一区| 一区二区在线视频播放| 性xxxx视频| 亚洲二区中文字幕| 亚洲第一第二区| 欧美酷刑日本凌虐凌虐| 无码人妻一区二区三区线| 亚洲v中文字幕| 欧美日韩大片在线观看| 亚洲欧美日韩中文字幕一区二区三区 | 国产女人18水真多毛片18精品| 国产日本欧洲亚洲| 瑟瑟视频在线观看| 99久久综合国产精品| 原创真实夫妻啪啪av| 激情综合一区二区三区| 成人免费在线观看视频网站| 玖玖在线精品| 三年中国国语在线播放免费| 男女av一区三区二区色多| 中文字幕无码精品亚洲35| 伊人成人在线| 国产美女网站在线观看| 亚洲三级视频| 国产原创popny丨九色| 一区二区激情| 116极品美女午夜一级| 午夜一区在线| 国产精品免费成人| 日日摸夜夜添夜夜添亚洲女人| 欧美成人黑人猛交| 蜜臀av一级做a爰片久久| 男人添女人下面免费视频| 麻豆国产欧美日韩综合精品二区 | 懂色一区二区三区免费观看| 精品人妻二区中文字幕| 成人动漫视频在线| 久久中文字幕人妻| 国产精品三级av| 国产探花在线免费观看| 亚洲一二三四在线观看| 久久久久久久黄色片| 91精品1区2区| 国产又色又爽又黄又免费| 日韩三区在线观看| 三级在线观看网站| 亚洲欧洲国产一区| 欧美jizzhd69巨大| 欧美极品在线播放| 国产资源在线观看入口av| 日韩美女写真福利在线观看| 六九午夜精品视频| 国产高清在线精品一区二区三区| 色天天色综合| 亚洲午夜精品久久| 欧美日韩免费| 国产精品无码一本二本三本色| 老司机一区二区| 国产a√精品区二区三区四区| 91论坛在线播放| 国产黄a三级三级| 午夜不卡在线视频| 久久久999久久久| 日韩精品一区二区三区老鸭窝| 深夜福利视频一区| 久久精品一本久久99精品| 僵尸再翻生在线观看免费国语| 国产一区二区在线免费视频| av成人男女| 亚洲 日韩 国产第一区| 国产一区日韩一区| 天天爽天天爽夜夜爽| 粉嫩av一区二区三区| 欧美日韩生活片| 亚洲成av人**亚洲成av**| 一区二区三区日| 亚洲精品视频在线播放| 图片区小说区亚洲| 国产精品日韩专区| 日韩高清电影免费| 国产尤物av一区二区三区| 免费看欧美美女黄的网站| 精品视频站长推荐| 亚洲视频一区二区在线| 日韩精品一区不卡| 亚洲国产精品美女| 99热国产在线中文| 国产精品丝袜久久久久久高清| 久久午夜影院| 亚洲小视频在线播放| 免费成人在线观看| 亚洲专区区免费| 性久久久久久久久久久久| 99久久久久成人国产免费 | 2024最新电影免费在线观看| 日韩av男人的天堂| 精品亚洲精品| 国内自拍中文字幕| 国内外成人在线| 国产午夜精品福利视频| 色哟哟国产精品| 午夜av免费观看| 性欧美视频videos6一9| 亚洲一区二区三区日本久久九| 一区二区不卡在线观看| 男女男精品网站| 六月婷婷七月丁香| 欧美性猛交xxxxx水多| 日韩一区二区三区不卡| 欧美激情免费看| 日韩欧美中文字幕在线视频| 伊人久久大香线蕉午夜av| 免费国产亚洲视频| 亚洲欧美va天堂人熟伦| 欧洲视频一区二区| 超碰免费在线| 国产精品国产亚洲伊人久久 | 国产农村妇女精品| 探花国产精品一区二区| 中文字幕av一区二区三区谷原希美 | 91欧美在线| 五月婷婷六月丁香激情| 国产精品超碰97尤物18| 亚洲自拍偷拍另类| 久久综合电影一区| 亚洲精品一二三**| 野外做受又硬又粗又大视频√| 成人精品亚洲人成在线| 国产系列精品av| 日韩精品中文字幕久久臀| 亚洲优女在线| 无码免费一区二区三区免费播放| 日韩不卡手机在线v区| 国产美女网站视频| 69久久夜色精品国产69蝌蚪网| a级在线观看| 国产免费一区二区| 免费看的黄色欧美网站| 久久久久亚洲av无码a片| 在线成人免费观看| 午夜成年人在线免费视频| 精品一区日韩成人| 久久免费国产| 天天操夜夜操av| 欧美成人官网二区| 毛片免费看不卡网站| 午夜久久资源| 国产高清久久久久| 成人精品在线看| 色系列之999| 亚洲一区二区三区免费| 那种视频在线观看| 成人免费在线观看入口| 欧性猛交ⅹxxx乱大交| 热久久99这里有精品| 午夜国产一区二区| av不卡中文字幕| 欧美视频中文字幕| 在线中文字幕-区二区三区四区| 精品乱码一区| 久久99精品久久久久久动态图| 伊人国产在线观看| 最近2019中文字幕mv免费看| 91亚洲无吗| 杨幂毛片午夜性生毛片 | 精品无码一区二区三区爱欲| 久久蜜臀精品av| 国产av无码专区亚洲av麻豆| 人体精品一二三区| 91精品国产视频| 欧美图片一区二区| 欧美成人女星排名| 成人av色网站| 五十路熟女丰满大屁股| 中文无字幕一区二区三区 | 被灌满精子的波多野结衣| 欧美极品少妇xxxxⅹ高跟鞋 | 久久视频在线免费观看| 天堂99x99es久久精品免费| 亚洲丝袜在线观看| 在线视频一区二区三| ririsao久久精品一区| 午夜啪啪免费视频|