精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文讀懂多模態 embeddings

人工智能 開發
在本文中,我將討論多模態 embeddings ,并通過兩個實際用例分享它們的功能。

傳統上,AI研究被劃分為不同的領域:自然語言處理(NLP)、計算機視覺(CV)、機器人學、人機交互(HCI)等。然而,無數實際任務需要整合這些不同的研究領域,例如自動駕駛汽車(CV + 機器人學)、AI代理(NLP + CV + HCI)、個性化學習(NLP + HCI)等。

盡管這些領域旨在解決不同的問題并處理不同的數據類型,但它們都共享一個基本過程。即生成現實世界現象的有用數值表示。

歷史上,這是手工完成的。這意味著研究人員和從業者會利用他們(或其他人)的專業知識,將數據顯式轉換為更有用的形式。然而,今天,這些可以通過另一種方式獲得。在本文中,我將討論多模態embeddings,并通過兩個實際用例分享它們的功能。

Embeddings

embeddings是通過模型訓練隱式學習的數據的有用數值表示。例如,通過學習如何預測文本,BERT學習了文本的表示,這些表示對許多NLP任務很有幫助[1]。另一個例子是Vision Transformer(ViT),它在Image Net上進行圖像分類訓練,可以重新用于其他應用[2]。

這里的一個關鍵點是,這些學習到的embeddings空間將具有一些底層結構,使得相似的概念彼此接近。如下面的玩具示例所示。

文本和圖像embeddings的表示

前面提到的模型的一個關鍵限制是它們僅限于單一數據模態,例如文本或圖像。這阻止了跨模態應用,如圖像字幕生成、內容審核、圖像搜索等。但如果我們可以合并這兩種表示呢?

多模態 Embeddings

盡管文本和圖像在我們看來可能非常不同,但在神經網絡中,它們通過相同的數學對象(即向量)表示。因此,原則上,文本、圖像或任何其他數據模態都可以由單個模型處理。

這一事實是多模態embeddings的基礎,它將多個數據模態表示在同一向量空間中,使得相似的概念位于相近的位置(獨立于它們的原始表示)。

多模態embeddings空間的表示

例如,CLIP將文本和圖像編碼到共享的embeddings空間中[3]。CLIP的一個關鍵見解是,通過對齊文本和圖像表示,模型能夠在任意一組目標類上進行零樣本圖像分類,因為任何輸入文本都可以被視為類標簽(我們將在后面看到一個具體示例)。

然而,這個想法不僅限于文本和圖像。幾乎任何數據模態都可以以這種方式對齊,例如文本-音頻、音頻-圖像、文本-腦電圖、圖像-表格和文本-視頻。這解鎖了視頻字幕生成、高級OCR、音頻轉錄、視頻搜索和腦電圖到文本等用例[4]。

對比學習

對齊不同embeddings空間的標準方法是對比學習(CL)。CL的一個關鍵直覺是相似地表示相同信息的不同視圖[5]。

這包括學習表示,以最大化正對之間的相似性并最小化負對的相似性。在圖像-文本模型的情況下,正對可能是帶有適當標題的圖像,而負對可能是帶有不相關標題的圖像(如下所示)。

對比訓練中使用的正對和負對示例

CL的兩個關鍵方面促成了其有效性:

  • 由于正對和負對可以從數據的固有結構(例如,網絡圖像的元數據)中策劃,CL訓練數據不需要手動標記,這解鎖了更大規模的訓練和更強大的表示[3]。
  • 它通過特殊的損失函數同時最大化正對和最小化負對的相似性,如CLIP所示[3]。

CLIP用于文本-圖像表示對齊的對比損失[3]

示例代碼:使用CLIP進行零樣本分類和圖像搜索

在了解了多模態embeddings的工作原理后,讓我們看看它們可以做的兩個具體示例。在這里,我將使用開源的CLIP模型執行兩個任務:零樣本圖像分類和圖像搜索。

這些示例的代碼在GitHub倉庫中免費提供:https://github.com/ShawhinT/YouTube-Blog/tree/main/multimodal-ai/2-mm-embeddings。

用例1:零樣本圖像分類

使用CLIP進行零樣本圖像分類的基本思想是將圖像與一組可能的類標簽一起傳遞給模型。然后,通過評估哪個文本輸入與輸入圖像最相似來進行分類。

我們首先導入Hugging Face Transformers庫,以便可以在本地下載CLIP模型。此外,PIL庫用于在Python中加載圖像。

from transformers import CLIPProcessor, CLIPModel
from PIL import Image

接下來,我們可以導入一個版本的clip模型及其相關的數據處理器。注意:處理器處理輸入文本的標記化和圖像準備。

# import model
model = CLIPModel.from_pretrained("openai/clip-vit-base-patch16")

# import processor (handles text tokenization and image preprocessing)
processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch16")

我們加載下面的貓的圖像,并創建兩個可能的類標簽列表:“一張貓的照片”或“一張狗的照片”。

# load image
image = Image.open("images/cat_cute.png")

# define text classes
text_classes = ["a photo of a cat", "a photo of a dog"]

輸入的貓照片

接下來,我們將預處理圖像/文本輸入并將它們傳遞給模型。

# pass image and text classes to processor
inputs = processor(text=text_classes, images=image, return_tensors="pt", 
                                                    padding=True)

# pass inputs to CLIP
outputs = model(**inputs) # note: "**" unpacks dictionary items

要進行類預測,我們必須提取圖像logits并評估哪個類對應于最大值。

# image-text similarity score
logits_per_image = outputs.logits_per_image 
# convert scores to probs via softmax
probs = logits_per_image.softmax(dim=1) 

# print prediction
predicted_class = text_classes[probs.argmax()]
print(predicted_class, "| Probability = ", 
                       round(float(probs[0][probs.argmax()]),4))
>> a photo of a cat | Probability =  0.9979

模型以99.79%的概率準確識別出這是一張貓的照片。然而,這是一個非常簡單的例子。讓我們看看當我們將類標簽更改為:“丑貓”和“可愛貓”時會發生什么。

>> cute cat | Probability =  0.9703

模型輕松識別出圖像確實是一只可愛的貓。讓我們做一些更具挑戰性的標簽,例如:“貓表情包”或“非貓表情包”。

>> not cat meme | Probability =  0.5464

雖然模型對這個預測的信心較低,只有54.64%的概率,但它正確地暗示了圖像不是表情包。

用例2:圖像搜索

CLIP的另一個應用基本上是用例1的逆過程。與其識別哪個文本標簽與輸入圖像匹配,我們可以評估哪個圖像(在一組中)與文本輸入(即查詢)最匹配——換句話說,在圖像上執行搜索。我們首先將一組圖像存儲在列表中。在這里,我有三張貓、狗和山羊的圖像。

# create list of images to search over
image_name_list = ["images/cat_cute.png", "images/dog.png", "images/goat.png"]

image_list = []
for image_name in image_name_list:
    image_list.append(Image.open(image_name))

接下來,我們可以定義一個查詢,如“一只可愛的狗”,并將其與圖像一起傳遞給CLIP。

# define a query
query = "a cute dog"

# pass images and query to CLIP
inputs = processor(text=query, images=image_list, return_tensors="pt", 
                                                  padding=True)

然后,我們可以通過提取文本logits并評估對應于最大值的圖像來將最佳圖像與輸入文本匹配。

# compute logits and probabilities
outputs = model(**inputs)
logits_per_text = outputs.logits_per_text
probs = logits_per_text.softmax(dim=1)


# print best match
best_match = image_list[probs.argmax()]
prob_match = round(float(probs[0][probs.argmax()]),4)


print("Match probability: ",prob_match)
display(best_match)
>> Match probability:  0.9817

查詢“一只可愛的狗”的最佳匹配

我們看到(再次)模型在這個簡單示例中表現出色。但讓我們嘗試一些更棘手的例子。

query = "something cute but metal ??"
>> Match probability:  0.7715

查詢“可愛但金屬的東西??”的最佳匹配

query = "a good boy"
>> Match probability:  0.8248

查詢“一個好男孩”的最佳匹配

query = "the best pet in the world"
>> Match probability:  0.5664

查詢“世界上最好的寵物”的最佳匹配

盡管最后一個預測頗具爭議,但所有其他匹配都非常準確。這可能是因為像這樣的圖像在互聯網上無處不在,因此在CLIP的預訓練中被多次看到。

接下來可以做什么?

多模態embeddings解鎖了涉及多個數據模態的無數AI用例。在這里,我們看到了兩個這樣的用例,即使用CLIP進行零樣本圖像分類和圖像搜索。像CLIP這樣的模型的另一個實際應用是多模態RAG,它包括自動檢索多模態上下文到LLM。在本系列的下一篇文章中,我們將了解其內部工作原理并回顧一個具體示例。

【參考文獻】

  • [1] BERT:https://arxiv.org/abs/1810.04805
  • [2] ViT:https://arxiv.org/abs/2010.11929
  • [3] CLIP:https://arxiv.org/abs/2103.00020
  • [4] Thought2Text: 使用大型語言模型(LLMs)從腦電圖信號生成文本:https://arxiv.org/abs/2410.07507
  • [5] 對比學習視覺表示的簡單框架:https://arxiv.org/abs/2002.05709
責任編輯:趙寧寧 來源: 小白玩轉Python
相關推薦

2021-08-27 10:14:16

Thanos監控開源

2021-08-09 10:20:04

Thanos監控架構

2025-03-25 09:06:11

2021-08-04 16:06:45

DataOps智領云

2023-12-22 19:59:15

2024-11-13 09:39:13

2022-09-22 09:00:46

CSS單位

2018-09-28 14:06:25

前端緩存后端

2025-04-03 10:56:47

2022-11-06 21:14:02

數據驅動架構數據

2023-11-27 17:35:48

ComponentWeb外層

2023-05-20 17:58:31

低代碼軟件

2022-10-20 08:01:23

2022-07-05 06:30:54

云網絡網絡云原生

2022-07-26 00:00:03

語言模型人工智能

2025-10-14 09:01:20

2022-12-01 17:23:45

2021-12-29 18:00:19

無損網絡網絡通信網絡

2024-05-31 12:44:12

2023-08-10 09:49:57

自動駕駛視覺
點贊
收藏

51CTO技術棧公眾號

激情图片qvod| 国产自产在线视频一区| 国产精品久久久久久久精| 精品欧美视频| 黄色成人av网| 在线综合视频网站| 你懂的网站在线| 日本不卡高清视频| 久久久久久com| 午夜精产品一区二区在线观看的| 伊人久久一区| 日韩欧美国产成人| 日日噜噜夜夜狠狠久久丁香五月| 天天摸天天干天天操| 免费看黄色91| 69视频在线播放| 亚洲欧美精品久久| 香蕉国产成人午夜av影院| 欧美日韩成人一区二区| 可以在线看的av网站| 免费大片在线观看www| 99久久精品国产导航| 国产日韩欧美日韩| 亚洲图片在线视频| 一区二区三区在线| 永久免费毛片在线播放不卡| 欧美成人精品一区二区综合免费| 久久亚洲人体| 色噜噜狠狠成人中文综合| 国产精品无码免费专区午夜| 137大胆人体在线观看| 91老师国产黑色丝袜在线| 91在线观看免费观看| 最新中文字幕第一页| 国产欧美午夜| 久久久亚洲成人| 美女的奶胸大爽爽大片| 久久亚洲国产| 在线国产精品播放| 一区二区精品免费| 妖精视频一区二区三区| 亚洲国产精品高清久久久| 亚洲丝袜在线观看| 国产亚洲字幕| 欧美一区二区观看视频| 国产喷水theporn| se69色成人网wwwsex| 日韩欧美aaa| 69堂免费视频| 九色porny丨入口在线| 亚洲一二三四久久| 伊人网在线免费| a免费在线观看| 亚洲欧美日韩一区二区| 青青视频免费在线| 手机av免费在线| 亚洲一二三区在线观看| 91成人综合网| 2020国产在线| 精品久久久国产精品999| 日本一道本久久| 亚洲优女在线| 欧美吻胸吃奶大尺度电影| 日韩免费高清在线| 欧美一级做a| 欧美一区二区播放| 美女伦理水蜜桃4| 欧美国产极品| 亚洲一级片在线看| 99自拍偷拍视频| 香蕉综合视频| 欧美精品久久久久久久免费观看| 日本系列第一页| 国产色综合网| 国产精品免费电影| 99久久免费国产精精品| 成人午夜激情在线| 麻豆91av| 求av网址在线观看| 亚洲高清在线精品| 亚洲精品乱码久久久久久自慰 | 欧美激情一区二区三区全黄| 日韩av一区二区三区在线| 日本三级在线播放完整版| 一区二区视频免费在线观看| 人妻av中文系列| 亚洲成人短视频| 欧美日韩成人激情| 国产乱国产乱老熟300部视频| 欧美sss在线视频| 在线精品国产成人综合| 免费人成在线观看| 亚洲综合精品| 国产在线观看精品| 婷婷五月综合激情| 国产亚洲短视频| 久久www视频| 婷婷六月国产精品久久不卡| 欧美精品第1页| 在线观看国产免费视频| 欧美一区二区性| 国内精品久久久久久影视8| 波多野结衣黄色| 床上的激情91.| 午夜久久资源| 国产拍在线视频| 欧美精品123区| 国产熟妇搡bbbb搡bbbb| 亚洲高清影视| 国产成人综合精品在线| 精品国产无码AV| 国产欧美日韩麻豆91| a级免费在线观看| 日韩av一级| 亚洲国产精品推荐| 欧美第一页在线观看| 久久动漫亚洲| 国产伦精品一区| 国产黄a三级三级三级av在线看 | 精品三级av在线导航| xxx成人少妇69| 中文字字幕在线中文| 国产另类ts人妖一区二区| 日本一区二区久久精品| 丁香花高清在线观看完整版| 欧美日本一区二区三区| 男女做爰猛烈刺激| 亚洲久色影视| av在线不卡观看| 蜜桃视频网站在线观看| 在线免费观看不卡av| 欧美双性人妖o0| 欧美一区二区三区久久精品| 国产精品视频区| 国产日韩精品在线看| 天天综合日日夜夜精品| 香蕉久久久久久av成人| 亚洲精品中文字幕乱码| 国产一区视频在线播放| www亚洲人| 91精品91久久久中77777| 少妇饥渴放荡91麻豆| 精品二区久久| 国产日产精品一区二区三区四区| 四虎影视国产在线视频| 日韩欧美国产一区二区在线播放 | 国产中文字幕在线视频| 午夜精品一区在线观看| 东京热av一区| 亚洲国产导航| 国产亚洲欧美一区二区| www.综合| 精品亚洲一区二区| 亚洲va在线观看| 久久久高清一区二区三区| 青青视频在线播放| 奇米亚洲欧美| 国产精品视频自在线| 91涩漫在线观看| 欧美老人xxxx18| 欧产日产国产v| 成人精品鲁一区一区二区| 丝袜人妻一区二区三区| 欧美wwwwww| 国产精品99导航| 日本中文字幕伦在线观看| 欧美男生操女生| 欧美黑吊大战白妞| 99麻豆久久久国产精品免费| 亚洲欧洲日产国码无码久久99| 女一区二区三区| 国产成人精品在线| 久cao在线| 精品国产乱码久久久久久久久| 午夜影院在线看| 国产肉丝袜一区二区| 天天干天天草天天| 欧美日本一区二区高清播放视频| 国产综合动作在线观看| 欧美黄色网页| 久久久精品影院| 少妇人妻偷人精品一区二区| 日本久久精品电影| 久久精品黄色片| 91免费国产在线观看| 中文字幕永久有效| 亚洲片区在线| 亚洲在线色站| 精品亚洲精品| 国产啪精品视频网站| 久草在线视频网站| 亚洲人成在线电影| 亚洲va久久久噜噜噜无码久久| 日韩欧美国产免费播放| 青花影视在线观看免费高清| av亚洲精华国产精华| 中文字幕永久有效| 国产手机视频一区二区| 在线观看一区欧美| 亚洲成a人片77777在线播放| 成人欧美一区二区三区在线湿哒哒 | 国产视频第二页| 欧美日韩在线另类| fc2ppv在线播放| 久久在线免费观看| 免费黄色在线播放| 久久99久久久久| 欧美三级午夜理伦三级| 欧美日韩免费| 亚洲国产午夜伦理片大全在线观看网站 | 在线能看的av网址| 欧美理论电影在线播放| 国产视频网站在线| 亚洲精品白浆高清久久久久久| 中文字幕人妻一区二区在线视频| 亚洲国产欧美日韩另类综合| 国产大屁股喷水视频在线观看| 99久久精品情趣| 亚洲成人av免费观看| 蜜桃久久久久久| 一本久道综合色婷婷五月| 海角社区69精品视频| 一区二区三区观看| 国产欧美高清视频在线| 久久国产精品99久久久久久丝袜| 亚洲视频一起| 亚洲一区二区三区久久| 亚洲精品乱码日韩| 国产成人精品在线视频| 亚洲黄色中文字幕| 97国产在线视频| 暧暧视频在线免费观看| 色在人av网站天堂精品| 黄色网页在线播放| 久久视频在线看| 黄页视频在线播放| 久久国内精品一国内精品| 自拍视频在线免费观看| 揄拍成人国产精品视频| 成年人在线看| 尤物yw午夜国产精品视频| 四季av一区二区三区| 欧美在线aaa| 久久99青青| 麻豆av一区| 妖精视频一区二区三区| 精品一区二区视频| 欧美偷窥清纯综合图区| 精品一区二区三区日本| 日韩高清电影免费| 久久婷婷开心| 久久av影视| 日韩亚洲视频| 欧美亚洲激情| 一区高清视频| 伊人成综合网| 国产传媒久久久| 伊人精品视频| 成人在线看视频| 日韩成人dvd| 午夜精品久久久久久久99热影院| 精品在线一区二区| 久久黄色一级视频| 99在线精品一区二区三区| 男生裸体视频网站| 国产午夜精品久久久久久久| 国产精品理论在线| 亚洲人成亚洲人成在线观看图片| 日韩a级片在线观看| 午夜久久久影院| 日日夜夜操视频| 欧美丰满高潮xxxx喷水动漫| 精品国产99久久久久久宅男i| 精品久久久久久久久久久久久久久| 亚洲国产精品无码久久| 亚洲精品电影网站| 成人性生交大片免费看午夜| 久久久精品在线观看| 国模雨婷捆绑高清在线| 日本精品久久久| 香蕉成人影院| 97操在线视频| 国产探花一区| 女人被男人躁得好爽免费视频 | thepron国产精品| 香蕉视频久久久| 一区二区三区欧美| 日韩在线播放中文字幕| 欧美日韩二区三区| 天天舔天天干天天操| 一本久久综合亚洲鲁鲁| 女人天堂av在线播放| 国产成人一区二区| 成人h动漫精品一区二区器材| 欧美凹凸一区二区三区视频| 一个色综合网| 成人午夜激情av| www.日韩在线| 99久久久免费精品| 色综合久久中文综合久久97| 国产老妇伦国产熟女老妇视频| 亚洲高清一二三区| 精品国产白色丝袜高跟鞋| 欧日韩在线观看| 51精品国产| 一区二区视频在线免费| 国产一区二区三区久久| 国产乱叫456| 国产欧美日韩在线看| 影音先锋亚洲天堂| 欧美一区二区在线免费观看| 国产视频三级在线观看播放| 久久久影视精品| 日韩激情欧美| 中文字幕日韩精品久久| 久久一区国产| 艳妇乳肉亭妇荡乳av| 亚洲永久精品大片| 91禁在线观看| 国产香蕉97碰碰久久人人| 多野结衣av一区| 国产精品免费视频一区二区| 香蕉久久网站| 免费在线观看污网站| 国产无遮挡一区二区三区毛片日本| 精品久久免费视频| 亚洲成人在线网| 日韩经典av| 99视频在线播放| 欧美黄在线观看| 超碰中文字幕在线观看| 国产精品成人网| 91亚洲国产成人精品一区| 在线精品国产成人综合| 成人a在线观看高清电影| 欧美日本亚洲| 日韩二区在线观看| 真实乱视频国产免费观看| 欧美日韩日本国产| 香蕉av一区二区三区| 韩国日本不卡在线| 九九热hot精品视频在线播放| 黄色一级片在线看| 9人人澡人人爽人人精品| 国产精品99re| 亚洲级视频在线观看免费1级| 国产理论电影在线| 国产精品自拍首页| 一本久久知道综合久久| 你懂的在线观看网站| 欧美日韩性视频| 欧美日韩国产综合视频| 国产精品999| 久久免费精品视频在这里| 中日韩av在线播放| 亚洲免费三区一区二区| 性生活免费网站| 亚洲**2019国产| 亚洲精品无吗| 成人性生生活性生交12| 一区在线播放视频| 亚洲成人中文字幕在线| 国模视频一区二区三区| 丝袜美腿一区二区三区动态图 | 日本美女久久| 伊人久久大香线蕉成人综合网| 黄一区二区三区| 久久久久久天堂| 日韩av网站大全| 先锋欧美三级| 色乱码一区二区三区熟女| 国产69精品久久777的优势| 好吊操这里只有精品| 亚洲天堂日韩电影| 99tv成人影院| 少妇人妻在线视频| 国产精品色一区二区三区| 超碰福利在线观看| 人人爽久久涩噜噜噜网站| 日韩av有码| 女性生殖扒开酷刑vk| 91久久一区二区| 色女人在线视频| 欧美连裤袜在线视频| 狠狠狠色丁香婷婷综合激情| 国产一级黄色av| 一本色道久久综合亚洲精品小说| 国产亚洲亚洲国产一二区| 免费在线观看亚洲视频| 国产精品福利电影一区二区三区四区| 午夜精品久久久久久久91蜜桃| 浅井舞香一区二区| 真实国产乱子伦精品一区二区三区| 91精品又粗又猛又爽| 欧美日韩免费不卡视频一区二区三区 | 成年人国产精品| 国产精品久久久久久久免费| 2021国产精品视频| 欧美日本中文| 我要看一级黄色录像|