精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用 Llama 3.2-Vision 多模態 LLM 和圖像“聊天”

人工智能
本文專注于了解如何在類似聊天的模式下本地構建 Llama 3.2-Vision,并在 Colab 筆記本上探索其多模態技能。

一、引言

將視覺能力與大型語言模型(LLMs)結合,正在通過多模態 LLM(MLLM)徹底改變計算機視覺領域。這些模型結合了文本和視覺輸入,展示了在圖像理解和推理方面的卓越能力。雖然這些模型以前只能通過 API 訪問,但最近的開放源代碼選項現在允許本地執行,使其在生產環境中更具吸引力。

在本教程中,我們將學習如何使用開源的 Llama 3.2-Vision 模型與圖像進行對話,您將對其 OCR、圖像理解和推理能力感到驚嘆。所有代碼都方便地提供在一個 Colab 筆記本中。

二、背景

Llama 是 “Large Language Model Meta AI” 的縮寫,是由 Meta 開發的一系列先進 LLM。其最新版本 Llama 3.2 引入了先進的視覺能力。視覺變體有兩種尺寸:11B 和 90B 參數,能夠在邊緣設備上進行推理。憑借高達 128k 的上下文窗口和對高達 1120x1120 像素的高分辨率圖像的支持,Llama 3.2 可以處理復雜的視覺和文本信息。

三、架構

Llama 系列模型是僅解碼器的 Transformer。Llama 3.2-Vision 基于預訓練的 Llama 3.1 純文本模型構建。它采用了標準的密集自回歸 Transformer 架構,與前代 Llama 和 Llama 2 沒有顯著偏離。

為了支持視覺任務,Llama 3.2 使用預訓練的視覺編碼器(ViT-H/14)提取圖像表示向量,并通過視覺適配器將這些表示集成到凍結的語言模型中。適配器由一系列交叉注意力層組成,允許模型專注于與正在處理的文本相對應的圖像部分 [1]。

適配器在文本-圖像對上進行訓練,以將圖像表示與語言表示對齊。在適配器訓練期間,圖像編碼器的參數會更新,而語言模型的參數保持凍結,以保留現有的語言能力。

Llama 3.2-Vision 架構。視覺模塊(綠色)集成到固定的語言模型(粉色)中

這種設計使 Llama 3.2 在多模態任務中表現出色,同時保持了強大的純文本性能。生成的模型在需要圖像和語言理解的任務中展示了令人印象深刻的能力,并允許用戶與其視覺輸入進行交互式通信。在了解了 Llama 3.2 的架構后,我們可以深入實際實現。但首先,我們需要做一些準備工作。

四、準備工作

在 Google Colab 上運行 Llama 3.2 — Vision 11B 之前,我們需要進行以下準備工作:

(1) GPU 設置:

  • 推薦使用至少 22GB VRAM 的高端 GPU 以實現高效推理 [2]。
  • 對于 Google Colab 用戶:導航到“運行時” > “更改運行時類型” > 選擇“A100 GPU”。請注意,高端 GPU 可能不適用于免費 Colab 用戶。

(2) 模型權限:在此處申請 Llama 3.2 模型的訪問權限。

(3) Hugging Face 設置:

  • 如果您還沒有 Hugging Face 賬戶,請在此處創建一個。
  • 如果您還沒有訪問令牌,請從您的 Hugging Face 賬戶生成一個。
  • 對于 Google Colab 用戶,在 Google Colab Secrets 中將 Hugging Face 令牌設置為名為“HF_TOKEN”的秘密環境變量。

(4) 安裝所需庫。

五、加載模型

在設置好環境和獲取必要權限后,我們將使用 Hugging Face Transformers 庫實例化模型及其關聯的處理器。處理器負責為模型準備輸入并格式化其輸出。

model_id = "meta-llama/Llama-3.2-11B-Vision-Instruct"

model = MllamaForConditionalGeneration.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto")

processor = AutoProcessor.from_pretrained(model_id)

1.期望的聊天模板

聊天模板通過存儲“用戶”(我們)和“助手”(AI 模型)之間的對話歷史來保持上下文。對話歷史被結構化為一個名為 messages 的列表,其中每個字典代表一個對話輪次,包括用戶和模型的響應。用戶輪次可以包括圖像-文本或純文本輸入,{"type": "image"} 表示圖像輸入。例如,經過幾次聊天迭代后,messages 列表可能如下所示:

messages = [
    {"role": "user",      "content": [{"type": "image"}, {"type": "text", "text": prompt1}]},
    {"role": "assistant", "content": [{"type": "text", "text": generated_texts1}]},
    {"role": "user",      "content": [{"type": "text", "text": prompt2}]},
    {"role": "assistant", "content": [{"type": "text", "text": generated_texts2}]},
    {"role": "user",      "content": [{"type": "text", "text": prompt3}]},
    {"role": "assistant", "content": [{"type": "text", "text": generated_texts3}]}
]

這個 messages 列表稍后會傳遞給 apply_chat_template() 方法,以將對話轉換為模型期望格式的單個可標記化字符串。

2.主函數

在本教程中,我提供了一個 chat_with_mllm 函數,該函數支持與 Llama 3.2 MLLM 進行動態對話。此函數處理圖像加載、預處理圖像和文本輸入、生成模型響應,并管理對話歷史以啟用聊天模式交互。

def chat_with_mllm (model, processor, prompt, images_path=[],do_sample=False, temperature=0.1, show_image=False, max_new_tokens=512, messages=[], images=[]):

    # Ensure list:
    if not isinstance(images_path, list):
        images_path =  [images_path]

    # Load images 
    if len (images)==0 and len (images_path)>0:
            for image_path in tqdm (images_path):
                image = load_image(image_path)
                images.append (image)
                if show_image:
                    display ( image )

    # If starting a new conversation about an image
    if len (messages)==0:
        messages = [{"role": "user", "content": [{"type": "image"}, {"type": "text", "text": prompt}]}]

    # If continuing conversation on the image
    else:
        messages.append ({"role": "user", "content": [{"type": "text", "text": prompt}]})

    # process input data
    text = processor.apply_chat_template(messages, add_generation_prompt=True)
    inputs = processor(images=images, text=text, return_tensors="pt", ).to(model.device)

    # Generate response
    generation_args = {"max_new_tokens": max_new_tokens, "do_sample": True}
    if do_sample:
        generation_args["temperature"] = temperature
    generate_ids = model.generate(**inputs,**generation_args)
    generate_ids = generate_ids[:, inputs['input_ids'].shape[1]:-1]
    generated_texts = processor.decode(generate_ids[0], clean_up_tokenization_spaces=False)

    # Append the model's response to the conversation history
    messages.append ({"role": "assistant", "content": [  {"type": "text", "text": generated_texts}]})

    return generated_texts, messages, images

六、與 Llama 對話

1. 蝴蝶圖像示例

在我們的第一個示例中,我們將與 Llama 3.2 討論一張孵化中的蝴蝶圖像。由于 Llama 3.2-Vision 在使用圖像時不支持系統提示,我們將直接在用戶提示中附加指令以指導模型的響應。通過設置 do_sample=True 和 temperature=0.2,我們允許輕微的隨機性,同時保持響應的一致性。對于固定答案,可以設置 do_sample=False。messages 參數(保存聊天歷史)最初為空,images 參數也是如此。

instructions = "Respond concisely in one sentence."
prompt = instructions + "Describe the image."

response, messages,images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path],
                                             do_sample=True,
                                             temperature=0.2,
                                             show_image=True,
                                             messages=[],
                                             images=[])

# Output:  "The image depicts a butterfly emerging from its chrysalis, 
#           with a row of chrysalises hanging from a branch above it."

正如我們所見,輸出準確且簡潔,表明模型有效地理解了圖像。在下一個聊天迭代中,我們將傳遞一個新的提示以及聊天歷史(messages)和圖像文件(images)。新提示旨在評估 Llama 3.2 的推理能力:

prompt = instructions + "What would happen to the chrysalis in the near future?"
response, messages, images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path,],
                                             do_sample=True,
                                             temperature=0.2,
                                             show_image=False,
                                             messages=messages,
                                             images=images)

# Output: "The chrysalis will eventually hatch into a butterfly."

我們在提供的 Colab 筆記本中繼續了這次對話,并獲得了以下對話內容:

對話突出了模型通過準確描述場景來理解圖像的能力。它還展示了其推理能力,通過邏輯連接信息,正確推斷出蛹會發生什么,并解釋了為什么有些是棕色的而有些是綠色的。

2. 表情包圖像示例

在這個示例中,我將向模型展示我自己創建的一個表情包,以評估 Llama 的 OCR 能力,并確定它是否理解我的幽默感。

instructions = "You are a computer vision engineer with sense of humor."
prompt = instructions + "Can you explain this meme to me?"


response, messages,images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path,],
                                             do_sample=True,
                                             temperature=0.5,
                                             show_image=True,
                                             messages=[],
                                             images=[])
instructions = "You are a computer vision engineer with sense of humor."
prompt = instructions + "Can you explain this meme to me?"


response, messages,images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path,],
                                             do_sample=True,
                                             temperature=0.5,
                                             show_image=True,
                                             messages=[],
                                             images=[])

這是輸入的表情包:

這是模型的響應:

正如我們所見,模型展示了出色的 OCR 能力,并理解了圖像中的文本含義。至于它的幽默感——你怎么看,它理解了嗎?你理解了嗎?

責任編輯:趙寧寧 來源: 小白玩轉Python
相關推薦

2024-12-17 08:05:34

大型語言模型MetaAILLM

2024-01-11 16:24:12

人工智能RAG

2025-01-08 08:21:16

2023-11-10 08:00:00

微服務架構開發

2024-12-18 18:57:58

2024-10-24 23:37:33

2023-12-07 12:05:39

2024-09-26 14:40:45

2025-05-06 08:40:00

2024-11-19 14:40:00

AI技術

2025-04-07 07:00:00

2024-09-26 17:54:10

2023-08-01 13:31:18

模型Alpacaicuna

2023-10-31 16:37:55

大型語言模型人工智能

2024-11-19 15:00:00

模型開源

2024-08-08 13:04:28

2023-12-25 09:07:50

AI人工智能Ferret

2023-07-10 13:46:58

PythonLlama.cppLLM

2025-07-24 02:00:00

2023-06-08 11:32:00

模型論文
點贊
收藏

51CTO技術棧公眾號

国产在线观看欧美| 在线亚洲欧美视频| 五月丁香综合缴情六月小说| 天堂av中文字幕| 日韩电影一二三区| 九九热这里只有精品6| 性欧美丰满熟妇xxxx性久久久| 欧美电影h版| 亚洲精品一二三四区| 精品国产免费久久久久久尖叫| 日韩国产成人在线| 在线欧美三区| www亚洲欧美| 草草影院第一页| 亚洲高清999| 91福利视频久久久久| 国产精品自拍合集| 99免在线观看免费视频高清| 中文字幕一区二区三区人妻四季 | 91久久香蕉国产日韩欧美9色| 亚洲免费视频播放| 精品资源在线看| 处破女av一区二区| 成人乱色短篇合集| 波多野结衣绝顶大高潮| 亚洲人体大胆视频| 欧美高清第一页| 亚洲 欧美 变态 另类 综合| 亚洲精品aaaaa| 精品国产乱码久久久久久浪潮| 青青草原国产在线视频| 成人勉费视频| 欧美色图在线视频| 免费网站在线观看视频| 欧美精品日韩少妇| 91成人高清| 麻豆91在线观看| 国产成人精品av在线| 国产极品美女高潮无套嗷嗷叫酒店| 99精品全国免费观看视频软件| 亚洲欧洲午夜一线一品| 精品国产av色一区二区深夜久久| 亚洲一区二区三区日本久久九| 欧美日韩国产小视频在线观看| 北条麻妃av高潮尖叫在线观看| 日韩av影片| 亚洲国产精品久久久久秋霞影院| 欧美少妇一区二区三区| 精品孕妇一区二区三区| 国产精品毛片无遮挡高清| 欧美精品一区二区三区久久| 特黄aaaaaaaaa真人毛片| 成人午夜视频网站| 国产精品久久久久久久久久久久冷| 国产熟女一区二区三区四区| 麻豆成人免费电影| 国产在线观看一区二区三区| 91福利在线观看视频| 美女免费视频一区| 国产狼人综合免费视频| 夜夜嗨aⅴ一区二区三区| 美女视频黄久久| 国产在线观看精品| www.我爱av| 成人性生交大片免费看中文网站| 99电影网电视剧在线观看| 999免费视频| 国产精品一卡二| 成人做爰66片免费看网站| 高潮一区二区三区乱码| zzijzzij亚洲日本少妇熟睡| 欧美精品v日韩精品v国产精品| 精品视频二区| 中文幕一区二区三区久久蜜桃| 亚洲在线观看一区| 欧美hdxxx| 欧美性xxxxxxxxx| 亚洲综合日韩欧美| 视频二区欧美| 亚洲欧美成人网| 亚洲一二三四五六区| 牛夜精品久久久久久久99黑人| 欧美激情三级免费| 国产一级淫片a视频免费观看| 琪琪一区二区三区| 丁香婷婷久久久综合精品国产 | 久艹视频在线观看| 日韩午夜在线电影| 国产精品日韩一区| 亚洲精品无amm毛片| 国产午夜久久久久| 免费的一级黄色片| 欧美一级二级视频| 日韩视频在线永久播放| 精品久久久久久中文字幕人妻最新| 日韩国产欧美| 久久久噜噜噜久久久| 午夜一级黄色片| 不卡视频免费播放| 永久久久久久| 中文字幕在线视频久| 欧美精品在欧美一区二区少妇| 性久久久久久久久久久| 久久香蕉国产| 欧美亚洲伦理www| 97在线公开视频| 久久午夜色播影院免费高清| gogogo免费高清日本写真| 中文字幕乱码在线播放| 日韩一级欧美一级| 一级特黄曰皮片视频| 伊人成人在线视频| 91久久精品日日躁夜夜躁国产| 少妇性bbb搡bbb爽爽爽欧美| 亚洲视频一区二区在线观看| 欧美女人性生活视频| 日韩免费精品| 日韩一区二区三区国产| 手机在线看片1024| av成人老司机| 91免费国产精品| 亚洲二区av| 在线成人激情黄色| 人妻丰满熟妇av无码区| 丁香啪啪综合成人亚洲小说| 这里只有精品66| yiren22亚洲综合| 亚洲欧美国产一本综合首页| 国产精品成人国产乱| 久久99国产精品免费| 日韩不卡av| 少妇一区视频| 国产性色av一区二区| 伊人久久综合视频| 成人福利在线看| 全黄性性激高免费视频| 最新精品在线| 久久999免费视频| 国产三区在线播放| 日韩理论片网站| 青青草原国产在线视频| 成人激情电影在线| 国产精品极品尤物在线观看| 久久国产精品高清一区二区三区| 欧美视频免费在线| 欧美深性狂猛ⅹxxx深喉| 亚洲麻豆av| 久久久久久久久久久一区 | 触手亚洲一区二区三区| 在线看日本不卡| 欧美一区二区三区粗大| 秋霞国产午夜精品免费视频| 色噜噜狠狠色综合网| 亚洲天堂1区| 精品国产一区av| 国产草草影院ccyycom| 亚洲免费在线观看视频| 中文字幕亚洲日本| 亚洲激情午夜| 明星裸体视频一区二区| 日本三级一区| 一区二区亚洲欧洲国产日韩| 中文字幕日本人妻久久久免费 | 欧美日韩午夜爽爽| 第一区第二区在线| 57pao精品| 啊v视频在线| 欧美一区二区三区影视| 久久中文字幕无码| 91丝袜美腿高跟国产极品老师| 欧美精品色婷婷五月综合| 国产欧美一区二区三区精品观看| 国产高清视频一区三区| 黄色一级片在线观看| 日韩欧美在线123| 日本天堂在线视频| 久久麻豆一区二区| 亚洲图色中文字幕| 伊人精品视频| 日韩欧美在线电影| 国产日韩中文在线中文字幕| 欧美激情日韩图片| 免费福利在线观看| 制服丝袜亚洲网站| 日韩欧美三级在线观看| 欧美激情一区二区| 成年人看片网站| 丝袜诱惑亚洲看片| 超碰97在线看| 美女毛片一区二区三区四区最新中文字幕亚洲 | 天堂8中文在线最新版在线| 伊人伊成久久人综合网小说| 国产成人精品免费看视频| 欧美日韩国产中字| 欧美视频www| www久久精品| 人妻换人妻仑乱| 肉肉av福利一精品导航| 国产乱子伦精品无码专区| 欧美猛男同性videos| 91日韩久久| www.久久| 欧洲日本亚洲国产区| 18加网站在线| 尤物99国产成人精品视频| 二区三区在线视频| 91精品国产综合久久久久久漫画 | 精品亚洲va在线va天堂资源站| 91久久久久国产一区二区| 黑人极品videos精品欧美裸| 黄色录像一级片| 久久婷婷国产综合国色天香| 少妇欧美激情一区二区三区| 免费欧美在线视频| 精品中文字幕av| 亚洲小说区图片区| 国产盗摄视频在线观看| 青青草国产成人a∨下载安卓| 国产一区二区视频在线免费观看| 91精品视频一区二区| 国产精品第二页| 中文字幕在线直播| 91国产美女在线观看| 性xxxfreexxxx性欧美| 伊人久久久久久久久久久久久| 丝袜视频国产在线播放| 欧美精品一区二区三区在线播放| 99精品在线视频观看| 欧美日韩久久一区二区| 成人免费视频国产免费| 日韩欧美在线中文字幕| 日韩少妇高潮抽搐| 亚洲成人一区在线| 精品午夜福利视频| 亚洲在线中文字幕| 国产性生活网站| 一区二区三区美女视频| 欧美大片xxxx| 亚洲日本成人在线观看| 国产白丝一区二区三区| 国产精品你懂的在线| 天天舔天天操天天干| 国产日本欧洲亚洲| 国产一区二区三区四区在线| 国产欧美一区二区在线观看| 亚洲人成人无码网www国产| 成人黄页毛片网站| 亚洲国产综合视频| 91色综合久久久久婷婷| 国产亚洲无码精品| 久久久久久亚洲综合| 免费一级做a爰片久久毛片潮| 久久色中文字幕| 国产伦精品一区二区三区视频女| 欧美国产日韩精品免费观看| 国产又大又粗又爽的毛片| 国产视频一区二区三区在线观看| 亚洲天堂最新地址| 综合久久久久久久| 欧美成人三级视频| 亚洲一二三专区| 999这里只有精品| 日韩欧美国产骚| 在线免费观看一区二区| 欧美一区二区在线免费观看| 国产黄色美女视频| 日韩av网址在线| 成人在线观看一区| 久久久电影免费观看完整版| a毛片在线观看| 91精品国产91久久久久久| 校园春色亚洲色图| 成人免费网站在线| 欧美精品中文| 日韩国产美国| 亚洲色图88| 欧美成人一区二区在线观看| 日韩中文字幕一区二区三区| 亚洲日本黄色片| 成人免费毛片app| www.99热| 亚洲一区av在线| 这里只有精品999| 精品国精品国产| jizz在线观看| 久久久久久久久久亚洲| 小明成人免费视频一区| www.久久爱.cn| 精品国产91乱码一区二区三区四区| 日韩视频在线免费播放| 免费在线播放第一区高清av| 亚洲 欧美 日韩系列| 国产成人午夜精品影院观看视频 | 免费黄网站在线| 97碰在线观看| www久久久| 久久久久久久免费| 伊人久久大香线蕉综合四虎小说 | 国产亚洲精品久久久久久777| 2024最新电影在线免费观看| 欧美亚洲日本黄色| 日韩成人久久| 亚洲二区三区四区| 亚洲精品裸体| 手机av在线网站| 国产精品视频线看| 欧美一区二区三区四| 91精品一区二区三区久久久久久| 国产在线观看黄| 8090成年在线看片午夜| 玖玖精品一区| 亚洲综合av一区| 爽爽淫人综合网网站| 欧美大喷水吹潮合集在线观看| 亚洲日本成人在线观看| 自拍偷拍福利视频| 亚洲视频网站在线观看| 国产蜜臀av在线播放| 成人黄色大片在线免费观看| 国产一区日韩| 凹凸国产熟女精品视频| 成人污污视频在线观看| 小泽玛利亚一区二区免费| 欧美日韩一区国产| 国产一级片在线| 欧美性视频在线| 欧美精品密入口播放| 日韩一级性生活片| 成人av电影在线网| 国产精品18p| 精品久久久久一区| 里番在线播放| 高清日韩一区| 影音先锋中文字幕一区二区| 亚洲911精品成人18网站| 日韩理论在线观看| 精品人妻一区二区三区含羞草| 久久精品免费电影| 国产中文欧美日韩在线| 最新av在线免费观看| 精品在线播放午夜| 国产精品视频看看| 91精品国模一区二区三区| 成人在线影视| 99re热精品| 精品电影一区| 国产精品久久久免费观看| 精品日韩中文字幕| 可以在线观看的黄色| 国产精品国产亚洲伊人久久 | 美女精品视频在线| 国产精品日韩三级| av日韩在线网站| 久久夜色精品国产噜噜亚洲av| 亚洲国产精品久久久男人的天堂| 欧美日韩国产综合一区二区三区| 春暖花开成人亚洲区| 国产欧美日韩免费| 欧美在线二区| 中文字幕人妻一区二区三区| 精品国产乱码久久久久久虫虫漫画 | 中文字幕免费在线不卡| 国产一区中文字幕| 国产性70yerg老太| 亚洲欧洲自拍偷拍| 色综合视频一区二区三区44| 九九久久九九久久| 97se亚洲国产综合自在线不卡| 亚洲综合久久网| www.欧美精品一二三区| 亚洲视频国产| 波多野结衣家庭教师在线| 欧美国产成人在线| 精品国自产拍在线观看| 2019中文字幕在线| 日韩欧美高清在线播放| 国产精品一级无码| 色综合久久久久久久久| 免费a级人成a大片在线观看| 97se亚洲综合| 日韩精品成人一区二区三区| 熟女少妇a性色生活片毛片| 精品蜜桃在线看| 桃花岛成人影院| 青青在线免费视频| 91视频com| 精品国产99久久久久久宅男i| 538国产精品视频一区二区| 久久精品高清| 在线精品一区二区三区| 欧美喷潮久久久xxxxx| av在线最新| 小说区视频区图片区| 99久久婷婷国产综合精品| 国产精品久久久久久69| 欧美中文字幕精品| 欧美人成网站| 成年人视频软件| 日韩精品电影网| 日韩精品一区二区三区免费视频|