精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰 原創

發布于 2024-12-17 07:52
瀏覽
0收藏

本文將以實戰案例探討如何在類似聊天的模式下從本地構建Llama3.2-Vision模型,并在Colab筆記本上探索其多模態技能。

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰-AI.x社區

簡介

視覺功能與大型語言模型(LLM)的集成正在通過多模態LLM(MLLM)徹底改變計算機視覺領域。這些模型結合了文本和視覺輸入,在圖像理解和推理方面表現出令人印象深刻的能力。雖然這些模型以前只能通過API訪問,但是最近發布的一些開源項目已經支持在本地執行,這使得它們對生產環境中一線應用更具吸引力。

在本文中,我們將學習如何使用開源Llama3.2-Vision模型與我們提供的圖像聊天,其間你會驚嘆于該模型的OCR、圖像理解和推理能力。示例工程的所有代碼都將方便地提供在一個Colab筆記本文件中。

Llama 3.2-Vision模型

背景

Llama是“大型語言模型MetaAI”的縮寫,是Meta公司開發的一系列高級大語言模型。他們的產品Llama 3.2推出了先進的視覺功能。視覺變體有兩種大小:11B和90B參數,可在邊緣設備上進行推理。Llama 3.2具有高達128k個標記的上下文窗口,支持高達1120x1120像素的高分辨率圖像,可以處理復雜的視覺和文本信息。

架構

Llama系列模型是僅使用解碼器的轉換器。Llama3.2-Vision模型建立在預訓練的Llama 3.1純文本模型之上。它采用標準的密集自回歸轉換器架構,與其前身Llama和Llama 2并無太大差異。

為了支持視覺任務,Llama 3.2使用預訓練的視覺編碼器(ViT-H/14)提取圖像表示向量,并使用視覺適配器將這些表示集成到凍結語言模型中。適配器由一系列交叉注意層組成,允許模型專注于與正在處理的文本相對應的圖像的特定部分(參考文獻【1】)。

適配器基于“文本-圖像”對進行訓練,以使圖像表示與語言表示對齊。在適配器訓練期間,圖像編碼器的參數會更新,而語言模型參數保持凍結以保留現有的語言能力。

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰-AI.x社區

Llama 3.2-Vision模型架構:視覺模塊(綠色)集成到固定語言模型(粉紅色)中

這種設計使Llama 3.2在多模態任務中表現出色,同時保持其強大的純文本性能。生成的模型在需要圖像和語言理解的任務中展示了令人印象深刻的能力,并允許用戶與他們的視覺輸入進行交互式交流。

編碼實戰

有了對Llama 3.2架構的基本了解后,讓我們深入研究其實際實現。但首先,我們需要做一些準備工作。

準備

在Google Colab上運行Llama3.2—Vision11B之前,我們需要做一些準備:

1.GPU設置

  • 建議使用至少具有22GB VRAM的高端GPU進行高效推理(參考文獻【2】)。
  • 對于Google Colab用戶來說:需要導航至“運行時”>“更改運行時類型”>“A100 GPU”。請注意,高端GPU可能不適用于免費的Colab用戶。

2.  模型權限

請求訪問Llama 3.2模型在鏈接https://www.llama.com/llama-downloads/處提供。

3.HuggingFace設置

如果你還沒有Hugging Face賬戶,請在鏈接??https://huggingface.co/join處創建一個。??

如果你沒有Hugging Face賬戶,請在鏈接https://huggingface.co/join處生成訪問令牌。

對于Google Colab用戶,請在谷歌Colab Secrets中將Hugging Face令牌設置為名為“HF_TOKEN”的秘密環境變量。

4.安裝所需的庫

加載模型

設置環境并獲得必要的權限后,我們將使用Hugging Face轉換庫來實例化模型及其相關的處理器。處理器負責為模型準備輸入并格式化其輸出。

model_id = "meta-llama/Llama-3.2-11B-Vision-Instruct"

model = MllamaForConditionalGeneration.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto")

processor = AutoProcessor.from_pretrained(model_id)

預期的聊天模板

聊天模板通過存儲“用戶”(我們)和“助手”(AI模型)之間的交流,通過對話歷史記錄來維護上下文。對話歷史記錄的結構為一個稱為消息的字典列表,其中每個字典代表一個對話輪次,包括用戶和模型響應。用戶輪次可以包括圖像文本或純文本輸入,其中{"type": "image"}表示圖像輸入。

例如,經過幾次聊天迭代后,消息列表可能如下所示:

messages = [
{"role": "user",      "content": [{"type": "image"}, {"type": "text", "text": prompt1}]},
{"role": "assistant", "content": [{"type": "text", "text": generated_texts1}]},
{"role": "user",      "content": [{"type": "text", "text": prompt2}]},
{"role": "assistant", "content": [{"type": "text", "text": generated_texts2}]},
{"role": "user",      "content": [{"type": "text", "text": prompt3}]},
{"role": "assistant", "content": [{"type": "text", "text": generated_texts3}]}
]

此消息列表隨后會傳遞給apply_chat_template()方法,以便將對話轉換為模型期望格式的單個可標記字符串。

主函數

在本教程中,我提供了一個chat_with_mllm函數,該函數可實現與Llama 3.2 MLLM的動態對話。此函數能夠處理圖像加載、預處理圖像和文本輸入、生成模型響應并管理對話歷史記錄以啟用聊天模式交互。

def chat_with_mllm (model, processor, prompt, images_path=[],do_sample=False, temperature=0.1, show_image=False, max_new_tokens=512, messages=[], images=[]):

# 確保列表形式:
if not isinstance(images_path, list):
images_path =  [images_path]

#加載圖像
if len (images)==0 and len (images_path)>0:
for image_path in tqdm (images_path):
image = load_image(image_path)
images.append (image)
if show_image:
display ( image )

#如果開始了一個關于一個圖像的新的對話
if len (messages)==0:
messages = [{"role": "user", "content": [{"type": "image"}, {"type": "text", "text": prompt}]}]

# 如果繼續對圖像進行對話
else:
messages.append ({"role": "user", "content": [{"type": "text", "text": prompt}]})

# 處理輸入數據
text = processor.apply_chat_template(messages, add_generation_prompt=True)
inputs = processor(images=images, text=text, return_tensors="pt", ).to(model.device)

    生成相應
generation_args = {"max_new_tokens": max_new_tokens, "do_sample": True}
if do_sample:
generation_args["temperature"] = temperature
generate_ids = model.generate(**inputs,**generation_args)
generate_ids = generate_ids[:, inputs['input_ids'].shape[1]:-1]
generated_texts = processor.decode(generate_ids[0], clean_up_tokenization_spaces=False)

# 附加該模型對對話歷史記錄的響應
messages.append ({"role": "assistant", "content": [  {"type": "text", "text": generated_texts}]})

return generated_texts, messages, images

與Llama聊天

蝴蝶圖像示例

在我們的第一個示例中,我們將與Llama3.2進行聊天,討論一張孵化蝴蝶的圖像。由于Llama3.2-Vision在使用圖像時不支持使用系統提示進行提示,因此我們將直接在用戶提示中附加說明,以指導模型的響應。通過設置do_sample=True和temperature=0.2,我們可以在保持響應一致性的同時實現輕微的隨機性。對于固定答案,你可以設置do_sample==False。保存聊天歷史記錄的messages參數最初為空,如images參數中所示:

instructions = "Respond concisely in one sentence."
prompt = instructions + "Describe the image."

response, messages,images= chat_with_mllm ( model, processor, prompt,
images_path=[img_path],
do_sample=True,
temperature=0.2,
show_image=True,
messages=[],
images=[])

# 輸出:"The image depicts a butterfly emerging from its chrysalis, 
#           with a row of chrysalises hanging from a branch above it."

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰-AI.x社區

圖片來自Pixabay(https://www.pexels.com/photo/brown-and-white-swallowtail-butterfly-under-white-green-and-brown-cocoon-in-shallow-focus-lens-63643/)。

我們可以看到,輸出準確而簡潔,表明模型有效地理解了圖像。

對于下一次聊天迭代,我們將傳遞一個新提示以及聊天歷史記錄和圖像文件。新提示旨在評估Llama3.2的推理能力:

prompt = instructions + "What would happen to the chrysalis in the near future?"
response, messages, images= chat_with_mllm ( model, processor, prompt,
images_path=[img_path,],
do_sample=True,
temperature=0.2,
show_image=False,
messages=messages,
images=images)

# 輸出: "The chrysalis will eventually hatch into a butterfly."

我們在提供的Colab筆記本中繼續此聊天,并得到了以下對話:

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰-AI.x社區

對話通過準確描述場景,突出了模型的圖像理解能力。它還展示了它的推理能力,通過邏輯地連接信息來正確推斷蛹會發生什么,并解釋為什么有些蛹是棕色的,而有些蛹是綠色的。

模因圖像示例

在這個例子中,我將向模型展示我自己創建的模因,以評估Llama的OCR能力并確定它是否理解我的幽默感。

instructions = "You are a computer vision engineer with sense of humor."
prompt = instructions + "Can you explain this meme to me?"


response, messages,images= chat_with_mllm ( model, processor, prompt,
images_path=[img_path,],
do_sample=True,
temperature=0.5,
show_image=True,
messages=[],
images=[])

這是輸入模因:

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰-AI.x社區

作者制作的表情包。原始熊圖像由??Hans-Jurgen Mager??制作。

這是模型的回應:

本地構建Llama 3.2-Vision多模態LLM聊天應用實戰-AI.x社區

我們可以看到,該模型展示了出色的OCR能力,并理解了圖像中文本的含義。至于它的幽默感——你覺得怎么樣,它明白了嗎?你明白了嗎?也許我也應該努力培養我的幽默感!

結束語

在本文中,我們學習了如何在本地構建Llama3.2-Vision模型并管理聊天式交互的對話歷史記錄,從而增強用戶參與度。我們探索了Llama 3.2的零樣本能力,并領悟了其場景理解、推理和OCR技能。

我們還可以將其他一些高級技術應用于Llama 3.2,例如對獨特數據進行微調,或使用檢索增強生成(RAG)來進行預測并減少幻覺。

總體而言,本文帶領你深入了解了快速發展的多模態LLM領域及其在各種應用中的強大功能。

參考文獻

【0】本文示例項目在Colab Notebook地址:??https://gist.github.com/Lihi-Gur-Arie/0e87500813c29bb4c4a6a990795c3aaa??

【1】Llama 3模型介紹地址:https://arxiv.org/pdf/2407.21783

【2】Llama 3.2 11B Vision模型要求:https://llamaimodel.com/requirements-3-2/

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:??Chat with Your Images Using Llama 3.2-Vision Multimodal LLMs??,作者:Lihi Gur Arie

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-12-17 07:53:49修改
收藏
回復
舉報
回復
相關推薦
国产日韩综合av| 久久人人精品| 亚洲精品ady| 亚洲色成人一区二区三区小说| 免费国产在线观看| 精品一区二区三区免费毛片爱| 久久99精品国产99久久6尤物 | 午夜精品久久久久久久久久蜜桃| 中文字幕一区二区不卡| 精品国产一二| 国产精品毛片一区视频播| 99在线精品免费视频九九视| 国产一区二区黑人欧美xxxx| 日批免费观看视频| 日本一区二区电影| 第一福利永久视频精品 | 成人av电影观看| 成人一区二区三区在线观看| 国产日韩欧美中文在线播放| 六月丁香激情综合| 国产一区二区三区自拍| 国产一区二区三区高清在线观看| 亚洲图片欧美另类| 宅男噜噜噜66国产精品免费| 色爱区综合激月婷婷| 青青草国产免费| 免费看美女视频在线网站| 久久久亚洲欧洲日产国码αv| 91精品黄色| 又骚又黄的视频| 小嫩嫩精品导航| 欧美福利在线观看| 三级在线观看免费大全| 国产一区二区在线| 亚洲女人被黑人巨大进入| 风韵丰满熟妇啪啪区老熟熟女| 欧美黄色a视频| 五月婷婷欧美视频| 国产欧美久久久久| 污的网站在线观看| ...xxx性欧美| 亚洲自拍三区| av基地在线| 国产婷婷色一区二区三区四区 | 午夜视频免费在线| 国产xxx精品视频大全| 91丨九色丨国产在线| 中文字幕精品无码亚| 久久久久久久欧美精品| 欧美一级视频一区二区| 男人午夜免费视频| 欧美一区=区| 欧美一级大片在线免费观看| 天天综合天天干| 国产一区二区高清| 55夜色66夜色国产精品视频 | 99成人在线| 久久久久久久成人| 久久精品视频日本| 亚洲美女91| 2025国产精品视频| 国产日产精品一区二区三区| 国产精品女主播一区二区三区| 97视频在线观看免费| 日韩av片在线播放| 亚洲综合激情| 国产高清在线不卡| 91亚洲欧美激情| 国产精品一区二区免费不卡 | 国产精品一区=区| 亚洲无码久久久久| 国产一区二区三区四区五区入口| av日韩免费电影| 人人妻人人澡人人爽人人欧美一区 | 在线看片不卡| 久久97久久97精品免视看| 久久精品久久精品久久| 亚洲专区免费| 国产精品久久久久久久久久久久 | 国产精品一区二区三区网站| 大波视频国产精品久久| 午夜影院免费体验区| 久久精品夜色噜噜亚洲a∨ | 在线亚洲成人| 国产第一区电影| 国产a级免费视频| 成人精品免费网站| 日韩欧美亚洲区| 国产丝袜在线| 大荫蒂欧美视频另类xxxx| 午夜免费一区二区| 日韩欧美一级| 亚洲天堂男人天堂| 久久机热这里只有精品| 久久精品中文| 91网站在线看| 酒色婷婷桃色成人免费av网| 亚洲人成小说网站色在线| 日日碰狠狠添天天爽超碰97| 日本免费成人| 精品亚洲aⅴ在线观看| 一级免费黄色录像| 亚洲精品专区| 成人免费视频网| 美国成人毛片| 亚洲国产精品久久一线不卡| 男女男精品视频站| 久9re热视频这里只有精品| 中文字幕在线日韩 | 日韩欧美二区三区| 男人天堂av电影| 一区在线播放| 成人在线一区二区| 第一福利在线| 精品久久久一区二区| 熟妇无码乱子成人精品| 国内黄色精品| 51精品国产黑色丝袜高跟鞋| 国产叼嘿视频在线观看| 国产精品不卡视频| 男人透女人免费视频| 九九99久久精品在免费线bt| 国产亚洲在线播放| 国产成人自拍视频在线| 国产精品1区2区| 亚洲精品一区二| 欧美特大特白屁股xxxx| 日韩精品视频观看| 日本三级2019| 粉嫩在线一区二区三区视频| 中文字幕在线亚洲三区| 99re久久| 尤物九九久久国产精品的特点| 亚洲天堂一区在线观看| 97精品久久久午夜一区二区三区| 欧洲精品在线播放| 亚洲精品影片| 欧美激情在线视频二区| aaa一区二区| 中文字幕一区二区不卡| 日韩av片专区| 亚洲国产精品久久久天堂| 国产精品久久久久久亚洲影视| 日本中文字幕一区二区有码在线 | 国产精品天天看天天狠| 久久成人18免费网站| 国产精品视频第一页| 最近中文字幕一区二区三区| 久热在线视频观看| 在线精品小视频| 2019国产精品视频| 图片区小说区亚洲| 亚洲成人免费网站| 51国产偷自视频区视频| 久久久久久久久一| 免费无码av片在线观看| 欧洲三级视频| 成人高h视频在线| av网站大全在线| 精品美女一区二区| 日本在线视频中文字幕| 91丝袜美腿高跟国产极品老师| 日韩在线综合网| 免费观看久久av| 国产剧情久久久久久| a级毛片免费观看在线| 日韩亚洲欧美综合| 日本少妇毛茸茸高潮| 2021中文字幕一区亚洲| 9久久婷婷国产综合精品性色 | 91综合精品国产丝袜长腿久久| 欧美激情三级免费| 天天操天天干天天操| 色狠狠色狠狠综合| 久久爱一区二区| 成人精品国产一区二区4080| 北条麻妃在线视频观看| 欧美亚洲在线日韩| 亚洲一区二区三区久久 | 欧美在线免费| 国产一区二区视频在线免费观看 | 国产一区久久| 欧美凹凸一区二区三区视频| 欧美亚洲综合视频| 欧美精品videossex88| 国内在线免费高清视频| 91精品国产综合久久久久久久久久 | 亚洲观看高清完整版在线观看| 中文字幕在线观看的网站| 日本在线不卡视频| 日韩专区第三页| 国产99久久久国产精品成人免费| 成人性生交大片免费看视频直播 | 日韩欧美一区二区三区免费观看| 亚洲丝袜在线视频| 国产后入清纯学生妹| 天天综合天天综合色| 综合 欧美 亚洲日本| 成人免费看黄yyy456| 亚洲一级免费在线观看| 99精品国产99久久久久久福利| 一本一生久久a久久精品综合蜜| 美女视频免费精品| 91传媒免费看| 99久久久国产精品免费调教网站 | 四虎永久在线精品| 国产精品看片你懂得| 疯狂揉花蒂控制高潮h| 国产麻豆精品久久一二三| 成人在线免费播放视频| 在线精品福利| 蜜臀在线免费观看| 欧洲乱码伦视频免费| 久久精品国产99精品国产亚洲性色| 亚洲国产伊人| 国产精品第1页| 美女高潮在线观看| 欧美激情小视频| gogogogo高清视频在线| 色偷偷偷综合中文字幕;dd| 亚洲日本香蕉视频| 精品国产免费人成在线观看| 国产精品热久久| 欧美欧美欧美欧美| 波多野结衣视频观看| 高跟丝袜欧美一区| av资源吧首页| 一区二区三区四区国产精品| 婷婷社区五月天| 国产精品二三区| 337人体粉嫩噜噜噜| 久久一区二区视频| 一二三不卡视频| 99久久免费精品| 人妻体内射精一区二区三区| 国产999精品久久久久久绿帽| 欧美激情国内自拍| 久久99精品久久久| 超碰超碰在线观看| 蜜桃免费网站一区二区三区| 男女男精品视频站| 久久精品二区亚洲w码| www.日本一区| 久久成人免费日本黄色| gai在线观看免费高清| 韩国v欧美v亚洲v日本v| 性久久久久久久久久久久久久| 国内久久婷婷综合| 亚洲丝袜在线观看| 成人午夜看片网址| 中文文字幕文字幕高清| 97se狠狠狠综合亚洲狠狠| 亚洲av无码一区二区三区观看| 2021国产精品久久精品| 欧美人与性囗牲恔配| 中文一区二区完整视频在线观看| 丁香激情五月少妇| 亚洲欧洲日韩一区二区三区| 26uuu成人网| 亚洲综合另类小说| 你懂的国产视频| 在线观看免费亚洲| 91丨九色丨蝌蚪丨对白| 日韩一级视频免费观看在线| 六月婷婷综合网| 亚洲男人天堂久| 免费黄色在线观看| 欧美激情欧美激情在线五月| 在线免费看h| 国产精品久久久久久av福利| 精品国产鲁一鲁****| 国产欧美在线一区二区| 国产精品羞羞答答在线观看| 亚洲人久久久| 好吊一区二区三区| 成人免费无码av| 国产一区二区三区久久悠悠色av| 国产情侣久久久久aⅴ免费| 91久色porny| h色网站在线观看| 午夜精品在线看| 精品国产www| 日韩欧美国产一区二区三区| 麻豆导航在线观看| www.欧美精品一二三区| 黄色在线观看www| 国产精品视频色| 成人高潮a毛片免费观看网站| 欧美日韩亚洲在线| 中文无码久久精品| 国产女女做受ⅹxx高潮| 国产一区三区三区| 中文字幕网站在线观看| 一区二区三区精品| 日本丰满少妇做爰爽爽| 精品日韩成人av| caoporn国产精品免费视频| 久久久久国产精品免费网站| www.成人在线视频| 好看的日韩精品| 综合一区在线| 成人一区二区三| 成人精品高清在线| 特黄一区二区三区| 色综合网站在线| 人妻丰满熟妇av无码区hd| 在线日韩av观看| 免费h视频在线观看| 5566av亚洲| 俺要去色综合狠狠| 1024精品视频| 大尺度一区二区| 免费成年人视频在线观看| 日本韩国一区二区| 日本精品一二区| 久久91精品国产91久久跳| 青青伊人久久| 丝袜足脚交91精品| 男人天堂欧美日韩| 亚洲精品乱码久久久久久蜜桃图片| 18欧美乱大交hd1984| 亚洲第一网站在线观看| 亚洲韩国青草视频| 欧美黑人xx片| 99久久99久久| 欧美一区二区三区免费看| 亚洲欧美自拍另类日韩| 国产欧美精品国产国产专区| 亚洲精品视频在线观看免费视频| 日韩欧美色电影| av免费在线免费观看| 国产中文字幕91| 久久中文视频| 高潮一区二区三区| 国产精品国产自产拍在线| 99re热视频| 在线播放精品一区二区三区| 日本少妇一区| 日韩欧美亚洲在线| 老司机精品福利视频| 亚洲精品国产熟女久久久| 91久久国产最好的精华液| 邻居大乳一区二区三区| 国产精品www| 色中色综合网| 在线视频观看一区二区| 亚洲激情第一区| 亚洲精品无码专区| 久久免费精品视频| 老牛精品亚洲成av人片| 日日碰狠狠添天天爽超碰97| 91免费在线视频观看| 国产精品第5页| 在线观看欧美日韩| 国产精品久久久久77777丨| 亚洲资源视频| 国产传媒日韩欧美成人| 国产五月天婷婷| 日韩精品免费在线视频| 超碰超碰人人人人精品| 日韩欧美国产二区| 麻豆成人综合网| 欧产日产国产v| 亚洲精品97久久| 欧美xnxx| 警花观音坐莲激情销魂小说 | 亚洲图片另类小说| 在线观看日韩一区| av在线app| 精品日本一区二区| 日本麻豆一区二区三区视频| 在线观看亚洲网站| 亚洲精品一区二区三区蜜桃下载 | 91沈先生在线观看| 精品白丝av| 国产高潮呻吟久久| 91精品国产欧美日韩| av第一福利在线导航| 日本高清视频一区二区三区 | 亚洲自拍av在线| 999在线观看精品免费不卡网站| 一级特黄曰皮片视频| 日韩欧美一区二区视频| 性欧美又大又长又硬| 亚洲欧洲一区二区在线观看| 国产成人免费在线视频| 国产免费av一区| 久久精品国产欧美亚洲人人爽| 国产福利资源一区| 五月婷婷六月合| 亚洲成人激情av| 麻豆传媒免费在线观看| 久久99精品国产一区二区三区| 久久99久久99| 五月天婷婷久久| 久久99精品久久久久久噜噜| 精品视频97| 好吊色视频一区二区三区| 欧美日韩一区二区三区免费看 | 亚洲深深色噜噜狠狠爱网站|