精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用Llama.cpp在CPU上快速的運行LLM

開發 前端
大型語言模型(llm)正變得越來越流行,但是它需要很多的資源,尤其時GPU。在這篇文章中,我們將介紹如何使用Python中的llama.cpp庫在高性能的cpu上運行llm。

大型語言模型(llm)正變得越來越流行,但是它需要很多的資源,尤其時GPU。在這篇文章中,我們將介紹如何使用Python中的llama.cpp庫在高性能的cpu上運行llm。

大型語言模型(llm)正變得越來越流行,但是它們的運行在計算上是非常消耗資源的。有很多研究人員正在為改進這個缺點而努力,比如HuggingFace開發出支持4位和8位的模型加載。但它們也需要GPU才能工作。雖然可以在直接在cpu上運行這些llm,但CPU的性能還無法滿足現有的需求。而Georgi Gerganov最近的工作使llm在高性能cpu上運行成為可能。這要歸功于他的llama.cpp庫,該庫為各種llm提供了高速推理。

原始的llama.cpp庫側重于在shell中本地運行模型。這并沒有為用戶提供很大的靈活性,并且使用戶很難利用大量的python庫來構建應用程序。而最近LangChain的發展使得我可以可以在python中使用llama.cpp。

在這篇文章中,我們將介紹如何在Python中使用llama-cpp-python包使用llama.cpp庫。我們還將介紹如何使用LLaMA -cpp-python庫來運行Vicuna LLM。

llama- pcp -python

pip install llama-cpp-python

更詳細的安裝說明,請參閱llama- pcp -python文檔:https://github.com/abetlen/llama-cpp-python#installation-from-pypi-recommended。

使用LLM和llama-cpp-python

只要語言模型轉換為GGML格式,就可以被llama.cpp加載和使用。而大多數流行的LLM都有可用的GGML版本。

需要注意的重要一點是,在將原始llm轉換為GGML格式時,它們就已被量化過了。量化的好處是在不顯著降低性能的情況下,減少運行這些大型模型所需的內存。例如,在不到4GB的RAM中可以加載大小為13GB的70億個參數模型。

在本文中,我們使用GGML版本的Vicuna-7B,該模型可從HuggingFace下載:https://huggingface.co/CRD716/ggml-vicuna-1.1-quantized。

下載GGML文件并加載LLM

可以使用以下代碼下載模型。該代碼還在嘗試下載文件之前檢查該文件是否已經存在。

import os
 import urllib.request
 
 
 def download_file(file_link, filename):
    # Checks if the file already exists before downloading
    if not os.path.isfile(filename):
        urllib.request.urlretrieve(file_link, filename)
        print("File downloaded successfully.")
    else:
        print("File already exists.")
 
 # Dowloading GGML model from HuggingFace
 ggml_model_path = "https://huggingface.co/CRD716/ggml-vicuna-1.1-quantized/resolve/main/ggml-vicuna-7b-1.1-q4_1.bin"
 filename = "ggml-vicuna-7b-1.1-q4_1.bin"
 
 download_file(ggml_model_path, filename)

下一步是加載模型:

from llama_cpp import Llama
 
 llm = Llama(model_path="ggml-vicuna-7b-1.1-q4_1.bin", n_ctx=512, n_batch=126)

在加載模型時,應該設置兩個重要參數。

n_ctx:用于設置模型的最大上下文大小。默認值是512個token。

上下文大小是輸入提示符中的令牌數量和模型可以生成的令牌最大數量的總和。具有較小上下文大小的模型生成文本的速度比具有較大上下文大小的模型快得多。

n_batch:用于設置在生成文本時要批處理的提示令牌的最大數量。默認值是512個token。

應該仔細設置n_batch參數。降低n_batch有助于加速多線程cpu上的文本生成。但是太少可能會導致文本生成明顯惡化。

使用LLM生成文本

下面的代碼編寫了一個簡單的包裝器函數來使用LLM生成文本。

def generate_text(
    prompt="Who is the CEO of Apple?",
    max_tokens=256,
    temperature=0.1,
    top_p=0.5,
    echo=False,
    stop=["#"],
 ):
    output = llm(
        prompt,
        max_tokens=max_tokens,
        temperature=temperature,
        top_p=top_p,
        echo=echo,
        stop=stop,
    )
    output_text = output["choices"][0]["text"].strip()
    return output_text

llm對象有幾個重要的參數:

prompt:模型的輸入提示。該文本被標記并傳遞給模型。

max_tokens:該參數用于設置模型可以生成的令牌的最大數量。此參數控制文本生成的長度。默認值是128個token。

temperature:溫度,介于0和1之間。較高的值(如0.8)將使輸出更加隨機,而較低的值(如0.2)將使輸出更加集中和確定。缺省值為1。

top_p:溫度采樣的替代方案,稱為核采樣,其中模型考慮具有top_p概率質量的標記的結果。所以0.1意味著只考慮包含前10%概率質量的標記。

echo: 用于控制模型是否返回(回顯)生成文本開頭的模型提示符。

stop:用于停止文本生成的字符串列表。如果模型遇到任何字符串,文本生成將在該標記處停止。用于控制模型幻覺,防止模型產生不必要的文本。

llm對象返回如下形式的字典對象:

{
  "id": "xxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx", # text generation id 
  "object": "text_completion",             # object name
  "created": 1679561337,                   # time stamp
  "model": "./models/7B/ggml-model.bin",   # model path
  "choices": [
    {
      "text": "Q: Name the planets in the solar system? A: Mercury, Venus, Earth, Mars, Jupiter, Saturn, Uranus, Neptune and Pluto.", # generated text
      "index": 0,
      "logprobs": None,
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 14,       # Number of tokens present in the prompt
    "completion_tokens": 28,   # Number of tokens present in the generated text
    "total_tokens": 42
  }
 }

可以使用output"choices"["text"]從字典對象中提取生成的文本。

使用Vicuna-7B生成文本的示例代碼

import os
 import urllib.request
 from llama_cpp import Llama
 
 
 def download_file(file_link, filename):
    # Checks if the file already exists before downloading
    if not os.path.isfile(filename):
        urllib.request.urlretrieve(file_link, filename)
        print("File downloaded successfully.")
    else:
        print("File already exists.")
 
 
 # Dowloading GGML model from HuggingFace
 ggml_model_path = "https://huggingface.co/CRD716/ggml-vicuna-1.1-quantized/resolve/main/ggml-vicuna-7b-1.1-q4_1.bin"
 filename = "ggml-vicuna-7b-1.1-q4_1.bin"
 
 download_file(ggml_model_path, filename)
 
 
 llm = Llama(model_path="ggml-vicuna-7b-1.1-q4_1.bin", n_ctx=512, n_batch=126)
 
 
 def generate_text(
    prompt="Who is the CEO of Apple?",
    max_tokens=256,
    temperature=0.1,
    top_p=0.5,
    echo=False,
    stop=["#"],
 ):
    output = llm(
        prompt,
        max_tokens=max_tokens,
        temperature=temperature,
        top_p=top_p,
        echo=echo,
        stop=stop,
    )
    output_text = output["choices"][0]["text"].strip()
    return output_text
 
 
 generate_text(
    "Compose an engaging travel blog post about a recent trip to Hawaii, highlighting cultural experiences and must-see attractions.",
    max_tokens=356,
 )

生成的文本如下:

Hawaii is a state located in the United States of America that is known for its beautiful beaches, lush landscapes, and rich culture. It is made up of six islands: Oahu, Maui, Kauai, Lanai, Molokai, and Hawaii (also known as the Big Island). Each island has its own unique attractions and experiences to offer visitors.
 One of the most interesting cultural experiences in Hawaii is visiting a traditional Hawaiian village or ahupuaa. An ahupuaa is a system of land use that was used by ancient Hawaiians to manage their resources sustainably. It consists of a coastal area, a freshwater stream, and the surrounding uplands and forests. Visitors can learn about this traditional way of life at the Polynesian Cultural Center in Oahu or by visiting a traditional Hawaiian village on one of the other islands.
 Another must-see attraction in Hawaii is the Pearl Harbor Memorial. This historic site commemorates the attack on Pearl Harbor on December 7, 1941, which led to the United States' entry into World War II. Visitors can see the USS Arizona Memorial, a memorial that sits above the sunken battleship USS Arizona and provides an overview of the attack. They can also visit other museums and exhibits on the site to learn more about this important event in American history.
 Hawaii is also known for its beautiful beaches and crystal clear waters, which are perfect for swimming, snorkeling, and sunbathing.

總結

在這篇文章中,我們介紹了如何在Python中使用llama.cpp庫和llama-cpp-python包。這些工具支持基于cpu的llm高性能執行。

Llama.cpp幾乎每天都在更新。推理的速度越來越快,社區定期增加對新模型的支持。在Llama.cpp有一個“convert.py”可以幫你將自己的Pytorch模型轉換為ggml格式。

llama.cpp庫和llama-cpp-python包為在cpu上高效運行llm提供了健壯的解決方案。如果您有興趣將llm合并到您的應用程序中,我建議深入的研究一下這個包。

本文源代碼:

https://github.com/awinml/llama-cpp-python-bindings

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2025-01-20 07:58:51

2024-08-13 14:20:00

模型數據

2023-08-17 16:07:16

模型優化

2024-03-26 08:00:00

LLMVLMRaspberry

2025-04-29 07:47:27

2023-12-19 16:12:40

GPT-4AI聊天機器人人工智能

2023-08-01 13:31:18

模型Alpacaicuna

2013-12-18 11:04:57

CPU雙核

2020-04-02 18:30:28

PythonGitHub編程語言

2020-04-02 16:02:44

PythonGithub博客

2023-04-12 15:37:31

Linux系統CPU

2018-12-14 08:29:56

CPU編程x86

2014-12-17 15:18:27

LinuxMonoWindows

2024-12-16 07:00:00

2025-04-08 03:22:00

2025-01-08 08:00:00

2024-05-15 08:42:19

Phi-3LLM機器學習

2022-01-18 17:57:21

PodmanLinux容器

2022-06-30 13:54:16

BottlesLinuxWindows

2015-10-14 10:02:33

ClojureScri Android
點贊
收藏

51CTO技術棧公眾號

国产成人精品一区二三区| 91插插插插插插插插| 蜜臀久久99精品久久久| 激情综合电影网| 亚洲精品国产精品乱码不99按摩| 国产欧美日韩小视频| 天天射天天色天天干| 视频在线观看一区| 亚洲色图国产精品| 亚欧美在线观看| 中日韩高清电影网| 99久久精品免费精品国产| 日本成人在线视频网址| 日本免费www| 国产一区二区三区免费观看在线| 亚洲成a人v欧美综合天堂| 麻豆亚洲一区| 国产精品一区二区人人爽| 欧美xxxx中国| 日韩av在线网页| 天天干天天操天天做| 91精品久久| 99精品欧美一区二区蜜桃免费 | 日本成人在线免费观看| 第四色日韩影片| 国产清纯美女被跳蛋高潮一区二区久久w | 亚洲精品写真福利| 欧美成人一区二区在线| 国产孕妇孕交大片孕| 夜夜爽av福利精品导航| 精品国偷自产在线视频| 午夜男人的天堂| 久久国内精品| 岛国av一区二区三区| 一本久道久久综合狠狠爱亚洲精品 | 精品成人在线| 最近2019中文字幕在线高清| 97人妻精品一区二区三区免费| www.久久.com| 欧美日韩综合视频| 日本黄色a视频| 手机亚洲第一页| 国产福利不卡视频| 国产日韩欧美在线播放| 国产成人自拍视频在线| 综合久久久久| 丝袜亚洲欧美日韩综合| 美女爆乳18禁www久久久久久| 综合中文字幕| 91精品国产综合久久久久| 日本女优爱爱视频| 不卡视频观看| 亚洲欧美一区二区在线观看| 日本不卡二区高清三区| 国产精品一区二区三区在线免费观看| 首页综合国产亚洲丝袜| 日本国产高清不卡| 日韩精品无码一区二区| 国产亚洲欧美精品久久久久久| 视频二区欧美| 欧美高清hd18日本| 欧美aⅴ在线观看| 波多野结衣中文字幕久久| 日韩理论片在线| 伊人色综合影院| 成人性爱视频在线观看| 久久久久国色av免费看影院| 免费日韩av电影| 午夜成人免费影院| 2欧美一区二区三区在线观看视频| 国产精品成人观看视频免费| 精品欧美一区二区精品少妇| 国产在线麻豆精品观看| 成人国产精品日本在线| 亚洲中文字幕在线观看| 久久精品国内一区二区三区 | 性高爱久久久久久久久| 欧美日韩国产中文字幕| 六月丁香激情网| 中文字幕乱码在线播放| 色婷婷亚洲一区二区三区| 黄在线观看网站| 国产乱码午夜在线视频| 天天综合日日夜夜精品| 国产主播在线看| 日韩高清成人| 欧美美女视频在线观看| 国产资源中文字幕| 在线观看视频一区二区三区| 精品国产一区二区三区久久久蜜月| 岛国精品一区二区三区| 加勒比色老久久爱综合网| 亚洲精品国产综合区久久久久久久 | 国产无遮无挡120秒| 国产日本精品| 国产精品久久久久秋霞鲁丝 | 欧美色图12p| 亚洲国产欧美91| 国产精品久久久久av蜜臀 | 在线观看xxx| 欧美国产精品专区| 老司机午夜免费福利视频| av在线小说| 欧美专区日韩专区| 欧美体内she精高潮| 天天躁日日躁狠狠躁欧美巨大小说| 国产亚洲xxx| www.99热| 欧美福利专区| 欧美做受高潮1| 久久这里只有精品9| 国产在线不卡一卡二卡三卡四卡| 国产在线一区二| 国产大片在线免费观看| 亚洲欧美日韩国产成人精品影院 | 久久国产毛片| 91亚洲va在线va天堂va国| 色婷婷av一区二区三区之红樱桃 | 久久婷婷五月综合| 亚洲特色特黄| 亚洲一区二区免费| 成人在线观看一区| 午夜精品福利一区二区三区av| 永久免费黄色片| 国产精品成久久久久| 日韩美女视频免费在线观看| 日韩在线观看视频一区| 亚洲欧美国产三级| 亚洲精品第三页| 精品国产aⅴ| 日本三级久久久| 午夜视频1000| 精品久久久国产| 一级少妇精品久久久久久久| 欧美日韩岛国| 亚洲综合中文字幕在线观看| 国产午夜精品久久久久免费视| 欧美在线视频全部完| 熟女少妇内射日韩亚洲| 久久天堂精品| 日本视频一区二区在线观看| 不卡福利视频| 亚洲香蕉成视频在线观看| 国产区一区二区三| 26uuu色噜噜精品一区二区| 亚洲国产精品成人天堂| 97视频一区| 韩国v欧美v日本v亚洲| 人妻少妇精品无码专区| 亚洲成av人片在www色猫咪| 国产香蕉精品视频| 亚洲精品裸体| 久久久久久九九九九| 最近在线中文字幕| 伊人久久久久久久久久| 中文字幕+乱码+中文乱码91| 亚洲国产高清不卡| 亚洲第一色av| 欧美日本精品| 精品国产中文字幕| 成人免费直播| 中文字幕亚洲综合| 99热这里只有精品1| 亚洲资源中文字幕| 国产一级二级在线观看| 狂野欧美一区| 自拍亚洲欧美老师丝袜| 日韩免费一级| 欧美一级电影免费在线观看| 国产一级免费在线观看| 欧美日韩亚洲综合一区| 欧美黑人猛猛猛| 99免费精品视频| 亚洲精品高清无码视频| 我不卡伦不卡影院| 国产一区二区三区无遮挡 | 91精品久久久久久久久久久久| 免费欧美日韩国产三级电影| 日韩精品一区二区三区电影| 日韩av不卡一区| 国产精品视频男人的天堂| 国产精品实拍| 日韩精品视频在线| 国产一区二区三区四区视频| 亚洲一级在线观看| 亚洲а∨天堂久久精品2021| 国产精品一区二区久久精品爱涩| 国产午夜伦鲁鲁| 999精品色在线播放| 国产福利一区二区三区在线观看| 欧美xo影院| 国产精品欧美综合在线| 亚洲欧洲综合另类| 色啦啦av综合| 亚洲人成在线影院| 一区二区视频在线观看| 欧美电影免费网站| 国产精品久久久久999| 国产色在线 com| 欧美大肚乱孕交hd孕妇| 中文字幕男人天堂| 图片区小说区区亚洲影院| 成人黄色短视频| 久久这里只有精品视频网| 亚洲女人在线观看| 男男成人高潮片免费网站| 无码中文字幕色专区| 91精品国产91久久久久久密臀| 国产综合 伊人色| 高清在线一区二区| 国产成+人+综合+亚洲欧洲| 成人免费一区二区三区牛牛| 久久精品精品电影网| 国产二区视频在线观看| 日韩电影免费观看在线观看| a级片在线播放| 欧美日韩亚洲综合| 少妇一级淫片日本| 天天综合色天天综合| 久久久国产精华液| 中文字幕亚洲成人| 亚洲无人区码一码二码三码的含义| 成人激情黄色小说| 色哟哟免费视频| 九九久久精品视频| 黄色免费网址大全| 久久久噜噜噜| 97视频久久久| 亚洲午夜视频| 成人在线观看毛片| 欧美影院一区| 中文字幕在线亚洲三区| 欧美特黄一级大片| 欧美日韩国产三区| 日韩影视在线观看| 国产欧美欧洲| 卡一精品卡二卡三网站乱码| 99在线首页视频| 日韩最新av| 91精品国产综合久久久久久丝袜 | av老司机在线观看| 欧美激情一二三| 国产一线二线在线观看| 欧美激情视频在线观看| 日本动漫理论片在线观看网站| 久久中文精品视频| 天堂av中文在线| 九九九久久久久久| 国产经典三级在线| 国内精品一区二区三区| 日本不良网站在线观看| 欧洲成人在线视频| 免费高清视频在线一区| 国产精品入口日韩视频大尺度| 九七影院97影院理论片久久| 成人黄色av网| 亚洲一区二区三区四区电影 | 性感美女久久精品| 男女啊啊啊视频| 色哟哟欧美精品| 亚洲av无码乱码国产精品fc2| 欧美日本一区二区在线观看| 国产片在线播放| 精品国产露脸精彩对白| av女名字大全列表| 日韩在线视频网| av在线播放国产| 性色av一区二区咪爱| 桃花岛tv亚洲品质| 国产欧美精品xxxx另类| 日韩精品久久久久久久软件91| 国产一区二区三区黄| 国产精品免费不| 欧美日韩一级在线| 999在线观看精品免费不卡网站| av天堂永久资源网| 九一九一国产精品| 99精品一区二区三区无码吞精| 26uuu成人网一区二区三区| 丁香激情五月少妇| 亚洲另类色综合网站| 在线天堂中文字幕| 欧美妇女性影城| 手机看片福利在线| 波霸ol色综合久久| 999av小视频在线| 国产精品一区二区三| 国产精品午夜av| 亚洲国产欧美不卡在线观看| 狠狠噜噜久久| 91人人澡人人爽人人精品| 国产激情一区二区三区桃花岛亚洲| 91玉足脚交白嫩脚丫| 国产精品黄色在线观看| 国产一级生活片| 欧美午夜精品久久久久久孕妇| 99精品人妻无码专区在线视频区| 日韩电影免费在线观看中文字幕 | 欧美日韩国产精品| 91激情在线观看| 日韩高清av在线| 50度灰在线| 国产精品爽黄69天堂a| 国产美女撒尿一区二区| 亚洲一区综合| 久久福利毛片| 日韩无码精品一区二区| 日本一区二区三区高清不卡| 日本特黄特色aaa大片免费| 欧美久久高跟鞋激| 黄色片在线播放| 午夜精品国产精品大乳美女| 日韩黄色碟片| 日韩国产欧美精品| 香蕉久久a毛片| 久久国产劲爆∧v内射| 亚洲同性同志一二三专区| 国产一级片av| 亚洲精品成人网| 久草在线视频网站| 亚洲自拍av在线| 不卡一区2区| 日本成人黄色网| 91久色porny| 九一国产在线观看| 精品久久久久久久久久久久久久久| 黄色动漫在线| 亚洲free嫩bbb| 99精品视频在线| 日本一二区免费| 欧美国产日韩精品免费观看| 探花国产精品一区二区| 亚洲欧洲第一视频| 日本成人三级电影| 欧美精品在线一区| 母乳一区在线观看| 熟女少妇一区二区三区| 天天综合网 天天综合色| 少妇无码一区二区三区| 久久频这里精品99香蕉| 加勒比视频一区| 少妇高潮毛片色欲ava片| 97精品视频在线观看自产线路二| 中文字幕第28页| 亚洲а∨天堂久久精品9966| 国产天堂在线播放视频| 国产高清精品一区二区三区| 亚洲国产专区| 水蜜桃av无码| 欧美视频裸体精品| 国产一级免费在线观看| 国产精品美女无圣光视频| 成人在线一区| 污视频在线观看免费网站| 亚洲激情图片小说视频| 亚洲精品国产suv一区| 午夜精品三级视频福利| 同性恋视频一区| 国产成人精品无码播放| 国产精品乱码一区二区三区软件| 国产精品热久久| 韩国三级电影久久久久久| 国产videos久久| 中国黄色片一级| 亚洲制服丝袜在线| 水中色av综合| 成人h片在线播放免费网站| 欧美日韩三级| 波多野结衣一本| 欧美日韩国产影片| 女人天堂av在线播放| 久99久在线| 麻豆91在线播放| 精品无码人妻一区二区三| 亚洲精品按摩视频| 久久免费影院| 欧美亚洲黄色片| 久久精品网站免费观看| 国产口爆吞精一区二区| 久久久久久久久综合| 欧美在线电影| 亚洲一级Av无码毛片久久精品| 色婷婷综合久久久中文字幕| 麻豆视频在线| 久久精品国产一区二区三区不卡| 免费欧美在线视频| 日本一级淫片色费放| 日韩在线中文字| 久久99精品国产自在现线| 黑森林精品导航| 亚洲国产三级在线| jizzjizz在线观看| 国产精品推荐精品| 精品一区二区av| 日韩av大片在线观看| 久久久极品av| 综合伊思人在钱三区| 国产精品探花在线播放| 欧美中文字幕一区二区三区亚洲| 黄色小说在线播放|