精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比HuggingFace快24倍!伯克利神級LLM推理系統(tǒng)開源,碾壓SOTA,讓GPU砍半

人工智能 新聞
打「排位賽」的大模型們背后秘密武器曝光!UC伯克利重磅開源神級LLM推理系統(tǒng)——vLLM,利用PagedAttention,比HuggingFace/Transformers快24倍,GPU數(shù)量減半。

過去2個月,來自UC伯克利的研究人員給大語言模型們安排了一個擂臺——Chatbot Arena。

GPT-4等大語言模型玩家打起了「排位賽」,通過隨機battle,根據(jù)Elo得分來排名。

這一過程中,每當一個用戶訪問并使用網(wǎng)站,就需要同時讓兩個不同的模型跑起來。

圖片

他們是如何做到的?

這不,就在今天,UC伯克利重磅開源了世界最快LLM推理和服務系統(tǒng)vLLM。

圖片

簡之,vLLM是一個開源的LLM推理和服務引擎。它利用了全新的注意力算法「PagedAttention」,有效地管理注意力鍵和值。

配備全新算法的vLLM,重新定義了LLM服務的最新技術(shù)水平:

與HuggingFace Transformers相比,它提供高達24倍的吞吐量,而無需進行任何模型架構(gòu)更改。

值得一提的是,「小羊駝」Vicuna在demo中用到的就是FastChat和vLLM的一個集成。

正如研究者所稱,vLLM最大的優(yōu)勢在于——提供易用、快速、便宜的LLM服務。

這意味著,未來,即使對于像LMSYS這樣計算資源有限的小型研究團隊也能輕松部署自己的LLM服務。

圖片

項目地址:https://github.com/vllm-project/vllm

現(xiàn)在,所有人可以在GitHub倉庫中使用一個命令嘗試vLLM了。論文隨后也會發(fā)布。

圖片

性能全面碾壓SOTA

今天,這個由UC伯克利創(chuàng)立的開放研究組織LMSYS介紹道:

「一起來見證vLLM:Chatbot Arena背后的秘密武器。FastChat-vLLM的集成使LMSYS使用的GPU數(shù)量減少了一半,同時每天平均提供3萬次請求。」

圖片

vLLM的性能具體如何?

UC伯克利團隊將vLLM的吞吐量與最受歡迎的LLM庫HuggingFace Transformers(HF),以及HuggingFace文本生成推理(TGI),先前的最新技術(shù)水平進行了比較。

團隊在兩個設置中進行評估:在NVIDIA A10G GPU上運行LLaMA-7B模型,在NVIDIA A100 GPU(40GB)上運行LLaMA-13B模型。

然后,研究人員從ShareGPT數(shù)據(jù)集中抽樣請求的輸入/輸出長度。

在實驗中,vLLM的吞吐量比HF高達24倍,并且比TGI高達3.5倍。

圖片

在每個請求只需要一個輸出完成時的服務吞吐量。vLLM比HF的吞吐量高出14倍-24倍,比TGI的吞吐量高出2.2倍-2.5倍

圖片

在每個請求需要3個并行輸出完成時的服務吞吐量。vLLM比HF的吞吐量高出8.5倍-15倍,比TGI的吞吐量高出3.3倍-3.5倍

秘密武器:PagedAttention

在vLLM中,團隊發(fā)現(xiàn)LLM服務的性能受到內(nèi)存的限制。

在自回歸解碼過程中,LLM的所有輸入token都會生成注意力鍵(key)和值(value)張量,并且這些張量被保留在GPU內(nèi)存中以生成下一個token。

這些緩存的鍵和值張量通常被稱為KV緩存。KV緩存具有以下特點:

1. 內(nèi)存占用大:在LLaMA-13B中,單個序列的KV緩存占用高達1.7GB的內(nèi)存。

2. 動態(tài)化:其大小取決于序列長度,而序列長度高度易變,且不可預測。

因此,有效管理KV緩存是一個重大挑戰(zhàn)。對此,研究團隊發(fā)現(xiàn)現(xiàn)有系統(tǒng)由于碎片化和過度保留而浪費了60%至80%的內(nèi)存。

用團隊的導師Joey Gonzalez的一句話來講:GPU內(nèi)存碎片化=慢。

圖片

為了解決這個問題,團隊引入了PagedAttention,一種受到操作系統(tǒng)中虛擬內(nèi)存和分頁經(jīng)典概念啟發(fā)的注意力算法。

與傳統(tǒng)的注意力算法不同,PagedAttention允許在非連續(xù)的內(nèi)存空間中存儲連續(xù)的鍵和值。

具體來說,PagedAttention將每個序列的KV緩存分為若干塊,每個塊包含固定數(shù)量token的鍵和值。在注意力計算過程中,PagedAttention內(nèi)核能夠高效地識別和提取這些塊。

圖片

PagedAttention:KV緩存被分割成塊,這些塊在內(nèi)存中不需要連續(xù)

由于這些塊在內(nèi)存中不需要連續(xù),因此也就可以像操作系統(tǒng)的虛擬內(nèi)存一樣,以更靈活的方式管理鍵和值——將塊看作頁,token看作字節(jié),序列看作進程。

序列的連續(xù)邏輯塊通過塊表映射到非連續(xù)的物理塊。隨著生成新的token,物理塊會按需進行分配。

圖片

使用PagedAttention的請求生成過程示例

PagedAttention將內(nèi)存浪費控制在了序列的最后一個塊中。

在實踐中,這帶來了接近最優(yōu)的內(nèi)存使用——僅有不到4%的浪費。

而這種內(nèi)存效率的提升,能讓系統(tǒng)將更多的序列進行批處理,提高GPU利用率,從而顯著提高吞吐量。

此外,PagedAttention還具有另一個關(guān)鍵優(yōu)勢:高效的內(nèi)存共享。

比如在并行采樣中,就能從相同的提示生成多個輸出序列。在這種情況下,提示的計算和內(nèi)存可以在輸出序列之間共享。

圖片

并行采樣的示例

PagedAttention通過塊表自然地實現(xiàn)了內(nèi)存共享。

類似于進程共享物理頁的方式,PagedAttention中的不同序列可以通過將它們的邏輯塊映射到相同的物理塊來共享塊。

為了確保安全,PagedAttention會跟蹤物理塊的引用計數(shù),并實現(xiàn)了寫時復制機制。

圖片

采樣多個輸出的請求示例生成過程

PagedAttention的內(nèi)存共享極大減少了復雜采樣算法(如并行采樣和束搜索)的內(nèi)存開銷,將它們的內(nèi)存使用量減少了高達55%。這可以將吞吐量提高多達2.2倍。

總結(jié)而言,PagedAttention是vLLM的核心技術(shù),它是LLM推斷和服務的引擎,支持各種模型,具有高性能和易于使用的界面。

GitHub上,團隊也介紹了vLLM能夠無縫支持的HuggingFace模型,包括以下架構(gòu):

- GPT-2(gpt2、gpt2-xl等)

- GPTNeoX(EleutherAI/gpt-neox-20b、databricks/dolly-v2-12b、stabilityai/stablelm-tuned-alpha-7b等)

- LLaMA(lmsys/vicuna-13b-v1.3、young-geng/koala、openlm-research/open_llama_13b等)

- OPT(facebook/opt-66b、facebook/opt-iml-max-30b等)

小羊駝和排位賽的「幕后英雄」

4月初,UC伯克利學者聯(lián)手UCSD、CMU等,最先推出了一個開源全新模型——130億參數(shù)的Vicuna,俗稱「小羊駝」

圖片

從那時起,Vicuna已在Chatbot Arena為數(shù)百萬用戶提供服務。

最初,LMSYS的FastChat采用基于HF Transformers的服務后端來提供聊天demo。

但隨著demo變得越來越受歡迎,峰值流量猛增了好幾倍,而HF后端也因此成了一個重大的瓶頸。

為了解決這一挑戰(zhàn),LMSYS與vLLM團隊緊密合作,全力開發(fā)出了全新的FastChat-vLLM集成——通過將vLLM作為新的后端,來滿足不斷增長的需求(最多增加5倍的流量)。

根據(jù)LMSYS內(nèi)部微基準測試的結(jié)果,vLLM服務后端可以實現(xiàn)比初始HF后端高出30倍的吞吐量。

圖片

4月-5月期間,Chatbot Arena的后端已經(jīng)部落了FastChat-vLLM的集成。實際上,有超過一半的Chatbot Arena請求都使用FastChat-vLLM集成服務的

自4月中旬以來,最受歡迎的語言模型,如Vicuna、Koala和LLaMA,都已成功使用FastChat-vLLM集成提供服務。

FastChat作為多模型聊天服務前端,vLLM作為推理后端,LMSYS能夠利用有限數(shù)量的GPU(學校贊助的),以高吞吐量和低延遲為數(shù)百萬用戶提供Vicuna服務。

現(xiàn)在,LMSYS正在將vLLM的使用擴展到更多的模型,包括Databricks Dolly、LAION的OpenAsssiant和Stability AI的StableLM等。

vLLM使用教程

使用以下命令安裝vLLM(另可查看安裝指南了解更多信息):

$ pip install vllm

vLLM可用于離線推理和在線服務。要使用vLLM進行離線推理,你可以導入vLLM并在Python腳本中使用LLM類:

from vllm import LLMprompts = ["Hello, my name is", "The capital of France is"]  # Sample prompts.
llm = LLM(model="lmsys/vicuna-7b-v1.3")  # Create an LLM.
outputs = llm.generate(prompts)  # Generate texts from the prompts.

要使用vLLM進行在線服務,你可以通過以下方式啟動與OpenAI API兼容的服務器:

$ python -m vllm.entrypoints.openai.api_server --model lmsys/vicuna-7b-v1.3

你可以使用與OpenAI API相同的格式查詢服務器:

$ curl http://localhost:8000/v1/completions \-H "Content-Type: application/json" \-d '{
        "model": "lmsys/vicuna-7b-v1.3",
        "prompt": "San Francisco is a",
        "max_tokens": 7,
        "temperature": 0
    }'

有關(guān)使用vLLM的更多方法,請查看快速入門指南:

https://vllm.readthedocs.io/en/latest/getting_started/quickstart.html

團隊介紹

Zhuohan Li

圖片

Zhuohan Li是加州大學伯克利分校計算機科學專業(yè)的博士生,研究興趣是機器學習和分布式系統(tǒng)的交叉領(lǐng)域。

在此之前,他在北京大學獲得了計算機科學學士學位,指導老師是王立威和賀笛。

Woosuk Kwon

圖片

Woosuk Kwon是加州大學伯克利分校的博士生,研究興趣是為大語言模型等新興應用建立實用、靈活和高性能的軟件系統(tǒng)。

團隊其他成員包括莊思遠、盛穎、鄭憐憫、Cody Yu。團隊導師包括Joey Gonzalez,Ion Stoica和張昊。

其中,團隊的大部分成員同時也是LMSYS成員。

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-06-21 13:44:57

模型AI

2025-02-14 09:20:00

模型數(shù)據(jù)訓練

2018-10-09 14:00:41

SQL深度學習神經(jīng)網(wǎng)絡

2025-04-18 08:42:52

模型推理AI

2025-06-03 08:38:00

2025-01-22 15:21:00

2025-07-14 13:47:29

2024-09-25 09:37:16

2023-07-01 13:27:55

2023-04-04 13:17:00

GPUCMU開源

2025-04-23 09:10:00

AI系統(tǒng)模型

2022-03-28 13:25:42

AI扶貧機器之心

2023-09-27 12:56:56

AI模型

2025-01-24 15:30:00

2025-07-03 09:49:43

2024-12-18 07:20:00

2025-01-20 13:08:25

2019-08-06 17:19:22

開源技術(shù) 趨勢

2025-04-30 09:09:00

2023-11-14 07:47:42

IGN擴散模型
點贊
收藏

51CTO技術(shù)棧公眾號

久久99久久精品| 精品精品99| 欧美日韩在线视频观看| 欧美中日韩免费视频| 瑟瑟视频在线免费观看| 小小影院久久| 亚洲精品国偷自产在线99热| chinese少妇国语对白| 成人资源www网在线最新版| 麻豆国产精品一区二区三区| 欧美精品久久久久| a级片在线观看| 日韩免费成人| 色婷婷狠狠综合| 大陆极品少妇内射aaaaaa| 日本一区高清| 国产精品系列在线观看| 日韩av男人的天堂| 免费在线观看国产精品| 欧美色女视频| 亚洲第一区在线| 天堂av8在线| 伊人色综合一区二区三区影院视频 | 成人中文字幕av| 性xxxxfjsxxxxx欧美| 国产亚洲婷婷免费| 国产精品一 二 三| 国产免费无遮挡| 日本伊人精品一区二区三区观看方式| 欧美国产日韩免费| 韩国一级黄色录像| 国产在线日韩精品| 精品视频在线观看日韩| 性高潮久久久久久| 永久免费观看精品视频| 91久久人澡人人添人人爽欧美| 成人一级生活片| 黄色成人影院| 亚洲欧洲精品一区二区三区| 欧美日韩一区二区视频在线观看| 黄色av中文字幕| 国产精品996| 91日韩在线视频| 中文字幕一区二区人妻痴汉电车| 一区二区国产在线观看| 欧美激情亚洲综合一区| 欧洲猛交xxxx乱大交3| 四虎成人精品永久免费av九九| 亚洲欧美综合另类中字| 一起草在线视频| 国产精东传媒成人av电影| 91精品国产美女浴室洗澡无遮挡| 久久国产精品国产精品| 成人黄色视屏网站| 欧美午夜一区二区三区| 国产第一页视频| 韩国主播福利视频一区二区三区| 欧美性猛交xxxx偷拍洗澡| 日韩精品久久一区二区| 新版中文在线官网| 亚洲一级二级在线| 国产成人永久免费视频| 福利在线视频网站| 一区二区激情小说| 无码 制服 丝袜 国产 另类| 欧洲精品二区| 亚洲成a人v欧美综合天堂| 欧美一级免费播放| 涩涩涩在线视频| 欧美视频在线免费| 天天爽天天爽夜夜爽| 国产精品传媒麻豆hd| 欧美日韩一卡二卡三卡| 亚洲一二区在线观看| 亚洲成av人片在线观看www| 欧美成人福利视频| 噜噜噜在线视频| 国产在线观看91一区二区三区| 最近2019中文字幕第三页视频 | 国产精品盗摄久久久| 国产精品sm调教免费专区| 看电视剧不卡顿的网站| 亚洲精品免费一区二区三区| 亚洲精品久久久久久久久久| 97久久精品人人爽人人爽蜜臀| 久久riav二区三区| av亚洲在线| 亚洲激情第一区| 分分操这里只有精品| 欧美色网一区| 91精品国产综合久久久蜜臀图片| 亚洲免费观看在线| 国产一区国产二区国产三区| 日韩中文字幕在线精品| 免费在线观看av网址| 久久久夜夜夜| 亚洲自拍偷拍视频| 飘雪影院手机免费高清版在线观看| 国产精品午夜电影| 日韩中文字幕在线免费| 国产精品99| 亚洲国产精品网站| 99自拍视频在线| 国产一区91| 91色琪琪电影亚洲精品久久| 日韩二区三区| 亚洲三级小视频| 免费无码av片在线观看| 日韩激情欧美| 尤物精品国产第一福利三区| 欧美日韩成人免费观看| 人人爽香蕉精品| 国产在线精品一区二区中文| 免费观看在线午夜影视| 精品久久久久久中文字幕大豆网| 欧美第一页浮力影院| 特黄特色欧美大片| 欧美国产日韩二区| 国产精品久久久久久久久久久久久久久久| 99久久精品免费看国产免费软件| 夜夜爽www精品| 桃花岛成人影院| 亚洲国产高清福利视频| 欧美国产日韩在线观看成人| 日本中文字幕不卡| 国产精品一区二区三区精品 | 欧美在线999| 一本之道在线视频| 日韩精品一卡| 3344国产精品免费看| www.黄色片| 中文字幕在线不卡视频| 日本熟妇人妻xxxxx| 日韩精品丝袜美腿| 97在线观看免费| 亚洲第一成年人网站| 亚洲视频 欧洲视频| 在线观看av网页| 精品盗摄女厕tp美女嘘嘘| 欧美一级淫片videoshd| 少妇高潮一区二区三区99小说| 亚洲人一二三区| 在线不卡一区二区三区| 色呦哟—国产精品| 国产精品久久在线观看| www.亚洲.com| 欧美影片第一页| 大吊一区二区三区| 蜜臀av性久久久久蜜臀aⅴ四虎 | 人妻 丝袜美腿 中文字幕| 亚洲视频电影在线| 91免费精品视频| 国产一二区在线观看| 3atv在线一区二区三区| 91香蕉视频在线播放| 韩国一区二区三区| 亚洲精品视频一二三| 四虎精品一区二区免费 | av日韩国产| 亚洲白虎美女被爆操| 日韩福利片在线观看| 99久久精品费精品国产一区二区| aa在线观看视频| 影视先锋久久| 国产精品一久久香蕉国产线看观看 | 久热成人在线视频| 国产精品久久成人免费观看| 亚洲国产中文在线| 97久久精品国产| 黄色视屏网站在线免费观看| 色偷偷久久一区二区三区| 成人性生交大片免费看无遮挡aⅴ| 青青草原综合久久大伊人精品优势| 亚洲精品乱码久久久久久蜜桃91| 精品久久亚洲| 久久免费成人精品视频| 免费在线黄色影片| 欧美精品v日韩精品v韩国精品v| 性色av无码久久一区二区三区| 成人少妇影院yyyy| 国产91对白刺激露脸在线观看| 欧美一区三区| 亚洲已满18点击进入在线看片| 国产精品一区二区日韩| 亚洲乱码国产乱码精品精| 中国一区二区视频| 亚洲影院理伦片| 色欲狠狠躁天天躁无码中文字幕| 国产精品性做久久久久久| heyzo国产| 99免费精品| 精品国产乱码久久久久久久软件| 小黄鸭精品aⅴ导航网站入口| 久久精品精品电影网| 欧美一级淫片aaaaaa| 欧美性淫爽ww久久久久无| 日本一级二级视频| 久久亚洲影视婷婷| 四虎1515hh.com| 日本欧美一区二区| 全黄性性激高免费视频| 日韩精品永久网址| 国产一区在线观| 高清一区二区| 日韩美女毛茸茸| 免费影视亚洲| 精品国产一区av| 欧洲一级在线观看| 亚洲高清久久久久久| 一级黄色片免费看| 欧美丝袜一区二区三区| 欧美日韩国产精品综合 | 精品国产无码在线| 婷婷综合一区| 国产免费一区| 清纯唯美激情亚洲| 国产精品亚洲激情| 欧美日韩五区| 庆余年2免费日韩剧观看大牛| 新版中文在线官网| 麻豆国产va免费精品高清在线| 精品电影在线| 精品亚洲一区二区三区在线观看| 亚洲av永久无码国产精品久久| 欧美日韩1区2区| 销魂美女一区二区| 精品久久久精品| 久久久无码一区二区三区| 综合在线观看色| 国产jizz18女人高潮| 国产日韩亚洲欧美综合| 毛片网站免费观看| 99精品久久久久久| 动漫av在线免费观看| 国产电影精品久久禁18| 欧美精品 - 色网| 精品一区二区三区在线播放| 久久久国产欧美| 青青草国产成人av片免费 | 国产黄人亚洲片| 精产国品一区二区三区| 国产一区二区视频在线播放| 欧美一级xxxx| 国产乱对白刺激视频不卡| 欧美大片久久久| 国产麻豆一精品一av一免费| 亚洲xxx在线观看| 激情综合网av| 午夜免费视频网站| 粉嫩av一区二区三区| 国产精品91av| www.久久精品| 日韩精品电影一区二区| 国产日韩v精品一区二区| 五月婷婷欧美激情| 亚洲欧洲精品一区二区三区不卡 | 午夜精品视频一区| 自拍偷拍欧美亚洲| 日韩欧美一区二区在线| 无码人妻一区二区三区免费| 欧美性一区二区| 99久久99久久久精品棕色圆| 日韩欧美国产不卡| 熟妇人妻av无码一区二区三区| 亚洲国产精品电影| 免费毛片在线| 日韩中文字幕欧美| 午夜激情在线| 68精品国产免费久久久久久婷婷 | 亚洲一区二区三区sesese| 日韩欧美中文字幕在线视频 | 日韩免费在线视频| 亚州精品国产| 国产成人精品免费视频大全最热 | 91传媒免费视频| 亚洲每日更新| 小泽玛利亚视频在线观看| 国产精品456| 91精品人妻一区二区| 国产精品每日更新| 国产精品成人国产乱| 在线看国产日韩| 国产99对白在线播放| 日韩电影免费观看在线观看| 国产视频福利在线| 美女性感视频久久久| 乡村艳史在线观看| 91九色视频导航| 尤物tv在线精品| 日本丰满大乳奶| 可以看av的网站久久看| 中文字幕乱码在线人视频| 2021久久国产精品不只是精品| 九九热久久免费视频| 亚洲韩国精品一区| 中文字幕视频一区二区| 亚洲国产91色在线| 麻豆av免费在线观看| 高清欧美电影在线| 素人啪啪色综合| 精品视频高清无人区区二区三区| 国产精品精品国产一区二区| 国产h视频在线播放| 国产一区在线看| jizz中文字幕| 精品女厕一区二区三区| 99热精品在线播放| 在线看福利67194| 日本不卡网站| 国产精品毛片va一区二区三区| 成人高清电影网站| 国产 福利 在线| 成人av在线网| 男人与禽猛交狂配| 欧美精品欧美精品系列| 青草久久伊人| 国产91精品久久久久| 中文字幕av一区二区三区四区| 天堂va久久久噜噜噜久久va| 亚洲制服av| 理论片大全免费理伦片| 亚洲精品中文在线影院| 伊人色综合久久久| 亚洲区中文字幕| 中文一区一区三区高中清不卡免费| 99r国产精品视频| 亚洲国产一成人久久精品| 天天综合网久久| 国产精品区一区二区三| 国产精品自拍第一页| 亚洲精品国产综合区久久久久久久| 人人超在线公开视频| 97人人模人人爽人人少妇| 亚洲最大黄网| 性生活免费在线观看| 中文字幕不卡的av| 国产精品成人无码| 在线电影av不卡网址| 欧美黄色三级| 日韩一区二区三区资源| 日韩极品在线观看| 人人爽人人爽人人片| 在线视频综合导航| yourporn在线观看视频| 国产精品久久久久久亚洲调教| 国产免费av一区二区三区| 欧美精品第三页| 日本一区二区视频在线| 亚洲中文无码av在线| 最近更新的2019中文字幕| 黄色日韩网站| 日韩精品第1页| 丁香五精品蜜臀久久久久99网站 | 亚洲精品理论片| 色哟哟一区二区在线观看| 都市激情一区| 成人国产精品一区二区| 欧美韩国一区| a级一a一级在线观看| 色诱亚洲精品久久久久久| 成a人片在线观看www视频| 成人国产在线视频| 激情综合自拍| 丰满少妇高潮一区二区| 欧美三级午夜理伦三级中视频| 黄色大片在线播放| 国产原创精品| 日韩成人免费电影| 欧美精品久久久久久久久46p| 欧美tk丨vk视频| 在线免费看h| 亚洲精品免费在线看| 国产99一区视频免费| 男人天堂2024| 久久九九全国免费精品观看| 盗摄牛牛av影视一区二区| 激情六月丁香婷婷| 亚洲天天做日日做天天谢日日欢 | 99视频在线精品| 日韩xxx视频| 欧美国产中文字幕| 九九精品久久| 乳色吐息在线观看| 色国产综合视频| 亚洲综合伊人久久大杳蕉| 久久综合九九| 国产精品原创巨作av| wwwwww国产| 久久精品久久久久| 欧美女王vk| 色悠悠在线视频| 欧美日韩aaa| 最近高清中文在线字幕在线观看1| 亚洲欧美日韩精品久久久| av一区二区三区| 国产精品无码一区二区桃花视频| 欧美有码在线观看| 影音先锋成人在线电影| 男人的天堂av网| 亚洲黄色免费三级|