精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

利用多Lora節省大模型部署成本 精華

發布于 2024-8-21 09:28
瀏覽
0收藏

如何把多個大模型合并部署以節省成本呢?本文將深入探討這一技術與應用場景,利用多Lora合并部署大模型。

一、背景

近期,我們在大模型集群的部署過程中遇到了一些挑戰。公司有多個業務場景,每個場景都基于自身的數據進行微調,訓練出相應的大模型并上線。然而,這些場景的調用量并不高,同時大模型的部署成本較為昂貴,這造成了資源的浪費。

本文將介紹我們如何利用多Lora技術,將多個場景合并部署,從而有效解決這一問題。同時,我們也將探討大模型訓練與推理過程中Lora技術的應用。

二、Lora是什么

Lora的概念

如果你去網上搜索"Lora"這個關鍵字,你一定會搜到下面這篇論文。

利用多Lora節省大模型部署成本-AI.x社區

這就是Lora這個詞出處。這一概念是由著名人工智能研究員Edward J. Hu于2021年提出的。Lora完整名稱是低秩自適應(Low-Rank Adaptation)。雖然這個名稱比較復雜,但其核心概念卻相對容易理解。

以GPT3為例,該模型擁有1750億個參數。為了使大模型適應特定的業務場景,我們通常需要對其進行微調。如果對大模型進行全參數微調,因其參數數量龐大,成本將非常高。Lora技術的解決方案是,僅對不到2%的參數進行微調,其他參數則保持不變。相較于全參微調GPT-3(175B),Lora最多能夠將訓練參數的數量減少約10,000倍,GPU內存需求也減少三倍。

那么,Lora是如何凍結參數的呢?接下來,我們將展示Lora的經典原理圖。

利用多Lora節省大模型部署成本-AI.x社區

上圖中,W 表示大模型的一個原始參數矩陣。Lora的思路是將矩陣 W 拆分為兩個低秩矩陣 A 和 B。在訓練過程中,僅對 A 和 B 的參數進行訓練,這與訓練整個 W 的參數相比,能顯著減少所需的訓練參數數量,從而降低訓練成本。

如何開啟大模型的Lora微調

利用多Lora節省大模型部署成本-AI.x社區

雖然論文中Lora的原理較為復雜,但實際上開啟大模型的Lora微調過程相對簡單。許多算法框架都支持快速上手微調。以LLaMA-Factory這個微調大模型的框架為例,啟用Lora微調只需配置以下參數:

利用多Lora節省大模型部署成本-AI.x社區

接下來,執行訓練命令即可啟動Lora微調:

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml

通過這個命令,LLaMA-Factory框架將讀取配置文件,并開始進行Lora微調。整個過程相對簡便,使得用戶能夠快速適應并利用Lora技術進行大模型微調。

Lora微調完成后,將生成一個只包含部分參數(即Lora參數)的文件,稱為Lora Adapter。與整個大模型的所有參數相比,這個參數文件非常小。

三、如何基于Lora部署大模型

Lora參數合并

經過微調后,會生成一個Lora文件,里面僅包含部分參數。如何利用這個Lora文件來部署大模型呢?

利用多Lora節省大模型部署成本-AI.x社區

我們之前提到,Lora參數實際上是將大模型的其余參數凍結后剩下的部分。Lora參數本身也是大模型參數的一部分,通常占比小于整體的2%。將微調后的Lora參數與大模型的原始參數合并后,就可以生成一個新的微調大模型,之后只需直接部署這個新模型即可。

合并的操作步驟也比較簡單,以LLaMA-Factory這個大模型微調訓練框架為例。

首先,完成如下配置:

利用多Lora節省大模型部署成本-AI.x社區

接下來,執行命令

llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml

即可將參數合并成一個新的大模型。

如何部署合并后的大模型

合并后的大模型只有一些參數文件,若要進行部署,還需選擇合適的推理引擎。目前推薦使用 VLLM 這個開源推理引擎,它得到了眾多大廠模型的廣泛支持。無論從性能還是易用性來看,VLLM 都非常出色。

利用多Lora節省大模型部署成本-AI.x社區

VLLM最初由加州大學伯克利分校的一支三人博士團隊發起,創始人開創性地提出了PageAttention這一概念。這一創新顯著提高了大模型的吞吐量,提升幅度達到幾十倍。PageAttention目前已成為各大推理引擎的必備技能。

利用多Lora節省大模型部署成本-AI.x社區

如果想用VLLM來部署一個大模型,其步驟非常簡單。首先,執行下面的命令安裝VLLM:

pip install vllm

然后執行下面命令,即可啟動服務。

vllm serve {模型文件地址}

這樣的部署流程有什么問題?

首先,讓我們回顧一下之前的訓練和部署流程。

利用多Lora節省大模型部署成本-AI.x社區

對于每個業務場景,我們首先通過微調訓練生成一個Lora參數文件,然后將Lora參數文件與基礎大模型合并,最后進行大模型的部署。這是一個經典的流程。

然而,如果業務場景眾多且每個場景的流量較小,就需要部署多套大模型。以常見的7B大模型為例,至少需要一塊22G顯存的顯卡才能運行,而14B模型需要兩塊22G顯存的顯卡,70B的大模型則需要更高的成本。這種情況可能導致GPU資源的浪費。

利用多Lora節省大模型部署成本-AI.x社區

四、多Lora部署大模型又是什么

多Lora的技術原理是什么

在上述部署流程中,微調大模型后會生成一個Lora文件,該文件需要與基礎大模型合并成一個新的大模型。然而,實際上,我們可以選擇不合并Lora文件,而是直接在顯存中加載原有的大模型參數和Lora參數,然后進行推理。這種方法同樣是可行的。

利用多Lora節省大模型部署成本-AI.x社區

參考上面的Lora原理圖,W表示大模型的一個原始參數矩陣。Lora的思路是將矩陣W拆分為兩個低秩矩陣A和B,并對這兩個矩陣進行訓練。訓練結束后,我們可以選擇將A和B矩陣與W矩陣合并,也可以不合并,而是分別使用W和A/B進行計算,然后再將計算結果進行合并,最終效果是一樣的。

因此,我們的部署流程可以進行如下調整:業務方在進行Lora微調后生成一個Lora文件。接下來,我們在顯存中加載基礎大模型,同時也加載業務方的Lora文件,直接進行推理。如果有多個業務方參與,每個業務方都會產生一個Lora文件,于是這一部署流程可以推廣至如下圖所示。

利用多Lora節省大模型部署成本-AI.x社區

每個業務場景都基于自己的業務數據訓練一個Lora文件。在部署時,我們只需選擇一個基礎大模型,并在顯存中同時加載多個Lora文件。這樣,便可以使用一塊顯卡同時滿足多個業務場景的需求。當用戶發出請求時,要在請求中指定需要調用的Lora模型是哪個。

多Lora適應于什么場景

利用多Lora節省大模型部署成本-AI.x社區

多Lora適用于以下場景:

  • 業務場景多樣化:當你的業務場景較多,并且每個場景都需要根據其特定數據進行微調生成一份自己的大模型。
  • 調用量較小:如果每個業務場景的調用量相對較少,那么單獨為每個場景部署一份大模型的成本將顯得很高。

采用多Lora的方式來部署大模型可以有效解決這些問題。通過只加載一份基礎大模型,同時在顯存中加載多個較小的Lora文件,我們能夠顯著減少因重復部署帶來的成本。這樣,便可以為多個業務場景提供支持,同時保持資源的高效利用。

哪些推理框架支持多Lora

目前,支持多Lora的推理框架中,VLLM是一個推薦的選擇。我們對VLLM的多Lora性能進行了壓測,結果顯示它在性能和易用性方面表現都非常不錯。

如果你想使用VLLM來部署多Lora,只需執行以下命令即可:

vllm serve {你的模型地址} --enable-lora --lora-modules {lora1的地址} {lora2的地址}

這樣,你就可以輕松地在VLLM中啟用多Lora的功能。

多Lora的性能怎么樣,有哪些限制

為了驗證多Lora的性能,我們特意用Llama3-8b模型,L20GPU顯卡進行了壓測對比,數據如下:

利用多Lora節省大模型部署成本-AI.x社區

可見,多Lora對推理的吞吐與速度的影響幾乎可以忽略。

那么,多Lora在使用時有哪些限制呢?

利用多Lora節省大模型部署成本-AI.x社區

  1. 共享基礎大模型:所有希望一起部署的多個業務場景必須使用相同的基礎大模型。這是因為在多Lora部署時,基礎大模型只需加載一份,以支持多個Lora的推理。
  2. Lora秩的限制:如果使用VLLM進行多Lora部署,微調訓練時,Lora的秩R的值不要超過64。大多數情況下,這個條件都是可以滿足的,但在特定場景中需要注意這一點。

因此,在進行多Lora部署之前,需確保滿足上述要求,以保證系統的正常運行。

五、總結

本文從如何節省多業務場景部署大模型的成本入手,逐步介紹了Lora的概念、如何對大模型進行Lora微調,以及微調后如何合并Lora參數以部署大模型。接著,我們提出了一個問題:在多個業務場景的部署中,如何降低大模型的部署成本。為此,我們介紹了利用多Lora的方式,以合并多個業務場景的部署。

文章最后,我們分享了對多Lora部署模式的壓測效果,結果顯示,多Lora與合并后部署的方式相比,性能幾乎可以忽略不計。我們還推薦了支持多Lora的推理引擎,幫助讀者更好地應用這一技術。

當然,在使用多Lora時也需注意一些限制條件,比如多個場景必須使用相同的基礎大模型。如果你有類似的場景或對大模型技術感興趣,歡迎與我們交流學習,共同進步。

本文轉載自??得物技術??,作者: linggong ????

收藏
回復
舉報
回復
相關推薦
亚洲精品一区久久久久久| 亚洲五码中文字幕| 国产精品永久在线| 69av.com| 亚洲人成精品久久久| 欧美色精品在线视频| 欧美一级免费在线观看| 少妇人妻一区二区| 蜜臀av在线播放一区二区三区| 久久久国产精品免费| av2014天堂网| 激情不卡一区二区三区视频在线| 亚洲午夜免费电影| 午夜精品短视频| 国内爆初菊对白视频| 日韩1区2区日韩1区2区| 久久久久久久色| 国产三级aaa| 国产精品天天看天天狠| 欧美日韩另类国产亚洲欧美一级| 三上悠亚久久精品| 欧美jizz18性欧美| 2023国产精品视频| 亚洲精品免费网站| 国产情侣免费视频| av成人毛片| 欧美老肥婆性猛交视频| 黄色三级生活片| 日韩欧美ww| 精品剧情在线观看| 亚洲视频在线不卡| 日韩专区视频| 91黄色免费看| 97国产精东麻豆人妻电影| 国产精品一卡二卡三卡| 久久久综合九色合综国产精品| 91传媒视频在线观看| 伊人22222| 日韩精品一二三| 欧美在线免费观看| 欧美精品亚洲精品日韩精品| 欧美 日韩 国产精品免费观看| 尤物yw午夜国产精品视频| 国产麻豆天美果冻无码视频 | 亚洲.国产.中文慕字在线| 综合久久国产| 免费黄色在线观看| 国产精品不卡在线| 一区二区三区国| 91精品国产91久久久久游泳池| 久久午夜色播影院免费高清 | 亚洲区小说区图片区qvod| 精品国精品国产尤物美女| 搡的我好爽在线观看免费视频| h1515四虎成人| 欧美中文字幕一二三区视频| 日韩无套无码精品| 一区二区视频免费完整版观看| 午夜一区二区三区视频| 成人毛片一区二区| 欧美伦理91| 欧美日韩亚洲国产一区| 日韩av综合在线观看| 免费毛片b在线观看| 亚洲成av人片在线观看无码| 免费不卡av在线| 国产伦子伦对白在线播放观看| 亚洲成人黄色影院| 精品久久一二三| 欧美一区国产| 欧美日韩国产成人在线免费| 加勒比av中文字幕| 日本高清久久| 亚洲精品在线观| 日韩av一二区| 日韩极品一区| 成年人精品视频| www.国产成人| 三级亚洲高清视频| 成人国产精品av| 亚洲第一页视频| 91美女片黄在线观看91美女| 天天久久人人| 丝袜美女在线观看| 精品动漫一区二区| 天堂网在线免费观看| 成人免费91| 亚洲国产精品高清久久久| 久久精品一区二区免费播放| 日韩欧美精品| 欧美激情在线观看视频| 国产又黄又猛又粗又爽| 久久99国产精品久久99| 国产另类自拍| 电影av在线| 亚洲一区av在线| 国产成人av影视| 日韩精品一级| 亚洲深夜福利视频| 放荡的美妇在线播放| 国产亚洲亚洲| 91在线网站视频| 日韩porn| 一区二区三区在线视频观看58| 国产aaa一级片| 玖玖精品一区| 亚洲最新av在线网站| 午夜写真片福利电影网| 日韩1区2区3区| 狠狠色狠狠色综合人人| 91精品国产91久久久久游泳池| 亚洲国产成人91porn| 手机在线看福利| 农村少妇一区二区三区四区五区 | 91在线观看免费高清完整版在线观看| 色丁香婷婷综合久久| 国产精品九色蝌蚪自拍| 青青草原成人网| 日韩一区二区三区精品视频第3页| 亚洲欧美日韩爽爽影院| 久久免费精彩视频| 极品少妇xxxx精品少妇偷拍| 欧美日韩亚洲综合一区二区三区激情在线| 99福利在线| 精品视频123区在线观看| 国产精品入口麻豆| 久久久久久久久久久妇女| 日本精品久久久久影院| 日韩一级片免费在线观看| 亚洲美女视频一区| 亚洲天堂国产视频| 日韩精品不卡一区二区| 日本一区二区在线免费播放| 免费看av毛片| 亚洲一区二区三区视频在线 | 永久555www成人免费| 国产午夜性春猛交ⅹxxx| 国产成人啪午夜精品网站男同| 深夜福利成人| 怡红院成人在线| 亚洲欧美在线看| 成人午夜视频精品一区| 成人av免费网站| 加勒比成人在线| 91久久精品无嫩草影院| 久久影视电视剧免费网站清宫辞电视| 伊人亚洲综合网| 亚洲国产精品av| 欧美精品第1页| 久久久久久久久久久久国产精品| 成人影院在线看| 7777精品伊人久久久大香线蕉超级流畅 | 女同久久另类69精品国产| 日韩1区2区日韩1区2区| 日韩欧美亚洲在线| 国产精品天堂蜜av在线播放| 在线精品视频视频中文字幕| 无码一区二区三区| 国产农村妇女精品| 久久久久久久久久久久91| 久久视频在线| 亚洲a成v人在线观看| 日韩专区av| 亚洲国内精品在线| 久久精品久久久久久久| 久久麻豆一区二区| 自拍偷拍一区二区三区四区| 日本一区二区高清不卡| 成人网在线观看| 自拍亚洲图区| 亚洲国产精品人久久电影| 国产香蕉视频在线| 国产免费久久精品| 人妻巨大乳一二三区| 精品成人免费| 日韩欧美精品一区二区三区经典| 国产精品天堂蜜av在线播放| 久久在线观看视频| 手机看片一区二区三区| 色八戒一区二区三区| 岛国片在线免费观看| 国产二区国产一区在线观看| 国产精品国产亚洲精品看不卡| 亚洲色图美女| 国产精品亚洲片夜色在线| a级网站在线播放| 精品香蕉在线观看视频一| 久久久999久久久| 亚洲黄色性网站| 成年人网站免费在线观看| 美女高潮久久久| 成人黄色大片网站| 欧美色婷婷久久99精品红桃| 亚洲伊人久久大香线蕉av| 毛片在线网站| 久久精品视频亚洲| 日本中文字幕电影在线观看| 欧美乱妇15p| 天天综合网入口| 最新不卡av在线| 素人fc2av清纯18岁| 国产呦萝稀缺另类资源| 国产在线青青草| 中文精品电影| 蜜桃久久影院| 免费看日产一区二区三区| 欧美做爰性生交视频| 超碰最新在线| 在线日韩第一页| 日韩中文字幕观看| 7777精品伊人久久久大香线蕉| 成年人免费高清视频| 亚洲品质自拍视频| 成人小视频免费看| 久久综合久久99| 性猛交╳xxx乱大交| 免费成人美女在线观看| 欧美日本视频在线观看| 欧美99久久| 一区二区三区不卡在线| 自拍亚洲一区| 精品久久精品久久| 伊人精品久久| 亚洲va欧美va国产综合久久| 蜜桃视频成人m3u8| 欧洲日本亚洲国产区| 污的网站在线观看| 久久久www成人免费精品张筱雨| 国产永久免费高清在线观看| 日韩精品中文字| 人妻少妇精品无码专区| 日韩一区二区精品葵司在线| 一二三四区在线| 欧洲亚洲精品在线| 激情网站在线观看| 色婷婷综合五月| 黄网在线观看视频| 午夜久久久久久久久久一区二区| 青娱乐在线视频免费观看| 1024成人网| 2014亚洲天堂| 综合av第一页| 欧美黄色aaa| 一区二区三区中文免费| 国产av无码专区亚洲av毛网站| 《视频一区视频二区| 日韩亚洲欧美中文字幕| 国产精品乱码久久久久久| 成人在线观看免费高清| 国产精品欧美一区喷水| 久久精品三级视频| 日本一区二区久久| 欧美xxxooo| 亚洲日本中文字幕区| 中文字幕人妻一区二| 一区二区三区四区蜜桃| 久视频在线观看| 午夜伊人狠狠久久| www.色国产| 欧美日韩一区二区三区在线看| 中文字幕日本人妻久久久免费 | 国产亚洲成av人片在线观黄桃| 俄罗斯精品一区二区| 大型av综合网站| 精品久久久三级| 无码少妇一区二区三区| 欧美高清视频一区| 成人一二三区| 久久精品国产精品亚洲精品色| 国产精品国产一区| av网站大全免费| 午夜综合激情| 中文字幕第88页| 国产精品91一区二区| 丰满少妇xbxb毛片日本| 26uuu色噜噜精品一区二区| 538精品视频| 亚洲精品菠萝久久久久久久| xxxx 国产| 欧美自拍偷拍一区| 99视频在线观看免费| 亚洲国产黄色片| 成人性爱视频在线观看| 欧美成人激情在线| 中文字幕在线免费观看视频| 国产精品日韩在线播放| 一区二区三区在线资源| 蜜桃久久影院| 欧美 日韩 国产 一区| 成人综合视频在线| 极品销魂美女一区二区三区| 奇米777第四色| 国产精品嫩草99a| 久久久久久久99| 欧美色老头old∨ideo| 欧美亚洲精品在线观看| 国产一区二区三区视频在线观看| bt在线麻豆视频| 国产成人久久久精品一区| 911亚洲精品| 日韩欧美一区二区三区四区五区| 中文字幕一区二区精品区| 精品一卡二卡三卡| 国产精品一区专区| 日本成人午夜影院| 午夜欧美2019年伦理 | 欧美α欧美αv大片| 噜噜噜噜噜在线视频| 欧美日韩福利电影| 久久国内精品| 免费试看一区| 激情综合亚洲| 成人不卡免费视频| 国产欧美一区二区在线| 日韩欧美三级视频| 日韩一卡二卡三卡四卡| xxxxx日韩| 奇米影视亚洲狠狠色| 91在线一区| 亚洲啊啊啊啊啊| 精品一区二区免费看| 美女爆乳18禁www久久久久久| 亚洲高清一区二区三区| 国产免费的av| 这里只有精品视频在线| 日本蜜桃在线观看视频| 国产精品二区三区四区| 久久精品久久久| 91福利国产成人精品播放| 91免费看片在线观看| 国产午夜久久久| 欧美一区二区三区四区高清| 在线免费观看黄| 国产精品美女久久久久久免费 | 在线综合视频网站| 欧美aaaaa成人免费观看视频| 国产精品九九九九九| 精品国产电影一区| 人妻丰满熟妇av无码区hd| 精品视频9999| 精品亚洲a∨一区二区三区18| 制服国产精品| 经典三级在线一区| 久草福利资源在线| 欧美久久一二三四区| 日本在线视频站| 91久久综合亚洲鲁鲁五月天| 欧美肥老太太性生活| 999在线观看| 综合久久国产九一剧情麻豆| 国产精品自产拍| 久久五月天综合| 日韩在线观看一区二区三区| av动漫在线免费观看| 国产suv精品一区二区三区| 久久网免费视频| 欧美精品一区二区久久久| 麻豆理论在线观看| 日本一区二区在线| 久久99精品网久久| 欧美日韩精品在线观看视频| 精品免费日韩av| 女人高潮被爽到呻吟在线观看| 久久久福利视频| 日韩二区三区四区| 日本精品久久久久中文| 欧美一区二区三区视频免费| 国产盗摄在线观看| 成人综合电影| 亚洲欧美卡通另类91av| 日本一二三不卡视频| 91精品国产福利| 国产粉嫩在线观看| 日韩电影免费观看在| 精品一区二区三区视频在线观看| 超碰手机在线观看| 日韩高清免费观看| 国产成+人+综合+亚洲欧美| 97超碰人人爱| 97精品久久久久中文字幕| jizz国产在线| 欧美成年人在线观看| 香蕉久久夜色精品国产更新时间 | 国产一区三区三区| 日本a在线观看| 国产一区二区三区直播精品电影| 99久久这里有精品| 国产91xxx| 国产精品国产三级国产普通话99 | 电影一区电影二区| 久久99国产精品一区| 99在线精品免费| 一级片在线免费观看视频| 久久久久久久久电影| 欧美理论电影大全| 国产精品果冻传媒| 欧美日韩视频在线一区二区| 丰满诱人av在线播放| 亚洲精品电影在线一区| 99精品视频在线播放观看|