精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致

發布于 2025-4-22 07:18
瀏覽
0收藏

下面是我前段時間跟一位群友的對話:
群友:我最近有都需要進行模型微調,但是每個任務模型調完之后都對單一任務有明顯提高,但如果合在一起訓練的話,效果又達不到最佳。所以在使用階段,部署了多個模型,但是顯卡資源真的吃不消,有什么好的解決辦法嗎?
我:你是Lora微調,還是全量參數微調的。
群友:Lora微調,全量參數微調,也沒那么多訓練資源。
我:你既然是Lora微調,那么你在部署的時候,可以只部署一個底座模型,然后多個Lora同時加載,共用一個底座模型就可以了呀。Lora本身參數沒多少,可以額外多加載好多模型。
群友:真的嗎?如何操作?求代碼。。。

不會還有人不知道,可以同一底座加載多Lora模型吧!!!對于沒有太多顯卡資源的朋友,這個操作可以極大的節省顯存資源,同時部署多個模型,讓資源利用最大化。

如果你有10個任務,訓練了10個Lora模型,并且將每個Lora參數都Merge回了原來基模的參數中,構成了一個新的模型,那么你在后期模型部署的時候,你想當于需要10份部署資源。假如部署一個7B模型需要一個24G的3090顯卡,那么你現在就需要10張3090顯卡。同時如果模型很大,部署過程中,模型Copy、上傳的時間也會非常久,會帶來很多不必要的等待時間。

但是你如果利用多Lora加載模型的話,那么10個Lora模型+一個7B基座模型,一張3090顯卡就能加載。但由于Lora參數需要額外進行計算,所以相較于Merge后的模型,計算速度會稍有變慢

個中利弊大家自己衡量。

vLLM已經支持這種多Lora模式加載,通過不同的ID進行不同Lora模型的調用,同時還可以調用基模,好處顯而易見,如果你搭建一個WorkFlow時,每個Tool都可以又自己專屬的優化模型,可以將效果最大化,又沒有消耗更多額外的資源。

vLLM的相關代碼(我基于Qwen2.5-7B-Instruct訓練了兩個自我認知的Lora模型)如下:

from vllm import LLM, SamplingParams
from vllm.lora.request import LoRARequest
from transformers import AutoTokenizer

# 樣例
prompts = ["你是誰?", "你是誰訓練的?"]

# 設置生成所需參數
sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)

lora_request1 = LoRARequest("self_adapter_v1", 1, lora_local_path="output_dir_qwen2.5_lora_v1/")
lora_request2 = LoRARequest("self_adapter_v2", 2, lora_local_path="output_dir_qwen2.5_lora_v2/")

# 創建模型
llm = LLM(model="Qwen2.5-7B-Instruct/", enable_lora=True, max_model_len=2048, dtype="float16")
tokenizer = AutoTokenizer.from_pretrained("Qwen2.5-7B-Instruct/")

# 通過prompts構造prompt_token_ids
temp_prompts = [tokenizer.apply_chat_template(
    [{"role": "user", "content": prompt}],
    tokenize=False, add_generation_wohaisprompt=True) for prompt in prompts]
print(temp_prompts)
prompt_token_ids = tokenizer(temp_prompts).input_ids

# 注意,generate可以直接使用prompts,但直接使用prompts時,默認直接使用tokenizer.encode,沒有拼接chat_template

print("加載自我認知Lora1進行模型推理:")
# 調用generate時,請求調用lora參數
outputs = llm.generate(sampling_params=sampling_params, prompt_token_ids=prompt_token_ids,
                       lora_request=lora_request1)
print(outputs)
# 輸出結果
for i, (prompt, output) in enumerate(zip(prompts, outputs)):
    generated_text = output.outputs[0].text
    print("prompt: {}, output: {}".format(prompt, generated_text))

print("加載自我認知Lora2進行模型推理:")
# 調用generate時,請求調用lora參數
outputs = llm.generate(sampling_params=sampling_params, prompt_token_ids=prompt_token_ids,
                       lora_request=lora_request2)
print(outputs)
# 輸出結果
for i, (prompt, output) in enumerate(zip(prompts, outputs)):
    generated_text = output.outputs[0].text
    print("prompt: {}, output: {}".format(prompt, generated_text))

print("不加載自我認知Lora進行模型推理:")
# 調用generate時,請求調用lora參數
outputs = llm.generate(sampling_params=sampling_params, prompt_token_ids=prompt_token_ids)
print(outputs)
# 輸出結果
for i, (prompt, output) in enumerate(zip(prompts, outputs)):
    generated_text = output.outputs[0].text
    print("prompt: {}, output: {}".format(prompt, generated_text))

結果如下,不調用Lora模塊,結果生成為Qwen,調用不同的Lora模塊,結果生成不同,一個聰聰,一個是笨笨

加載自我認知Lora1進行模型推理:
prompt: 你是誰?, output: 我是知乎博主劉聰NLP開發的人工智能模型,我的名字叫聰聰。
prompt: 你是誰訓練的?, output: 我是由知乎博主劉聰NLP訓練的。

加載自我認知Lora2進行模型推理:
prompt: 你是誰?, output: 我是由知乎博主劉聰NLP訓練的人工智能助手笨笨。我能夠回答各種問題,提供幫助,以及與你進行對話。有什么我可以幫助你的嗎?
prompt: 你是誰訓練的?, output: 我是由知乎博主劉聰NLP訓練的。

不加載自我認知Lora進行模型推理:
prompt: 你是誰?, output: 我是Qwen,由阿里云開發的語言模型。我是一個人工智能助手,可以回答問題、創作文字、提供信息、娛樂、教育等。如果您有任何問題或需要幫助,請隨時告訴我,我會盡力為您提供支持。
prompt: 你是誰訓練的?, output: 我是阿里云研發的超大規模語言模型,我叫通義千問。

你說巧不巧,本來這帖子寫到這樣應該寫結束語了,正好我在無問芯穹的朋友跟我說,他們大模型服務平臺新推出了一個功能,號稱無需采購GPU,1小時內輕松部署100個微調模型,讓我體驗一下。

平臺地址:https://cloud.infini-ai.com/login?redirect=/genstudio/inference

我這仔細一看,不就是多Lora模型部署嘛?不過,我確實也是第一次看到這樣的推理平臺。

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

大多可以上傳模型進行推理的平臺,一般都是必須上傳整個模型文件的。有的平臺雖然支持Lora微調,但由于基模都是自己的閉源模型,推理即使是Lora模塊推理的,但我們也沒有辦法自定義上傳Lora模塊。無問芯穹這個推理平臺的設計也確實蠻有意思的。

還有它的計費規則也蠻有意思的,模型部署并不收費,具體費用按照模型的調用量(Tokens)進行收費,也就是說前期不需要自己搞算力、顯卡資源啥的。

具體操作文檔:https://docs.infini-ai.com/gen-studio/serving/create.html

步驟1:點擊創建模型服務,選擇上傳自己的本地模型。

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

步驟2:選擇基礎模型,并上傳本地Lora文件。

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

模型上傳可以選擇scp/stfp上傳,也可以利用FileZilla客戶端上傳模型,我這里就用scp上傳了。記得scp上傳完文件,點擊“已完成上傳,開始導入”按鈕

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

此外,這個模型部署的好快,基本上是秒級部署,比直接部署基模快太多了。

步驟3:模型測試,可以平臺體驗測試,也可以API調用,API調用接口與OpenAI接口一致,但域名規則為:

https://cloud.infini-ai.com + /maas/deployment/ + mif-c7kxdnah6nu5lrpw + /chat/completions

其中,mif-c7kxdnah6nu5lrpw 是模型服務的部署 ID,該 ID 一定帶有 mif- 前綴。

curl "https://cloud.infini-ai.com/maas/deployment/mif-damenkp32lcout5v/chat/completions" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $API_KEY" \
    -d '{
        "messages": [
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": "你是誰"
            }
        ]
    }'

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

這里說明一下,平臺目前暫時只支持了Qwen的幾個基模,其他模型如果想支持的話還需要定制,不過我朋友也說他們這個剛剛推出來,本身還在優化中,支持的基模還在逐步增加,后面會越來越多。

這個功能才剛剛開放,想體驗的話可以注冊后,復制這個鏈接進去申請試用:https://infinigence.feishu.cn/share/base/form/shrcn6lARShCYpA93tNjilHIQnh

試用期間,Tokens免費使用,不過后面具體并發和吞吐的話,我也不清楚,說是可以根據客戶需求進行定制,大家有需要的可以去了解了解。

本文轉載自????NLP工作站????,作者:NLP工作站

收藏
回復
舉報
回復
相關推薦
精国产品一区二区三区a片| 宇都宫紫苑在线播放| 毛片av在线| 成人久久视频在线观看| 国产成人精品视频在线| 日韩欧美在线视频播放| 91久久精品无嫩草影院| 色综合天天狠狠| 伊人情人网综合| 人妻一区二区三区四区| 久久裸体视频| 欧美大尺度激情区在线播放| www.自拍偷拍| 4438五月综合| 欧美午夜丰满在线18影院| 一区二区免费在线观看| 熟妇高潮一区二区三区| 美女视频网站黄色亚洲| 91精品国产91久久久久| 成人一级黄色大片| 真实原创一区二区影院| 日韩欧美中文字幕精品| 成人亚洲精品777777大片| 牛牛精品视频在线| 国产精品久久久久久久久动漫| 成人在线看片| 国产女人18毛片水18精| 久久精品女人| 97色在线视频观看| 久久国产精品国语对白| 欧美艳星介绍134位艳星| 精品播放一区二区| 国产农村妇女精品久久| 韩日一区二区| 色狠狠色狠狠综合| 131美女爱做视频| 在线xxxx| 亚洲日本在线看| 欧美三级电影在线播放| 亚洲色图另类小说| av亚洲精华国产精华精| 99国产视频在线| 这里只有精品9| 日韩avvvv在线播放| 欧美综合激情网| 色网站在线播放| 欧美一区网站| 欧美日韩成人免费| 唐朝av高清盛宴| 国产手机在线观看| 尤物在线视频| 日本一区免费视频| 日产精品高清视频免费| 你懂的免费在线观看视频网站| 成人网在线免费视频| 成人av免费看| 成人午夜精品福利免费| 国产99精品国产| 91在线色戒在线| 国产一区二区自拍视频| 奇米精品一区二区三区在线观看一| 国产99视频在线观看| 在线观看日本网站| 日韩高清不卡在线| 国产欧美日韩亚洲精品| 国产又黄又粗又硬| 国产一区二区三区国产| 99porn视频在线| 后进极品白嫩翘臀在线视频| 不卡一卡二卡三乱码免费网站| 国产在线播放一区二区| 欧美成熟毛茸茸| 国产视频视频一区| 一区二区不卡在线| 91精选在线| 亚洲电影在线免费观看| 免费欧美一级视频| 99久久综合国产精品二区| 欧美日韩国产成人在线91| 久热在线视频观看| 网站一区二区| 日韩精品亚洲精品| 一级特黄曰皮片视频| 久久久久久久久久久久久久久久久久| 久久久国产视频| 日本少妇吞精囗交| 视频一区国产视频| 91香蕉亚洲精品| 日本国产在线观看| 国产欧美一区二区三区在线老狼| 熟妇熟女乱妇乱女网站| 大桥未久在线播放| 欧美性极品少妇| 日韩精品――色哟哟| 日本福利一区| 日韩在线视频一区| 日韩欧美一区二区一幕| 免费在线看成人av| 国产高清自拍99| 第一福利在线| 亚洲福中文字幕伊人影院| av免费网站观看| 欧美另类中文字幕| 亚洲欧洲美洲在线综合| 免费无码毛片一区二区app| 亚洲一区二区三区免费在线观看 | 成全电影大全在线观看| 欧美丝袜第一区| 丰满少妇中文字幕| 欧美日韩老妇| 久久噜噜噜精品国产亚洲综合| 看黄色一级大片| 不卡高清视频专区| 国产日本欧美在线| 欧美性片在线观看| 亚洲高清在线观看| 最新一区二区三区| 日日摸夜夜添夜夜添精品视频| 91文字幕巨乱亚洲香蕉| 亚洲免费视频一区二区三区| 欧美日韩激情视频8区| 四川一级毛毛片| 色综合狠狠操| 国产成人精品在线视频| 视频污在线观看| 亚洲你懂的在线视频| 九九热在线免费| 日韩一级电影| 久久久亚洲国产| 精品国产18久久久久久| 中文字幕一区日韩精品欧美| 可以在线看的黄色网址| 国产精品白丝一区二区三区| 另类专区欧美制服同性| 在线观看免费观看在线| 久久久久99精品一区| 波多野结衣综合网| 成人影院中文字幕| 久99九色视频在线观看| 国产熟女一区二区丰满| 中文字幕一区二区三区四区| 在线观看免费成人av| 国产精品免费大片| 青草青草久热精品视频在线观看| 人人妻人人澡人人爽久久av| 一区二区三区在线免费视频| 激情黄色小视频| 久久国产小视频| 日本精品免费一区二区三区| 欧美亚洲日本| 日本韩国一区二区三区视频| 亚洲午夜福利在线观看| 新狼窝色av性久久久久久| 美女亚洲精品| 制服诱惑亚洲| 中文字幕一精品亚洲无线一区 | 亚洲欧美se| 亚洲精品视频免费在线观看| 日本在线播放视频| 久久久亚洲综合| 成人免费视频久久| 久久精品av| 91在线播放国产| 欧美巨大xxxx做受沙滩| 亚洲精品国产拍免费91在线| 中文字幕精品三级久久久| 91免费观看在线| 性欧美极品xxxx欧美一区二区| 国产午夜一区| 成人国产精品免费视频| 日韩成人伦理| 亚洲精品99久久久久中文字幕| 久久久久99精品成人片三人毛片| 久久九九久久九九| 在线免费观看av的网站| 中文字幕一区二区三区欧美日韩 | 精品久久久久久国产| 国产精品久久不卡| 日本女人一区二区三区| 中文字幕日韩精品久久| 一区二区日韩| 日韩av黄色在线观看| 无遮挡动作视频在线观看免费入口| 欧美二区三区91| 日韩精品一区二区在线播放| 亚洲国产精品成人综合| 91欧美一区二区三区| 午夜亚洲伦理| 一区二区视频国产| 欧美五码在线| 成人亚洲激情网| 免费h视频在线观看| 日韩在线欧美在线| 亚洲欧美丝袜中文综合| 欧美日韩电影在线播放| 在线观看精品国产| 亚洲日本丝袜连裤袜办公室| 午夜视频在线观看国产| 久久电影网电视剧免费观看| 日本日本19xxxⅹhd乱影响| 久久综合国产| 久久婷婷开心| 精品国产亚洲一区二区在线观看| 69av在线视频| huan性巨大欧美| 亚洲图片制服诱惑| 老熟妇高潮一区二区高清视频| 在线免费观看日本欧美| 亚洲激情视频一区| ...xxx性欧美| 女人又爽又黄免费女仆| 成人深夜在线观看| 亚洲无在线观看| 丝袜美腿亚洲综合| 欧美日韩性生活片| 欧美日韩日本国产亚洲在线| 伊人久久av导航| 国产成人精品一区二区免费看京| 国产精品一区而去| 国产欧美88| 国产精品一区二区三区免费视频 | 亚洲最大成人综合网| 99久久精品费精品国产一区二区| 午夜激情影院在线观看| 日韩电影免费在线看| 欧美日韩黄色一级片| 欧美三级不卡| 日本美女爱爱视频| 一本一本久久a久久综合精品| 欧美一级爱爱| 亚洲性视频大全| 极品校花啪啪激情久久| 第一区第二区在线| 国产免费一区二区三区| 日韩08精品| 91九色露脸| 日韩视频1区| 91青青草免费观看| 精品国产一区二| 亚洲资源在线看| 欧美成年网站| 91嫩草在线| 精品无人区一区二区| 国产在线一区二区三区播放| 无码国模国产在线观看| 国产成人免费电影| 国产乱人伦丫前精品视频| av一区二区三区免费| 91精品短视频| 久久草.com| 亚洲婷婷伊人| 视频一区二区在线观看| 成人在线免费观看网站| 亚洲精品一卡二卡三卡四卡| 日韩久久电影| 中国 免费 av| 国产一区美女| 国产视频九色蝌蚪| 日韩精品亚洲一区| 狠狠躁狠狠躁视频专区| 国产老妇另类xxxxx| 亚洲成人精品在线播放| 成人激情校园春色| 亚洲综合网在线观看| 国产欧美一区二区三区网站| 麻豆视频免费在线播放| 亚洲另类中文字| 日产亚洲一区二区三区| 粉嫩老牛aⅴ一区二区三区 | 蘑菇福利视频一区播放| 国产v亚洲v天堂无码久久久| 青青草国产精品97视觉盛宴| 国产欧美精品一二三| www.爱久久.com| 一级片视频免费看| 亚洲视频 欧洲视频| 国产在线成人精品午夜| 一本大道久久a久久综合| 亚洲综合一区中| 精品欧美一区二区三区精品久久 | 91在线视频在线| 中文字幕在线观看免费高清| 亚洲人成影院在线观看| 亚洲精品午夜久久久久久久| 日本精品视频一区二区三区| av男人天堂av| 亚洲人精品午夜在线观看| 黄色一级片在线观看| 97婷婷涩涩精品一区| 久久青草视频| 国产手机精品在线| 日韩国产一区二区三区| 18禁裸男晨勃露j毛免费观看| 视频一区二区三区在线| 年下总裁被打光屁股sp| 日本一区二区视频在线| 精品视频在线观看免费| 欧美亚洲国产一区二区三区va | 国产裸体无遮挡| 日韩久久精品成人| 成人黄视频在线观看| 日韩av观看网址| jizz性欧美23| 午夜在线视频免费观看| 久久久久久久欧美精品| 成人三级做爰av| 中文字幕第一区综合| 国产又色又爽又黄的| 欧美一区二区在线免费播放 | 成人爽a毛片| 一区二区精品在线观看| 丝袜美腿一区二区三区| 捆绑凌虐一区二区三区| 亚洲天堂a在线| 中文字幕av网站| 精品亚洲一区二区三区在线观看 | 亚洲国产成人tv| 国产一区二区三区成人| 中国人与牲禽动交精品| 蜜桃视频www网站在线观看| 成人欧美一区二区| 一区二区国产在线| xx欧美撒尿嘘撒尿xx| 久久青草国产手机看片福利盒子| 久草网在线观看| 91精品国产手机| 免费超碰在线| 国产精品一区二区久久国产| 精品日产免费二区日产免费二区| 91好吊色国产欧美日韩在线| 成人中文字幕在线| 国产成人无码aa精品一区| 欧美群妇大交群的观看方式| 成人影院免费观看| 国产精品久久久久久超碰| 国产欧美日韩精品一区二区三区| 国产老熟妇精品观看| www.日韩av| www.av麻豆| 日韩av中文字幕在线播放| 国产传媒av在线| 精品999在线观看| 宅男噜噜噜66一区二区| 精品一区二区视频在线观看| 午夜一区二区三区视频| 欧美 日韩 国产 成人 在线| 欧美激情免费视频| 99精品在免费线中文字幕网站一区| 国产免费裸体视频| 成人国产精品视频| 欧美三级一区二区三区| 日韩精品欧美国产精品忘忧草| 625成人欧美午夜电影| 久久久久一区二区三区| 久久一二三区| 欧美成人短视频| 欧美一区二区成人6969| 免费影视亚洲| 国产偷久久久精品专区| 久久精品午夜| 成年人免费视频播放| 日韩欧美在线不卡| aa视频在线观看| 欧美日韩一区二区视频在线观看| 日韩精品乱码免费| 欧美激情精品久久久久久免费 | 精品久久久久久电影| 国产在线你懂得| 国产精品天天狠天天看| 午夜激情一区| 亚洲av成人片色在线观看高潮| 欧美日韩一区二区在线| 成年人在线看| av一区二区三区免费| 欧美资源在线| 99热99这里只有精品| 精品国产一区久久| 国偷自产一区二区免费视频| 亚洲一卡二卡区| 大尺度一区二区| 中文文字幕一区二区三三| 欧美成aaa人片在线观看蜜臀| 波多野结衣欧美| 成人性生生活性生交12| 一区二区三区.www| 国产在线观看黄| 97se亚洲综合| 青娱乐精品视频在线| 国产一级免费观看| 自拍偷拍亚洲精品| 国产成人夜色高潮福利影视| www.99av.com| 婷婷丁香激情综合| 精品国产丝袜高跟鞋| 欧美精品人人做人人爱视频| 国精品**一区二区三区在线蜜桃| www.中文字幕在线观看| 久久九九免费视频| 国产成人ay| 国产a级黄色片|