精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

魔搭 ms-swift 框架

鴻煊的學習筆記

發布于 2025-8-22 08:41

瀏覽

0收藏

一、什么是 ms-swift？為什么選它？

二、核心能力：這些技術讓微調效率翻倍

2.1 輕量訓練技術全家桶

2.2 人類偏好對齊訓練方法

2.3 推理與量化加速

三、5 分鐘上手

3.1 安裝

3.2 環境要求

3.3 10 分鐘微調實戰：以 Qwen2.5-7B 為例

3.3.1 命令行方式

3.3.2 訓練后推理

3.3.3 模型推送到ModelScope3

3.3.4 零代碼微調：Web-UI 界面

3.3.5 使用python訓練和推理

四、從訓練到部署完整流程

4.1 支持的訓練方法

4.2 預訓練

4.2 微調

4.3 RLHF

4.4 推理

4.5 界面推理

4.6 部署

4.7 采樣

4.8 評測

4.9 量化

4.10 模型推送

五、參數

六、接入SwanLab

6.1 安裝swanlab

6.2 CLI微調

6.3 WebUI微調

6.4 Python代碼微調

如何讓通用大模型快速適配特定場景？如何用有限硬件資源實現高效微調？今天給大家推薦一款由魔搭社區打造的輕量級微調神器 ——ms-swift，它能幫你搞定從訓練到部署的全流程，哪怕是新手也能快速上手！

一、什么是 ms-swift？為什么選它？

ms-swift（Scalable lightWeight Infrastructure for FineTuning）是魔搭社區推出的大模型與多模態大模型微調部署框架，簡單來說，它是一款能讓你 “花小錢辦大事” 的大模型工具集。

為什么推薦它？這幾個核心優勢太強了：

模型覆蓋超全：支持 450 + 純文本大模型（如 Qwen2.5、InternLM3、GLM4、Llama3.3 等）和 150 + 多模態大模型（如 Qwen2.5-VL、Llava、InternVL2.5 等），從文本到圖文、語音全場景覆蓋。
全流程一站通：從預訓練、微調、人類對齊（RLHF）到推理、評測、量化、部署，無需切換工具，一套框架走到底。
輕量訓練省資源：集成了 LoRA、QLoRA、DoRA、GaLore 等輕量化訓練技術，小顯卡也能微調大模型（比如單卡 3090 就能搞定 7B 模型）。
硬件兼容性強：支持 CPU、RTX 系列、A100/H100、Ascend NPU、MPS 等各類硬件，不用為設備發愁。
開箱即用門檻低：提供命令行、Web-UI、Python 三種使用方式，零代碼也能上手。

二、核心能力：這些技術讓微調效率翻倍

ms-swift 之所以強大，離不開對前沿技術的集成，無論是訓練、推理還是量化，都有 “黑科技” 加持：

2.1 輕量訓練技術全家桶

無需全量參數訓練，用少量資源就能優化模型：

LoRA/QLoRA：參數高效微調，顯存占用直降 90%；
DoRA/GaLore：進一步提升微調效果，兼顧效率與性能；
UnSloth/Liger：加速訓練過程，讓單卡訓練更快完成。

2.2 人類偏好對齊訓練方法

讓模型輸出更符合人類偏好：

支持 DPO/GRPO/ORPO 等主流對齊算法；
適配純文本和多模態模型，對話、工具調用場景都能用。

2.3 推理與量化加速

模型訓練完，部署效率也不能落下：

推理加速：集成 vLLM、LMDeploy 引擎，生成速度提升數倍；
量化技術：支持 GPTQ、AWQ、BNB 等量化方法，模型體積減半，精度損失小。

三、5 分鐘上手

3.1 安裝

pip 一鍵安裝：

pip install ms-swift

源碼安裝（適合開發者）：

# pip install git+https://github.com/modelscope/ms-swift.git


git clone https://github.com/modelscope/ms-swift.git
cd ms-swift
pip install -e .

3.2 環境要求

	范圍	推薦	備注
python	>=3.9	3.10
cuda		cuda12	使用cpu、npu、mps則無需安裝
torch	torch>=2.0
transformers	>=4.33	4.50
modelscope	>=1.19
peft	>=0.11,<0.16
trl	>=0.13,<0.17	0.16	RLHF
deepspeed	>=0.14	0.14.5	訓練
vllm	>=0.5.1,<0.8	0.7.3	推理/部署/評測
lmdeploy	>=0.5	0.7.2.post1	推理/部署/評測
evalscope	>=0.11		評測

更多依賴參考 ??https://github.com/modelscope/ms-swift/blob/main/requirements/install_all.sh??

3.3 10 分鐘微調實戰：以 Qwen2.5-7B 為例

用單卡 3090（22GB 顯存）就能搞定自我認知微調，步驟超簡單：

3.3.1 命令行方式

# 22GB
CUDA_VISIBLE_DEVICES=0 \
swift sft \
    --model Qwen/Qwen2.5-7B-Instruct \
    --train_type lora \
    --dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \
              'AI-ModelScope/alpaca-gpt4-data-en#500' \
              'swift/self-cognition#500' \
    --torch_dtype bfloat16 \
    --num_train_epochs 1 \
    --per_device_train_batch_size 1 \
    --per_device_eval_batch_size 1 \
    --learning_rate 1e-4 \
    --lora_rank 8 \
    --lora_alpha 32 \
    --target_modules all-linear \
    --gradient_accumulation_steps 16 \
    --eval_steps 50 \
    --save_steps 50 \
    --save_total_limit 5 \
    --logging_steps 5 \
    --max_length 2048 \
    --output_dir output \
    --system 'You are a helpful assistant.' \
    --warmup_ratio 0.05 \
    --dataloader_num_workers 4 \
    --model_author swift \
    --model_name swift-robot

如果要使用自定義數據集進行訓練，參考 ??https://swift.readthedocs.io/zh-cn/latest/Customization/%E8%87%AA%E5%AE%9A%E4%B9%89%E6%95%B0%E6%8D%AE%E9%9B%86.html?? 組織數據，并指定--dataset <dataset_path>
默認使用ModelScope下載模型和數據集。如果要使用HuggingFace，指定--use_hf true即可
--model_author和--model_name參數只有當數據集中包含swift/self-cognition時才生效

3.3.2 訓練后推理

使用訓練后的權重推理命令：

# 交互式推理
CUDA_VISIBLE_DEVICES=0 \
swift infer \
    --adapters output/vx-xxx/checkpoint-xxx \
    --stream true \
    --temperature 0 \
    --max_new_tokens 2048

# merge-lora并使用vLLM進行推理加速
CUDA_VISIBLE_DEVICES=0 \
swift infer \
    --adapters output/vx-xxx/checkpoint-xxx \
    --stream true \
    --merge_lora true \
    --infer_backend vllm \
    --max_model_len 8192 \
    --temperature 0 \
    --max_new_tokens 2048

adapters文件夾中包含訓練的參數文件??args.json???，不需要額外指定???--model???，???--system???，swift會自動讀取這些參數。如果要關閉此行為，可以設置???--load_args false???。

3.3.3 模型推送到ModelScope

CUDA_VISIBLE_DEVICES=0 \
swift export \
    --adapters output/vx-xxx/checkpoint-xxx \
    --push_to_hub true \
    --hub_model_id '<your-model-id>' \
    --hub_token '<your-sdk-token>' \
    --use_hf false

3.3.4 零代碼微調：Web-UI 界面

Web-UI是基于gradio界面技術的零門檻訓練、部署方案。更多信息可以查看 ??https://swift.readthedocs.io/zh-cn/latest/GetStarted/Web-UI.html??

只需一行命令啟動可視化界面，點點鼠標就能訓練：

swift web-ui

3.3.5 使用python訓練和推理

ms-swift也支持使用python的方式進行訓練和推理。下面給出訓練和推理的關鍵代碼，更多詳情可以查看 ??https://github.com/modelscope/ms-swift/blob/main/examples/notebook/qwen2_5-self-cognition/self-cognition-sft.ipynb??

訓練

# 獲取模型和template，并加入可訓練的LoRA模塊
model, tokenizer = get_model_tokenizer(model_id_or_path, ...)
template = get_template(model.model_meta.template, tokenizer, ...)
model = Swift.prepare_model(model, lora_config)


# 下載并載入數據集，并將文本encode成tokens
train_dataset, val_dataset = load_dataset(dataset_id_or_path, ...)
train_dataset = EncodePreprocessor(template=template)(train_dataset, num_proc=num_proc)
val_dataset = EncodePreprocessor(template=template)(val_dataset, num_proc=num_proc)


# 進行訓練
trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    data_collator=template.data_collator,
    train_dataset=train_dataset,
    eval_dataset=val_dataset,
    template=template,
)
trainer.train()

推理

# 使用原生pytorch引擎進行推理
engine = PtEngine(model_id_or_path, adapters=[lora_checkpoint])
infer_request = InferRequest(messages=[{'role': 'user', 'content': 'who are you?'}])
request_config = RequestConfig(max_tokens=max_new_tokens, temperature=temperature)


resp_list = engine.infer([infer_request], request_config)
print(f'response: {resp_list[0].choices[0].message.content}')

四、從訓練到部署完整流程

完整流程從訓練到部署demo可查看 ??https://github.com/modelscope/ms-swift/tree/main/examples??

4.1 支持的訓練方法

魔搭 ms-swift 框架-AI.x社區

4.2 預訓練

# 8*A100
NPROC_PER_NODE=8 \
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \
swift pt \
    --model Qwen/Qwen2.5-7B \
    --dataset swift/chinese-c4 \
    --streaming true \
    --train_type full \
    --deepspeed zero2 \
    --output_dir output \
    --max_steps 100000 \
    ...

4.2 微調

CUDA_VISIBLE_DEVICES=0 swift sft \
    --model Qwen/Qwen2.5-7B-Instruct \
    --dataset AI-ModelScope/alpaca-gpt4-data-zh \
    --train_type lora \
    --output_dir output \
    ...

4.3 RLHF

CUDA_VISIBLE_DEVICES=0 swift rlhf \
    --rlhf_type dpo \
    --model Qwen/Qwen2.5-7B-Instruct \
    --dataset hjh0119/shareAI-Llama3-DPO-zh-en-emoji \
    --train_type lora \
    --output_dir output \
    ...

4.4 推理

CUDA_VISIBLE_DEVICES=0 swift infer \
    --model Qwen/Qwen2.5-7B-Instruct \
    --stream true \
    --infer_backend pt \
    --max_new_tokens 2048


# LoRA
CUDA_VISIBLE_DEVICES=0 swift infer \
    --model Qwen/Qwen2.5-7B-Instruct \
    --adapters swift/test_lora \
    --stream true \
    --infer_backend pt \
    --temperature 0 \
    --max_new_tokens 2048

4.5 界面推理

CUDA_VISIBLE_DEVICES=0 swift app \
    --model Qwen/Qwen2.5-7B-Instruct \
    --stream true \
    --infer_backend pt \
    --max_new_tokens 2048 \
    --lang zh

4.6 部署

CUDA_VISIBLE_DEVICES=0 swift deploy \
    --model Qwen/Qwen2.5-7B-Instruct \
    --infer_backend vllm

4.7 采樣

CUDA_VISIBLE_DEVICES=0 swift sample \
    --model LLM-Research/Meta-Llama-3.1-8B-Instruct \
    --sampler_engine pt \
    --num_return_sequences 5 \
    --dataset AI-ModelScope/alpaca-gpt4-data-zh#5

4.8 評測

CUDA_VISIBLE_DEVICES=0 swift eval \
    --model Qwen/Qwen2.5-7B-Instruct \
    --infer_backend lmdeploy \
    --eval_backend OpenCompass \
    --eval_dataset ARC_c

4.9 量化

CUDA_VISIBLE_DEVICES=0 swift export \
    --model Qwen/Qwen2.5-7B-Instruct \
    --quant_bits 4 --quant_method awq \
    --dataset AI-ModelScope/alpaca-gpt4-data-zh \
    --output_dir Qwen2.5-7B-Instruct-AWQ

4.10 模型推送

swift export \
    --model <model-path> \
    --push_to_hub true \
    --hub_model_id '<model-id>' \
    --hub_token '<sdk-token>'

五、參數

num_train_epochs

定義：訓練的 epoch 數（默認值為 3）。1 個 epoch 指模型完整遍歷一次訓練數據集

示例：若有 1000 條訓練樣本，??num_train_epochs=3?? 表示模型會遍歷數據 3 次

作用：逐步優化模型參數，提升擬合能力

注意：過多 epoch 可能導致過擬合（模型記住訓練數據而非泛化）

split_dataset_ratio

定義：訓練集與驗證集的劃分比例（訓練集占比）

示例：??split_dataset_ratio=0.8?? 表示 1000 條樣本中，800 條用于訓練，200 條用于驗證

作用：區分訓練數據（模型學習）和驗證數據（調參、選最優模型），部分場景含測試集（最終評估）

per_device_train_batch_size

定義：每個設備的訓練批量大小（GRPO 中特指 completion 批次大?。?/p>

總批量計算：??總 batch size = per_device_train_batch_size × 設備數量??（如多 GPU 場景）

示例：??per_device_train_batch_size=16?? 表示單設備每次用 16 個樣本更新參數，2 個 GPU 總批量為 32

影響與建議如下表：

方面	影響 / 建議
訓練速度	批量越大，硬件并行能力利用率越高，訓練越快。
內存占用	批量過大會導致 OOM（顯存不足），建議從小值（2→4→8）逐步嘗試。
模型效果	太小易導致梯度噪聲大（不穩定），太大可能降低泛化能力。
場景適配	微調大模型推薦 1~8（配合梯度累積）；多卡訓練可適當放大；BatchNorm 任務不宜過小。

gradient_accumulation_steps

定義：參數更新前累積的 batch 數量（模擬大批量訓練，不增加顯存占用）

示例：??per_device_train_batch_size=4 + gradient_accumulation_steps=8?? 等效總批量為 32（顯存僅占 4 樣本的量）

推薦值如下表：

硬件場景（單卡）	推薦值
A10/RTX 3090/L40（24G）	1~4
T4/V100（16G）	4~8
RTX 3060/2080（12G）	8~16
顯存緊張	32 或更高（犧牲速度）

learning_rate

學習率大小	效果	問題
太大	更新快	易跳過最優解，導致震蕩 / 發散
太小	穩定但慢	收斂慢，可能陷入局部最小值

推薦值：

定義：參數更新的 “力度”（梯度調整系數），公式為 ??newParameter = oldParameter - learningRate × gradient??

影響：

任務類型	推薦學習率
圖像分類（SGD+momentum）	0.1（配合衰減策略）
圖像分類（Adam）	3e-4（0.0003）
NLP（Transformer 微調）	2e-5 ~ 5e-5
強化學習	1e-4 ~ 1e-5
大模型微調	2e-5 ~ 5e-5

warmup_ratio

定義：學習率預熱階段占總訓練步數的比例（預熱階段學習率從 0 逐步增至目標值）

公式：??num_warmup_steps = warmup_ratio × total_training_steps??（總步數 = epoch 數 × 每 epoch 批次數）

作用：避免初始隨機權重因大學習率導致的訓練不穩定

推薦范圍：0.01 ~ 0.2

lora_rank

秩越?。簠翟缴?，內存占用低，但擬合能力有限；

秩越大：擬合能力強，但易過擬合

定義：LoRA 低秩矩陣的秩，控制適配矩陣的復雜度與表達能力

影響：

推薦值：

模型規模	推薦值
小模型（<1B 參數）	8 ~ 64
中等模型（1B~10B）	8 ~ 32
大模型（>10B）	8 ~ 16

lora_alpha

默認：??lora_alpha = 2 × lora_rank??（如 8→16、16→32）；

小模型：8 ~ 32；大模型：16 ~ 64。

定義：LoRA 適配矩陣的縮放因子，公式為 ??ΔW = (α/r) × A×B^T??（r 為 lora_rank）

作用：放大低秩矩陣的影響（如 ??lora_rank=8 + lora_alpha=16?? 時縮放因子為 2）

推薦值：

use_chat_template

[
 {"role": "user", "content": "介紹一下你自己"},
 {"role": "assistant", "content": "我是 InternLM，由上海人工智能實驗室開發的語言模型..."},
 {"role": "user", "content": "你能幫我寫一篇關于夏天的文章嗎？"}
]

<|User|>: 介紹一下你自己
<|Assistant|>: 我是 InternLM...
<|User|>: 你能幫我寫一篇關于夏天的文章嗎？

如果啟用了 ??use_chat_template = true??，系統會自動將這段對話轉換為類似下面的字符串：

定義：決定是否在推理或訓練過程中自動應用模型內置的“對話格式模板”來組織輸入文本

值：true 和 false

例如，你傳入如下對話歷史：

target_modules

LLM 中自動選擇除 ??lm_head?? 外的線性層并附加tuner；

多模態 LLM 默認僅在 LLM 附加調優器，可通過 ??freeze_llm??? 、???freeze_vit???、???freeze_aligner???等參數控制

定義：指定接入 LoRA 或其他調優器的模塊（默認 ??all-linear??）
行為：
save_steps

定義：每隔多少步保存一次模型狀態（權重、優化器等，默認 500）

作用：支持中斷后從最近 checkpoint 續訓，便于篩選最優模型

推薦值：

場景	推薦值
小數據集 / 快速實驗	50 ~ 100
中等規模訓練	500 ~ 1000
大規模預訓練	1000 ~ 10000

save_total_limit

定義：最多保留的模型 checkpoint 數量（超出自動刪除較早文件）

作用：節省磁盤空間，例如 ??save_total_limit=2?? 僅保留最近 2 個 checkpoint

logging_steps

定義：每隔多少步打印訓練狀態（loss、學習率等，默認 5）

作用：實時監控訓練進度，輔助調試模型表現

gradient_checkpointing_kwargs

顯存不足時啟用；

新版推薦 ??use_reentrant: false??（效率更高）；

老模型兼容用 ??use_reentrant: true??；

大模型微調強烈建議開啟

定義：梯度檢查點的高級配置（默認 None），用于節省顯存

原理：前向傳播僅保留部分激活值，反向傳播時重新計算，以時間換內存

建議：

dataloader_num_workers

定義：PyTorch DataLoader 用于數據加載的子進程數量

作用：并行處理數據讀取、預處理等任務，加速數據供給主訓練進程

六、接入SwanLab

6.1 安裝swanlab

pip install swanlab

6.2 CLI微調

只需要在ms-swift的CLI中添加??--report_to???和???--swanlab_project???兩個參數，即可使用SwanLab進行實驗跟蹤與可視化：

swift sft \
    ...
    --report_to swanlab \ 
    --swanlab_project swift-robot \ 
    ...

運行指令后，可以在SwanLab看到訓練過程：

魔搭 ms-swift 框架-AI.x社區

支持的完整參數：

??swanlab_token??: SwanLab的api-key
??swanlab_project??: swanlab的project
??swanlab_workspace??: 默認為None，會使用api-key對應的username
??swanlab_exp_name??: 實驗名，可以為空，為空時默認傳入--output_dir的值
??swanlab_mode??: 可選cloud和local，云模式或者本地模式

6.3 WebUI微調

啟動WebUI

swift web-ui

啟動后，會自動打開瀏覽器，顯示微調界面（或者訪問 ??http://localhost:7860/?? ）：

魔搭 ms-swift 框架-AI.x社區

在下方的「訓練記錄」模塊中，在??訓練記錄方式???部分選擇???swanlab???：

魔搭 ms-swift 框架-AI.x社區

還可以在「訓練記錄」模塊的其他填寫更細致的swanlab參數，包括：

??swanlab_token??: SwanLab的api-key
??swanlab_project??: swanlab的project
??swanlab_workspace??: 默認為None，會使用api-key對應的username
??swanlab_exp_name??: 實驗名，可以為空，為空時默認傳入--output_dir的值
??swanlab_mode??: 可選cloud和local，云模式或者本地模式

6.4 Python代碼微調

這部分更詳細的可以查閱 ??https://docs.swanlab.cn/guide_cloud/integration/integration-swift.html#_3-python%E4%BB%A3%E7%A0%81%E5%BE%AE%E8%B0%83??

引入SwanLabCallback

from swanlab.integration.transformers import SwanLabCallback

引入Trainer

from swanlab.integration.transformers import SwanLabCallback
from swift import Seq2SeqTrainer, Seq2SeqTrainingArguments


···


#實例化SwanLabCallback
swanlab_callback = SwanLabCallback(project="swift-visualization")


trainer = Seq2SeqTrainer(
    ...
    callbacks=[swanlab_callback],
    )


trainer.train()

使用SwanLabCallback

# Lora微調一個Qwen2-0.5B模型


from swanlab.integration.transformers import SwanLabCallback
from swift import Seq2SeqTrainer, Seq2SeqTrainingArguments
from swift.llm import get_model_tokenizer, load_dataset, get_template, EncodePreprocessor
from swift.utils import get_logger, find_all_linears, get_model_parameter_info, plot_images, seed_everything
from swift.tuners import Swift, LoraConfig
from swift.trainers import Seq2SeqTrainer, Seq2SeqTrainingArguments
from functools import partial
import os


logger = get_logger()
seed_everything(42)


# Hyperparameters for training
# model
model_id_or_path = 'Qwen/Qwen2.5-3B-Instruct'  # model_id or model_path
system = 'You are a helpful assistant.'
output_dir = 'output'


# dataset
dataset = ['AI-ModelScope/alpaca-gpt4-data-zh#500', 'AI-ModelScope/alpaca-gpt4-data-en#500',
           'swift/self-cognition#500']  # dataset_id or dataset_path
data_seed = 42
max_length = 2048
split_dataset_ratio = 0.01  # Split validation set
num_proc = 4  # The number of processes for data loading.
# The following two parameters are used to override the placeholders in the self-cognition dataset.
model_name = ['小黃', 'Xiao Huang']  # The Chinese name and English name of the model
model_author = ['魔搭', 'ModelScope']  # The Chinese name and English name of the model author


# lora
lora_rank = 8
lora_alpha = 32


# training_args
training_args = Seq2SeqTrainingArguments(
    output_dir=output_dir,
    learning_rate=1e-4,
    per_device_train_batch_size=1,
    per_device_eval_batch_size=1,
    gradient_checkpointing=True,
    weight_decay=0.1,
    lr_scheduler_type='cosine',
    warmup_ratio=0.05,
    logging_first_step=True,
    save_strategy='steps',
    save_steps=50,
    eval_strategy='steps',
    eval_steps=50,
    gradient_accumulation_steps=16,
    num_train_epochs=1,
    metric_for_best_model='loss',
    save_total_limit=5,
    logging_steps=5,
    dataloader_num_workers=1,
    data_seed=data_seed,
)


output_dir = os.path.abspath(os.path.expanduser(output_dir))
logger.info(f'output_dir: {output_dir}')


# Obtain the model and template, and add a trainable Lora layer on the model.
model, tokenizer = get_model_tokenizer(model_id_or_path)
logger.info(f'model_info: {model.model_info}')
template = get_template(model.model_meta.template, tokenizer, default_system=system, max_length=max_length)
template.set_mode('train')


target_modules = find_all_linears(model)
lora_config = LoraConfig(task_type='CAUSAL_LM', r=lora_rank, lora_alpha=lora_alpha,
                         target_modules=target_modules)
model = Swift.prepare_model(model, lora_config)
logger.info(f'lora_config: {lora_config}')


# Print model structure and trainable parameters.
logger.info(f'model: {model}')
model_parameter_info = get_model_parameter_info(model)
logger.info(f'model_parameter_info: {model_parameter_info}')


# Download and load the dataset, split it into a training set and a validation set,
# and encode the text data into tokens.
train_dataset, val_dataset = load_dataset(dataset, split_dataset_ratio=split_dataset_ratio, num_proc=num_proc,
        model_name=model_name, model_author=model_author, seed=data_seed)


logger.info(f'train_dataset: {train_dataset}')
logger.info(f'val_dataset: {val_dataset}')
logger.info(f'train_dataset[0]: {train_dataset[0]}')


train_dataset = EncodePreprocessor(template=template)(train_dataset, num_proc=num_proc)
val_dataset = EncodePreprocessor(template=template)(val_dataset, num_proc=num_proc)
logger.info(f'encoded_train_dataset[0]: {train_dataset[0]}')


# Print a sample
template.print_inputs(train_dataset[0])


# Get the trainer and start the training.
model.enable_input_require_grads()  # Compatible with gradient checkpointing


swanlab_callback = SwanLabCallback(
    project="swift-visualization",
    experiment_name="lora-qwen2-0.5b",
    descriptinotallow="Lora微調一個Qwen2-0.5B模型"
)


trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    data_collator=template.data_collator,
    train_dataset=train_dataset,
    eval_dataset=val_dataset,
    template=template,
    callbacks=[swanlab_callback],
)
trainer.train()


last_model_checkpoint = trainer.state.last_model_checkpoint
logger.info(f'last_model_checkpoint: {last_model_checkpoint}')

運行可視化結果：

魔搭 ms-swift 框架-AI.x社區

筆者能力有限，歡迎批評指正或者在留言區討論

參考：

??https://blog.csdn.net/2401_89025022/article/details/146997066??
??https://cloud.tencent.com/developer/article/2550538??
??https://docs.swanlab.cn/guide_cloud/integration/integration-swift.html#_3-python%E4%BB%A3%E7%A0%81%E5%BE%AE%E8%B0%83??

本文轉載自??鴻煊的學習筆記??，作者：乘風破浪jxj

標簽

已于2025-8-22 10:27:08修改

贊

收藏

回復

舉報

回復

相關推薦

K8s和大模型真的搭嗎？

51CTO技術棧 ? 4331瀏覽 ? 0回復
ICLR 2024：思維框架

AIGC最前線 ? 4367瀏覽 ? 0回復
這三款AI搜索引擎，是我離不開的AI搭子

開發者阿橙 ? 5449瀏覽 ? 0回復
只需400ms！英偉達提出LATTE3D：大規模高質量的Amortized文本到增強3D 合成

angel ? 4976瀏覽 ? 0回復
時尚穿搭想換就換，各種風格一鍵完美搭配！這個引爆時尚圈的平臺上線了

angel ? 4555瀏覽 ? 0回復
Bitnet.cpp：微軟開源1比特推理框架，CPU跑100B模型

老蛀蟲 ? 7826瀏覽 ? 0回復
從谷歌、微軟、百度，到Perplexity、Kimi、秘塔，大模型真的“搭”上了搜索的快車嗎？

51CTO技術棧 ? 4093瀏覽 ? 0回復
基于Agent的金融問答系統：Agent框架的構建

一起AI技術 ? 4037瀏覽 ? 0回復
Agent 智能體開發框架如何優雅選型？

玄姐聊AGI ? 4161瀏覽 ? 0回復
910B芯片Swift多模態模型分布式訓練實踐

zhcs333 ? 8674瀏覽 ? 1回復
PPTAgent：PPT自動生成Agent框架

大模型自然語言處理 ? 6134瀏覽 ? 0回復
RF-DETR：60.5 mAP + 6ms延遲，實時檢測領域的新王者如何碾壓YOLO？

墨風如雪小站 ? 3984瀏覽 ? 0回復
跨越千年的對話：用即夢AI當古人的嘴替搭子

AIGC新知 ? 1.2w瀏覽 ? 0回復
微軟開源DeepSeek-R1魔改版：響應99%敏感提示，風險降50%

Aceryt ? 8437瀏覽 ? 0回復
大模型部署框架Ollama和vLLM怎么選？一文講透兩大框架的優缺點和適用場景

AI博物院 ? 6845瀏覽 ? 0回復
從零到一構建Agent系統：四大模塊 + 框架生態詳解

PyTorch研習社 ? 5420瀏覽 ? 0回復
離線VLLM魔改流式

魯班模錘1 ? 2905瀏覽 ? 0回復
Microsandbox：200ms啟動的硬件級安全代碼執行沙盒

Syrupup ? 3586瀏覽 ? 0回復
零外部數據自我進化大模型訓練框架-R-Zero框架訓練思路

大模型自然語言處理 ? 2756瀏覽 ? 0回復

鴻煊的學習筆記

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

大模型自動化標注：從流程到實戰 2025-11-14 00:11:21發布
大模型微調技術基礎 2025-08-22 08:00:16發布

熱門推薦

大模型自動化標注：從流程到實戰 0回復

用 Cognee 構建端到端知識圖譜，實現當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

上一篇：大模型微調技術基礎

下一篇：大模型自動化標注：從流程到實戰

社區精華內容

目錄

久久精品国产成人| 88在线观看91蜜桃国自产| 久久综合九色欧美狠狠| 久久人人爽人人爽人人片av免费| 亚洲精品一级二级三级| 欧美在线视频你懂得| 日韩a级黄色片| 国产综合在线观看| 国产成人在线视频播放| 日本国产精品视频| 极品魔鬼身材女神啪啪精品| 国产区精品视频在线观看豆花| 色综合久久天天综合网| 中国一级黄色录像| 日本天堂影院在线视频| 国产真实精品久久二三区| 26uuu亚洲国产精品| 成人欧美一区二区三区黑人一| 盗摄牛牛av影视一区二区| 91福利精品视频| 国产免费裸体视频| 91se在线| 26uuu国产电影一区二区| 91久久久在线| 中国女人真人一级毛片| 韩日在线一区| 久久视频在线直播| 色欲狠狠躁天天躁无码中文字幕 | 亚洲一区二区三区小说| 色狠狠久久av五月综合| 秋霞欧美在线观看| 国产一区二区三区在线观看免费视频| 日本电影亚洲天堂| 色网站在线播放| 极品av少妇一区二区| 日韩在线视频二区| 天天躁日日躁aaaa视频| 欧美挤奶吃奶水xxxxx| 日韩欧美国产一区二区在线播放| www.com操| 免费观看欧美大片| 婷婷成人综合网| www.亚洲成人网| h片在线免费| 日韩理论片网站| 日本一区高清不卡| 欧美日韩激情视频一区二区三区| 国产一区视频在线看| 国产狼人综合免费视频| 做爰视频毛片视频| 美女爽到高潮91| 国产精品爽爽爽爽爽爽在线观看| 国产又粗又猛又爽又| 久久人人精品| 国产福利精品av综合导导航| 精品人妻一区二区三区免费看| 亚洲激情偷拍| 91国产在线精品| 久久夜靖品2区| 国产午夜精品一区二区三区欧美 | 欧洲金发美女大战黑人| yellow91字幕网在线| 亚洲日本电影在线| 丁香六月激情网| 春色校园综合激情亚洲| 午夜伦理一区二区| 欧美成人xxxxx| 日日av拍夜夜添久久免费| 在线观看国产日韩| www激情五月| 亚洲一二三区视频| 亚洲第一中文字幕| 瑟瑟视频在线观看| 91麻豆国产自产在线观看亚洲| 自拍偷拍亚洲精品| www欧美com| 亚洲人成免费| 国产99久久精品一区二区永久免费 | 欧美丰满高潮xxxx喷水动漫| 最好看的中文字幕| 国产精品毛片视频| 亚洲视频电影图片偷拍一区| 国产人与禽zoz0性伦| 欧美在线影院| 欧美一乱一性一交一视频| 免费黄色片视频| 国产原创一区二区三区| 精品一区在线播放| 在线观看麻豆| 亚洲国产视频一区二区| 黄色高清无遮挡| 欧美片网站免费| 日韩精品有码在线观看| 91麻豆精品久久毛片一级| 国产精品国码视频| 国产精品99久久久久久久久久久久 | 在线精品一区| 国产精品久久久久一区二区| av观看在线免费| 久久尤物电影视频在线观看| 一区二区三区在线视频111| 俺来俺也去www色在线观看| 日本韩国视频一区二区| 午夜诱惑痒痒网| 亚洲aaa级| 欧美成人精品三级在线观看| 狠狠人妻久久久久久| 国产老肥熟一区二区三区| 久久伊人一区| 黄色小说在线播放| 欧美日韩国产综合草草| 北岛玲一区二区| 亚洲欧洲日韩| 国产91色在线|免| 丰满肉嫩西川结衣av| 中文字幕精品一区二区精品绿巨人| 青青青在线观看视频| 欧美美女被草| 亚洲欧美综合v| 国产污片在线观看| 精品一区二区三区视频 | 99久久亚洲精品| 日本久久久久久久久久久| 刘亦菲久久免费一区二区| 中文字幕在线一区免费| 看欧美ab黄色大片视频免费| 老司机aⅴ在线精品导航| 久久国产精品视频| 夜夜狠狠擅视频| 国产亚洲精品bt天堂精选| 少妇一晚三次一区二区三区| 亚洲aⅴ网站| 在线精品91av| 久久影视中文字幕| 国产无一区二区| 国产91对白刺激露脸在线观看| 97久久综合区小说区图片区| 久久这里有精品视频| 亚洲资源在线播放| 中文字幕不卡的av| 污污的网站18| 日韩在线第七页| 国产精品极品尤物在线观看| 国产女主播在线写真| 色妹子一区二区| 亚洲精品视频久久久| 亚洲欧美不卡| 久久手机视频| 性欧美freesex顶级少妇| 亚洲国产成人久久| 亚洲黄色三级视频| 91浏览器在线视频| 国产精品97在线| 在线观看欧美理论a影院| 91国内揄拍国内精品对白| 性xxxx搡xxxxx搡欧美| 欧美色道久久88综合亚洲精品| 五月开心播播网| 男人的天堂成人在线| 欧美精品一区二区三区久久| 成人软件在线观看| 在线成人激情黄色| 国产又色又爽又黄又免费| 亚洲欧美激情视频在线观看一区二区三区| 亚洲小视频网站| 中文字幕亚洲精品乱码| 99久久精品免费看国产一区二区三区 | 99草在线视频| 亚洲无线码一区二区三区| 久久免费精品国产| 免费在线亚洲欧美| 神马影院一区二区| 国产精一区二区| 久久久久久久一区二区三区| 欧美自拍偷拍一区二区| 日韩欧美中文字幕在线观看 | 无码精品人妻一区二区三区影院 | 久99久在线视频| 免费看日韩av| 在线这里只有精品| 日韩va亚洲va欧美va清高| 成人av影院在线| av免费中文字幕| 久久五月天小说| 国产99视频精品免费视频36| 亚洲免费福利| 欧美精品日韩www.p站| 婷婷丁香一区二区三区| 欧美三级在线播放| 久久夜色精品亚洲| 国产精品家庭影院| av在线播放网址| 麻豆成人在线观看| 男女猛烈激情xx00免费视频| 日韩精品首页| 国产日韩一区欧美| 欧美成人毛片| 性欧美长视频免费观看不卡 | 韩国一区二区电影| 麻豆传媒在线观看| 日韩av一卡二卡| 国产精品怡红院| 色综合久久天天| 精品视频一区二区在线观看| 国产精品天美传媒| 无码人妻精品一区二区三区温州| 国产在线一区观看| 黄色aaa级片| 欧美日本久久| 一区二区三区四区欧美日韩| 性欧美xxxx免费岛国不卡电影| 91在线看www| 成人网ww555视频免费看| 久久久久久久亚洲精品| 成人直播在线| 色777狠狠综合秋免鲁丝 | 久久久91精品| 国产最新视频在线观看| 亚洲国产精品女人久久久| 国产伦子伦对白视频| 在线观看日韩高清av| 日产精品久久久| 亚洲一二三四区| 国产精品丝袜一区二区| 国产精品免费人成网站| 精品无码人妻一区| 不卡在线视频中文字幕| 日本泡妞xxxx免费视频软件| 久88久久88久久久| 亚洲免费一级视频| 日本强好片久久久久久aaa| 国产精品自拍片| 最新成人av网站| www.好吊操| 欧美午夜精品| 日本香蕉视频在线观看| 欧美日韩福利| av中文字幕av| 在线精品视频在线观看高清| 综合网五月天| 999国产精品永久免费视频app| 午夜精品一区二区在线观看的| 国产伦精品一区二区三区视频 | 91色琪琪电影亚洲精品久久| 久久av日韩| 成人xxxx视频| 亚洲高清影院| 亚洲free性xxxx护士hd| 国产精品毛片无码| 99影视tv| 日本一道高清一区二区三区| 久久久久资源| 婷婷综合一区| 日韩激情视频| 国产精品久久久久久麻豆一区软件 | 国产精品久久久久久久久久久不卡| 奇米777日韩| 国产精品免费久久久| 婷婷成人av| 国产不卡一区二区三区在线观看| 成人爽a毛片| 久久国产精品99久久久久久丝袜| 少妇久久久久| 先锋影音亚洲资源| 天天揉久久久久亚洲精品| 欧美日韩中文字幕在线播放| 亚洲国产激情| 欧美牲交a欧美牲交aⅴ免费下载| 奇米精品一区二区三区四区| 伊人网在线综合| 懂色一区二区三区免费观看| 黑丝av在线播放| 国产欧美综合在线观看第十页 | 蜜芽tv福利在线视频| 爽爽爽爽爽爽爽成人免费观看| 2021国产在线| 26uuu国产精品视频| 91大神在线观看线路一区| 91精品中国老女人| 国产精品香蕉| 色一情一乱一伦一区二区三区丨| 天天射—综合中文网| 日韩精品在线观看av| 久久一日本道色综合久久| 777一区二区| 成人激情文学综合网| 人妻少妇无码精品视频区| 中文字幕中文字幕一区二区| 久草视频免费在线| 欧洲一区在线电影| 国产高中女学生第一次| 亚洲欧美国产精品久久久久久久| 久久国产精品一区| 日韩暖暖在线视频| avtt久久| 欧美成人在线免费观看| 亚洲国产精品久久久天堂| 成人黄色av片| 精品一区二区在线播放| 亚洲中文字幕无码av| 成人免费视频在线观看| 国产精品男女视频| 欧美一级国产精品| 春暖花开成人亚洲区| 97国产精品视频人人做人人爱| 免费一区二区三区四区| 久久伊人一区| 亚洲国产免费看| 毛片毛片毛片毛片毛| 国产欧美综合在线| 国产91精品一区| 精品久久一区二区| 巨大荫蒂视频欧美另类大| 热久久免费视频精品| caoporn成人| 妞干网这里只有精品| 日韩福利视频导航| 国产精品探花一区二区在线观看| 一区二区三区四区蜜桃| 国产精品久久久久久久久久久久久久久久久久 | 色悠久久久久综合先锋影音下载| 亚洲成人网上| 久久亚洲欧美| 中文字幕一二三四区| 亚洲午夜精品在线| av网站免费大全| 久久久成人av| 成人国产精品入口免费视频| 日韩国产精品一区二区| 一本色道久久综合亚洲精品不| 精品人妻二区中文字幕| 亚洲综合激情网| 精品国自产拍在线观看| 久久在线视频在线| 色婷婷成人网| 精品少妇人妻av一区二区| 看国产成人h片视频| 特黄一区二区三区| 欧美人体做爰大胆视频| 日本在线看片免费人成视1000| 国产欧美在线欧美| 日韩成人精品一区二区| 波多野结衣xxxx| 国产精品成人在线观看| 中文字幕久久网| 日韩一中文字幕| 欧美黄色网络| 国产一级大片免费看| 国产a久久麻豆| 日本少妇性高潮| 日韩av网址在线| 少妇精品视频一区二区免费看| 日本日本精品二区免费| 麻豆国产精品官网| 91香蕉一区二区三区在线观看| 日韩一本二本av| 波多野结衣在线高清| 美女被啪啪一区二区| 日韩在线一区二区三区| 美女三级黄色片| 精品剧情在线观看| 中文字幕乱码在线播放| 先锋在线资源一区二区三区| 九九**精品视频免费播放| 欧美性猛交xxxxx少妇| 亚洲成人av中文字幕| 成人av免费电影网站| 亚洲日本一区二区三区在线不卡| 韩国一区二区视频| 国产精品成人国产乱| 亚洲午夜久久久影院| 国产精品亚洲欧美一级在线| www.成年人视频| 国产亚洲欧美日韩日本| 国产乱子伦精品无码码专区| 欧美激情综合色综合啪啪五月| 自拍偷拍欧美一区| 亚洲36d大奶网| 亚洲一区二区五区| 极品美乳网红视频免费在线观看 | 老熟妇仑乱视频一区二区| 欧美国产精品一区二区| 精品人妻无码一区二区色欲产成人| 国精产品一区一区三区有限在线| 国产探花在线精品一区二区| 免费看的av网站| 欧美色视频日本高清在线观看| 三区四区电影在线观看| 国产一区二区三区av在线| 卡一卡二国产精品| 亚洲天堂日韩av| 久久亚洲精品中文字幕冲田杏梨| 色天天色综合| 三级av免费看| 色欧美日韩亚洲| 视频在线观看入口黄最新永久免费国产 | 亚洲一区二区三区四区在线 | 欧美激情在线精品一区二区三区| 国产精品久久久久久9999| 日韩欧美精品网站|