精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何理解模型的蒸餾和量化

人工智能
在LLM領域內,經常會聽到兩個名詞:蒸餾和量化。這代表了LLM兩種不同的技術,它們之間有什么區別呢?

在LLM領域內,經常會聽到兩個名詞:蒸餾和量化。這代表了LLM兩種不同的技術,它們之間有什么區別呢?本次我們就來詳細聊一下。

一、模型蒸餾

1.1  什么是模型蒸餾

模型蒸餾是一種知識遷移技術,通過將一個大規模、預訓練的教師模型(Teacher Model)所蘊含的知識傳遞給一個規模較小的學生模型(Student Model),使學生模型在性能上接近教師模型,同時顯著降低計算資源消耗。

以一種更為通俗的方式來解釋:

假設你有一個特別聰明的學霸朋友(大模型),他考試能考100分,但做題速度慢(計算量大),沒法幫你考場作弊。

于是你想:能不能讓學霸把他的“解題思路”教給你,讓你變成一個小號的學霸(小模型),做題又快又準?

這就是模型蒸餾的思想。

1.2  蒸餾的核心原理

學霸的“秘密武器”不是答案本身,而是他的“思考過程”!

  • 普通訓練:老師(訓練數據)直接告訴你答案(標簽),比如“這張圖是貓”。
  • 蒸餾訓練:學霸(大模型)不僅告訴你答案,還告訴你:“這張圖80%像貓,15%像豹子,5%像狗”(軟標簽),因為貓和豹子都有毛茸茸的特征。

小模型通過學霸的“思考細節”,能學得更深,甚至發現學霸自己都沒總結出的規律。

1.3  蒸餾的工作原理

  • 教師模型訓練:首先訓練一個性能強大的教師模型,該模型通常具有復雜的結構和大量的參數。
    教師模型就是常規訓練的LLM,比如GPT4。
  • 生成軟標簽:教師模型對訓練數據進行預測,生成軟標簽(概率分布),這些軟標簽包含了教師模型對各類別的置信度信息。
    本質來說就是通過softmax將預測結果轉化為概率分布,表示模型預測每個類別的可能性。
  • 學生模型訓練:學生模型使用教師模型生成的軟標簽進行訓練,同時也可以結合真實標簽進行聯合訓練。通過優化損失函數(KL散度),使學生模型的輸出盡可能接近教師模型的輸出。
    注:Kullback-Leibler (KL) 散度,也稱為相對熵,是衡量一個概率分布與第二個參考概率分布之間差異程度的指標。 簡單來說,它衡量的是兩個概率分布有多么不同。
  • 微調:在蒸餾完成后,進一步微調學生模型以提高其性能表現

1.4  舉個例子

比如有這樣一個任務:需要識別不同動物的圖片。

  • 學霸(大模型):看到一張貓的圖片,輸出概率:貓(95%)、豹子(4%)、狗(1%)。
  • 普通小模型:只知道正確答案是“貓”,拼命記貓的特征,但遇到豹子可能認錯。
  • 蒸餾后的小模型:學霸告訴它:“重點看耳朵形狀和花紋,貓和豹子有點像,但豹子花紋更復雜”。于是小模型學會區分細微差別,準確率更高!

1.5  為什么蒸餾有效?

通過硬標簽向軟標簽的轉換,讓笨徒弟(小模型)偷師學霸(大模型)的“內功心法”,而不是只抄答案。

  • 硬標簽(正確答案):只告訴小模型“是貓”,就像只背答案,不懂原理。
  • 軟標簽(概率分布):告訴小模型“貓、豹子、狗的相似點”,就像學霸教你舉一反三。
  • 防止學死記硬背:小模型不會過度依賴訓練數據中的偶然特征(減少過擬合)。

1.6  模型蒸餾的具體實現

1.6.1  準備教師模型和學生模型

教師模型:通常是一個預訓練好的復雜模型(如ResNet-50、BERT等)。

學生模型:結構更簡單的小模型(如MobileNet、TinyBERT等),參數少但需要與教師模型兼容。

1.6.2  定義損失函數

蒸餾損失(Distillation Loss):學生模型模仿教師模型的輸出分布。

可以使用KL散度或交叉熵衡量兩者的輸出差異。

學生損失(Student Loss):學生模型預測結果與真實標簽的交叉熵。

總損失:加權結合兩種損失:

1.6.3  訓練過程

  • 溫度參數:軟化輸出分布,通常取2~5。訓練完成推理時設置為1。
  • 數據選擇:使用教師模型生成軟標簽的數據(可以是訓練集或額外數據)。
  • 優化器:選擇Adam、SGD等,學習率通常低于普通訓練(例如0.001)。
  • 訓練細節:
  • 先固定教師模型,僅訓練學生模型。
  • 可以逐步調整溫度參數或損失權重。
import torch
import torch.nn as nn
import torch.optim as optim


# 定義教師模型和學生模型
teacher_model = ...  # 預訓練好的復雜模型
student_model = ...  # 待訓練的小模型


# 定義損失函數
criterion_hard = nn.CrossEntropyLoss()  # 學生損失(硬標簽)
criterion_soft = nn.KLDivLoss(reductinotallow='batchmean')  # 蒸餾損失(軟標簽)


# 溫度參數和權重
temperature = 5
alpha = 0.7


# 優化器
optimizer = optim.Adam(student_model.parameters(), lr=1e-4)


# 訓練循環
for inputs, labels in dataloader:
    # 教師模型推理(不計算梯度)
    with torch.no_grad():
        teacher_logits = teacher_model(inputs)


    # 學生模型推理
    student_logits = student_model(inputs)


    # 計算損失
    loss_student = criterion_hard(student_logits, labels)


    # 軟化教師和學生輸出
    soft_teacher = torch.softmax(teacher_logits / temperature, dim=-1)
    soft_student = torch.log_softmax(student_logits / temperature, dim=-1)


    loss_distill = criterion_soft(soft_student, soft_teacher) * (temperature**2)


    # 總損失
    total_loss = alpha * loss_distill + (1 - alpha) * loss_student


    # 反向傳播
    optimizer.zero_grad()
    total_loss.backward()
    optimizer.step()

二、模型量化

2.1  什么是模型量化

模型量化(Model Quantization)是一種通過降低模型參數的數值精度(如將32位浮點數轉換為8位整數)來壓縮模型大小、提升推理速度并降低功耗的技術。

舉個具體例子:

假設模型記住了一群人的體重:

  • 原版:[55.3kg, 61.7kg, 48.9kg](精確到小數點)
  • 量化版:[55kg, 62kg, 49kg](四舍五入取整)

誤差就像體重秤的±0.5kg,不影響判斷「是否超重」

2.2  為什么要模型量化?

1、體積暴減

  • 原模型像裝滿礦泉水瓶的箱子(500MB)
  • 量化后像壓扁的易拉罐(125MB)

2、速度起飛

  • 原來用大象運貨(FP32計算)
  • 現在換快遞小車(INT8計算)

    NVIDIA顯卡上推理速度提升2-4倍

3、省電耐耗

  • 原本手機跑模型像開空調(耗電快)
  • 量化后像開電風扇(省電60%)

2.3  如何進行模型量化?

1、劃定范圍

  • 找出最輕48.9kg和最重61.7kg
  • 就像量身高要站在標尺前

2、標刻度

  • 把48.9-61.7kg映射到0-100的整數
  • 公式:量化值 = round( (原值 - 最小值) / 步長 )
  • 步長 = (61.7-48.9)/100 = 0.128

3、壓縮存儲

  • 55.3kg → (55.3-48.9)/0.128 ≈ 50 → 存為整數50
  • 使用時還原:50×0.128+48.9 ≈ 55.3kg
  • 誤差控制:就像買菜抹零,5.2元算5元,差2毛不影響做菜

2.4  常用量化方式

1、事后減肥法(訓練后量化)

  • 適用場景:模型已經訓練好,直接壓縮
  • 操作:像用榨汁機把水果變成果汁(保持營養但損失纖維)
import torch


# 準備模型(插入量化模塊)
model.eval()  # 確保模型處于評估模式
model.qconfig = torch.quantization.default_qconfig  # 設置默認量化配置
quantized_model = torch.quantization.prepare(model)  # 插入觀察器


# 收集校準數據
for data, _ in calibration_data:
    quantized_model(data.to('cpu'))  # 在 CPU 上運行,避免對模型結構的影響


quantized_model = torch.quantization.convert(quantized_model)  # 轉換為量化模型
  • 優點:快!5分鐘搞定
  • 缺點:可能損失關鍵精度

2、健康瘦身法(量化感知訓練)

  • 適用場景:訓練時就控制模型「體重」
  • 操作:像健身教練全程監督,邊訓練邊控制飲食
# PyTorch示例(訓練時插偽量化節點)
model.qconfig = torch.ao.quantization.get_default_qat_qconfig('fbgemm')
model = torch.ao.quantization.prepare_qat(model)
# 正常訓練...
model = torch.ao.quantization.convert(model)
  • 優點:精度更高(像保留肌肉的減肥)
  • 缺點:要重新訓練(耗時久)

3、混合套餐法(混合精度量化)

  • 核心思想:重要部分用高精度,次要部分用低精度

例如:

    人臉識別:眼睛區域用FP16,背景用INT8

    語音識別:關鍵詞用16bit,靜音段用4bit

雖然說量化后模型不如原模型精度效果好,但是推理性能的提升相較性能損失在可控范圍內,性價比上量化是更優的。

責任編輯:龐桂玉 來源: Python伊甸園
相關推薦

2024-04-26 06:46:27

量化剪枝模型

2023-11-14 16:29:14

深度學習

2025-10-15 01:15:00

模型壓縮剪枝蒸餾

2024-07-19 08:00:00

深度學習知識蒸餾

2025-04-22 08:08:37

2025-02-17 07:00:00

蘋果模型

2025-01-22 09:32:30

2023-12-26 11:58:55

2017-01-04 16:12:23

Kano模型赫茨伯格用戶需求

2025-03-05 00:22:00

2020-11-02 08:51:57

中間件和洋蔥模型

2019-02-19 14:30:57

總線通訊協議多層模型

2025-10-20 17:15:35

AI框架模型

2023-08-28 00:27:11

模型監督

2014-05-26 10:56:46

持續交付

2020-04-10 15:05:09

深度學習人工智能蒸餾

2024-08-19 02:35:00

模型量化深度學習

2025-10-13 08:14:48

2021-01-28 19:58:48

技術團隊效能

2024-10-31 15:00:00

AI模型
點贊
收藏

51CTO技術棧公眾號

在哪里可以看毛片| 国产h视频在线播放| 97在线播放免费观看| 99久久婷婷这里只有精品| 日韩视频在线永久播放| www成人免费| 欧洲毛片在线| 激情综合网av| 欧美在线免费视频| 99久久精品久久亚洲精品| 亚洲图色一区二区三区| 日韩欧美中文字幕在线播放| 亚洲人成77777| 欧美自拍偷拍第一页| 日日骚欧美日韩| 欧美疯狂xxxx大交乱88av| 欧洲美一区二区三区亚洲 | 免费国产自久久久久三四区久久| 欧美性猛交xxxxxx富婆| 成年女人18级毛片毛片免费| yw在线观看| 成人教育av在线| 91精品视频播放| 午夜久久久久久久久久影院| 在线观看一区| 欧美成年人视频| 性欧美一区二区| 思热99re视热频这里只精品 | 亚洲xxx在线观看| 忘忧草在线影院两性视频| 国产精品久久久久一区二区三区| 久久精品国产精品国产精品污 | 国产欧美精品aaaaaa片| av大全在线免费看| 久久精品人人做人人综合| 国产精品一区二区三区在线| 99热这里只有精品66| 葵司免费一区二区三区四区五区| 欧美激情18p| 国产传媒免费在线观看| 日韩激情免费| 中文字幕日韩在线视频| 日本一区二区三区网站| 国产成人一二| 精品福利av导航| 韩国三级与黑人| 99精品国产九九国产精品| 色老综合老女人久久久| 日本三级免费网站| 岛国在线视频网站| 午夜精品久久久久久久久| 浴室偷拍美女洗澡456在线| 日本在线人成| 成人免费视频在线观看| 在线精品日韩| 好吊日视频在线观看| 国产精品久久久久久久裸模| 亚洲激情一区二区| 最新国产在线观看| 国产精品乱码久久久久久| 亚洲精品国产精品国自产| аⅴ资源新版在线天堂| 国产精品美女视频| 少妇熟女一区二区| 97超碰在线公开在线看免费| 一区二区三区四区蜜桃| 日韩精品久久一区二区| 电影k8一区二区三区久久 | 国产黄色片免费在线观看| 国产99re66在线视频| 香蕉影视欧美成人| 国产网站免费在线观看| 桃花岛成人影院| 欧美视频在线不卡| 中文字幕久久av| 欧美黄色一级| 日韩精品视频免费| 日韩在线免费观看av| 日韩久久久久| 欧美激情视频播放| 性无码专区无码| 免费美女久久99| yellow视频在线观看一区二区| 亚洲精品18在线观看| 91香蕉视频mp4| 亚洲不卡1区| 日韩免费啪啪| 亚洲成人动漫av| 别急慢慢来1978如如2| 四虎影视精品永久在线观看| 日韩三级视频在线观看| 最近中文字幕无免费| 成人av资源电影网站| 欧美成人在线网站| 亚洲天堂一区在线观看| 久久国产乱子精品免费女| 亚洲精品免费在线视频| 亚洲色大成网站www| 亚洲国产精品成人久久综合一区 | 亚洲免费播放| 国产日韩专区在线| 午夜视频在线免费播放| 国产精品久久综合| 国产黄视频在线| 成人短视频软件网站大全app| 亚洲精品国产精品乱码不99按摩| 久久久精品成人| 亚洲免费黄色| 91九色在线观看| 不卡在线视频| 精品久久久久久久久国产字幕| 自拍偷拍21p| 日韩av网站在线免费观看| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 激情伊人五月天久久综合| 国产一区免费在线| 成人video亚洲精品| 91久久精品网| 亚洲久久久久久| 欧美激情一级片一区二区| 国产精品1区2区在线观看| 亚洲男人第一天堂| 一区二区中文视频| 午夜dv内射一区二区| 成人线上播放| 欧美精品一二区| 91精品视频免费在线观看| 久久久久亚洲蜜桃| 久色视频在线播放| eeuss鲁片一区二区三区| 久久精品国产2020观看福利| 波多野结衣电影在线播放| 丁香天五香天堂综合| 天堂av免费看| 亚洲欧美在线人成swag| 在线视频一区二区| 日本久久综合网| 91丨porny丨户外露出| 久激情内射婷内射蜜桃| 超碰97久久| 欧美黄色片视频| 精品人妻午夜一区二区三区四区| 中文字幕一区二区三区视频| 色综合色综合色综合色综合| 精品国产乱码久久久久久蜜坠欲下| 日本国产精品视频| 色视频免费在线观看| 欧美日韩性生活视频| 污污污www精品国产网站| 欧美日韩一区二区三区四区在线观看| 亚洲自拍另类欧美丝袜| 国产一二三区在线观看| 欧美一区永久视频免费观看| 欧美做爰爽爽爽爽爽爽| 国产乱子轮精品视频| 超碰在线免费观看97| 国产aⅴ精品一区二区四区| 最近2019中文字幕一页二页| 亚洲专区在线播放| 最新成人av在线| 中国老熟女重囗味hdxx| 欧美黄色一区二区| 国产不卡一区二区三区在线观看| 免费网站在线观看人| 精品国产露脸精彩对白 | 日本乱人伦aⅴ精品| 久久只有这里有精品| 水蜜桃久久夜色精品一区的特点| 日韩欧美一区二区三区四区| 日韩一级二级| 日韩中文理论片| 99这里有精品视频| 亚洲国产成人高清精品| 黄瓜视频污在线观看| 久久久久久久高潮| 中文字幕人成一区| 日韩欧美中文字幕在线视频| 欧美精品久久久久久久免费观看 | 97久久精品人人做人人爽50路| 91国视频在线| 精品一区二区三区的国产在线观看| 国产精品私拍pans大尺度在线| gogogogo高清视频在线| 精品福利在线导航| 无码视频一区二区三区| 国产精品久久久久久久浪潮网站| 少妇欧美激情一区二区三区| 日韩图片一区| 色综合666| 欧美中文高清| 欧美中文字幕第一页| 亚洲搞黄视频| 精品成人一区二区三区| 精产国品一区二区| 日韩一区在线看| 波多野结衣有码| 日本欧美在线看| 美女av免费观看| 国产精品一区二区av交换| 91视频-88av| 电影一区二区三| 欧美成人午夜影院| 国产小视频福利在线| 欧美成人一区二区三区| 草莓视频18免费观看| 亚洲精品免费在线观看| 午夜男人的天堂| 久久av资源站| 粗暴91大变态调教| 小说区亚洲自拍另类图片专区| 精品视频一区二区| 91精品国产自产观看在线| 97超碰蝌蚪网人人做人人爽| 久久精品视频观看| 亚洲三级免费看| 亚洲成人第一区| 欧美日韩高清一区二区不卡| 国产精品人人人人| 亚洲亚洲精品在线观看| 国产免费嫩草影院| 久久久精品国产免费观看同学| 免费黄色在线播放| 奇米色一区二区三区四区| 日韩精品 欧美| 欧美日韩调教| av动漫在线播放| 天天av综合| 亚洲日本精品国产第一区| 日韩精品免费一区二区夜夜嗨| 亚洲一区久久久| 最新亚洲国产| 国产成人精品一区二区| 欧亚av在线| 午夜精品在线观看| 日本一级理论片在线大全| 久久天天躁狠狠躁夜夜躁2014| aaa日本高清在线播放免费观看| 日韩久久免费视频| 无码国产伦一区二区三区视频| 日韩欧美中文字幕精品| 国产精品高潮呻吟av| 欧美男同性恋视频网站| 中文字字幕在线中文乱码| 在线视频你懂得一区二区三区| 日本在线播放视频| 色综合一个色综合亚洲| 一本一道无码中文字幕精品热| 婷婷六月综合网| 日韩少妇高潮抽搐| 五月天国产精品| 日韩欧美三级视频| 欧美日韩一区二区在线播放| 国产在线欧美在线| 亚洲va国产va欧美va观看| 久久综合亚洲色hezyo国产| 亚洲在线成人精品| 日韩女优在线观看| 黄色精品在线看| 亚洲婷婷综合网| 欧美色视频一区| 国产乱码精品一区二区| 日韩视频一区二区三区| 亚洲第一精品网站| 亚洲精品国产欧美| 欧美人体大胆444www| 有码中文亚洲精品| 免费高清在线观看| 欧美尺度大的性做爰视频| 欧美aaaxxxx做受视频| 国模吧一区二区三区| 伊人久久在线| 国产精品一区二区久久久| 天天综合在线观看| wwwxx欧美| 欧美美女在线| 自拍视频一区二区三区| 欧美日韩调教| 日本黄色三级大片| 狠狠色狠狠色综合系列| 东京热av一区| 国产亚洲短视频| 极品色av影院| 黄网站色欧美视频| 亚洲成人av网址| 日韩美女一区二区三区| 亚洲av成人无码久久精品老人| 国产亚洲成av人片在线观看桃| 黄色成人影院| 日本a级片电影一区二区| 亚洲国产91视频| 精品久久久三级| 国产精品久久观看| 国产免费黄视频| 国产在线精品国自产拍免费| 精品人妻一区二区三区日产| 中文字幕精品一区二区精品绿巨人| 少妇被躁爽到高潮无码文| 欧美日韩亚洲成人| 999精品国产| 亚洲欧洲高清在线| 2020国产在线视频| 国产成人精品av在线| 我要色综合中文字幕| 日韩欧美亚洲v片| 亚洲第一网站| 久久6免费视频| 国产亚洲一区二区在线观看| 欧美精品一级片| 欧美性色aⅴ视频一区日韩精品| 成人免费视频国产免费麻豆| 日韩视频在线免费| 欧洲av不卡| 国产精品一级久久久| 999视频精品| 国产v亚洲v天堂无码久久久| 国产成a人亚洲精品| 少妇人妻好深好紧精品无码| 五月天丁香久久| 亚洲国产综合一区| www.日韩视频| 91p九色成人| 你懂的网址一区二区三区| 一区视频在线| 欧美一级小视频| 国产精品素人视频| 日本中文字幕第一页| 精品国产成人在线影院| 天堂成人av| 91亚洲精品久久久| 日韩电影在线视频| 亚洲 中文字幕 日韩 无码| 99久久精品国产一区| 妺妺窝人体色www婷婷| 欧美精品v日韩精品v韩国精品v| 黄色片在线免费观看| 欧美在线观看视频| 全球av集中精品导航福利| 香港三级日本三级a视频| 国产综合久久久久影院| 制服丨自拍丨欧美丨动漫丨| 欧美视频在线观看一区二区| 成年人在线观看视频| 日本午夜人人精品| 自拍自偷一区二区三区| 亚洲 高清 成人 动漫| 99视频精品全部免费在线| 国产稀缺真实呦乱在线| 欧美精品一区二区三区蜜桃视频| 天堂8中文在线| 粉嫩精品一区二区三区在线观看| 欧美精品99| 四虎成人免费视频| 亚洲第一主播视频| 日韩在线一区二区三区四区| 欧美精品久久久久久久| 人人网欧美视频| 那种视频在线观看| 久久久99精品免费观看不卡| 黄色av一区二区| 日韩中文字幕网站| 国产高清精品二区| 日韩精品免费一区| 99国产精品久久久久久久久久久| 欧美精品二区三区| 亚洲男人7777| 涩涩涩久久久成人精品| 国产在线拍揄自揄拍无码| 国产aⅴ精品一区二区三区色成熟| 久青草视频在线观看| 日韩成人激情在线| gogo亚洲高清大胆美女人体| 亚洲激情图片| 福利电影一区二区三区| 国产成人一区二区三区影院在线| 亚洲免费av网址| 成人在线视频免费看| 欧美大片免费播放| 91一区二区在线观看| 成人黄色片在线观看| 久久国产天堂福利天堂| 秋霞影院一区二区三区| 91极品视频在线观看| 亚洲狼人国产精品| 色综合888| 亚洲free性xxxx护士hd| 中国女人久久久| 美国黄色片视频| 亚洲国产精品电影在线观看| 欧洲成人一区| 欧美日韩午夜爽爽| 久久久久成人黄色影片| 国产欧美第一页| 日韩av日韩在线观看| 天天操夜夜操国产精品| 特级西西人体wwwww| 欧美肥妇毛茸茸| 免费高潮视频95在线观看网站| 在线观看欧美一区| 91视频免费观看| www.成人精品|