精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

手動實現一個擴散模型DDPM

發布于 2024-4-1 15:44

瀏覽

1收藏

擴散模型是目前大部分AIGC生圖模型的基座，其本質是用神經網絡學習從高斯噪聲逐步恢復圖像的過程，本文用python代碼從零開始構建了一個簡單的擴散模型。

一、理論部分

DDPM(Denoising Diffusion Probabilistic Models) 是一種在生成對抗網絡等技術的基礎上發展起來的新型概率模型去噪擴散模型，與其他生成模型（如歸一化流、GANs或VAEs）相比并不是那么復雜，DDPM由兩部分組成：

一個固定的前向傳播的過程，它會逐漸將高斯噪聲添加到圖像中，直到最終得到純噪聲
一種可學習的反向去噪擴散過程，訓練神經網絡以從純噪聲開始逐漸對圖像進行去噪

手動實現一個擴散模型DDPM-AI.x社區

前向過程

前向擴散過程，其本質上是一個不斷加噪聲的過程。如下圖所示，在貓的圖片中多次增加高斯噪聲直至圖片變成隨機噪音矩陣。可以看到，對于初始數據，我們設置K步的擴散步數，每一步增加一定的噪聲，如果我們設置的K足夠大，那么我們就能夠將初始數據轉化成隨機噪音矩陣。

手動實現一個擴散模型DDPM-AI.x社區

手動實現一個擴散模型DDPM-AI.x社區

手動實現一個擴散模型DDPM-AI.x社區

具體推理驗證可參考：??http://www.egbenz.com/#/my_article/12??

訓練過程

反向生成過程和前向擴散過程相反，是一個不斷去噪的過程。神經網絡從一個隨機高斯噪聲矩陣開始通過擴散模型的Inference過程不斷預測并去除噪聲。

手動實現一個擴散模型DDPM-AI.x社區

手動實現一個擴散模型DDPM-AI.x社區

二、實踐部分

環境包

我們將首先安裝并導入所需的庫。

!pip install -q -U einops datasets matplotlib tqdm


import math
from inspect import isfunction
from functools import partial                                 


%matplotlib inline
import matplotlib.pyplot as plt
from tqdm.auto import tqdm
from einops import rearrange, reduce
from einops.layers.torch import Rearrange


import torch
from torch import nn, einsum
import torch.nn.functional as F

加噪聲

手動實現一個擴散模型DDPM-AI.x社區

下面是一些周期性的函數，這段代碼定義了幾種不同的函數，每個函數都用于計算深度學習中的beta調度（scheduling）。Beta調度主要用于控制噪聲添加的程度，具體代碼如下：

import torch


# cosine_beta_schedule函數用于創建一個余弦退火beta調度。
# 這種調度方法基于余弦函數，并且可以調整隨時間的衰減速率。
def cosine_beta_schedule(timesteps, s=0.008):
    steps = timesteps + 1  # 計算總的步數，需要比時間步多一個，以便計算alpha的累積乘積
    x = torch.linspace(0, timesteps, steps)  # 創建從0到timesteps的均勻分布的張量
    # 計算alpha的累積乘積，使用一個余弦變換，并平方來計算當前步的alpha值
    alphas_cumprod = torch.cos(((x / timesteps) + s) / (1 + s) * torch.pi * 0.5) ** 2
    alphas_cumprod = alphas_cumprod / alphas_cumprod[0]  # 歸一化，確保初始值為1
    betas = 1 - (alphas_cumprod[1:] / alphas_cumprod[:-1])  # 計算每個時間步的beta值
    return torch.clip(betas, 0.0001, 0.9999)  # 對beta值進行裁剪，避免過大或過小


# linear_beta_schedule函數用于創建一個線性退火beta調度。
# 這意味著beta值將從beta_start線性增加到beta_end。
def linear_beta_schedule(timesteps):
    beta_start = 0.0001  # 定義起始beta值
    beta_end = 0.02  # 定義結束beta值
    return torch.linspace(beta_start, beta_end, timesteps)  # 創建一個線性分布的beta值數組


# quadratic_beta_schedule函數用于創建一個二次退火beta調度。
# 這意味著beta值將根據二次函數變化。
def quadratic_beta_schedule(timesteps):
    beta_start = 0.0001  # 定義起始beta值
    beta_end = 0.02  # 定義結束beta值
    # 創建一個線性分布的數組，然后將其平方以生成二次分布，最后再次平方以計算beta值
    return torch.linspace(beta_start**0.5, beta_end**0.5, timesteps) ** 2


# sigmoid_beta_schedule函數用于創建一個sigmoid退火beta調度。
# 這意味著beta值將根據sigmoid函數變化，這是一種常見的激活函數。
def sigmoid_beta_schedule(timesteps):
    beta_start = 0.0001  # 定義起始beta值
    beta_end = 0.02  # 定義結束beta值
    betas = torch.linspace(-6, 6, timesteps)  # 創建一個從-6到6的線性分布，用于sigmoid函數的輸入
    # 應用sigmoid函數，并根據beta_start和beta_end調整其范圍和位置
    return torch.sigmoid(betas) * (beta_end - beta_start) + beta_start

手動實現一個擴散模型DDPM-AI.x社區

# import torch  # 假設在代碼的其他部分已經導入了torch庫


# 定義前向擴散函數
# x_start: 初始數據，例如一批圖像
# t: 擴散的時間步，表示當前的擴散階段
# noise: 可選參數，如果提供，則使用該噪聲數據；否則，將生成新的隨機噪聲
def q_sample(x_start, t, noise=None):
    if noise is None:
        noise = torch.randn_like(x_start)  # 如果未提供噪聲，則生成一個與x_start形狀相同的隨機噪聲張量
        
 # 提取對應于時間步t的α的累積乘積的平方根
    sqrt_alphas_cumprod_t = extract(sqrt_alphas_cumprod, t, x_start.shape)
    # 提取對應于時間步t的1-α的累積乘積的平方根
    sqrt_one_minus_alphas_cumprod_t = extract(
        sqrt_one_minus_alphas_cumprod, t, x_start.shape
    )
  # 返回前向擴散的結果，該結果是初始數據和噪聲的線性組合
    # 系數sqrt_alphas_cumprod_t和sqrt_one_minus_alphas_cumprod_t分別用于縮放初始數據和噪聲
    return sqrt_alphas_cumprod_t * x_start + sqrt_one_minus_alphas_cumprod_t * noise

測試如下：

# take time step
for noise in [10,20,40,80 100]:
  t = torch.tensor([40])
  get_noisy_image(x_start, t)

take time step

for noise in [10,20,40,80 100]: t = torch.tensor([40]) get_noisy_image(x_start, t)

核心殘差網絡

下面是殘差網絡的實現代碼，Block 類是一個包含卷積、歸一化、激活函數的標準神經網絡層。ResnetBlock 類構建了一個殘差塊（residual block），這是深度殘差網絡（ResNet）的關鍵特性，它通過學習輸入和輸出的差異來提高網絡性能。在 ResnetBlock 中，可選的 time_emb 參數和內部的 mlp 允許該Block處理與時間相關的特征。

import torch.nn as nn
from einops import rearrange  # 假設已經導入了einops庫中的rearrange函數
from torch_utils import exists  # 假設已經定義了exists函數，用于檢查對象是否存在


# 定義一個基礎的Block類，該類將作為神經網絡中的一個基本構建模塊
class Block(nn.Module):
    def __init__(self, dim, dim_out, groups=8):
        super().__init__()
        # 一個2D卷積層，卷積核大小為3x3，邊緣填充為1，從輸入維度dim到輸出維度dim_out
        self.proj = nn.Conv2d(dim, dim_out, 3, padding=1)
        # GroupNorm層用于歸一化，分組數為groups
        self.norm = nn.GroupNorm(groups, dim_out)
        # 使用SiLU（也稱為Swish）作為激活函數
        self.act = nn.SiLU()
        
    def forward(self, x, scale_shift=None):
        x = self.proj(x)  # 應用卷積操作
        x = self.norm(x)  # 應用歸一化操作
        # 如果scale_shift參數存在，則對歸一化后的數據進行縮放和位移操作
        if exists(scale_shift):
            scale, shift = scale_shift
            x = x * (scale + 1) + shift
        x = self.act(x)  # 應用激活函數
        return x  # 返回處理后的數據


# 定義一個ResnetBlock類，用于構建殘差網絡中的基本塊
class ResnetBlock(nn.Module):
    """https://arxiv.org/abs/1512.03385"""
    
    def __init__(self, dim, dim_out, *, time_emb_dim=None, groups=8):
        super().__init__()
        # 如果time_emb_dim存在，定義一個小型的多層感知器（MLP）網絡
        self.mlp = (
            nn.Sequential(nn.SiLU(), nn.Linear(time_emb_dim, dim_out))
            if exists(time_emb_dim)
            else None
        )
        # 定義兩個順序的基礎Block模塊
        self.block1 = Block(dim, dim_out, groups=groups)
        self.block2 = Block(dim_out, dim_out, groups=groups)
        # 如果輸入維度dim和輸出維度dim_out不同，則使用1x1卷積進行維度調整
        # 否則使用Identity層（相當于不做任何處理）
        self.res_conv = nn.Conv2d(dim, dim_out, 1) if dim != dim_out else nn.Identity()
        
    def forward(self, x, time_emb=None):
        h = self.block1(x)  # 通過第一個Block模塊
        # 如果存在時間嵌入向量time_emb且存在mlp模塊，則將其應用到h上
        if exists(self.mlp) and exists(time_emb):
            time_emb = self.mlp(time_emb)  # 通過MLP網絡
            # 重整time_emb的形狀以匹配h的形狀，并將結果加到h上
            h = rearrange(time_emb, "b c -> b c 1 1") + h
        h = self.block2(h)  # 通過第二個Block模塊
        return h + self.res_conv(x)  # 將Block模塊的輸出與調整維度后的原始輸入x相加并返回

注意力機制

DDPM的作者把大名鼎鼎的注意力機制加在卷積層之間。注意力機制是Transformer架構的基礎模塊(參考:Vaswani et al., 2017)，Transformer在AI各個領域，NLP,CV等等都取得了巨大的成功，這里Phil Wang實現了兩個變種版本，一個是普通的多頭注意力(用在了transformer中)，另一種是線性注意力機制(參考:Shen et al.,2018)，和普通的注意力在時間和存儲的二次的增長相比，這個版本是線性增長的。

SelfAttention可以將輸入圖像的不同部分（像素或圖像Patch）進行交互，從而實現特征的整合和全局上下文的引入，能夠讓模型建立捕捉圖像全局關系的能力，有助于模型理解不同位置的像素之間的依賴關系，以更好地理解圖像的語義。

在此基礎上，SelfAttention還能減少平移不變性問題，SelfAttention模塊可以在不考慮位置的情況下捕捉特征之間的關系，因此具有一定的平移不變性。

參考:Vaswani et al., 2017 地址：https://arxiv.org/abs/1706.03762
參考:Shen et al.,2018 地址：https://arxiv.org/abs/1812.01243

import torch
from torch import nn
from einops import rearrange
import torch.nn.functional as F


# 定義一個標準的多頭注意力（Multi-Head Attention）機制的類
class Attention(nn.Module):
    def __init__(self, dim, heads=4, dim_head=32):
        super().__init__()
        # 根據維度的倒數平方根來縮放查詢（Query）向量
        self.scale = dim_head ** -0.5
        # 頭的數量（多頭中的"多"）
        self.heads = heads
        # 計算用于多頭注意力的隱藏層維度
        hidden_dim = dim_head * heads
        # 定義一個卷積層將輸入的特征映射到QKV（查詢、鍵、值）空間
        self.to_qkv = nn.Conv2d(dim, hidden_dim * 3, 1, bias=False)
        # 定義一個卷積層將多頭注意力的輸出映射回原特征空間
        self.to_out = nn.Conv2d(hidden_dim, dim, 1)


    def forward(self, x):
        # 獲取輸入的批量大小、通道數、高度和寬度
        b, c, h, w = x.shape
        # 使用to_qkv卷積層得到QKV，并將其分離為三個組件
        qkv = self.to_qkv(x).chunk(3, dim=1)
        # 將QKV重排并縮放查詢向量
        q, k, v = map(
            lambda t: rearrange(t, "b (h c) x y -> b h c (x y)", h=self.heads), qkv
        )
        q = q * self.scale
        # 使用愛因斯坦求和約定計算查詢和鍵之間的相似度得分
        sim = einsum("b h d i, b h d j -> b h i j", q, k)
        # 從相似度得分中減去最大值以提高數值穩定性
        sim = sim - sim.amax(dim=-1, keepdim=True).detach()
        # 應用Softmax函數獲取注意力權重
        attn = sim.softmax(dim=-1)
        # 使用注意力權重對值進行加權
        out = einsum("b h i j, b h d j -> b h i d", attn, v)
        # 將輸出重新排列回原始的空間形狀
        out = rearrange(out, "b h (x y) d -> b (h d) x y", x=h, y=w)
        # 返回通過輸出卷積層的結果
        return self.to_out(out)


# 定義一個線性注意力（Linear Attention）機制的類
class LinearAttention(nn.Module):
    def __init__(self, dim, heads=4, dim_head=32):
        super().__init__()
        # 根據維度的倒數平方根來縮放查詢（Query）向量
        self.scale = dim_head ** -0.5
        # 頭的數量
        self.heads = heads
        # 計算用于多頭注意力的隱藏層維度
        hidden_dim = dim_head * heads
        # 定義一個卷積層將輸入的特征映射到QKV空間
        self.to_qkv = nn.Conv2d(dim, hidden_dim * 3, 1, bias=False)
        # 定義一個順序容器包含卷積層和組歸一化層將輸出映射回原特征空間
        self.to_out = nn.Sequential(nn.Conv2d(hidden_dim, dim, 1),
                                    nn.GroupNorm(1, dim))


    def forward(self, x):
        # 獲取輸入的批量大小、通道數、高度和寬度
        b, c, h, w = x.shape
        # 使用to_qkv卷積層得到QKV，并將其分離為三個組件
        qkv = self.to_qkv(x).chunk(3, dim=1)
        # 將QKV重排，應用Softmax函數并縮放查詢向量
        q, k, v = map(
            lambda t: rearrange(t, "b (h c) x y -> b h c (x y)", h=self.heads), qkv
        )
        q = q.softmax(dim=-2)
        k = k.softmax(dim=-1)
        q = q * self.scale
        # 計算上下文矩陣，是鍵和值的加權組合
        context = torch.einsum("b h d n, b h e n -> b h d e", k, v)
        # 使用上下文矩陣和查詢計算最終的注意力輸出
        out = torch.einsum("b h d e, b h d n -> b h e n", context, q)
        # 將輸出重新排列回原始的空間形狀
        out = rearrange(out, "b h c (x y) -> b (h c) x y", h=self.heads, x=h, y=w)
        # 返回經過輸出順序容器處理的結果
        return self.to_out(out)

位置嵌入

手動實現一個擴散模型DDPM-AI.x社區

如何讓網絡知道目前處于K的哪一步？可以增加一個Time Embedding（類似于Positional embeddings）進行處理，通過將timestep編碼進網絡中，從而只需要訓練一個共享的U-Net模型，就可以讓網絡知道現在處于哪一步了。

Time Embedding正是輸入到ResNetBlock模塊中，為U-Net引入了時間信息（時間步長T，T的大小代表了噪聲擾動的強度），模擬一個隨時間變化不斷增加不同強度噪聲擾動的過程，讓SD模型能夠更好地理解時間相關性。

同時，在SD模型調用U-Net重復迭代去噪的過程中，我們希望在迭代的早期，能夠先生成整幅圖片的輪廓與邊緣特征，隨著迭代的深入，再補充生成圖片的高頻和細節特征信息。由于在每個ResNetBlock模塊中都有Time Embedding，就能告訴U-Net現在是整個迭代過程的哪一步，并及時控制U-Net夠根據不同的輸入特征和迭代階段而預測不同的噪聲殘差。

從AI繪畫應用視角解釋一下Time Embedding的作用。Time Embedding能夠讓SD模型在生成圖片時考慮時間的影響，使得生成的圖片更具有故事性、情感和沉浸感等藝術效果。并且Time Embedding可以幫助SD模型在不同的時間點將生成的圖片添加完善不同情感和主題的內容，從而增加了AI繪畫的多樣性和表現力。

class SinusoidalPositionEmbeddings(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.dim = dim


    def forward(self, time):
        device = time.device
        half_dim = self.dim // 2
        embeddings = math.log(10000) / (half_dim - 1)
        embeddings = torch.exp(torch.arange(half_dim, device=device) * -embeddings)
        embeddings = time[:, None] * embeddings[None, :]
        embeddings = torch.cat((embeddings.sin(), embeddings.cos()), dim=-1)
        return embeddings

手動實現一個擴散模型DDPM-AI.x社區

手動實現一個擴散模型DDPM-AI.x社區

U-net

基于上述定義的DM神經網絡基礎的層和模塊，現在是時候把他組裝拼接起來了：

神經網絡接受一批如下shape的噪聲圖像輸入(batch_size, num_channels, height, width) 同時接受這批噪聲水平,shape=(batch_size, 1)。返回一個張量，shape = (batch_size, num_channels, height, width)

按照如下步驟構建這個網絡：

首先，對噪聲圖像進行卷積處理，對噪聲水平進行進行位置編碼（embedding）
然后，進入一個序列的下采樣階段，每個下采樣階段由兩個ResNet/ConvNeXT模塊+分組歸一化+注意力模塊+殘差鏈接+下采樣完成。
在網絡的中間層，再一次用ResNet/ConvNeXT模塊，中間穿插著注意力模塊(Attention)。
下一個階段，則是序列構成的上采樣階段，每個上采樣階段由兩個ResNet/ConvNeXT模塊+分組歸一化+注意力模塊+殘差鏈接+上采樣完成。
最后，一個ResNet/ConvNeXT模塊后面跟著一個卷積層。

手動實現一個擴散模型DDPM-AI.x社區

class Unet(nn.Module):
    # 初始化函數，定義U-Net網絡的結構和參數
    def __init__(
            self,
            dim,  # 基本隱藏層維度
            init_dim=None,  # 初始層維度，如果未提供則會根據dim計算得出
            out_dim=None,  # 輸出維度，如果未提供則默認為輸入圖像的通道數
            dim_mults=(1, 2, 4, 8),  # 控制每個階段隱藏層維度倍增的倍數
            channels=3,  # 輸入圖像的通道數，默認為3
            with_time_emb=True,  # 是否使用時間嵌入，這對于某些生成模型可能是必要的
            resnet_block_groups=8,  # ResNet塊中的組數
            use_cnotallow=True,  # 是否使用ConvNeXt塊而不是ResNet塊
            convnext_mult=2,  # ConvNeXt塊的維度倍增因子
    ):
        super().__init__()  # 調用父類構造函數
        # 確定各層維度
        self.channels = channels
        init_dim = default(init_dim, dim // 3 * 2)  # 設置或計算初始層維度
        self.init_conv = nn.Conv2d(channels, init_dim, 7, padding=3)  # 初始卷積層，使用7x7卷積核和padding
        dims = [init_dim, *map(lambda m: dim * m, dim_mults)]  # 計算每個階段的維度
        in_out = list(zip(dims[:-1], dims[1:]))  # 創建輸入輸出維度對
        # 根據use_convnext選擇塊類
        if use_convnext:
            block_klass = partial(ConvNextBlock, mult=convnext_mult)
        else:
            block_klass = partial(ResnetBlock, groups=resnet_block_groups)
        # 時間嵌入層
        if with_time_emb:
            time_dim = dim * 4  # 時間嵌入的維度
            self.time_mlp = nn.Sequential(  # 時間嵌入的多層感知機
                SinusoidalPositionEmbeddings(dim),  # 正弦位置嵌入
                nn.Linear(dim, time_dim),  # 線性變換
                nn.GELU(),  # GELU激活函數
                nn.Linear(time_dim, time_dim),  # 再一次線性變換
            )
        else:
            time_dim = None
            self.time_mlp = None
        # 下采樣層
        self.downs = nn.ModuleList([])
        self.ups = nn.ModuleList([])
        num_resolutions = len(in_out)  # 解析的層數
        # 構建下采樣模塊
        for ind, (dim_in, dim_out) in enumerate(in_out):
            is_last = ind >= (num_resolutions - 1)  # 是否為最后一層
            self.downs.append(  # 添加下采樣塊
                nn.ModuleList(
                    [
                        block_klass(dim_in, dim_out, time_emb_dim=time_dim),  # 卷積塊
                        block_klass(dim_out, dim_out, time_emb_dim=time_dim),  # 卷積塊
                        Residual(PreNorm(dim_out, LinearAttention(dim_out))),  # 殘差連接和注意力模塊
                        Downsample(dim_out) if not is_last else nn.Identity(),  # 下采樣或恒等映射
                    ]
                )
            )
        # 中間層（瓶頸層）
        mid_dim = dims[-1]
        # 中間層（瓶頸層）
        # 第一個中間卷積塊
        self.mid_block1 = block_klass(mid_dim, mid_dim, time_emb_dim=time_dim)
        # 中間層的注意力模塊
        self.mid_attn = Residual(PreNorm(mid_dim, Attention(mid_dim)))
        # 第二個中間卷積塊
        self.mid_block2 = block_klass(mid_dim, mid_dim, time_emb_dim=time_dim)


        # 構建上采樣模塊
        for ind, (dim_in, dim_out) in enumerate(reversed(in_out[1:])):
            is_last = ind >= (num_resolutions - 1)  # 是否是最后一次上采樣，減2是因為我們需要留出一個輸出層
            self.ups.append(
                nn.ModuleList(
                    [
                        # 卷積塊，這里輸入維度翻倍是因為上采樣過程中會與編碼器階段的相應層進行拼接
                        block_klass(dim_out * 2, dim_in, time_emb_dim=time_dim),
                        # 卷積塊
                        block_klass(dim_in, dim_in, time_emb_dim=time_dim),
                        # 殘差和注意力模塊
                        Residual(PreNorm(dim_in, LinearAttention(dim_in))),
                        # 上采樣或恒等映射
                        Upsample(dim_in) if not is_last else nn.Identity(),
                    ]
                )
            )


        # 設置或計算輸出維度，如果未提供則默認為輸入圖像的通道數
        out_dim = default(out_dim, channels)
        # 最后的卷積層，將輸出維度變換到期望的輸出維度
        self.final_conv = nn.Sequential(
            block_klass(dim, dim),  # 卷積塊
            nn.Conv2d(dim, out_dim, 1)  # 1x1卷積，用于輸出維度變換
        )


    # 前向傳播函數
    def forward(self, x, time):
        # 初始卷積層
        x = self.init_conv(x)
        # 如果存在時間嵌入層，則將時間編碼
        t = self.time_mlp(time) if exists(self.time_mlp) else None
        # 用于存儲各個階段的特征圖
        h = []


        # 下采樣過程
        for block1, block2, attn, downsample in self.downs:
            x = block1(x, t)  # 應用卷積塊
            x = block2(x, t)  # 應用卷積塊
            x = attn(x)  # 應用注意力模塊
            h.append(x)  # 存儲特征圖以便后續的拼接
            x = downsample(x)  # 應用下采樣或恒等映射


        # 中間層或瓶頸層
        x = self.mid_block1(x, t)  # 第一個中間卷積塊
        x = self.mid_attn(x)  # 中間層的注意力模塊
        x = self.mid_block2(x, t)  # 第二個中間卷積塊


        # 上采樣過程
        for block1, block2, attn, upsample in self.ups:
            # 拼接特征圖和對應的編碼器階段的特征圖
            x = torch.cat((x, h.pop()), dim=1)
            x = block1(x, t)  # 應用卷積塊
            x = block2(x, t)  # 應用卷積塊
            x = attn(x)  # 應用注意力模塊
            x = upsample(x)  # 應用上采樣或恒等映射


        # 最后的輸出層，輸出最終的特征圖或圖像
        return self.final_conv(x)

損失函數

手動實現一個擴散模型DDPM-AI.x社區

下面這段代碼是為擴散模型中的去噪模型定義的損失函數。它計算由去噪模型預測的噪聲和實際加入的噪聲之間的差異。該函數支持不同類型的損失，包括L1損失、均方誤差損失（L2損失）和Huber損失。選擇適當的損失函數可以幫助模型更好地學習如何預測和去除生成數據中的噪聲。

import torch
import torch.nn.functional as F


# 定義損失函數，它評估去噪模型的性能
def p_losses(denoise_model, x_start, t, noise=None, loss_type="l1"):
    if noise is None:
        noise = torch.randn_like(x_start)  # 如果未提供噪聲，則生成一個與x_start形狀相同的隨機噪聲張量


    # 使用q_sample函數生成帶有噪聲的數據x_noisy，這模擬了擴散模型的前向過程
    x_noisy = q_sample(x_start=x_start, t=t, noise=noise)
    # 使用去噪模型對噪聲數據x_noisy進行預測，試圖恢復加入的噪聲
    predicted_noise = denoise_model(x_noisy, t)


    # 根據指定的損失類型計算損失
    if loss_type == 'l1':  # 如果損失類型為L1損失
        loss = F.l1_loss(noise, predicted_noise)  # 使用L1損失函數計算真實噪聲和預測噪聲之間的差異
    elif loss_type == 'l2':  # 如果損失類型為L2損失（均方誤差損失）
        loss = F.mse_loss(noise, predicted_noise)  # 使用均方誤差損失函數計算真實噪聲和預測噪聲之間的差異
    elif loss_type == "huber":  # 如果損失類型為Huber損失
        loss = F.smooth_l1_loss(noise, predicted_noise)  # 使用Huber損失函數，這是L1和L2損失的結合，對異常值不那么敏感
    else:
        raise NotImplementedError()  # 如果指定了未實現的損失類型，則拋出異常


    return loss  # 返回計算得到的損失值

手動實現一個擴散模型DDPM-AI.x社區

開始訓練

if __name__=="__main__":
    for epoch in range(epochs):
        for step, batch in tqdm(enumerate(dataloader), desc='Training'):
          optimizer.zero_grad()
          batch = batch[0]


          batch_size = batch.shape[0]
          batch = batch.to(device)
          # 國內版啟用這段，注釋上面兩行
          # batch_size = batch[0].shape[0]
          # batch = batch[0].to(device)


          # Algorithm 1 line 3: sample t uniformally for every example in the batch
          t = torch.randint(0, timesteps, (batch_size,), device=device).long()


          loss = p_losses(model, batch, t, loss_type="huber")


          if step % 50 == 0:
            print("Loss:", loss.item())


          loss.backward()
          optimizer.step()


          # save generated images
          if step != 0 and step % save_and_sample_every == 0:
            milestone = step // save_and_sample_every
            batches = num_to_groups(4, batch_size)
            all_images_list = list(map(lambda n: sample(model, batch_size=n, channels=channels), batches))
            all_images = torch.cat(all_images_list, dim=0)
            all_images = (all_images + 1) * 0.5
            # save_image(all_images, str(results_folder / f'sample-{milestone}.png'), nrow = 6)
            currentDateAndTime = datetime.now()
            torch.save(model,f"train.pt")

推理結果

手動實現一個擴散模型DDPM-AI.x社區

三、參考文獻

深入學習：Diffusion Model 原理解析（地址：http://www.egbenz.com/#/my_article/12）
【一個本子】Diffusion Model 原理詳解（地址：https://zhuanlan.zhihu.com/p/582072317）
深入淺出擴散模型(Diffusion Model)系列：基石DDPM（模型架構篇），最詳細的DDPM架構圖解（地址：https://zhuanlan.zhihu.com/p/637815071）
一文讀懂Transformer模型的位置編碼（地址：https://zhuanlan.zhihu.com/p/637815071
??https://zhuanlan.zhihu.com/p/632809634??

四、團隊介紹

我們是淘天集團業務技術線的手貓營銷&導購團隊，專注于在手機天貓平臺上探索創新商業化，我們依托淘天集團強大的互聯網背景，致力于為手機天貓平臺提供效率高、創新性強的技術支持。
我們的隊員們來自各種營銷和導購領域，擁有豐富的經驗。通過不斷地技術探索和商業創新，我們改善了用戶的體驗，并提升了平臺的運營效率。
我們的團隊持續不懈地探索和提升技術能力，堅持“技術領先、用戶至上”，為手機天貓的導購場景和商業發展做出了顯著貢獻。

本文轉載自大淘寶技術，作者：修尋

原文鏈接：??https://mp.weixin.qq.com/s/UojH6YRjEWDWnyuWL-oTuA???

標簽

AIGC生圖模型

已于2024-4-1 16:10:03修改

贊 1

收藏 1

回復

舉報

回復

相關推薦

Agents需要一個代碼解釋器

51CTO技術棧 ? 3738瀏覽 ? 0回復
CVPR 2024｜讓圖像擴散模型生成高質量360度場景，只需要一個語言模型

輕薄滴假象 ? 4754瀏覽 ? 0回復
如果老板讓你基于大模型搭建一個系統，怎么選擇一個適合自己任務的大模型？選擇大模型需要考慮哪些問題？

AI探索時代 ? 4031瀏覽 ? 0回復
一個更小、更快、更干凈的 GraphRAG??！

玄姐聊AGI ? 6545瀏覽 ? 0回復
不要上來就大模型，從訓練一個小模型開始

AI探索時代 ? 4329瀏覽 ? 0回復
一個關于學習大模型技術的方法論

AI探索時代 ? 3336瀏覽 ? 0回復
Agent遇上4萬個工具？一個Token搞定！

探索AGI ? 3788瀏覽 ? 0回復
怎么設計一個自己的大模型？設計一個大模型需要哪些能力？

AI探索時代 ? 5036瀏覽 ? 0回復
我訓練了一個醫療多模態大模型幫家里老人看病

一起AI技術 ? 6815瀏覽 ? 0回復
大模型上層應用本質上是一個能力整合的過程

AI探索時代 ? 3469瀏覽 ? 0回復
一個很強大的集成學習算法：XGBoost!

寶寶數模AI ? 4555瀏覽 ? 0回復
使用大模型實現一個聊天機器人思路以及困難點

AI探索時代 ? 4823瀏覽 ? 0回復
討論一個技術問題，大模型流式返回

AI探索時代 ? 5929瀏覽 ? 0回復
如何從0開始構建一個通用AI Agent 智能體架構設計和實現？

玄姐聊AGI ? 6698瀏覽 ? 0回復
從一個簡單的神經網絡模型開始

AI探索時代 ? 3041瀏覽 ? 0回復
怎么實現一個神經網絡？神經網絡的組成結構

AI探索時代 ? 3550瀏覽 ? 0回復
自己打包一個數據集代碼案例——使用Numpy計算框架自定義一個類似MINST的數據集

AI探索時代 ? 3179瀏覽 ? 0回復
快速學會一個機器學習算法：高斯混合模型

寶寶數模AI ? 3301瀏覽 ? 0回復
部署一個大模型，到底需要多大機器？

hm673c38238a021 ? 6762瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

今日arXiv最熱NLP大模型論文：浙大發布歌曲合成工具Prompt-Singer，歌手性別風格均可控！ 2024-04-03 09:44:58發布
華盛頓大學撰文反駁微軟，我們無法刪除大模型關于哈利波特的記憶 2024-04-03 09:33:28發布

熱門推薦

用 Cognee 構建端到端知識圖譜，實現當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

8%價格，2倍速度！國產MiniMax M2暴打Claude Sonnet 4.5？我們實測后發現堪稱性價比之王！ 0回復

上一篇： AIGC在天貓商品海報生成上的探索

下一篇：大模型與數據分析：探索Text-to-SQL

社區精華內容

目錄

av剧情在线观看| 亚洲黄色精品视频| 日韩精品电影| 精品国产一区二区三区av性色| 免费一级特黄毛片| 成全电影播放在线观看国语| 国产麻豆9l精品三级站| 欧美野外猛男的大粗鳮| 中文字幕观看av| 激情视频极品美女日韩| 欧美日韩亚洲国产综合| 热99这里只有精品| 高清全集视频免费在线| 91在线码无精品| 91中文字幕一区| 69视频免费看| 亚洲二区视频| 欧美裸体xxxx极品少妇| 亚洲黄色小说视频| 欧美在线导航| 精品日产卡一卡二卡麻豆| 亚洲欧美激情网| 蜜桃av.网站在线观看| 亚洲视频在线一区二区| 日本高清一区| 香港一级纯黄大片| 国产成a人亚洲精品| 国产精品一区二区三区久久 | 日韩88av| 日韩精品亚洲精品| 国产精品一区二区无码对白| 欧美激情三区| 欧美特级限制片免费在线观看| 日韩五码在线观看| 波多野结衣中文字幕久久| 综合电影一区二区三区 | 欧美成人久久| 精品国产一区二区三区久久久狼 | 九色精品国产蝌蚪| 日韩av影视在线| 麻豆免费在线观看视频| 国产精品亚洲四区在线观看| 欧美美女激情18p| 激情五月俺来也| se69色成人网wwwsex| 欧美性xxxx18| 国产在线播放观看| 免费成人黄色大片| 中文字幕欧美激情| 9国产精品视频| 久久人人爽国产| 国产污片在线观看| 欧美视频二区| 久久久久久久999精品视频| 麻豆成人在线视频| 黄色欧美日韩| 国模精品一区二区三区色天香| 久久国产在线视频| 黄色免费成人| 欧美一性一乱一交一视频| www.伊人久久| 爽好久久久欧美精品| 97视频在线播放| 日本中文字幕第一页| 国产日韩欧美一区| 国产91色在线| 中文字幕观看视频| 韩国av一区二区三区| 91免费看网站| 人妻夜夜爽天天爽| 91论坛在线播放| 日韩中文一区| 黄在线免费观看| 一区二区日韩av| 青青青青草视频| 国产精品扒开腿做爽爽爽视频软件| 色综合久久88色综合天天免费| 国内自拍视频一区| 成人看片网站| 欧美一区二区精品在线| 波多野结衣影院| 日本一二区不卡| 欧美人交a欧美精品| 日韩成人免费观看| 麻豆一区二区三区| 成人看片在线| 青春有你2免费观看完整版在线播放高清| 国产日韩欧美制服另类| 男同互操gay射视频在线看| 欧美草逼视频| 色国产精品一区在线观看| 狠狠操狠狠干视频| 国内精品偷拍| 色婷婷av一区二区三区久久| 国产极品在线播放| 日本伊人午夜精品| eeuss一区二区三区| 欧美色综合一区二区三区| 国产精品久久国产精麻豆99网站| 国产精品三级一区二区| 韩国美女久久| 欧美电影精品一区二区| 一区二区三区视频观看| 日韩视频中文字幕| 中文字幕在线观看日本| 日韩和欧美的一区二区| 亚洲一区二区欧美| 精品国产欧美成人夜夜嗨| 免费在线观看一级片| 日韩三级视频在线播放| 国产美女久久| 日韩精品在线一区| 国产制服丝袜在线| 天天做天天爱综合| 欧美中文在线观看国产| 国产精品自偷自拍| 国产日韩精品视频一区| 国产精品一区二区av交换| 中文国产成人精品久久一| 欧美激情一区二区视频| 国产欧美日韩激情| 91在线短视频| 欧美成人免费| 一区二区三区四区乱视频| 在线成人高清不卡| 一本色道久久综合亚洲二区三区| 性爱视频在线播放| 亚洲私拍视频| av欧美精品.com| 一区二区三区在线观看www| 高潮在线视频| 在线播放91灌醉迷j高跟美女 | 久久精品九九| 国产精品一级久久久| 被黑人猛躁10次高潮视频| 久久精品国产亚洲5555| 欧美成人精品不卡视频在线观看| 中文字幕免费观看视频| 久久久久久一二三区| 国产精品12345| 在线精品自拍| 欧美疯狂性受xxxxx另类| 国产剧情精品在线| 中文字幕亚洲欧美在线不卡| 美女网站免费观看视频| 欧美日本成人| 国产成人一区二区三区电影| 免费a级毛片在线观看| 精品久久久久久久久国产字幕| 久久无码专区国产精品s| 午夜国产精品视频| 超碰97在线播放| 日韩少妇视频| 亚洲成avwww人| 久久9999久久免费精品国产| 粉嫩高潮美女一区二区三区| 老司机午夜网站| 在线视频亚洲欧美中文| 午夜精品一区二区三区视频免费看 | 91激情在线| 欧美日韩成人高清| 欧美人妻一区二区| 99精品欧美一区二区蜜桃免费| www黄色日本| 国产欧美高清视频在线| 国产精品久久久久久久久久新婚| 成人网视频在线观看| 欧美日韩国产免费| 久久精品第一页| 91免费看视频| 密臀av一区二区三区| 久久精品青草| 国产九色91| 日韩电影av| 久久综合电影一区| 亚洲精品国产片| 色综合久久久久久久久久久| 强制高潮抽搐sm调教高h| 成人成人成人在线视频| 日韩在线xxx| 中文字幕免费一区二区| 韩国一区二区三区美女美女秀| 经典三级一区二区| 欧美乱大交xxxxx| 久久精品a一级国产免视看成人| 欧美撒尿777hd撒尿| 校园春色亚洲| 久久亚洲精精品中文字幕早川悠里 | 亚洲色图狂野欧美| 国产伦子伦对白视频| 午夜精品在线视频一区| 影音先锋男人看片资源| 成人一区在线观看| 自拍偷拍21p| 亚洲精品影视| 亚洲一区三区视频在线观看| 国产精品白丝一区二区三区| 国产精品久久久久久久久粉嫩av | 污污网站免费在线观看| 欧美日韩在线亚洲一区蜜芽| 国产在线欧美在线| 国产精品区一区二区三区| 中文字幕人妻一区| 久久精品理论片| 大陆极品少妇内射aaaaa| 91精品福利| 日韩精品无码一区二区三区| 1204国产成人精品视频| 国产在线精品一区免费香蕉 | 国产精品久久久久秋霞鲁丝| 久久大胆人体| 不卡毛片在线看| 东热在线免费视频| 日韩精品久久久久久久玫瑰园| 国产精品久久久久久久免费| 肥臀熟女一区二区三区| 午夜欧美2019年伦理| 日本成人精品视频| 久久奇米777| 手机在线成人av| 国产毛片精品一区| 日韩av片网站| 久久久久99| 成人av一级片| 精久久久久久| 屁屁影院ccyy国产第一页| 日韩精品久久久久久久电影99爱| 久久精品国产一区二区三区日韩| 日韩精品视频在线看| 91精品视频在线| 国产69精品久久久久9999人| 日本一区二区在线播放| 极品在线视频| 国语自产精品视频在线看| 色帝国亚洲欧美在线| 久久久精品免费| 欧美被日视频| 精品国产一区二区三区久久狼黑人 | 裸体一区二区三区| 亚欧在线免费观看| 日韩精品一二三| 国产精品乱码久久久久| 久久一二三四| www欧美激情| 美女国产一区二区| 在线观看免费av网址| 免费成人在线网站| 国产aⅴ爽av久久久久| 久久精品国产一区二区三区免费看 | 欧美日韩亚洲在线| 欧美美女在线观看| 日本免费高清一区| 成人av二区| 青青草原国产免费| 欧美国产专区| 东北少妇不带套对白| 亚洲精品欧洲| 99草草国产熟女视频在线| 美腿丝袜亚洲色图| xxxx在线免费观看| 国产成a人亚洲| 粉嫩av懂色av蜜臀av分享| 26uuu精品一区二区在线观看| 久久久久久亚洲中文字幕无码| 国产日韩欧美精品一区| 国产91在线播放九色| 亚洲视频网在线直播| 久久久综合久久久| 疯狂做受xxxx欧美肥白少妇| 无码人妻精品一区二区| 555www色欧美视频| 亚洲男人天堂久久| 日韩精品福利在线| 日本视频在线免费观看| 欧美日韩福利视频| 在线观看爽视频| 国产精品日韩在线一区| 国产麻豆精品| 久久av一区二区三区亚洲| 成人羞羞网站| 久久久久久久久久伊人| 中文亚洲免费| 三年中文在线观看免费大全中国| 国产a级毛片一区| 一区二区精品免费| 一区二区三区在线观看网站| 西西44rtwww国产精品| 欧美三级电影网站| 午夜小视频免费| 国产午夜精品美女毛片视频| 少妇特黄a一区二区三区| 9999国产精品| 日日摸日日碰夜夜爽无码| 精品成人国产| av在线免费看片| 久久精品视频一区| 欧美成人一二三区| 欧美调教femdomvk| 色综合免费视频| 久久影视电视剧免费网站| 电影网一区二区| 99在线看视频| 日韩电影免费网站| 北条麻妃69av| 国产福利一区二区三区| 久久久精品成人| 高跟丝袜欧美一区| 亚洲精品.www| 久久九九国产精品怡红院| 九九热线视频只有这里最精品| 国产精品对白一区二区三区| 大片网站久久| 国产麻花豆剧传媒精品mv在线| 国产jizzjizz一区二区| av黄色免费在线观看| 欧美最猛性xxxxx直播| 色综合久久久久久| 欧美日本黄视频| 国产精品日本一区二区三区在线| 欧美日韩亚洲一区二区三区四区| 亚洲日本免费| 韩国三级视频在线观看| 亚洲欧美激情一区二区| 亚洲视频中文字幕在线观看| 亚洲色图在线观看| 中文在线8资源库| 国产在线一区二区三区播放| 欧美大片一区| 国产精品igao网网址不卡| 国产精品家庭影院| 性色av一区二区三区四区| 亚洲网在线观看| 欧美最新精品| 欧美日韩精品免费看| 亚洲欧美网站| 少妇一级淫片免费放播放| 五月开心婷婷久久| 天堂在线免费av| 欧美在线观看日本一区| 偷拍亚洲色图| www.com毛片| 91色在线porny| 国产一级精品视频| 日韩精品在线观看网站| 中文字幕在线视频久| 欧美精品二区三区四区免费看视频| 一本色道久久综合亚洲精品不| 182在线视频| 手机成人在线| 欧美调教网站| 午夜精品久久久久久久无码| 99这里只有精品| 日韩特黄一级片| 国产婷婷色综合av蜜臀av | 97精品视频在线| xvideos.蜜桃一区二区| av在线免费观看国产| 99这里只有精品| 在线免费观看国产精品| 一区二区三区动漫| 精品女同一区二区三区在线观看| 伊人av成人| 国产成人在线网站| 日韩免费在线视频观看| 亚洲欧美在线一区| 成人国产激情| 青草全福视在线| 99精品视频中文字幕| 欧美超碰在线观看| 日韩中文字幕网址| 99久久香蕉| 欧美亚洲日本在线观看| 国产精品二三区| 高潮毛片7777777毛片| 啪一啪鲁一鲁2019在线视频| 欧美伦理在线视频| 99视频在线观看视频| 午夜精品久久久久久不卡8050| 男人av在线| 91久久在线播放| 亚洲深夜激情| 日韩成人短视频| 亚洲精品国产精品乱码不99按摩 | 91在线视频成人| 国产亚洲毛片在线| 国精产品久拍自产在线网站| 亚洲国产欧美一区二区丝袜黑人 | 欧美日韩国产美女| av3级在线| 亚洲春色在线视频| 成人激情黄色小说| 91久久久久久久久久久久| 午夜精品视频网站| 99久久99热这里只有精品| 99精品一区二区三区无码吞精| 欧美日韩在线亚洲一区蜜芽| 17videosex性欧美| 亚洲第一精品区| 久久久久久久综合日本| 午夜精品久久久久久久爽 |