精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微調大模型,AMD MI300X就夠了!跟著這篇博客微調Llama 3.1 405B,效果媲美H100

人工智能 新聞
為了優化訓練,在微調 LLaMA 405B 模型,只計算 LoRA 參數的梯度,保持主模型參數不變。

隨著 AI 模型的參數量越來越大,對算力的需求也水漲船高。

比如最近,Llama-3.1 登上了最強開源大模型的寶座,但超大杯 405B 版本的內存就高達 900 多 GB,這對算力構成了更加苛刻的挑戰。

如何降低算力的使用成本和使用門檻,已經成為許多公司尋求突破的關鍵。Felafax 就是其中的一家創業公司,致力于簡化 AI 訓練集群的搭建流程。

Nikhil Sonti 和 Nikhin Sonti 創立了 Felafax,他們的口號是在構建開源 AI 平臺,為下一代 AI 硬件服務,將機器學習的訓練成本降低 30%。

與英偉達相比,AMD 的 GPU,尤其是 MI300X 系列,提供了更高的性價比,按每美元計算,其性能表現更為出色。

最近,Felafax 的聯合創始人 Nikhil Sonti 發布了一篇博客,詳細分享了如何通過 8 張 AMD MI300X GPU 和 JAX 微調 LLaMA 3.1 405B 模型的方法,所有代碼現已開源。

圖片

Github 鏈接:https://github.com/felafax/felafax

機器之心對博客內容進行了不改變原意的編譯、整理,以下是博客內容:

JAX 尤其適合非英偉達硬件

JAX 是一個強大的機器學習庫,結合了類似 NumPy 的 API、自動微分功能以及 Google 的 XLA 編譯器。它在模型并行化方面提供了優秀的 API,因此非常適合像 LLaMA 3.1 405B 這樣的超大模型訓練。

在使用 AMD 硬件時,JAX 有幾個明顯的優勢:

  • 多硬件并行支持:JAX 采用 XLA(加速線性代數)編譯器,將計算編譯為硬件無關的中間表示(HLO),這意味著同樣的 JAX 代碼無需修改便可高效運行在不同硬件后端,包括 AMD GPU。
  • 獨立于底層硬件:XLA 編譯器的優化策略是通用的,不針對某個特定的硬件平臺。這使得任何支持 XLA 的硬件設備(如 CPU、GPU、TPU)都能受益于這些優化,獲得更好的性能表現。
  • 極高的適應性:從 NVIDIA 轉移到 AMD(或其他硬件)時,JAX 只需做極少的代碼改動。而相較之下,PyTorch 與英偉達的 CUDA 生態系統緊密耦合,遷移過程相對復雜。

因此,JAX 成為了我們在非英偉達硬件上的最佳選擇。

拉取 Docker 鏡像:

docker pull rocm/jax:latest

啟動 Docker 容器:

# Pull the Docker Image:
docker pull rocm/jax:latest 


# Start the Docker Container:
docker run -it -w /workspace --device=/dev/kfd --device=/dev/dri --group-add video \ 
--cap-add=SYS_PTRACE --security-opt seccomp=unconfined --shm-size 16G rocm/jax:latest


# Verify the Installation: 
python3 -c 'import jax; print(jax.devices())'

驗證安裝

python3 -c 'import jax; print (jax.devices ())'

訓練使用了一個配備了 8 張 AMD MI300x GPU 的 AMD 節點。每張 MI300x 擁有 192GB 的 HBM3 內存,性能表現與最新的英偉達 H100 GPU 相比非常出色。

圖片

與英偉達 H100 的比較,來源:TensorWave

訓練 LLaMA 405B:性能與可擴展性

使用 JAX,可以成功地在 AMD GPU 上訓練 LLaMA 405B 模型。我們使用 LoRA 微調,將所有模型權重和 LoRA 參數都設為 bfloat16,LoRA rank 設為 8,LoRA alpha 設為 16:

  • 模型大小:LLaMA 模型的權重占用了約 800GB 的顯存。
  • LoRA 權重 + 優化器狀態:大約占用了 400GB 的顯存。
  • 顯存總使用量:占總顯存的 77%,約 1200GB。
  • 限制:由于 405B 模型的規模過大,batch 大小和序列長度的空間有限,使用的 batch size 為 16,序列長度為 64。
  • JIT 編譯:由于空間限制,無法運行 JIT 編譯版本;它可能需要比急切模式稍多的空間。
  • 訓練速度:使用 JAX 急切模式,約為 35 tokens / 秒。
  • 內存效率:穩定在約 70% 左右。
  • 擴展性:在 8 張 GPU 上,使用 JAX 的擴展性接近線性。

由于硬件和顯存的限制,我們無法運行 JIT 編譯版本的 405B 模型,整個訓練過程是在 JAX 的急切模式下執行的,因此還有很大的進步空間。 

下圖中顯示了在一次微調訓練步驟中,8 張 GPU 的顯存利用率和 rocm-smi 輸出:

GPU 利用率:

圖片

顯存利用率:

圖片

rocm-smi 輸出:

圖片

訓練設置 

將 LLaMA 3.1 從 PyTorch 移植到 JAX 

圖片

此前,Nikhil Sonti 分享過如何將 LLaMA 3.1 從 PyTorch 移植到 JAX。他指出,目前 90% 的大型語言模型(LLM)都運行在 NVIDIA GPU 上,但實際上還有一些同樣強大且性價比更高的替代方案。例如,在 Google TPU 上訓練和部署 Llama 3.1 的成本比 NVIDIA GPU 低約 30%。

然而,支持非 NVIDIA 硬件的開發工具較為匱乏。Sonti 最初嘗試使用 PyTorch XLA 在 TPU 上訓練 Llama 3.1,但過程并不順利。XLA 與 PyTorch 的集成不夠完善,缺少一些關鍵的庫(如 bitsandbytes 無法正常運行),同時還遇到了一些難以解決的 HuggingFace 錯誤。

為此,他決定調整策略,將 Llama 3.1 從 PyTorch 移植到 JAX,成功解決了這些問題。Sonti 還錄制了詳細的教程視頻,并開源了所有代碼:

圖片

  • 方法演示:https://dub.sh/felafax-demo
  • 代碼倉庫:https://github.com/felafax/felafax

加載模型,并把模型參數分片

處理像 LLaMA 405B 這樣的超大模型,需要在多個設備之間高效地進行參數分片。以下是如何通過 JAX 實現這一點的。

在 JAX 中進行參數分片

為了將巨大的 LLaMA 405B 模型高效地分布到 8 張 AMD GPU 上,需要使用 JAX 的設備網格(device mesh)功能。

部署代碼:https://github.com/felafax/felafax/blob/e2a96a0e207e1dc70effde099fe33a9e42a7d5cb/llama3_jax/trainer_engine/jax_utils.py#L69

JAX 的設備網格可以幫助我們把可用的設備組織成一個網格,讓我們可以指定如何把模型的參數和計算分配到不同的 GPU 上。

在本文的設置中,需要創建一個形狀為(1, 8, 1)的網格,并將軸分別命名為數據并行(dp)、全分片數據并行(fsdp)和模型并行(mp)。然后,為模型的每個張量定義特定的分片規則,指定這些維度如何沿著這些網格軸進行分片。

DEVICES = jax.devices () 
DEVICE_COUNT = len (DEVICES) 
DEVICE_MESH = mesh_utils.create_device_mesh ((1, 8, 1)) 
MESH = Mesh (devices=DEVICE_MESH, axis_names=("dp", "fsdp", "mp"))

可視化分片

可以使用以下代碼來可視化分片結果,從而方便地驗證分片規則是否按預期應用。

jax.debug.visualize_array_sharding

分片規則

模型不同組件的分片規則如下所示:

  • 參數如何分片:

參數要在 8 個 GPU 之間分配。例如,LM head(lm_head/kernel)張量有兩個軸,按照 PS ("fsdp", "mp") 進行分片。在本例中是 8 和 1,因此可以看到該張量在第一個軸上沿著 8 個 GPU 被拆分。

  • Non-Replicated 參數:

沒有任何分片規范的參數會在所有設備上進行復制。例如,層歸一化(attention_norm/kernel 和 ffn_norm/kernel)沒有設置分片規范,是 PS (None)。

應用分片函數

在加載模型時,使用以下分片函數逐步對模型權重進行分片:

def make_shard_and_gather_fns (partition_specs):
    def make_shard_fn (partition_spec):
        out_sharding = NamedSharding (mesh, partition_spec)
        def shard_fn (tensor):
            return jax.device_put (tensor, out_sharding).block_until_ready ()
        return shard_fn

    shard_fns = jax.tree_util.tree_map (make_shard_fn, partition_specs)
    return shard_fns

# Create shard functions based on partitioning rules
shard_fns = make_shard_and_gather_fns (partitioning_rules)

這使得我們能夠將每個參數放置在指定的設備上,并按照設定的分片進行處理。

分片訓練 Batch

最初,訓練 Batch 是正常創建的,但在輸入模型之前,需要按照下面的代碼在 GPU 上進行分片:

train_batch = jax.device_put ( train_batch, 
NamedSharding (self.mesh, PS ("dp", "fsdp")))

在這里,我們指定訓練 Batch 應該在 "dp" 和 "fsdp" 軸上進行分片,在本例中分別對應于被分成 1 和 8 份,如果把結果可視化出來,如下所示:

分片前:

圖片

在調用  jax.device_put 之后:

圖片

加入 LoRA

LoRA 通過將權重更新分解為低秩矩陣,減少了可訓練參數的數量,這對于微調大型模型特別有效。以下是在 AMD GPU 上微調 Llama 3.1-405 的 LoRA 的要點:

  • 將 LoRA 參數(lora_a 和 lora_b)與主模型參數分開。
  • 使用 jax.lax.stop_gradient (kernel) 來防止對主模型權重的更新。
  • 使用 lax.dot_general 進行快速、精確控制的矩陣運算。
  • LoRA 輸出在添加到主輸出之前會被縮放為 (self.lora_alpha/self.lora_rank)。

LoRADense 層

在此設定一個自定義的 LoRADense 層,該層集成了 LoRA 參數:

class LoRADense (nn.Module):
    features: int
    lora_rank: int = 8
    lora_alpha: float = 16.0
@nn.compact
def __call__(self, inputs: Any) -> Any:
# Original kernel parameter (frozen)
        kernel = self.param ('kernel', ...)
        y = lax.dot_general (inputs, jax.lax.stop_gradient (kernel), ...)
# LoRA parameters (trainable)
        lora_a = self.variable ('lora_params', 'lora_a', ..., ...)
        lora_b = self.variable ('lora_params', 'lora_b', ..., ...)
# Compute LoRA output
        lora_output = lax.dot_general (inputs, lora_a.value, ...)
        lora_output = lax.dot_general (lora_output, lora_b.value, ...)
# Combine original output with LoRA modifications
        y += (self.lora_alpha/self.lora_rank) * lora_output




        return y.astype (self.dtype)

分片 LoRA 參數

為了高效地在設備之間分配 LoRA 參數,我們也通過 JAX 設定了分片規則,這確保了 LoRA 參數與主模型參數的分片一致,優化了內存使用和計算效率。

LoRA A matrices (lora_a)

LoRA A 矩陣(lora_a)

  • 分片規則:PS ("fsdp", "mp")
  • 可視化結果:如下圖所示,lora_a 參數被分片為 (8, 1),這意味著第一個軸在 8 個設備上進行分片("fsdp" 軸),而第二個軸未進行分片。

圖片

LoRA B 矩陣(lora_b)

  • 分片規則:PS ("mp", "fsdp")
  • 可視化結果:如下圖所示,lora_b 參數被分片為 (1, 8),這意味著第二個軸在 8 個設備上進行分片(fsdp 軸),而第一個軸未進行分片。

圖片

這種分片策略優化了參數的分配,減少了通信開銷,并在訓練過程中增強了并行性。它確保每個設備僅持有一部分 LoRA 參數,使得大模型如 LLaMA 405B 的高效擴展成為可能。

僅更新 LoRA 參數 

為了優化訓練,在微調 LLaMA 405B 模型,只計算 LoRA 參數的梯度,保持主模型參數不變。這個方法減少了內存使用,并加速了訓練,因為只更新較少的參數。可以移步 GitHub 倉庫,查看實現細節。

在訓練過程中,每一步都涉及將一批輸入數據通過模型進行處理。由于只有 LoRA 參數是可訓練的,因此模型的預測和計算的損失僅依賴于這些參數,然后對 LoRA 參數進行反向傳播。只更新這些參數簡化了訓練過程,使得在多個 GPU 上高效微調像 LLaMA 405B 這樣的大型模型成為可能。

更多研究細節,請參考原博客。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-24 13:58:25

2024-08-02 14:53:00

2024-08-16 14:00:00

2024-07-24 13:18:17

2023-06-07 08:22:59

LLM微調技術

2024-04-15 12:50:00

大型語言模型ReFT

2023-06-14 12:08:51

2023-08-13 07:44:18

GPU模型英偉達

2024-07-23 09:20:35

2024-12-25 13:33:18

2023-06-28 21:47:54

2025-04-10 07:59:51

2024-09-09 07:46:16

2024-09-06 13:00:29

2023-10-20 17:53:05

2024-04-29 06:46:50

2024-07-29 13:38:06

2024-12-30 00:01:00

多模態大模型Python

2024-07-24 09:20:45

點贊
收藏

51CTO技術棧公眾號

欧洲亚洲精品在线| 国产精品视频| 欧美性生活影院| 天堂社区 天堂综合网 天堂资源最新版| 久久久久亚洲av成人毛片韩| 免费电影一区二区三区| 欧美日韩激情一区二区三区| 狠狠精品干练久久久无码中文字幕 | 天堂网av手机版| 要久久电视剧全集免费| 欧美无人高清视频在线观看| 一区二区三区在线观看www| 亚洲AV无码成人片在线观看| 亚洲一区二区三区高清| 一区二区三区亚洲| 一区二区三区人妻| 免费看av不卡| 亚洲视频一二区| 国产视频精品网| 波多野结衣爱爱| 欧美精品福利| 亚洲免费伊人电影在线观看av| 天天爱天天操天天干| 午夜羞羞小视频在线观看| 99久久夜色精品国产网站| 国产精品视频精品视频| 九九热国产在线| 欧美日韩激情| 精品精品国产高清一毛片一天堂| 国产视频在线视频| 二区三区在线观看| 久久久久国产精品免费免费搜索| 国产精品美女免费视频| 91香蕉一区二区三区在线观看| 亚洲小说春色综合另类电影| 午夜精品久久久久| 天堂av一区二区| 不卡的日韩av| 日本特黄久久久高潮| 97欧美精品一区二区三区| 国精产品视频一二二区| 香蕉视频一区二区三区| 日韩欧美亚洲国产另类| 欧美女同在线观看| 性欧美18~19sex高清播放| 亚洲精品成人在线| 亚洲精品乱码久久久久久蜜桃91| 亚洲人妻一区二区三区| 国产麻豆精品在线| 国产日韩专区在线| 日韩乱码一区二区三区| 9国产精品视频| 欧美日韩高清在线观看| 日韩精品久久久久久久的张开腿让| 久久国产精品色av免费看| 欧美一区二区三区四区高清| 在线观看免费成人av| 国产理论在线| 亚洲va天堂va国产va久| 欧美精品久久96人妻无码| 国产成人天天5g影院在线观看| av一区二区三区四区| eeuss一区二区三区| 一卡二卡三卡在线| 三级不卡在线观看| 日本在线观看天堂男亚洲 | 91精品国产91久久久久久吃药| 亚洲 欧美 国产 另类| 欧美精品系列| 亚洲日本成人女熟在线观看| 国产网站无遮挡| 91综合久久爱com| 日韩一卡二卡三卡四卡| 黄色一级片免费的| 国产精品4hu.www| 色一区在线观看| 中文字幕无码精品亚洲35| 91高清视频在线观看| 一区二区免费在线| 欧美少妇一区二区三区| 爆操欧美美女| 亚洲成人在线免费| 黄色一级片国产| 国产蜜臀在线| 疯狂做受xxxx高潮欧美日本| 少妇高潮喷水久久久久久久久久| 国产精品秘入口18禁麻豆免会员| 国产特黄一级片| 国产一区日韩二区欧美三区| 91国产在线播放| 亚洲国产成人一区二区| 成人av电影免费在线播放| 激情一区二区三区| 成人18在线| 亚洲天堂中文字幕| 97在线国产视频| 成人小电影网站| 欧美亚洲高清一区二区三区不卡| 午夜免费看视频| 6080亚洲理论片在线观看| 亚洲国产日韩欧美在线99| 9.1成人看片免费版| 欧美精选一区二区三区| 美女视频久久黄| 日操夜操天天操| 久久国产精品亚洲77777| 国产精品丝袜久久久久久高清 | 在线看三级电影| 黑人巨大精品欧美一区二区三区| 北条麻妃69av| 成人国产精品入口免费视频| 欧美日韩国产综合一区二区| 亚洲美女性囗交| 精品素人av| 亚洲色图35p| 欧美人妻一区二区| 水野朝阳av一区二区三区| 91视频免费在线| 人成在线免费视频| 亚洲美腿欧美偷拍| 国产麻花豆剧传媒精品mv在线| 亚洲三级在线| 亚洲美女黄色片| 久久久久国产精品夜夜夜夜夜| 日韩精品电影在线| 国产精品一区视频| 秋霞a级毛片在线看| 天天做天天摸天天爽国产一区| 五月婷婷狠狠操| 激情亚洲另类图片区小说区| 中文字幕免费精品一区| 日本熟妇毛茸茸丰满| 青青草国产成人99久久| 国产日韩在线一区二区三区| 黄色精品免费看| 欧美性极品少妇精品网站| 国产精品探花在线播放| 精品国产精品| 欧美亚洲成人xxx| 亚洲大尺度网站| 亚洲同性gay激情无套| 免费国产成人av| 欧美亚洲国产日韩| 九九热这里只有在线精品视| 中文字幕 日韩有码| 91在线观看高清| 91黄色在线看| 国产视频一区二| 日韩中文在线不卡| 亚洲 日本 欧美 中文幕| va亚洲va日韩不卡在线观看| 国产精品久久久久四虎| 成人三级在线| huan性巨大欧美| 欧美视频日韩视频在线观看| 一级特级黄色片| 国产精品精品| 国产精品视频区| 黄色在线网站| 黑人巨大精品欧美一区二区一视频 | 久久人人九九| segui88久久综合9999| 欧美成人a∨高清免费观看| 久久高清内射无套| 久久草av在线| 正在播放91九色| 日韩色性视频| 久久精品一本久久99精品| 亚洲图片视频小说| 综合在线观看色| 在线观看视频你懂得| 中文字幕一区二区精品区| 91九色在线视频| aa在线视频| 精品日韩欧美在线| 国产真人真事毛片| 国产成人三级在线观看| 日韩亚洲欧美视频| 亚洲人成精品久久久| 国产成人精品视频在线| 91女主播在线观看| 69久久99精品久久久久婷婷 | 中文字幕av不卡| 狠狠热免费视频| 精品一区在线| 成人免费视频网| 日本动漫理论片在线观看网站| 欧美一区二区美女| 久久久久久久福利| 26uuu国产一区二区三区| 久久午夜夜伦鲁鲁一区二区| 婷婷激情综合| 国精产品一区二区| 成人开心激情| 久久久精品在线| 亚洲欧美另类综合| 色伊人久久综合中文字幕| 中日韩一级黄色片| 粉嫩av亚洲一区二区图片| 免费黄色日本网站| 国产精品久久久久久久| 国产九色91| 国产激情欧美| 午夜精品久久久久久99热软件| 国产小视频在线播放| 91麻豆精品国产91| 东京热一区二区三区四区| 自拍av一区二区三区| 国产一级二级视频| 久久国产精品99久久久久久老狼| 国产成人亚洲综合无码| 伊人精品一区| 亚洲自拍偷拍色片视频| 伊人久久国产| 久久这里有精品视频| 外国精品视频在线观看| 色哟哟亚洲精品| 亚洲一级理论片| 国产盗摄视频一区二区三区| 亚洲免费黄色网| 欧美在线播放| 日韩一区国产在线观看| 欧美日日夜夜| 91免费版网站入口| 视频二区不卡| 97久久精品在线| caoporm免费视频在线| 亚洲免费视频在线观看| 亚洲第一黄色片| 欧美美女一区二区三区| 日产精品久久久久久久| 亚洲精品免费在线| 四虎影视一区二区| 久久久99久久| 久久人妻少妇嫩草av无码专区| 国产一区在线看| 五月婷婷狠狠操| 久久xxxx精品视频| 九九爱精品视频| 欧美特黄一级| 特级西西人体www高清大胆| 日本一二区不卡| 色中色综合成人| 香蕉一区二区| 久久精品国产一区二区三区日韩| 日韩欧美另类中文字幕| 91精品视频免费| 日韩性xxx| 91高清视频免费| 日韩欧美一中文字暮专区| 欧美另类精品xxxx孕妇| www久久日com| 久久影视免费观看| 在线激情小视频| 最近2019年好看中文字幕视频 | 亚洲一区二区电影| 国产欧美最新羞羞视频在线观看| 国产免费不卡| 日本人成精品视频在线| 中文在线а√天堂| 欧美一级免费视频| 夜鲁夜鲁夜鲁视频在线播放| 韩国v欧美v日本v亚洲| 国产精品186在线观看在线播放| 美女av一区二区三区| 日韩av激情| 欧美激情一级精品国产| h片在线观看视频免费| 午夜精品久久17c| 国产免费拔擦拔擦8x高清在线人| 久久久久久亚洲精品不卡| 超碰资源在线| 欧美最猛性xxxxx(亚洲精品)| 亚洲精品福利电影| 国产精品久久久久久超碰| 日韩色淫视频| 成人免费淫片视频软件| 国产精品久久久久久av公交车| 91久久国产综合久久蜜月精品| 天堂va在线高清一区| 韩国成人av| 精品视频在线你懂得| 久久综合九色欧美狠狠| 日韩在线观看| 69精品丰满人妻无码视频a片| 红桃视频国产一区| 国产成人无码精品久久久性色| 日韩国产在线观看一区| 在线播放av中文字幕| 国产成人免费视频网站| 成人h动漫精品一区| 国产精品理论在线观看| 欧产日产国产v| 五月天激情小说综合| 无码人妻一区二区三区免费| 欧美精品在线视频| 殴美一级特黄aaaaaa| 亚洲视频欧美视频| 伦xxxx在线| 91黄色8090| 色综合一区二区日本韩国亚洲 | 成人性生活视频免费看| 久久亚洲电影| 337p日本欧洲亚洲大胆张筱雨| 99re6这里只有精品视频在线观看| 91麻豆精品国产91久久综合| 一区二区三区免费在线观看| 久久久久久久久久一区二区三区 | 欧美成人精品高清在线播放 | 久久精品国产福利| 国产区一区二区三区| 欧美熟乱15p| 成人免费性视频| 麻豆精品一二三| 亚洲少妇18p| 亚洲天堂免费看| 美女又爽又黄免费视频| 欧美一区二区成人6969| 欧美孕妇孕交| 欧美乱大交xxxxx| 巨胸喷奶水www久久久| 国产精品国产三级国产专区53| 色喇叭免费久久综合| 无罩大乳的熟妇正在播放| 国产精品亚洲专一区二区三区| 亚洲精品午夜视频| 亚洲成人综合网站| 国产老女人乱淫免费| 亚洲三级av在线| 日本三级一区| 国产 高清 精品 在线 a| 97视频热人人精品免费| 国产裸体舞一区二区三区| 国内久久精品视频| 欧美激情aaa| 亚洲成人第一页| 亚洲精品国产suv一区| 久久国内精品一国内精品| 吞精囗交69激情欧美| 国产欧美日韩综合一区在线观看| 一个色综合网| 免费成年人高清视频| 国产午夜亚洲精品午夜鲁丝片| 日韩毛片在线播放| 欧美久久高跟鞋激| bbbbbbbbbbb在线视频| 欧美在线视频观看| 农村少妇一区二区三区四区五区 | 精品国产91| 精品人妻少妇一区二区| 国产在线国偷精品产拍免费yy| 日本美女bbw| 色婷婷久久一区二区三区麻豆| 你懂的在线看| 清纯唯美亚洲激情| 天天躁日日躁狠狠躁欧美巨大小说| 亚洲国产精品无码观看久久| 国产成人免费网站| 黄色小视频在线免费看| 欧美一区日本一区韩国一区| 久草免费在线| 91久久精品美女高潮| 91精品一区二区三区综合在线爱| 九九热精品在线播放| 国产精品国产三级国产专播品爱网 | 老司机精品视频导航| 国产三级黄色片| 欧美丝袜丝nylons| 91se在线| 国产成人一区三区| 国产99久久精品一区二区300| 日本三级免费网站| 97精品久久久久中文字幕| 久久av高潮av无码av喷吹| 5月丁香婷婷综合| 中文字幕在线观看日本| 成人黄色激情网| 黄色亚洲大片免费在线观看| 男人网站在线观看| 欧美日韩一区二区在线播放| 免费动漫网站在线观看| 国产精品白嫩美女在线观看| 成人羞羞动漫| 亚洲精品成人在线播放| 亚洲男人的天堂在线观看| 国产chinasex对白videos麻豆| 欧美黑人一区二区三区| 精品三级av| 国产aaaaa毛片| 亚洲激情欧美激情| 天天综合天天色| 国产精品成人播放| 亚洲精品网址| 亚洲综合自拍网| 欧美影片第一页| √天堂8在线网| 久久久久久亚洲精品不卡4k岛国| 日韩电影一二三区| 老女人性淫交视频| 亚洲欧美变态国产另类|