精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

定制化算子融合,大幅提升AI端到端性能

人工智能 新聞
Composable Kernel(CK)庫(kù)旨在提供一套在 AMD GPU 上算子融合的后端方案,該研究希望未來(lái)能夠移植到 AMD 的所有 GPU 上,并且最終也可以被移植到 AMD CPU 上,該項(xiàng)目已開(kāi)源。與Meta AITemplate的深度合作大幅提升了AI模型在AMD GPU的端到端性能。

圖片

圖優(yōu)化在降低 AI 模型的訓(xùn)練和推理使用的時(shí)間和資源方面起著重要作用。圖優(yōu)化的一個(gè)重要功能是模型中將可以融合的算子進(jìn)行融合,通過(guò)降低內(nèi)存占用和減少數(shù)據(jù)在低速內(nèi)存中的搬運(yùn)來(lái)提高計(jì)算效率。然而,實(shí)現(xiàn)一套能夠提供各種算子融合的后端方案難度很大,導(dǎo)致在實(shí)際硬件上 AI 模型能夠使用的算子融合非常有限。

Composable Kernel (CK)庫(kù)旨在提供一套在 AMD GPU 上的算子融合的后端方案。CK 使用通用編程語(yǔ)言 HIP C++,完全開(kāi)源。其設(shè)計(jì)理念包括:

  • 高性能 & 高生產(chǎn)力:CK 的核心是一組精心設(shè)計(jì),高度優(yōu)化,可復(fù)用的基礎(chǔ)模塊。CK 庫(kù)內(nèi)所有的算子都是通過(guò)組合這些基礎(chǔ)模塊實(shí)現(xiàn)的。復(fù)用這些基礎(chǔ)模塊大大縮短開(kāi)發(fā)后端算法的周期,同時(shí)還能保證高性能。
  • 精通當(dāng)前的 AI 問(wèn)題,快速適應(yīng)未來(lái)的 AI 問(wèn)題:CK 旨在提供一套完整的 AI 算子后端方案,這讓復(fù)雜的算子融合成為可能,因?yàn)檫@樣讓整個(gè)后端都可以用 CK 實(shí)現(xiàn),而不需依賴(lài)外部算子庫(kù)。CK 的可復(fù)用基礎(chǔ)模塊足以實(shí)現(xiàn)常見(jiàn) AI 模型(機(jī)器視覺(jué),自然語(yǔ)言處理,等等)所需的各種算子及其融合。當(dāng)新出現(xiàn)的 AI 模型需要新的算子時(shí),CK 也將會(huì)提供所需的基礎(chǔ)模塊。
  • AI 系統(tǒng)專(zhuān)家的簡(jiǎn)單但強(qiáng)大的工具:CK 所有的算子都是用 HIP C++ 模版實(shí)現(xiàn)的。AI 系統(tǒng)專(zhuān)家可以通過(guò)實(shí)例化模版來(lái)定制這些算子的屬性,比如數(shù)據(jù)類(lèi)型,元操作類(lèi)型,張量存儲(chǔ)格式,等等。這通常只需要幾行代碼。
  • 友好的 HIP C++ 界面:HPC 算法開(kāi)發(fā)者一直在推動(dòng)著 AI 計(jì)算加速的前沿。CK 的一個(gè)重要設(shè)計(jì)理念就是要讓 HPC 算法開(kāi)發(fā)者更容易對(duì) AI 加速作出貢獻(xiàn)。因此 CK 所有核心模塊都是用 HIP C++ 實(shí)現(xiàn),而不是 Intermediate Representation (IR)。HPC 算法開(kāi)發(fā)者直接以他們熟悉的編寫(xiě) C++ 代碼的形式編寫(xiě)算法,而無(wú)需像基于 IR 的算子庫(kù)那樣,以通過(guò)編寫(xiě)針對(duì)某種特定算法的 Compiler Pass 來(lái)實(shí)現(xiàn)。這樣做可以大大提高算法的迭代速度。
  • 可移植性:今天使用 CK 作為后端的圖優(yōu)化將能夠移植到未來(lái) AMD 的所有的 GPU 上,并且最終也可以被移植到 AMD CPU 上【2】。
  • CK 源代碼:https://github.com/ROCmSoftwarePlatform/composable_kernel

核心概念

CK 引入了兩個(gè)概念以提高后端開(kāi)發(fā)者的生產(chǎn)力:

1. 開(kāi)創(chuàng)性的引入“張量坐標(biāo)變換” (Tensor Coordinate Transformation)降低 AI 算子的編寫(xiě)復(fù)雜度。該研究開(kāi)創(chuàng)性地定義了一組可復(fù)用的 Tensor Coordinate Transformation 基礎(chǔ)模塊,并且用它們把復(fù)雜的 AI 算子(比如卷積,group normalization reduction,Depth2Space,等等)以數(shù)學(xué)嚴(yán)謹(jǐn)?shù)姆绞街匦卤磉_(dá)成了最基礎(chǔ)的 AI 算子(GEMM,2D reduction,tensor transfer,等等)。這項(xiàng)技術(shù)可以讓為基礎(chǔ) AI 算子編寫(xiě)的算法直接被用到所有與之對(duì)應(yīng)的復(fù)雜的 AI 算子上,而無(wú)需重寫(xiě)算法。

2. 基于 Tile 的編程范式:開(kāi)發(fā)算子融合的后端算法可以被看成先將每一個(gè)融合前的算子(獨(dú)立算子)拆解成許多 “小塊” 的數(shù)據(jù)操作,然后再把這些 “小塊” 操作組合成融合的算子。每一個(gè)這樣的 “小塊” 操作都對(duì)應(yīng)一個(gè)原始的獨(dú)立算子,但是被操作的數(shù)據(jù)只是原始張量的一部分(tile),因此這樣的 “小塊” 操作被稱(chēng)為 Tile Tensor Operator。CK 庫(kù)包含一組針對(duì) Tile Tensor Operator 的高度優(yōu)化的實(shí)現(xiàn),CK 里所有的 AI 獨(dú)立算子和融合算子都是用它們實(shí)現(xiàn)的。目前,這些 Tile Tensor Operators 包括 Tile GEMM,Tile Reduction 和 Tile Tensor Transfer。每一個(gè) Tile Tensor Operator 都有針對(duì) GPU thread block,warp 和 thread 的實(shí)現(xiàn)。

Tensor Coordinate Transformation 和 Tile Tensor Operator 共同組成了 CK 的可復(fù)用的基礎(chǔ)模塊。

圖片

圖 1,使用 CK 的 Tensor Coordinate Transformation 基礎(chǔ)模塊將 convolution 算子表達(dá)成 GEMM 算子

圖片

圖 2,CK 的組成(下:可復(fù)用的基礎(chǔ)模塊;上:獨(dú)立算子與融合算子)

代碼結(jié)構(gòu)

CK 庫(kù)結(jié)構(gòu)分為四層,從下到上分別是:Templated Tile Operator,Templated Kernel and Invoker,Instantiated Kernel and Invoker 和 Client API【3】。每一層對(duì)應(yīng)不同的開(kāi)發(fā)者。

  • AI 系統(tǒng)專(zhuān)家:“我需要一個(gè)后端方案提供高性能的獨(dú)立和融合算子讓我可以直接使用”。這個(gè)例子【4】里用的 Client API 和 Instantiated Kernel and Invoker 提供了預(yù)先實(shí)例化并編譯好的對(duì)象,以滿(mǎn)足這類(lèi)開(kāi)發(fā)者的需求。
  • AI 系統(tǒng)專(zhuān)家:“我為一個(gè)開(kāi)源的 AI 框架做最先進(jìn)的圖優(yōu)化工作。我需要一個(gè)能夠?yàn)閳D優(yōu)化所需的所有融合算子提供高性能 kernel 的后端方案。同時(shí)我也需要定制這些 kernel,所以像 “要么接受,要么棄用” 的黑盒解決方案不能滿(mǎn)足我的需求”。Templated Kernel and Invoker 層能滿(mǎn)足這類(lèi)開(kāi)發(fā)者。比如這個(gè)例子【5】中開(kāi)發(fā)者可以自己使用 Templated Kernel and Invoker 層實(shí)例化出所需的 FP16 的 GEMM + Add + Add + FastGeLU 的 kernel。
  • HPC 算法專(zhuān)家:“我的團(tuán)隊(duì)為公司內(nèi)部不斷迭代的 AI 模型開(kāi)發(fā)高性能后端算法。我們團(tuán)隊(duì)中有 HPC 算法專(zhuān)家,但我們?nèi)匀幌M梢酝ㄟ^(guò)復(fù)用和改進(jìn)硬件供應(yīng)商提供的高度優(yōu)化的源代碼來(lái)提高我們的生產(chǎn)力,并且讓我們的代碼可以被移植到未來(lái)的硬件構(gòu)架上。我們希望可以不用通過(guò)與硬件提供商分享我們的代碼來(lái)做到這點(diǎn)”。Templated Tile Operator 層可以幫助到這一類(lèi)開(kāi)發(fā)者。比如這個(gè)代碼【6】中開(kāi)發(fā)者使用 Templated Tile Operator 來(lái)實(shí)現(xiàn) GEMM 的優(yōu)化管線(xiàn)。

圖片

圖 3,CK 庫(kù)四層結(jié)構(gòu)

基于 AITemplate + CK 的端到端模型推理

Meta 的 AITemplate 【7】(AIT)是一個(gè)統(tǒng)一 AMD 和 Nvidia GPU 的 AI 推理系統(tǒng)。AITemplate 使用 CK 作為其 AMD GPU 上的后端,它使用的是 CK 的 Templated Kernel and Invoker 層。

AITemplate + CK 在 AMD Instinct? MI250 上取得了多個(gè)重要 AI 模型最先進(jìn)的推理性能。CK 里大多數(shù)先進(jìn)的融合算子的定義,都是在 AITemplate 團(tuán)隊(duì)的遠(yuǎn)見(jiàn)下推動(dòng)的。許多融合算子的算法也是由 CK 和 AITemplate 團(tuán)隊(duì)共同設(shè)計(jì)。

本文比較了幾個(gè)端到端模型在 AMD Instinct MI250 和同級(jí)別產(chǎn)品【8】的性能表現(xiàn)。本文中所有 AMD Instinct MI250 的 AI 模型的性能數(shù)據(jù)都是用 AITemplate【9】 + CK【10】取得的。

實(shí)驗(yàn)

ResNet-50

下圖顯示了 AMD Instinct MI250 上的 AIT + CK 與 A100-PCIe-40GB 和 A100-DGX-80GB 上的 TensorRT v8.5.0.12 【11】(TRT)的性能比較。結(jié)果顯示 AMD Instinct MI250 上的 AIT + CK 取得了相比于 A100-PCIe-40GB 上的 TRT 1.08 倍的加速。

圖片

BERT

一個(gè)基于 CK 實(shí)現(xiàn)的 Batched GEMM + Softmax + GEMM 融合算子模版,可以完全消除掉中間結(jié)果在 GPU 計(jì)算單元(Compute Unit)與 HBM 之間的搬運(yùn)。通過(guò)使用這個(gè)融合算子模版,attention layer 許多原本是帶寬瓶頸(bandwidth bound)的問(wèn)題變成了計(jì)算瓶頸(compute bound)的問(wèn)題,這樣可以更好發(fā)揮 GPU 的計(jì)算能力。這個(gè) CK 的實(shí)現(xiàn)深受 FlashAttention 【12】的啟發(fā),并比原始的 FlashAttention 的實(shí)現(xiàn)減少了更多的數(shù)據(jù)搬運(yùn)。

下圖顯示了 AMD Instinct MI250 上的 AIT + CK 與 A100-PCIe-40GB 和 A100-DGX-80GB 上的 FasterTransformer v5.1.1 bug fix 【13】(FT)的 Bert Base 模型(uncased)的性能比較。當(dāng) Sequence 是 4096 時(shí),F(xiàn)T 在 A100-PCIe-40GB 和 A100-DGX-80GB 上會(huì)在 Batch 32 時(shí) GPU 內(nèi)存溢出。因此,在 Sequence 是 4096 時(shí),本文只顯示 Batch 16 的結(jié)果。結(jié)果顯示 AMD Instinct MI250 上的 AIT + CK 取得了相比于 A100-PCIe-40GB 上的 FT 3.28 倍,以及相比于 A100-DGX-80GB 上的 FT 2.91 倍的加速。

圖片

Vision Transformer (VIT)

下圖顯示了 AMD Instinct MI250 上的 AIT + CK 與 A100-PCIe-40GB 和 A100-DGX-80GB 上的 TensorRT v8.5.0.12(TRT)的 Vision Transformer Base (224x224 圖片)的性能比較。結(jié)果顯示 AMD Instinct MI250 上的 AIT + CK 取得了相比于 A100-PCIe-40GB 上的 TRT 1.8 倍,以及相比于 A100-DGX-80GB 上的 TRT 1.4 倍的加速。

圖片

Stable Diffusion

端到端的 Stable Diffusion

下表顯示 AIT + CK 在 AMD Instinct MI250 上 Stable Diffusion 端到端(Batch 1,2,4, 6)的性能數(shù)據(jù)。當(dāng) Batch 是 1 時(shí),在 MI250 上只有一個(gè) GCD 被使用,而在 Batch 2,4,6 時(shí),兩個(gè) GCD 都被使用了。

圖片

Stable Diffusion 中的 UNet

不過(guò)本文還沒(méi)有關(guān)于使用 TensorRT 運(yùn)行 Stable Diffusion 端到端模型的公開(kāi)的信息。但這篇文章“Make stable diffusion 25% faster using TensorRT” 【14】說(shuō)明了怎么使用 TensorRT 加速 Stable Diffusion 中的 UNet 模型。UNet 是 Stable Diffusion 中最重要最花時(shí)間的部分,因此 UNet 的性能大致反應(yīng)了 Stable Diffusion 的性能。

下圖顯示了 AMD Instinct MI250 上的 AIT + CK 與 A100-PCIe-40GB 和 A100-DGX-80GB 上的 TensorRT v8.5.0.12(TRT)的 UNet 的性能比較。結(jié)果顯示 AMD Instinct MI250 上的 AIT + CK 取得了相比于 A100-PCIe-40GB 上的 TRT 2.45 倍,以及相比于 A100-DGX-80GB 上的 TRT 2.03 倍的加速。

圖片

更多信息

ROCm webpage: AMD ROCm? Open Software Platform | AMD

ROCm Information Portal: AMD Documentation - Portal

AMD Instinct Accelerators: AMD Instinct? Accelerators | AMD

AMD Infinity Hub: AMD Infinity Hub | AMD

Endnotes:

1.Chao Liu is PMTS Software Development Engineer at AMD. Jing Zhang is SMTS Software Development Engineer at AMD. Their postings are their own opinions and may not represent AMD’s positions, strategies, or opinions. Links to third party sites are provided for convenience and unless explicitly stated, AMD is not responsible for the contents of such linked sites and no endorsement is implied. GD-5

2.CK for CPU is in early development phase.

3.C++ APIs for now, Python APIs are under planning.

4.Example of CK “Client API” for GEMM + Add + Add + FastGeLU fused operator. https://github.com/ROCmSoftwarePlatform/composable_kernel/blob/685860c2a9483c9e909d2f8bfb95056672491...

5.Example of CK “Templated Kernel and Invoker” of GEMM + Add + Add + FastGeLU fuse operator. https://github.com/ROCmSoftwarePlatform/composable_kernel/blob/685860c2a9483c9e909d2f8bfb95056672491...

6.Example of using CK “Templated Tile Operator” primitives to write a GEMM pipeline. https://github.com/ROCmSoftwarePlatform/composable_kernel/blob/685860c2a9483c9e909d2f8bfb95056672491...

7.Meta’s AITemplate GitHub repository. https://github.com/facebookincubator/AITemplate

8.MI200-71: Testing Conducted by AMD MLSE 10.23.22 using AITemplate https://github.com/ROCmSoftwarePlatform/AITemplate, commit f940d9b) + Composable Kernel  https://github.com/ROCmSoftwarePlatform/composable_kernel, commit 40942b9) with ROCm?5.3 running on 2x AMD EPYC 7713 64-Core Processor server with 4x AMD Instinct MI250 OAM (128 GB HBM2e) 560W GPU with AMD Infinity Fabric? technology vs. TensorRT v8.5.0.12 and FasterTransformer (v5.1.1 bug fix) with CUDA? 11.8 running on 2x AMD EPYC 7742 64-Core Processor server with 4x Nvidia A100-PCIe-40GB (250W) GPU and TensorRT v8.5.0.12 and FasterTransformer (v5.1.1 bug fix) with CUDA? 11.8 running on 2xAMD EPYC 7742 64-Core Processor server with 8x NVIDIA A100 SXM 80GB (400W) GPU. Server manufacturers may vary configurations, yielding different results. Performance may vary based on factors including use of latest drivers and optimizations. 

9.https://github.com/ROCmSoftwarePlatform/AITemplate/tree/f940d9b7ac8b976fba127e2c269dc5b368f30e4e

10.https://github.com/ROCmSoftwarePlatform/composable_kernel/tree/40942b909801dd721769834fc61ad201b5795...

11.TensorRT GitHub repository. https://github.com/NVIDIA/TensorRT

12.FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness. https://arxiv.org/abs/2205.14135

13.FasterTransformer GitHub repository. https://github.com/NVIDIA/FasterTransformer

14.Making stable diffusion 25% faster using TensorRT. https://www.photoroom.com/tech/stable-diffusion-25-percent-faster-and-save-seconds/

15.During their time in AMD

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2023-04-10 09:15:25

Vite 4.3SWC 插件

2022-10-19 12:17:49

Android性能優(yōu)化

2022-08-30 09:24:47

數(shù)據(jù)算法

2011-04-22 09:25:37

思科數(shù)據(jù)中心交換矩陣融合技術(shù)

2024-02-19 16:06:53

人工智能AI聲音克隆Python

2012-08-24 09:34:58

戴爾

2023-11-09 08:46:24

2023-11-26 09:04:10

Vue性能

2024-07-09 10:24:13

2009-06-12 15:35:36

直播

2009-07-14 13:28:54

微軟虛擬化服務(wù)器虛擬化hyperv

2012-10-17 14:48:23

CA

2013-09-25 17:31:08

Storwize V5虛擬化存儲(chǔ)

2014-07-07 17:40:34

云智慧

2014-06-25 10:43:43

華為

2014-12-19 09:46:44

透視寶

2014-08-14 11:52:34

ITILAPM

2024-04-29 18:55:16

緩存Spring性能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

成人精品一区二区三区中文字幕| 五月天久久网站| 日韩欧美中文字幕在线播放| 欧美日韩国产综合视频在线| 国产免费久久久| 亚洲人成在线影院| 最新中文字幕亚洲| 日韩成人av一区二区| 日韩在线电影| 福利视频一区二区| 黄色a级在线观看| 亚洲日本国产精品| 蜜桃av一区二区在线观看 | av男人的天堂在线| 国产成人在线免费观看| 国产精品视频不卡| 久久久国产高清| 亚洲一区 二区 三区| 亚洲欧美制服中文字幕| 国产日韩视频一区| 日韩在线激情| 欧美中文字幕一区二区三区| 欧美亚洲日本一区二区三区| 九义人在线观看完整免费版电视剧| 91啪九色porn原创视频在线观看| 亚洲影院高清在线| 中文字幕一区2区3区| 免费在线成人| 97色伦亚洲国产| 久久黄色小视频| 亚洲91中文字幕无线码三区| 欧美日韩国产一级片| 日本国产在线播放| 色yeye免费人成网站在线观看| 日本一区二区三区在线观看| 九色综合日本| 色婷婷av一区二区三区之e本道| 久久av中文字幕片| 国产精品午夜一区二区欲梦| 国产伦精品一区二区三区视频网站| 国内精品福利| 欧美激情精品久久久久久久变态| 91杏吧porn蝌蚪| 久久久9色精品国产一区二区三区| 国产亚洲视频中文字幕视频| 国产高潮呻吟久久| 欧洲福利电影| 最近2019中文免费高清视频观看www99| 精品人妻无码一区二区三区 | 男女在线视频| 亚洲精品国产无套在线观| 人人妻人人澡人人爽精品欧美一区| 91在线直播| 国产精品网站在线观看| 亚洲精品在线视频观看| 日韩毛片久久久| 中文字幕一区二区三| 一区二区三视频| 成码无人av片在线观看网站| 一区二区三区中文字幕| 美女av免费观看| 爱福利在线视频| 亚洲超碰97人人做人人爱| 日韩精品在线视频免费观看| f2c人成在线观看免费视频| 亚洲国产综合色| 日韩免费视频播放| 韩国成人漫画| 欧美色综合天天久久综合精品| 亚洲36d大奶网| 国产成年精品| 精品国产91亚洲一区二区三区婷婷| 在线看黄色的网站| 九九久久电影| 精品久久国产精品| 国产午夜精品无码| 久久久久久亚洲精品杨幂换脸| 国产精品海角社区在线观看| 国产精品久久无码一三区| 国产69精品久久久久毛片| 精品一区二区三区日本| а√天堂中文在线资源bt在线| 亚洲欧洲精品一区二区三区| 成年人深夜视频| 男人皇宫亚洲男人2020| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 国产精品嫩草影院8vv8 | 免费精品视频在线| 亚洲影院污污.| 外国精品视频在线观看 | 欧美极品xxx| 成人毛片100部免费看| 小草在线视频免费播放| 777色狠狠一区二区三区| 800av在线播放| 日韩欧美不卡| 97色在线视频| 国产精品国产精品国产专区| 99综合电影在线视频| 一区二区三区四区| 蜜桃视频m3u8在线观看| 欧美日韩国产区一| 波多野结衣 在线| 狠狠综合久久| 91美女片黄在线观| 国产天堂在线| 午夜激情综合网| 国产美女视频免费看| 亚洲宅男网av| 久久久久久久影院| 国产人妖在线播放| 国产欧美一区二区精品久导航| 可以看毛片的网址| 精品成人18| 中文字幕欧美精品日韩中文字幕| 日本在线免费观看| 国产精品18久久久久久vr| 日韩影院一区| 中文在线8资源库| 欧美刺激午夜性久久久久久久| 超碰人人人人人人人| 每日更新成人在线视频| 国产日韩亚洲精品| 在线播放免费av| 欧美蜜桃一区二区三区| 国产一区二区三区四区五区六区 | 亚洲精品国产一区二区精华液 | 欧美激情福利| 在线日韩中文字幕| 人妻丰满熟妇av无码区| av电影天堂一区二区在线观看| 日韩视频 中文字幕| 国产精品视频一区视频二区 | 手机av在线看| 麻豆国产欧美日韩综合精品二区| 日韩国产伦理| 日本不卡一二三| 亚洲美女av在线播放| 国产又爽又黄的视频| bt7086福利一区国产| 成人毛片一区二区| 巨人精品**| 91精品国产色综合久久不卡98口| 欧美一级视频免费| 偷拍一区二区三区四区| 波多野结衣有码| 99视频精品免费观看| 精品欧美国产| 国产高清不卡| 亚洲天堂第二页| 中文字幕一区二区三区四区免费看| 国产午夜精品理论片a级大结局 | 26uuu色噜噜精品一区二区| 五十路熟女丰满大屁股| 天美av一区二区三区久久| 欧美性视频网站| 国模精品一区二区| 欧美日韩精品免费观看视频| 五月婷婷综合激情网| 韩国精品久久久| 国产精品8888| 精品三级av在线导航| 欧美一区在线直播| 国产对白叫床清晰在线播放| 欧美二区乱c少妇| 欧美黄色一区二区三区| 成人av网址在线观看| 欧美成人精品欧美一级乱| 成人激情在线| 亚洲自拍av在线| 2020国产在线| 一区二区三区国产在线观看| a级片免费观看| 黄色一区二区在线观看| 中文字幕第24页| 国产最新精品免费| 欧美深夜福利视频| 日韩电影在线视频| 波多野结衣成人在线| 综合日韩av| 久久天天躁狠狠躁老女人| 亚洲经典一区二区三区| 一本色道综合亚洲| 天天综合天天做| 久久久精品免费观看| 亚洲精品综合在线观看| 国产一区二区三区的电影| 水蜜桃一区二区三区| 一区二区三区视频免费视频观看网站| 91超碰caoporn97人人| 欧美高清视频| 日韩高清有码在线| 999av视频| 欧美在线播放高清精品| 久久久久久久中文字幕| 欧美国产一区二区| av在线播放网址| 久久99精品国产麻豆不卡| 欧美成人三级在线视频| 小小影院久久| 日韩高清专区| 色狼人综合干| av成人观看| 日本久久久久| 日本国产欧美一区二区三区| 人人澡人人添人人爽一区二区| 亚洲视频在线免费看| 特级丰满少妇一级aaaa爱毛片| 欧美福利电影网| 伊人中文字幕在线观看| 婷婷激情综合网| a在线视频播放观看免费观看| 国产色产综合产在线视频| 精品人妻在线视频| 国产传媒日韩欧美成人| 超碰超碰在线观看| 久久一区亚洲| 亚洲爆乳无码专区| 国产日韩欧美一区| 欧美乱大交xxxxx潮喷l头像| 综合在线一区| eeuss中文| 91精品国产乱码久久久久久久| 日韩国产欧美精品| 奇米色欧美一区二区三区| 精品卡一卡二| 成人资源在线| 丁香婷婷久久久综合精品国产| 亚洲国产精选| 日韩av成人在线| 一区二区三区短视频| 91精品国产网站| 狼人综合视频| 38少妇精品导航| 天堂√中文最新版在线| …久久精品99久久香蕉国产| 波多野结衣在线高清| 欧美精品激情blacked18| av官网在线播放| 久久99热精品| 毛片在线网址| 韩国v欧美v日本v亚洲| 暧暧视频在线免费观看| 91国产美女视频| 性欧美又大又长又硬| 欧美性受xxxx黑人猛交| 美脚恋feet久草欧美| 国产成人久久久精品一区| 久久久人成影片一区二区三区在哪下载 | 精品国产综合久久| 欧美freesex8一10精品| 欧美一区2区三区4区公司二百| 成人在线免费观看91| 亚洲一区三区视频在线观看| 久久久久国产精品| h无码动漫在线观看| 国产欧美一级| 日本特黄a级片| 国产一区二区三区香蕉| 成人啪啪18免费游戏链接| 91免费视频大全| 免费黄色片网站| 亚洲另类一区二区| 成年免费在线观看| 日本高清不卡在线观看| 97人妻一区二区精品免费视频| 欧美成人a∨高清免费观看| 天堂在线观看免费视频| 亚洲人成在线免费观看| 免费在线看黄| 久久电影一区二区| 毛片在线网站| 国产精品一区av| 日韩免费一级| 欧美精品二区三区四区免费看视频| 成人一二三区| 欧美做暖暖视频| 乱人伦精品视频在线观看| 久久久久久久久久久久久久久国产| 丁香天五香天堂综合| 国产又粗又猛又爽视频| 综合av第一页| www.国产一区二区| 91精品国产麻豆国产自产在线| 天天色综合久久| 中日韩午夜理伦电影免费| 欧美xxx黑人xxx水蜜桃| 国产精品99免视看9| 亚洲一区二区三区在线免费| 日本一区二区高清视频| 国产在线不卡| 天天插天天操天天射| 国产suv一区二区三区88区| 内射中出日韩无国产剧情| 亚洲视频中文字幕| 少妇一级淫片免费放中国 | 亚洲视屏一区| 青青草原国产在线视频| 99re66热这里只有精品3直播| 精品在线观看一区| 色综合色狠狠天天综合色| 国产高清第一页| 亚洲最新av在线网站| 91破解版在线观看| 91色精品视频在线| 国产一区二区三区四区二区| 久久人人爽人人爽人人av| 激情综合一区二区三区| 3d动漫精品啪啪一区二区下载 | 国产日韩欧美精品综合| 精品在线视频免费观看| 欧美顶级少妇做爰| 在线免费观看黄色av| 欧美亚洲国产成人精品| 18国产精品| 干日本少妇视频| 久久精品国产精品青草| 欧美 日韩 成人| 一本色道**综合亚洲精品蜜桃冫| 人妻与黑人一区二区三区| 欧美精品一区二区免费| 亚洲毛片在线免费| 在线成人av电影| 日本大胆欧美人术艺术动态| 亚洲av无码一区二区三区人| 富二代精品短视频| 色鬼7777久久| 26uuu亚洲伊人春色| 色综合www| 国产精品无码av在线播放| 99视频一区二区三区| 日韩av一二三区| 亚洲激情视频网站| 538视频在线| 国产欧美日韩综合精品二区| 伊人久久婷婷| 亚洲视频在线播放免费| 亚洲第一主播视频| 黄频网站在线观看| 久久全球大尺度高清视频| 国产精品jk白丝蜜臀av小说| www.av片| 91婷婷韩国欧美一区二区| 国产视频1区2区| 亚洲人成欧美中文字幕| 欧美国产日韩电影| 亚洲欧洲精品一区| 精品一区二区综合| 成年人av电影| 精品播放一区二区| 国产在线精彩视频| 久久久综合亚洲91久久98| 老司机一区二区三区| 国产肥白大熟妇bbbb视频| 91福利视频久久久久| 91大神xh98hx在线播放| 国产在线视频欧美| 欧美午夜免费影院| 泷泽萝拉在线播放| 欧美日韩三级在线| 在线黄色网页| 国产美女99p| 老妇喷水一区二区三区| 任你操精品视频| 精品国产一区二区亚洲人成毛片 | 欧美久久免费观看| 女子免费在线观看视频www| 久草精品电影| 蓝色福利精品导航| 免费麻豆国产一区二区三区四区| av电影在线观看| 一区二区三区四区乱视频| 超碰福利在线观看| 欧美一区深夜视频| 日韩欧美网址| 国产成人av片| 一本大道综合伊人精品热热| 日本在线免费| 国产一区二区在线网站| 日本色综合中文字幕| 免费在线观看黄视频| 国产婷婷97碰碰久久人人蜜臀| 成人看片网站| 黄色一级大片免费| 久久久久久久免费视频了| 97免费观看视频| 91成人精品网站| 天天做天天爱天天爽综合网| 日韩av手机在线播放| 欧美日韩国产欧美日美国产精品| 国产网红女主播精品视频| 亚洲成人av动漫| 成人h动漫精品一区二| 一本久道久久综合无码中文| 国内精品久久久| 久久精品国产大片免费观看| 日本一卡二卡在线| 欧美一区二区日韩| 国产精品久久久久久吹潮| 国产精品成人久久电影|