精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?揭秘NVIDIA大模型推理框架:TensorRT-LLM

人工智能
大家好,我是來自 NVIDIA 的周國峰,今天給大家帶來的是關于TensorRT-LLM 推理框架方案的介紹。TensorRT-LLM 是 NVIDIA 用于做 LLM(Large Language Model)的可擴展推理方案。

一、TensorRT-LLM 的產品定位

TensorRT-LLM 是 NVIDIA 用于做 LLM(Large Language Model)的可擴展推理方案。該方案是基于 TensorRT 深度學習編譯框架來構建、編譯并執行計算圖,并借鑒了許多 FastTransformer 中高效的 Kernels 實現,然后利用 NCCL 完成設備之間的通訊。考慮到技術的發展和需求的差異,開發者還可以定制算子來滿足定制需求,比如基于 cutlass 開發定制 GEMM。TensorRT-LLM 是一款致力于提供高性能并不斷完善其實用性的 NVIDIA 官方推理方案。

圖片

TensorRT-LLM 已經在 GitHub 上開源,主要分為兩個分支,即 Release branch 和 Dev branch。其中 Release branch 每個月更新一次,而在 Dev branch 中則會較為頻繁地更新來自官方或社區中的功能,方便開發者體驗、評估最新功能。下圖展示了 TensorRT-LLM 的框架結構,其中除了綠色 TensorRT 編譯部分和一些涉及硬件信息的 kernels 外,其他部分都是開源的。

圖片

TensorRT-LLM 還提供了類似于 Pytorch 的 API 來降低開發者的學習成本,并提供了許多預定義好的模型供用戶使用。

圖片

考慮到大語言模型比較大,有可能單卡放不下,需要多卡甚至多機推理,因此 TensorRT-LLM 還提供了 Tensor Parallelism 和 Pipeline Parallelism 兩種并行機制來支持多卡或多機推理。

圖片

二、TensorRT-LLM 的重要特性

TensorRT-LLM 的重要特性之一就是豐富的模型支持。TensorRT-LLM 對主流大語言模型都提供了支持,比如 Qwen(千問)就是由開發者完成的模型適配,并已經納入官方支持。用戶可以很容易地基于這些預定義的模型做擴展或定制。其二就是低精度推理,TensorRT-LLM 默認采用 FP16/BF16 的精度推理,并且可以利用業界的量化方法,使用硬件吞吐更高的低精度推理進一步推升推理性能。

圖片

另外一個特性就是 FMHA(fused multi-head attention) kernel 的實現。由于 Transformer 中最為耗時的部分是 self-attention 的計算,因此官方設計了 FMHA 來優化 self-attention 的計算,并提供了累加器分別為 fp16 和 fp32 不同的版本。另外,除了速度上的提升外,對內存的占用也大大降低。我們還提供了基于 flash attention 的實現,可以將 sequence-length 擴展到任意長度。

圖片

如下為 FMHA 的詳細信息,其中 MQA 為 Multi Query Attention,GQA 為 Group Query Attention。

圖片

另外一個 Kernel 是 MMHA(Masked Multi-Head Attention)。FMHA 主要用在 context phase 階段的計算,而 MMHA 主要提供 generation phase 階段 attention 的加速,并提供了 Volta 和之后架構的支持。相比 FastTransformer 的實現,TensorRT-LLM 有進一步優化,性能提升高達 2x。

圖片

另外一個重要特性是量化技術,以更低精度的方式實現推理加速。常用量化方式主要分為 PTQ(Post Training Quantization)和 QAT(Quantization-aware Training),對于 TensorRT-LLM 而言,這兩種量化方式的推理邏輯是相同的。對于 LLM 量化技術,一個重要的特點是算法設計和工程實現的 co-design,即對應量化方法設計之初,就要考慮硬件的特性。否則,有可能達不到預期的推理速度提升。

圖片

TensorRT 中 PTQ 量化步驟一般分為如下幾步,首先對模型做量化,然后對權重和模型轉化成 TensorRT-LLM 的表示。對于一些定制化的操作,還需要用戶自己編寫 kernels。常用的 PTQ 量化方法包括 INT8 weight-only、SmoothQuant、GPTQ 和 AWQ,這些方法都是典型的 co-design 的方法。

圖片

INT8 weight-only 直接把權重量化到 INT8,但是激活值還是保持為 FP16。該方法的好處就是模型存儲2x減小,加載 weights 的存儲帶寬減半,達到了提升推理性能的目的。這種方式業界稱作 W8A16,即權重為 INT8,激活值為 FP16/BF16——以 INT8 精度存儲,以 FP16/BF16 格式計算。該方法直觀,不改變 weights,容易實現,具有較好的泛化性能。

圖片

第二個量化方法是 SmoothQuant,該方法是 NVIDIA 和社區聯合設計的。它觀察到權重通常服從高斯分布,容易量化,但是激活值存在離群點,量化比特位利用不高。

圖片

SmoothQuant 通過先對激活值做平滑操作即除以一個scale將對應分布進行壓縮,同時為了保證等價性,需要對權重乘以相同的 scale。之后,權重和激活都可以量化。對應的存儲和計算精度都可以是 INT8 或者 FP8,可以利用 INT8 或者 FP8 的 TensorCore 進行計算。在實現細節上,權重支持 Per-tensor 和 Per-channel 的量化,激活值支持 Per-tensor 和 Per-token 的量化。

圖片

第三個量化方法是 GPTQ,一種逐層量化的方法,通過最小化重構損失來實現。GPTQ 屬于 weight-only 的方式,計算采用 FP16 的數據格式。該方法用在量化大模型時,由于量化本身開銷就比較大,所以作者設計了一些 trick 來降低量化本身的開銷,比如 Lazy batch-updates 和以相同順序量化所有行的權重。GPTQ 還可以與其他方法結合使用如 grouping 策略。并且,針對不同的情況,TensorRT-LLM 提供了不同的實現優化性能。具體地,對 batch size 較小的情況,用 cuda core 實現;相對地,batch size 較大時,采用 tensor core 實現。

圖片

第四種量化方式是 AWQ。該方法認為不是所有權重都是同等重要的,其中只有 0.1%-1% 的權重(salient weights)對模型精度貢獻更大,并且這些權重取決于激活值分布而不是權重分布。該方法的量化過程類似于 SmoothQuant,差異主要在于 scale 是基于激活值分布計算得到的。

圖片

圖片

除了量化方式之外,TensorRT-LLM 另外一個提升性能的方式是利用多機多卡推理。在一些場景中,大模型過大無法放在單個 GPU 上推理,或者可以放下但是影響了計算效率,都需要多卡或者多機進行推理。

圖片

TensorRT-LLM 目前提供了兩種并行策略,Tensor Parallelism 和 Pipeline Parallelism。TP 是垂直地分割模型然后將各個部分置于不同的設備上,這樣會引入設備之間頻繁的數據通訊,一般用于設備之間有高度互聯的場景,如 NVLINK。另一種分割方式是橫向切分,此時只有一個橫前面,對應通信方式是點對點的通信,適合于設備通信帶寬較弱的場景。

圖片

最后一個要強調的特性是 In-flight batching。Batching 是提高推理性能一個比較常用的做法,但在 LLM 推理場景中,一個 batch 中每個 sample/request 的輸出長度是無法預測的。如果按照靜態batching的方法,一個batch的時延取決于 sample/request 中輸出最長的那個。因此,雖然輸出較短的 sample/request 已經結束,但是并未釋放計算資源,其時延與輸出最長的那個 sample/request 時延相同。In-flight batching 的做法是在已經結束的 sample/request 處插入新的 sample/request。這樣,不但減少了單個 sample/request 的延時,避免了資源浪費問題,同時也提升了整個系統的吞吐。

圖片

三、TensorRT-LLM 的使用流程

TensorRT-LLM 與 TensorRT的 使用方法類似,首先需要獲得一個預訓練好的模型,然后利用 TensorRT-LLM 提供的 API 對模型計算圖進行改寫和重建,接著用 TensorRT 進行編譯優化,然后保存為序列化的 engine 進行推理部署。

圖片

以 Llama 為例,首先安裝 TensorRT-LLM,然后下載預訓練模型,接著利用 TensorRT-LLM 對模型進行編譯,最后進行推理。

圖片

對于模型推理的調試,TensorRT-LLM 的調試方式與 TensorRT 一致。由于深度學習編譯器,即 TensorRT,提供的優化之一是 layer 融合。因此,如果要輸出某層的結果,就需要將對應層標記為輸出層,以防止被編譯器優化掉,然后與 baseline 進行對比分析。同時,每標記一個新的輸出層,都要重新編譯 TensorRT 的 engine。

圖片

對于自定義的層,TensorRT-LLM 提供了許多 Pytorch-like 算子幫助用戶實現功能而不必自己編寫 kernel。如樣例所示,利用 TensorRT-LLM 提供的 API 實現了 rms norm 的邏輯,TensorRT 會自動生成 GPU 上對應的執行代碼。

圖片

如果用戶有更高的性能需求或者 TensorRT-LLM 并未提供實現相應功能的 building blocks,此時需要用戶自定義 kernel,并封裝為 plugin 供 TensorRT-LLM 使用。示例代碼是將 SmoothQuant 定制 GEMM 實現并封裝成 plugin 后,供 TensorRT-LLM 調用的示例代碼。

圖片

四、TensorRT-LLM 的推理性能

關于性能、配置等細節都可以在官網看到,在此不做詳細介紹。該產品從立項開始一直與國內很多大廠都有合作。通過反饋,一般情況下,TensorRT-LLM 從性能角度來說是當前最好的方案。由于技術迭代、優化手段、系統優化等眾多因素會影響性能,并且變化非常快,這里就不詳細展開介紹 TensorRT-LLM 的性能數據。大家如果有興趣,可以去官方了解細節,這些性能都是可復現的。

圖片

圖片

圖片

圖片

值得一提的是,TensorRT-LLM 跟自己之前的版本比,性能有持續地提升。如上圖所示,在 FP16 基礎上,采用了 KVQuant 后,速度一致的情況下降低了顯存的使用量。使用 INT8,可以看到明顯的吞吐的提升,同時顯存用量進一步降低。可見,隨著 TensorRT-LLM 優化技術的持續演進,性能會有持續地提升。這個趨勢會持續保持。

五、TensorRT-LLM 的未來展望

LLM 是一個推理成本很高、成本敏感的場景。我們認為,為了實現下一個百倍的加速效果,需要算法和硬件的共同迭代,通過軟硬件之間 co-design 來達到這個目標。硬件提供更低精度的量化,而軟件角度則利用優化量化、網絡剪枝等算法,來進一步提升性能。

圖片

TensorRT-LLM,將來 NVIDIA 會持續致力于提升 TensorRT-LLM 的性能。同時通過開源,收集反饋和意見,提高它的易用性。另外,圍繞易用性,會開發、開源更多應用工具,如 Model zone 或者量化工具等,完善與主流框架的兼容性,提供從訓練到推理和部署端到端的解決方案。

圖片

六、問答環節

Q1:是否每一次計算輸出都要反量化?做量化出現精度溢出怎么辦?

A1:目前 TensorRT-LLM 提供了兩類方法,即 FP8 和剛才提到的 INT4/INT8 量化方法。低精度如果 INT8 做 GEMM 時,累加器會采用高精度數據類型,如 fp16,甚至 fp32 以防止 overflow。關于反量化,以 fp8 量化為例,TensorRT-LLM 優化計算圖時,可能動自動移動反量化結點,合并到其它的操作中達到優化目的。但對于前面介紹的 GPTQ 和 QAT,目前是通過硬編碼寫在 kernel 中,沒有統一量化或反量化節點的處理。

Q2:目前是針對具體模型專門做反量化嗎?

A2:目前的量化的確是這樣,針對不同的模型做支持。我們有計劃做一個更干凈的api或者通過配置項的方式來統一支持模型的量化。

Q3:針對最佳實踐,是直接使用 TensorRT-LLM 還是與 Triton Inference Server 結合在一起使用?如果結合使用是否會有特性上的缺失?

A3:因為一些功能未開源,如果是自己的 serving 需要做適配工作,如果是 triton 則是一套完整的方案。

Q4:對于量化校準有幾種量化方法,加速比如何?這幾種量化方案效果損失有幾個點?In-flight branching 中每個 example 的輸出長度是不知道的,如何做動態的 batching?

A4:關于量化性能可以私下聊,關于效果,我們只做了基本的驗證,確保實現的 kernel 沒問題,并不能保證所有量化算法在實際業務中的結果,因為還有些無法控制的因素,比如量化用到的數據集及影響。關于 in-flight batching,是指在 runtime 的時候去檢測、判斷某個 sample/request 的輸出是否結束。如果是,再將其它到達的 requests 插進來,TensorRT-LLM 不會也不能預告預測輸出的長度。

Q5:In-flight branching 的 C++ 接口和 python 接口是否會保持一致?TensorRT-LLM 安裝成本高,今后是否有改進計劃?TensorRT-LLM 會和 VLLM 發展角度有不同嗎?

A5:我們會盡量提供 c++ runtime 和 python runtime 一致的接口,已經在規劃當中。之前團隊的重點在提升性能、完善功能上,以后在易用性方面也會不斷改善。這里不好直接跟 vllm 的比較,但是 NVIDIA 會持續加大在 TensorRT-LLM 開發、社區和客戶支持的投入,為業界提供最好的 LLM 推理方案。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2024-10-22 09:17:07

2024-02-04 00:00:00

Triton格式TensorRT

2023-09-11 09:37:58

開源軟件套AI模型

2023-09-10 12:37:38

模型英偉達

2024-09-09 08:31:15

2025-06-05 11:51:14

NVIDIAProRLLLM

2024-06-18 14:01:17

2025-08-26 04:11:00

大語言模型框架

2024-07-29 08:19:00

服務引擎

2025-05-21 09:02:20

2023-11-16 14:46:27

AIChat APIOpenAI

2023-05-30 14:17:00

模型推理

2025-10-11 02:25:00

2025-01-20 07:58:51

2025-01-16 08:40:00

2024-02-26 07:43:10

大語言模型LLM推理框架

2024-11-18 09:30:00

2024-11-12 13:40:00

2023-10-06 20:30:33

大模型LLMtoken

2025-04-07 09:23:00

大模型LLM推理
點贊
收藏

51CTO技術棧公眾號

国产在线精品观看| 日韩精品视频一区二区在线观看| 最新国产中文字幕| 亚洲精品极品少妇16p| 日韩午夜电影在线观看| 亚洲人精品午夜射精日韩| 九九在线视频| 久99久精品视频免费观看| 欧美激情视频网址| 西西444www无码大胆| 国产精品一区二区三区av| 亚洲成a天堂v人片| 亚洲欧洲一区二区| 涩涩视频免费看| 久久国产欧美日韩精品| 97超级碰碰人国产在线观看| 可以免费看av的网址| 日韩精品免费一区二区三区竹菊| 欧美日韩一区 二区 三区 久久精品| 草草草视频在线观看| 激情福利在线| 成人性色生活片| 国产区亚洲区欧美区| 免费日韩一级片| 91精品国产福利在线观看麻豆| 亚洲精品一区久久久久久| 五月天开心婷婷| 国产精品伦理| 亚洲国产日日夜夜| 国产高清免费在线| se在线电影| 久久―日本道色综合久久 | 久久亚洲精品人成综合网| 午夜av一区二区三区| 国产精品波多野结衣| 成人性生交大片免费看午夜 | av直播在线观看| 日日夜夜精品视频| 91精品国产色综合久久不卡电影 | 日韩精品一区二区三区| 亚洲午夜视频在线观看| 日本丰满大乳奶| 欧美成人高清在线| 国产精品萝li| 五月天色一区| 国产精品一区在线看| 2017欧美狠狠色| 精品国产乱码久久久久久蜜柚| a级片在线视频| 精品一区二区在线视频| 国产精品亚洲激情| 欧美 亚洲 另类 激情 另类| 久久激情婷婷| 欧美自拍大量在线观看| 亚洲第一在线播放| 先锋影音久久| 青草青草久热精品视频在线观看| www.国产高清| 亚洲永久在线| 日本不卡免费高清视频| 老熟妇仑乱一区二区av| 性欧美精品高清| 国产成人精彩在线视频九色| 亚洲天堂一区在线| 久久久久网站| 国产精品高潮呻吟久久av野狼| 国产午夜无码视频在线观看| 日韩精品1区2区3区| 国产精品视频一区二区高潮| 中文字幕一区二区人妻痴汉电车| 秋霞影院一区二区| 国产日韩精品在线观看| 国产精品毛片一区二区在线看舒淇| 激情欧美日韩一区二区| 99re6在线| 免费观看黄一级视频| 91浏览器在线视频| 色噜噜色狠狠狠狠狠综合色一| 成人在线观看黄色| 亚洲欧美日韩精品久久久久| 日本大片免费看| av在线网页| 欧美日韩综合视频网址| 亚洲xxxx2d动漫1| 四虎视频在线精品免费网址| 日韩精品一区二区三区视频播放 | av资源久久| 日韩在线免费视频观看| 国产探花在线播放| 亚洲永久在线| 成人国产在线视频| 亚洲乱色熟女一区二区三区| 91免费国产视频网站| 亚洲国产精品一区在线观看不卡 | 97在线观看免费高清| 无码人妻丰满熟妇区bbbbxxxx| 久久99国产精品免费| 国产精品日韩欧美一区二区| 你懂的在线视频| 亚洲欧洲成人自拍| 又粗又黑又大的吊av| 亚洲中文字幕在线观看| 激情都市一区二区| 农村寡妇一区二区三区| 国产在线高清视频| 久久嫩草精品久久久久| gogogo免费高清日本写真| 91超碰在线免费| 欧美精品乱人伦久久久久久| 先锋资源av在线| 外国成人免费视频| 38少妇精品导航| av中文字幕免费在线观看| 久久精品一区蜜桃臀影院| 国产激情片在线观看| 亚洲天堂1区| 精品sm在线观看| frxxee中国xxx麻豆hd| 久久国产福利| 国产精品一区免费观看| 午夜在线免费观看视频| 狠狠做深爱婷婷久久综合一区| 91视频福利网| 精品日韩毛片| 欧美亚洲另类视频| 亚洲乱码在线观看| 亚洲免费在线看| 国产福利影院在线观看| 亚洲精品播放| 欧美精品电影在线| 国产欧美久久久精品免费| 欧美国产日产图区| 国产淫片av片久久久久久| 久久香蕉精品香蕉| 欧美精品videosex牲欧美| 国产wwwxxx| 中文字幕永久在线不卡| 亚洲色图久久久| 国产精品片aa在线观看| 国产91精品不卡视频| 五月婷婷深深爱| 亚洲妇女屁股眼交7| 国模大尺度视频| 91精品秘密在线观看| 成人免费观看a| 黄色在线观看网站| 777奇米四色成人影色区| 黄色免费一级视频| 捆绑紧缚一区二区三区视频| 亚洲视频欧美在线| 巨大黑人极品videos精品| 这里只有精品在线观看| 自拍偷拍校园春色| 中文字幕电影一区| 麻豆一区二区三区视频| 日韩精品久久| 国产日韩欧美视频在线| 好吊日视频在线观看| 日韩午夜在线播放| 黄色一级片中国| 国产+成+人+亚洲欧洲自线| 人人妻人人澡人人爽欧美一区| 亚洲超碰在线观看| 午夜精品久久久久久99热| 亚洲av成人无码久久精品老人| 欧美日韩免费看| 久久亚洲AV无码专区成人国产| 免费在线视频一区| 一区二区三区|亚洲午夜| av日韩在线免费观看| 欧美高清在线播放| 欧美自拍偷拍一区二区| 日韩欧美在线第一页| 四虎国产精品成人免费入口| 久久精品国产99| 欧美日韩午夜爽爽| 日韩美女毛片| 国产欧美精品在线播放| v片在线观看| 精品对白一区国产伦| 日韩欧美成人一区二区三区| 国产精品全国免费观看高清| 久久无码人妻一区二区三区| 亚洲高清不卡| 亚洲图片都市激情| 福利电影一区| 国产精品久久91| 少妇视频在线| 精品呦交小u女在线| 亚洲自拍偷拍另类| 亚洲国产成人高清精品| 69视频在线观看免费| 国产乱码精品一区二区三区五月婷| 人妻无码久久一区二区三区免费| 国产成人手机高清在线观看网站| 91亚洲午夜在线| 久久野战av| 欧美激情一二三| 国产日韩精品在线看| 日韩欧美一区二区不卡| 波多野结衣爱爱| 亚洲综合视频网| 国产又粗又长免费视频| 成人免费毛片高清视频| 五月婷婷激情久久| 18成人免费观看视频| 亚洲高清精品中出| 欧美激情极品| 91免费在线视频网站| 玛雅亚洲电影| 欧美老女人xx| av在线三区| 亚洲精品国产精品国自产观看浪潮| 91福利在线观看视频| 欧美日韩精品二区| 久久综合成人网| 国产精品久久久久天堂| 亚洲永久精品ww.7491进入| 国产成人av电影| 999在线精品视频| 日本人妖一区二区| 欧美日韩激情视频在线观看| 国内精品美女在线观看| 中文字幕欧美日韩一区二区| 国产欧美日韩影院| 久久综合一区| 嫩草国产精品入口| 91精品国产高清久久久久久91裸体| 欧洲成人一区| 国产成人免费av电影| 狠狠操一区二区三区| 欧美激情精品久久久久久变态| 免费日本一区二区三区视频| 中文字幕欧美日韩在线| 裸体xxxx视频在线| 日韩精品免费在线播放| 天堂8在线视频| 精品粉嫩aⅴ一区二区三区四区| 成人激情四射网| 欧美一级黄色录像| 99视频国产精品免费观看a| 欧美三片在线视频观看| 最近中文字幕在线免费观看| 欧美熟乱第一页| 加勒比在线一区| 色88888久久久久久影院野外| 丁香社区五月天| 色综合激情久久| 日本久久综合网| 在线观看网站黄不卡| 波多野结衣爱爱| 欧美日韩和欧美的一区二区| 一级aaaa毛片| 91麻豆精品国产自产在线观看一区| 在线免费av网| 在线播放欧美女士性生活| 国产毛片在线视频| 日韩一二三区视频| 蜜桃视频在线观看www| 亚洲精品短视频| 精品电影在线| 中日韩美女免费视频网址在线观看| 幼a在线观看| 久久伊人91精品综合网站| 天堂av在线电影| 97视频国产在线| 国产精品亚洲一区二区三区在线观看| 国产精品黄色av| 24小时成人在线视频| 91成人理论电影| 久久久久久毛片免费看| 日本精品一区二区三区不卡无字幕| 日韩电影在线视频| 国产精品88久久久久久妇女| 亚洲第一伊人| 老熟妇仑乱视频一区二区| 激情综合网天天干| 在线xxxxx| 国产亚洲女人久久久久毛片| 777777国产7777777| 亚洲一级二级三级| 天堂网中文字幕| 51午夜精品国产| 日本xxxx人| 色阁综合伊人av| 波多野结衣中文字幕久久| 国产成人av在线| 亚洲综合影院| 日本在线观看不卡| 欧美日韩99| 日本一极黄色片| 国产大片一区二区| 人妻少妇无码精品视频区| 亚洲欧美国产三级| 国产一级片毛片| 91精品国产色综合久久不卡蜜臀| 天堂a√中文在线| 欧美成人午夜视频| 美女福利一区二区| 99国产视频在线| 成人精品久久| 精品这里只有精品| 国产在线精品视频| 法国空姐电影在线观看| 一区二区三区在线播放| 亚洲国产无线乱码在线观看| 精品成人a区在线观看| 免费av毛片在线看| 日本精品免费一区二区三区| 香港久久久电影| 亚洲精品国产精品国自产| 一本久道久久久| 午夜诱惑痒痒网| 国产片一区二区| 久久不卡免费视频| 日韩欧美国产一区二区三区| 在线免费观看黄色| 欧美孕妇毛茸茸xxxx| 91蝌蚪精品视频| 手机成人av在线| 麻豆一区二区99久久久久| 日本一区二区三区网站| 亚洲大型综合色站| 性欧美18一19性猛交| 久久精品国产精品亚洲| 亚洲精品粉嫩美女一区| 欧美久久久久久久| 亚洲深爱激情| 欧美成人三级伦在线观看| 依依成人精品视频| 国产区精品在线| 最近中文字幕mv在线一区二区三区四区 | 99精品视频99| 精品久久久久久久久久久久久久久久久| 精品国产丝袜高跟鞋| 国产有码在线一区二区视频| 成人av资源电影网站| 超碰影院在线观看| 久久久午夜电影| 日本久久综合网| 亚洲午夜未删减在线观看| 欧美电影免费观看| 免费国产一区二区| 天堂av在线一区| 国产肥白大熟妇bbbb视频| 日本久久一区二区| 99re在线视频| 国产精品丝袜高跟| 97在线精品| 想看黄色一级片| 亚洲精品免费在线播放| 国产成人麻豆精品午夜在线| 欧美成人精品在线| 亚洲一区 二区| 少妇av一区二区三区无码| 99麻豆久久久国产精品免费| 亚洲 欧美 日韩 综合| 国产丝袜一区二区| 精品无人乱码一区二区三区| 视频一区国产精品| 美女一区二区视频| 91高清免费观看| 精品国产乱码久久久久久久久| 91禁在线看| 日本一区不卡| 久99久精品视频免费观看| 久久久精品人妻一区二区三区四| 精品国产亚洲一区二区三区在线观看| 久久久久黄久久免费漫画| 乱色588欧美| 老司机精品视频一区二区三区| 免费在线看黄网址| 日韩av影视在线| 精品亚洲a∨| 欧美一级中文字幕| 久久久久久久电影| 一区二区三区免费观看视频| 美女啪啪无遮挡免费久久网站| 超碰精品在线| 天天爽人人爽夜夜爽| 亚洲一区在线观看免费观看电影高清| 神马午夜一区二区| 国产精品丝袜白浆摸在线| 激情国产一区| а天堂中文在线资源| 精品成人免费观看| 国产原创一区| a级黄色一级片| 国产精品久久久久久亚洲毛片 | 中文字幕欧美人与畜| 成人深夜在线观看| 亚洲 国产 日韩 欧美| 欧美精品一二区| 国产aⅴ精品一区二区三区久久| 在线免费看污网站| 欧美三级xxx| 深夜国产在线播放| 亚洲国产欧美日韩| 99久久婷婷国产精品综合| 国产偷拍一区二区|