精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

CPU 和 GPU之異構計算的演進與發展

商務辦公
世界上大多數事物的發展規律是相似的,在最開始往往都會出現相對通用的方案解決絕大多數的問題,隨后會出現為某一場景專門設計的解決方案,這些解決方案不能解決通用的問題,但是在某些具體的領域會有極其出色的表現。

[[392861]]

世界上大多數事物的發展規律是相似的,在最開始往往都會出現相對通用的方案解決絕大多數的問題,隨后會出現為某一場景專門設計的解決方案,這些解決方案不能解決通用的問題,但是在某些具體的領域會有極其出色的表現。而在計算領域中,CPU(Central Processing Unit)和 GPU(Graphics Processing Unit)分別是通用的和特定的方案,前者可以提供最基本的計算能力解決幾乎所有問題,而后者在圖形計算和機器學習等領域內表現優異。

圖 1 - CPU 和 GPU

異構計算是指系統同時使用多種處理器或者核心,這些系統通過增加不同的協處理器(Coprocessors)提高整體的性能或者資源的利用率[^1],這些協處理器可以負責處理系統中特定的任務,例如用來渲染圖形的 GPU 以及用來挖礦的 ASIC 集成電路。

中心處理單元(Central Processing Unit、CPU)[^2]一詞誕生于 1955 年,已經誕生 70 多年的 CPU 在今天已經是很成熟的技術了,不過它雖然能夠很好地處理通用的計算任務,但是因為核心數量的限制在圖形領域卻遠遠不如圖形處理單元(Graphics Processing Unit、GPU)[^3],復雜的圖形渲染、全局光照等問題仍然需要 GPU 來解決,而大數據、機器學習和人工智能等技術的發展也推動著 GPU 的演進。

今天的軟件工程師,尤其是數據中心和云計算的工程師因為異構計算的發展面對著更加復雜的場景,我們在這篇文章中主要談一談 CPU 和 GPU 的演進過程,重新回顧一下在過去幾十年的時間里,工程師為它們增加了哪些有趣的功能。

CPU

更高、更快和更強是人類永恒的追求,在科技上的進步也不例外,CPU 的主要演進方向其實只有一個:消耗最少的能源實現最快的計算速度,無數工程師的工作都是為了實現這個看起來簡單的目的。然而在 CPU 已經逐漸成熟的今天,想要提高它的性能需要花費極大的努力,我們在這一節簡單展示歷史上引入了哪些技術來提高 CPU 的性能。

制程

當我們討論 CPU 的發展時,制程(Fabrication Process)[^4]是繞不開的關鍵字,相信不了解計算機的人也都聽說過 Intel 處理器 10nm、7nm 的制程,而目前各個 CPU 制造廠商也都有各自的路線圖來實現更小的制程,例如臺積電準備在 2022 和 2023 年分別實現 3nm 和 2nm 的制造工藝。

[^4]: Wikipedia: Semiconductor device fabrication https://en.wikipedia.org/wiki/Semiconductor_device_fabrication

圖 2 - Intel CPU 制程

在大多數人眼中,仿佛 CPU 的制程越少就越先進,性能也會越好,但是制程并不是衡量 CPU 性能的標準,最起碼制程的演進不會直接提高 CPU 的性能。工藝制程的每次提升,都可以讓我們在單位面積內容納更多的晶體管(Transistor),只有越多的晶體管才意味著越強的性能。

越小的晶體管在開關時消耗的能量越少,既然晶體管需要一些時間充電和放電,那么消耗的能量也就越少,速度也越快,而這也解釋了為什么增加 CPU 的電壓可以提高它的運行速度。除此之外,更小的晶體管間隔使得信號的傳輸變得更快,這也能夠加快 CPU 的處理速度[^5]。

緩存

緩存也是 CPU 的重要組成部分,它能夠減少 CPU 訪問內存所需要的時間,相信很多開發者都看過如下所示的表格,我們可以看到從 CPU 的一級緩存中讀取數據大約是主存的 200 倍,哪怕是二級緩存也有將近 30 倍的提升:

 

Work Latency
L1 cache reference 0.5 ns
Branch mispredict 5   ns
L2 cache reference 7   ns
Mutex lock/unlock 25   ns
Main memory reference 100   ns
Compress 1K bytes with Zippy 3,000   ns
Send 1K bytes over 1 Gbps network 10,000   ns
Read 4K randomly from SSD* 150,000   ns
Read 1 MB sequentially from memory 250,000   ns
Round trip within same datacenter 500,000   ns
Read 1 MB sequentially from SSD* 1,000,000   ns
Disk seek 10,000,000   ns
Read 1 MB sequentially from disk 20,000,000   ns
Send packet CA->Netherlands->CA 150,000,000   ns

表 1 - 2012 年延遲數字對比[^6]

今天的 CPU 一般都包含 L1、L2 和 L3 三級緩存,CPU 訪問這些緩存的速度僅次于訪問寄存器,雖然緩存的速度很快,但是因為高性能需要保證盡可能靠近 CPU,所以它的成本異常昂貴。Intel 等 CPU 廠商也會通過增加 CPU 緩存的方式提高性能,更大的 CPU 緩存意味著更高的緩存命中率,也意味著更快的速度。

圖 3 - CPU 緩存

Intel 的處理器就在過去幾十年的時間中不斷增加 L1、L2 和 L3 的緩存大小、將 L1 和 L2 緩存集成在 CPU 中以提高訪問速度并在 L1 緩存中區分數據緩存和指令緩存以提高緩存的命中率。今天的 Core i9 處理器每個核心都有 64 KB 的 L1 緩存和 256 KB 的 L2 緩存,所有的 CPU 還會共享 16 MB 的 L3 緩存[^7]。

并行計算

多線程編程在今天幾乎已經是工程師的必修課了,主機上越來越多的 CPU 核心讓工程師不得不去思考如何才能通過多線程盡可能利用硬件的潛力,很多人可能都認為 CPU 會按照編寫的程序串行執行命令,但是真正的現實往往比這復雜得多,早在很多年前嵌入式工程師就開始嘗試在單個 CPU 上并行執行指令。

從軟件工程師的角度,我們確實可以認為每一條匯編指令都是原子操作,而原子操作意味著該操作要么處于未執行的狀態,要么處于已執行的狀態,而數據庫事務、日志以及并發控制都建立在原子操作上。不過如果再次放大指令的執行過程,我們會發現指令執行的過程并不是原子的:

圖 4 - 指令執行的步驟

不同機器架構執行指令的過程會有所差別,上面是經典的精簡指令集架構(RISC)中命令執行需要經過的 5 個步驟,其中包括獲取指令、解碼指令、執行、訪問內存以及寫回寄存器。

超標量處理器是可以實現指令級別并行的 CPU,它通過向處理器上的其他執行單元派發指令在一個時鐘周期內同時執行多條指令[^8],這里的執行單元是 CPU 內的資源,例如算術邏輯單元、浮點數單元等[^9]。

超標量設計意味著處理器會在一個時鐘周期發出多條指令,該技術往往都與指令流水線一起使用[^10],流水線會將執行拆分成多個步驟,而處理器的不同部分會分別負責這些步驟的處理,例如:因為指令的獲取和解碼由不同的執行單元處理,所以它們可以并行執行。

圖 5 - 超標量和流水線

除了超標量和流水線技術之外,嵌入式工程師們還引入了亂序執行以及分支預測等更加復雜的技術,其中亂序執行也被稱作動態執行,因為 CPU 執行指令時需要先將數據加載到寄存器中,所以我們分析 CPU 的寄存器操作確定哪些指令可以亂序執行。

圖 6 - 亂序執行

如上圖所示,其中包含 R1 = R0 + R1、R2 = R1 - R0 和 R3 = R3 + R5 三條指令,其中第三條指令使用的兩個寄存器與前兩條無關,所以該指令可以與前兩條指令并行執行,也就能減少這段代碼執行所需要的時間。

因為分支條件是程序中的常見邏輯,當我們在 CPU 的執行中引入流水線和亂序執行之后,如果遇到條件分支仍然需要等待分支確定才繼續執行后面的代碼,那么處理器可能會浪費很多時鐘周期等待條件的確定。在計算機架構中,分支預測器是用來在分支確定前預判的數字電路,在遇到條件跳轉指令時,它會預測條件的執行結果并選擇分支執行[^11]:

如果預判正確,可以節約等待所需要的時鐘周期,提高 CPU 的利用率;

如果預判失敗,需要丟棄預判執行的全部或者部分結果,重新執行正確的分支;

因為預判失敗需要付出較大的代價,一般在 10 ~ 20 個時鐘周期之間,所以如何提高分支預測器的準確率成為了比較重要的課題,常見的實現包括靜態分支預測、動態分支預測和隨機分支預測等。

上面的這些指令級并行僅僅存在于實現細節中,CPU 的使用者在外界觀察時仍然會得到串行執行的觀察結果,所以工程師可以認為 CPU 是能夠串行執行指令的黑箱。想要充分利用多個 CPU 的資源,仍然需要工程師理解多線程模型并掌握操作系統中一些并發控制機制。

單核的超標量處理器一般被分類為單指令單數據流(Single Instruction stream, Single Data stream、SISD)處理器,而如果處理器支持向量操作,就被分為單指令多數據流(Single Instruction stream, Multiple Data streams、SIMD)處理器,而 CPU 廠商會引入 SIMD 指令來提高 CPU 的處理能力。

片內布局

前端總線是 Intel 在 1990 年在芯片中使用的通信接口,AMD 在 CPU 中也引入了類似的接口,它們的作用都是在 CPU 和內存控制器中心(也被稱作北橋)之間傳遞數據。前端總線在剛設計時不僅靈活,而且成本很低,但是這種設計很難支持芯片中越來越多的 CPU:

圖 7 - 常見芯片布局

如果 CPU 不能從主存中快速獲取指令和數據,那么它會花費大量的事件等待讀寫主存中的數據,所以越高端的處理器越需要高帶寬和低延遲,而速度較慢的前端總線無法滿足這樣的需求。Intel 和 AMD 分別引入了點對點連接的 HyperTransport 和 QuickPath Interconnect(QPI)機制解決這個問題,上圖中的南橋被新的傳輸機制取代了,CPU 通過集成在內部的內存控制訪問內存,通過 QPI 連接其他 CPU 以及 I/O 控制器。

圖 8 - Intel QPI

使用 QPI 讓 CPU 直接連接其他組件確實可以提高效率,但是隨著 CPU 核心數量的增加,這種連接的方式限制了核心的數量,所以 Intel 在 Sandy Bridge 微架構中引入了如下所示的環形總線(Ring Bus)[^12]:

圖 9 - 環形總線

Sandy Bridge 在架構中引入了片內的 GPU 和視頻解碼器,這些組件也需要與 CPU 共享 L3 緩存,如果所有的組件都與 L3 緩存直接連接,那么片內會出現大量的連接,而這是芯片工程師不能接受的。片內環形總線連接了 CPU、GPU、L3 緩存、PCIe 控制器、DMI 和內存等部分,其中包含四個功能各異的環:數據、請求、確認和監聽[^13],這種設計減少了不同組件內部的連接同時也具有較好的可擴展性。

然而隨著 CPU 核心數量的繼續增加,環形的連接會不斷變大,這會增加環的大小進而影響整個環上組件之間的訪問延遲,導致該設計遇到瓶頸。Intel 由此引入了一種新的網格微架構(Mesh Interconnect Architecture)[^14]:

圖 10 - 網格架構

如上所示,Intel 的 Mesh 架構是一個二維的 CPU 陣列,網絡中有兩種不同的組件,一種是上圖中藍色的 CPU 核心,另一種是上圖中黃色的集成內存控制器,這些組件不會直接相連,相鄰的模塊會通過聚合網格站(Converged Mesh Stop、CMS)連接,這與我們今天看到的服務網格非常相似。

當不同組件需要傳輸數據時,數據包會由 CMS 負責傳輸,先縱向路由后水平路由,數據到達目標組件后,CMS 會將數據傳給 CPU 或者集成的內存控制器。

GPU

圖形處理單元(Graphics Processing Unit、GPU)是在緩沖區中快速操作和修改內存的專用電路,因為可以加速圖片的創建和渲染,所以在嵌入式系統、移動設備、個人電腦以及工作站等設備上應用都很廣泛[^15]。然而隨著機器學習和大數據的發展,很多公司都會使用 GPU 加速訓練任務的執行,這也是今天數據中心中比較常見的用例。

大多數的 CPU 不僅期望在盡可能短的時間內更快地完成任務以降低系統的延遲,還需要在不同任務之間快速切換保證實時性,正是因為這樣的需求,CPU 往往都會串行地執行任務。GPU 的設計與 CPU 完全不同,它期望提高系統的吞吐量,在同一時間竭盡全力處理更多的任務,而設計理念上的差異最終反映到了 CPU 和 GPU 的核心數量上[^16]:

圖 11 - CPU 和 GPU 的核心

雖然 GPU 在過去幾十年的時間有著很大的發展,但是不同 GPU 的架構大同小異,我們在這里簡單介紹下面的流式多處理器中不同組件的作用:

圖 12 - 流式多處理器

  • 流式多處理器(Streaming Multiprocessor、SM)是 GPU 的基本單元,每個 GPU 都由一組 SM 構成,SM 中最重要的結構就是計算核心 Core,上圖中的 SM 包含以下組成部分:
  • 線程調度器(Warp Scheduler):線程束(Warp)是最基本的單元,每個線程束中包含 32 個并行的線程,它們使用不同的數據執行相同的命令,調度器會負責這些線程的調度;
  • 訪問存儲單元(Load/Store Queues):在核心和內存之間快速傳輸數據;

核心(Core):GPU 最基本的處理單元,也被稱作流處理器(Streaming Processor),每個核心都可以負責整數和單精度浮點數的計算;

除了上述這些組件之外,SM 中還包含特殊函數的計算單元(Special Functions Unit、SPU)以及用于存儲和緩存數據的寄存器文件(Register File)、共享內存(Shared Memory)、一級緩存和通用緩存。

水平擴容

與 CPU 一樣,增加架構中的核心數目是提高 GPU 性能和吞吐量最簡單粗暴的手段。Fermi[^17] 是 Nvidia 早期圖形處理器的微架構,在如下所示的架構中,共包含 16 個流式多處理器,512 個 CUDA 核心以及 3,000,000,000 個晶體管:

圖 13 - Nvidia Fermi 架構

除了 512 個 CUDA 核心之外,上述架構中還包含 256 個用于傳輸數據的訪問存儲單元和 64 個特殊函數單元。如果我們把 2010 年發布的 Fermi 架構和 2020 年發布的 Ampere 做一個簡單的對比,就可以發現兩者核心數量的巨大差別:

圖 14 - Nvidia Ampere 架構

Ampere 架構中的流式多處理器增加到了 128 個,而每個處理器中的核心數也增加到了 64 個,整張顯卡上一共包含 8,192 個 CUDA 核心,是 Fermi 架構中核心數量的 16 倍。為了提高系統的吞吐量,新的 GPU 架構不只擁有了更多的核心數量,它還需要更大的寄存器、內存、緩存以及帶寬滿足計算和傳輸的需求。

專用核心

最初的 GPU 僅僅是為了更快地創建和渲染圖片,它們廣泛存在于個人主機上承擔著圖像渲染的任務,但是隨著機器學習等技術的發展,GPU 中出現了更多種類的專用核心來支撐特定的場景,我們在這里介紹兩種 GPU 中存在的專用核心:張量核心(Tensor Core)和光線追蹤核心(Ray-Tracing Core):

圖 13 - 專用核心

與個人電腦上的 GPU 不同,數據中心中的 GPU 往往都會用來執行高性能計算和 AI 模型的訓練任務。正是因為社區有了類似的需求,Nvidia 才會在 GPU 中加入張量核心(Tensor Core)[^19]專門處理相關的任務。

張量核心與普通的 CUDA 核心其實有很大的區別,CUDA 核心在每個時鐘周期都可以準確的執行一次整數或者浮點數的運算,時鐘的速度和核心的數量都會影響整體性能。張量核心通過犧牲一定的精度可以在每個時鐘計算執行一次 4 x 4 的矩陣運算,它的引入使得游戲中的實時深度學習任務成為了可能,能夠加速度圖像的生成和渲染[^20]。

計算機圖形領域的圣杯是實時的全局光照,實現更好的光線追蹤可以幫助我們在屏幕上渲染更加真實的圖像,然而全局光照需要 GPU 進行大量的計算,而實時的全局光照更是對性能有著非常高的要求。傳統的 GPU 架構并不擅長光線追蹤等任務,所以 Nvidia 在 Turing 架構中首次引入了光線追蹤核心(Ray-Tracing Core、RT Core)。

圖 16 - 光線追蹤核心

Nvidia 的光線追蹤核心實際上是為追蹤光線設計的特殊電路,光線追蹤中比較常見的算法就是 Bounding Volume Hierarchy(BVH)遍歷和光線三角形相交測試,使用流式多處理器計算該算法每條光線都會花費上千條指令[^21],而光線追蹤核心可以加速這一過程。

多租戶

今天 GPU 的性能已經非常強大,但是無論使用數據中心提供的 GPU 實例,還是自己搭建服務器運行計算任務都很昂貴,然而 GPU 算力的拆分在目前仍然是一個比較復雜的問題,運行簡單的訓練任務可能占用整塊 GPU,在這種情況下每提升一點 GPU 的利用率都可以降低一些成本。

圖 17 - 多實例 GPU

Nvidia 最新的 Ampere 架構支持多實例 GPU(Multi-Instance GPU、MIG)技術,它能夠水平切分 GPU 資源[^18]。每個 A100 GPU 都可以被拆分成 7 個 GPU 實例,每個實例都有隔離的內存、緩存和計算核心,這不僅可以滿足數據中心分割 GPU 資源的需要,還能在同一張顯卡上并行運行不同的訓練任務。

總結

從 CPU 和 GPU 的演進過程我們可以看到,所有的計算單元都受益于更精細的制作工藝,我們嘗試在相同的面積內放入更多的晶體管并增加更多的計算單元、使用更大的緩存,當這種『簡單粗暴』的方式因為物理上的瓶頸逐漸變得困難時,我們開始為特定領域設計專門的計算單元。

文中沒有提到的 ASIC 和 FPGA 是更加特殊的電路,在圖像渲染領域之外,我們可以通過設計適用于特定領域的 ASIC 和 FPGA 電路提高某一項任務的性能,OSDI ’20 的最佳論文 hXDP: Efficient Software Packet Processing on FPGA NICs[^23] 就研究了如何使用可編程的 FPGA 更高效地處理數據包的轉發,而在未來越來越多的任務會使用專門的硬件。

推薦閱讀

An Introduction to Modern GPU Arhitecture http://download.nvidia.com/developer/cuda/seminar/TDCI_Arch.pdf

Wikiwand: Tick–tock model https://www.wikiwand.com/en/Tick–tock_model

本文轉載自微信公眾號「真沒什么邏輯」,可以通過以下二維碼關注。轉載本文請聯系真沒什么邏輯公眾號。

 

責任編輯:武曉燕 來源: 真沒什么邏輯
相關推薦

2013-11-06 08:48:41

異構計算移動計算

2013-11-06 09:12:35

異構計算移動計算

2013-11-06 09:01:49

移動異構計算移動計算

2018-04-18 15:30:27

多元化異構計算

2013-11-06 09:43:23

體驗引擎移動異構計算高通

2025-03-20 11:22:12

2013-11-06 09:18:44

異構計算移動計算高通

2011-12-02 09:42:09

異構計算高性能計算x86處理器

2024-08-26 09:00:00

異構計算多元算力CPU

2013-11-05 16:53:20

高通異構計算

2022-09-14 17:32:27

VMwarevSphere 8

2017-10-31 14:44:35

華為

2022-10-24 15:56:55

PythonPyTorchGPU 計算

2017-09-12 19:53:23

阿里云異構計算AI

2023-04-03 14:32:39

異構計算算力芯片

2018-04-12 11:39:37

華為云

2015-09-22 13:45:30

2024-08-22 16:54:44

2012-06-14 09:58:28

異構AMDARM
點贊
收藏

51CTO技術棧公眾號

999精品视频在线观看播放| 久草热视频在线观看| 国产又黄又大又粗的视频| 欧美激情五月| 亚洲精品网址在线观看| 超碰在线人人爱| 手机电影在线观看| 91丨九色丨蝌蚪丨老版| 国产欧美一区二区| 国产精品theporn动漫| 精品无人区麻豆乱码久久久| 日韩一区二区三区视频| aⅴ在线免费观看| 成人高清免费在线| 国产亚洲精品7777| 99热最新在线| 夜夜爽8888| 国产欧美二区| 欧美成人激情视频| 国产精品天天干| 高清精品视频| 91精品国产欧美一区二区18| 国产真实乱子伦| 欧美日韩经典丝袜| 国产精品卡一卡二| 久久精品人成| 亚洲欧美另类视频| 激情综合网激情| 国产精品444| 色播视频在线播放| 欧美在线免费一级片| 尤物yw午夜国产精品视频明星| 欧美熟妇精品一区二区 | 午夜精品久久久久久久白皮肤 | 亚洲男人的天堂网| 日韩视频精品| 欧美理论在线观看| av在线不卡网| 成人蜜桃视频| 国产99对白在线播放| 美女视频网站久久| 国产精品极品尤物在线观看| 久久久久亚洲av成人毛片韩| 亚洲福利国产| 欧美激情视频三区| 国产精品老熟女一区二区| 欧美肥老太太性生活| 国产一区二区三区在线观看视频 | 337p日本欧洲亚洲大胆张筱雨| 国外成人福利视频| 欧美日韩在线精品一区二区三区激情 | 国产免费av在线| 久久免费看少妇高潮| 久久久久久久有限公司| 外国精品视频在线观看 | 少妇在线看www| 亚洲韩国一区二区三区| 成人免费观看在线| av不卡高清| 欧美日韩另类视频| 国产精品视频一区二区三区四区五区| 乱馆动漫1~6集在线观看| 五月激情六月综合| 日韩中文字幕组| 丁香婷婷久久| 欧美久久免费观看| 日韩精品aaa| 白嫩白嫩国产精品| 亚洲国产成人久久综合一区| 538国产视频| 国产91精品对白在线播放| 国产性猛交xxxx免费看久久| 日韩福利在线视频| 99视频精品视频高清免费| 久久久91精品国产| 久久精品视频免费在线观看| 国内一区二区三区| 91爱爱小视频k| 亚洲高清视频免费观看| 久久99精品久久久| av资源一区二区| 日本视频在线观看一区二区三区| 国产色爱av资源综合区| 国产精品夜夜夜爽张柏芝| 日本欧美电影在线观看| 欧美日韩激情美女| 伊人影院综合在线| 99re6热只有精品免费观看| 亚洲精品国产精品国产自| 免费黄在线观看| 午夜国产欧美理论在线播放 | 日韩a级黄色片| 午夜影院在线播放| 欧美精品xxxxbbbb| 少妇一级淫免费观看| 欧美色图国产精品| 欧美大尺度激情区在线播放| 国产成人免费观看视频| 美国毛片一区二区三区| 国产精品美女黄网| avav免费在线观看| 亚洲成av人片一区二区三区 | 国产精品久久久久久吹潮| 日韩欧美成人激情| www亚洲色图| 99在线|亚洲一区二区| 成人精品久久久| 色网站在线免费观看| 亚洲精品成人天堂一二三| av免费网站观看| 亚洲国产精品免费视频| 亚洲无亚洲人成网站77777| 欧美黄片一区二区三区| 日韩精品亚洲专区| 精品国产乱码久久久久久郑州公司| 一本一道波多野毛片中文在线| 亚洲国产日韩一级| 国产欧美激情视频| 国产尤物久久久| 久久久免费观看视频| 国产精品一区二区免费视频| 久久久久久久久久久久久夜| 免费在线看黄色片| 国产精品视频一区视频二区 | 电影在线观看一区| 欧美一区二区三区四区五区| 粉嫩精品久久99综合一区| 国产一区二区三区的电影 | 免费a在线观看| 亚洲成年人影院| 久久无码人妻一区二区三区| 日韩精品影视| 国产精品扒开腿做爽爽爽视频| 婷婷av一区二区三区| 亚洲在线免费播放| 九九热视频免费| 欧美激情黄色片| 国产精品视频公开费视频| 欧美69xxxxx| 欧美日韩一区免费| 六十路息与子猛烈交尾| 狠久久av成人天堂| 国产精品污www一区二区三区| 国产黄a三级三级三级av在线看| 欧美日韩一区高清| 丰满的亚洲女人毛茸茸| 日韩中文字幕av电影| 欧美一区1区三区3区公司| 原纱央莉成人av片| 亚洲欧美日韩精品久久奇米色影视 | 日韩欧美电影| 国产精品一区久久| 欧美被日视频| 欧美一区二区在线免费观看| 成人免费毛片xxx| 国产一本一道久久香蕉| 免费观看亚洲视频| 都市激情亚洲欧美| 7m精品福利视频导航| 色哟哟中文字幕| 欧美性xxxx18| 国产综合精品久久久久成人av| 日韩av电影天堂| 综合网五月天| 亚洲国产aⅴ精品一区二区| 国内精品久久久久伊人av| 亚洲人视频在线观看| 色呦呦日韩精品| 亚洲欧美卡通动漫| 国产不卡视频在线观看| 少妇av一区二区三区无码| 亚洲精品456| 国产免费久久av| 少妇视频在线| 日韩精品视频在线| 黄色一级视频免费看| 中文字幕制服丝袜一区二区三区| 手机在线免费毛片| 一区二区高清| 亚洲一区二区三区欧美| 视频一区在线| 日韩av电影中文字幕| 中文字幕在线视频区| 日韩欧美成人午夜| 欧美成人一区二区三区四区| 国产精品美女www爽爽爽| 亚洲少妇中文字幕| 久久久人人人| 只有这里有精品| 日韩av中文字幕一区| 国产精品自产拍在线观看中文| 欧美韩日亚洲| 国产香蕉一区二区三区在线视频 | 日韩在线精品强乱中文字幕| 97成人精品区在线播放| 91社区在线观看播放| 精品国产乱码久久久久久免费 | 国产另类ts人妖一区二区| 男人日女人bb视频| 99久久精品网| 免费国产一区| 最新精品在线| 国产精品视频资源| 91九色porn在线资源| 中文字幕精品在线视频| 天天综合永久入口| 欧美一级电影网站| 做爰无遮挡三级| 亚洲成人久久影院| 日本黄色小说视频| 欧美激情综合网| 最近日本中文字幕| 国产乱码一区二区三区| 天堂社区在线视频| 亚洲视频www| 日本成人在线不卡| 99久久亚洲精品| 欧美一区二区视频在线| 91av在线免费播放| 视频一区中文| 久久久免费看| 国产精品玖玖玖在线资源| 成人欧美一区二区三区在线| 在线成人视屏| 欧美在线视频免费| 91破解版在线观看| 欧美国产第一页| 成人看片免费| 久久久成人av| 婷婷成人激情| 在线日韩第一页| 牛牛热在线视频| 日韩成人xxxx| 天堂av一区二区三区| 亚洲精品在线三区| 亚洲美女福利视频| 日韩欧美国产精品| 国内精品久久久久久久久久| 制服丝袜在线91| 亚洲一区二区天堂| 欧美日韩在线亚洲一区蜜芽| 中文在线资源天堂| 欧美在线观看视频在线| 欧美男人天堂网| 欧美性生活一区| 日本妇乱大交xxxxx| 在线影院国内精品| 波多野结衣绝顶大高潮| 制服诱惑亚洲| 欧美成人精品一区二区| 超碰人人在线| 九九热这里只有精品免费看| 性欧美video高清bbw| 欧美国产日韩xxxxx| 伦理av在线| 午夜精品99久久免费| 在线人成日本视频| 国产精品扒开腿做爽爽爽的视频| 日韩中文视频| 成人精品网站在线观看| 精品视频一区二区三区在线观看| 亚洲在线一区二区| 91精品啪在线观看国产爱臀| 国产一区免费在线| 亚洲免费专区| 亚洲精品成人a8198a| 国产精品国产一区| 99久久99久久精品| 中日韩视频在线观看| 日韩免费高清在线| 狠狠色2019综合网| 亚洲图片欧美另类| 久久在线观看免费| 日本中文在线视频| 一区二区三区在线观看动漫| 国产在线欧美在线| 日本丶国产丶欧美色综合| 亚洲综合五月天婷婷丁香| 精品少妇一区二区三区在线播放| 五月婷婷六月丁香| 怡红院精品视频| 久久电影网站| 国产成人激情小视频| 国产精品一区二区美女视频免费看 | wwwjizzjizzcom| 国产精品综合| 国产aⅴ爽av久久久久| 成人国产精品免费观看| av电影网站在线观看| 一区二区三区中文字幕| 特黄视频免费看| 3d动漫精品啪啪1区2区免费| 四虎影院在线域名免费观看| 日韩中文字在线| 免费毛片b在线观看| 成人a级免费视频| 欧美wwwwww| 黑人巨大国产9丨视频| 亚洲一区二区成人| 制服下的诱惑暮生| 高清毛片在线观看| 欧美激情视频在线免费观看 欧美视频免费一 | 亚洲无线视频| 少妇网站在线观看| 97精品视频在线观看自产线路二| 亚洲综合久久av一区二区三区| 午夜精品免费在线| 国产精品久久久久久久免费| 亚洲精品一区在线观看香蕉| 青草青在线视频| 国产欧美亚洲精品| 久久av中文| 性欧美大战久久久久久久| 久久成人免费日本黄色| 免费在线观看你懂的| 亚洲国产三级在线| 国产麻豆免费观看| 亚洲午夜精品久久久久久久久久久久 | 亚洲男同性恋视频| 最近中文字幕在线观看视频| 亚洲精品黄网在线观看| 性直播体位视频在线观看| 国产精品一区二区久久| 久久99青青| av动漫免费看| 99精品黄色片免费大全| 免费在线视频观看| 这里只有精品视频在线观看| 高清毛片在线看| 国产成人精品在线观看| 亚洲欧洲美洲国产香蕉| 日韩av高清在线看片| 国产成人福利片| 国内偷拍精品视频| 日韩一区国产二区欧美三区| 欧美jizzhd欧美| 91精品久久久久久久久不口人| 欧美女优在线视频| 少妇高潮喷水久久久久久久久久| 成人免费视频视频在线观看免费| tube国产麻豆| 日韩一区二区免费高清| a天堂中文在线官网在线| 91夜夜未满十八勿入爽爽影院 | 中文字幕无码精品亚洲35| 粉嫩久久99精品久久久久久夜 | 国产精品二区影院| 爱情岛论坛亚洲自拍| 亚洲精品国产无套在线观| 精品人妻一区二区三区蜜桃 | 国产91丝袜在线播放0| 青青草国产在线观看| 精品日韩99亚洲| 超碰在线99| 欧美日韩亚洲免费| 日韩高清一级片| 国产精品麻豆一区| 欧美精品久久久久久久久老牛影院| 免费在线观看av| 999国内精品视频在线| 欧美精品激情| 久久久国产精品无码| 欧美日韩亚洲一区二| 成年人在线观看| 91久久在线观看| 亚洲午夜av| 自拍偷拍中文字幕| 欧美视频一区二| av电影免费在线观看| 国产一区二区无遮挡| 美女视频一区免费观看| 免费看的黄色录像| 日韩视频一区二区三区| av今日在线| 日韩电影免费观看在| 精品一区二区三区免费播放| 免费中文字幕在线观看| 日韩精品视频免费| 亚洲ww精品| xxxx18hd亚洲hd捆绑| 国产清纯在线一区二区www| 国产又大又黄的视频| 久久久久久久久久久成人| 亚洲传媒在线| 男人午夜视频在线观看| 午夜影院在线观看欧美| 川上优的av在线一区二区| 99re在线视频观看| 亚洲永久字幕| 国产67194| 日韩精品视频免费专区在线播放| 精品亚洲a∨| 福利视频一二区| 国产精品天干天干在观线| 丰满熟妇人妻中文字幕| 国产精品草莓在线免费观看| 狠狠色综合网| 色老板免费视频| 亚洲欧洲激情在线| 亚洲国产中文在线|