精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

全面超越DPO:陳丹琦團(tuán)隊(duì)提出簡(jiǎn)單偏好優(yōu)化SimPO,還煉出最強(qiáng)8B開(kāi)源模型

人工智能 新聞
近段時(shí)間已有一些研究者探索了更簡(jiǎn)單的離線算法,其中之一便是直接偏好優(yōu)化(DPO)。

為了將大型語(yǔ)言模型(LLM)與人類的價(jià)值和意圖對(duì)齊,學(xué)習(xí)人類反饋至關(guān)重要,這能確保它們是有用的、誠(chéng)實(shí)的和無(wú)害的。在對(duì)齊 LLM 方面,一種有效的方法是根據(jù)人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。盡管經(jīng)典 RLHF 方法的結(jié)果很出色,但其多階段的過(guò)程依然帶來(lái)了一些優(yōu)化難題,其中涉及到訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型,然后優(yōu)化一個(gè)策略模型來(lái)最大化該獎(jiǎng)勵(lì)。

近段時(shí)間已有一些研究者探索了更簡(jiǎn)單的離線算法,其中之一便是直接偏好優(yōu)化(DPO)。DPO 是通過(guò)參數(shù)化 RLHF 中的獎(jiǎng)勵(lì)函數(shù)來(lái)直接根據(jù)偏好數(shù)據(jù)學(xué)習(xí)策略模型,這樣就無(wú)需顯式的獎(jiǎng)勵(lì)模型了。該方法簡(jiǎn)單穩(wěn)定,已經(jīng)被廣泛用于實(shí)踐。

使用 DPO 時(shí),得到隱式獎(jiǎng)勵(lì)的方式是使用當(dāng)前策略模型和監(jiān)督式微調(diào)(SFT)模型之間的響應(yīng)似然比的對(duì)數(shù) 的對(duì)數(shù)比。但是,這種構(gòu)建獎(jiǎng)勵(lì)的方式并未與引導(dǎo)生成的指標(biāo)直接對(duì)齊,該指標(biāo)大約是策略模型所生成響應(yīng)的平均對(duì)數(shù)似然。訓(xùn)練和推理之間的這種差異可能導(dǎo)致性能不佳。

為此,弗吉尼亞大學(xué)的助理教授孟瑜與普林斯頓大學(xué)的在讀博士夏夢(mèng)舟和助理教授陳丹琦三人共同提出了 SimPO—— 一種簡(jiǎn)單卻有效的離線偏好優(yōu)化算法。

圖片


  • 論文標(biāo)題:SimPO: Simple Preference Optimization with a Reference-Free Reward
  • 論文地址:https://arxiv.org/pdf/2405.14734
  • 代碼 & 模型:https://github.com/princeton-nlp/SimPO

該算法的核心是將偏好優(yōu)化目標(biāo)中的獎(jiǎng)勵(lì)函數(shù)與生成指標(biāo)對(duì)齊。SimPO 包含兩個(gè)主要組件:(1)在長(zhǎng)度上歸一化的獎(jiǎng)勵(lì),其計(jì)算方式是使用策略模型的獎(jiǎng)勵(lì)中所有 token 的平均對(duì)數(shù)概率;(2)目標(biāo)獎(jiǎng)勵(lì)差額,用以確保獲勝和失敗響應(yīng)之間的獎(jiǎng)勵(lì)差超過(guò)這個(gè)差額。

總結(jié)起來(lái),SimPO 具有以下特點(diǎn):

  • 簡(jiǎn)單:SimPO 不需要參考模型,因此比 DPO 等其它依賴參考模型的方法更輕量更容易實(shí)現(xiàn)。
  • 性能優(yōu)勢(shì)明顯:盡管 SimPO 很簡(jiǎn)單,但其性能卻明顯優(yōu)于 DPO 及其最新變體(比如近期的無(wú)參考式目標(biāo) ORPO)。如圖 1 所示。并且在不同的訓(xùn)練設(shè)置和多種指令遵從基準(zhǔn)(包括 AlpacaEval 2 和高難度的 Arena-Hard 基準(zhǔn))上,SimPO 都有穩(wěn)定的優(yōu)勢(shì)。
  • 盡量小的長(zhǎng)度利用:相比于 SFT 或 DPO 模型,SimPO 不會(huì)顯著增加響應(yīng)長(zhǎng)度(見(jiàn)表 1),這說(shuō)明其長(zhǎng)度利用是最小的。

圖片

該團(tuán)隊(duì)進(jìn)行了大量分析,結(jié)果表明 SimPO 能更有效地利用偏好數(shù)據(jù),從而在驗(yàn)證集上對(duì)高質(zhì)量和低質(zhì)量響應(yīng)的似然進(jìn)行更準(zhǔn)確的排序,這進(jìn)一步能造就更好的策略模型。

如表 1 所示,該團(tuán)隊(duì)基于 Llama3-8B-instruct 構(gòu)建了一個(gè)具有頂尖性能的模型,其在 AlpacaEval 2 上得到的長(zhǎng)度受控式勝率為 44.7,在排行榜上超過(guò)了 Claude 3 Opus;另外其在 Arena-Hard 上的勝率為 33.8,使其成為了目前最強(qiáng)大的 8B 開(kāi)源模型。

SimPO:簡(jiǎn)單偏好優(yōu)化

為便于理解,下面首先介紹 DPO 的背景,然后說(shuō)明 DPO 的獎(jiǎng)勵(lì)與生成所用的似然度量之間的差異,并提出一種無(wú)參考的替代獎(jiǎng)勵(lì)公式來(lái)緩解這一問(wèn)題。最后,通過(guò)將目標(biāo)獎(jiǎng)勵(lì)差額項(xiàng)整合進(jìn) Bradley-Terry 模型中,推導(dǎo)出 SimPO 目標(biāo)。 

背景:直接偏好優(yōu)化(DPO)

DPO 是最常用的離線偏好優(yōu)化方法之一。DPO 并不會(huì)學(xué)習(xí)一個(gè)顯式的獎(jiǎng)勵(lì)模型,而是使用一個(gè)帶最優(yōu)策略的閉式表達(dá)式來(lái)對(duì)獎(jiǎng)勵(lì)函數(shù) r 進(jìn)行重新參數(shù)化:


其中 π_θ 是策略模型,π_ref 是參考策略(通常是 SFT 模型),Z (x) 是配分函數(shù)。通過(guò)將這種獎(jiǎng)勵(lì)構(gòu)建方式整合進(jìn) Bradley-Terry (BT) 排名目標(biāo),圖片,DPO 可使用策略模型而非獎(jiǎng)勵(lì)模型來(lái)表示偏好數(shù)據(jù)的概率,從而得到以下目標(biāo):

圖片

其中 (x, y_w, y_l) 是由來(lái)自偏好數(shù)據(jù)集 D 的 prompt、獲勝響應(yīng)和失敗響應(yīng)構(gòu)成的偏好對(duì)。

一種與生成結(jié)果對(duì)齊的簡(jiǎn)單無(wú)參考獎(jiǎng)勵(lì)

DPO 的獎(jiǎng)勵(lì)與生成之間的差異。使用 (1) 式作為隱式的獎(jiǎng)勵(lì)表達(dá)式有以下缺點(diǎn):(1) 訓(xùn)練階段需要參考模型 π_ref,這會(huì)帶來(lái)額外的內(nèi)存和計(jì)算成本;(2) 訓(xùn)練階段優(yōu)化的獎(jiǎng)勵(lì)與推理所用的生成指標(biāo)之間存在差異。具體來(lái)說(shuō),在生成階段,會(huì)使用策略模型 π_θ 生成一個(gè)能近似最大化平均對(duì)數(shù)似然的序列,定義如下:

圖片

在解碼過(guò)程中直接最大化該指標(biāo)是非常困難的,為此可以使用多種解碼策略,如貪婪解碼、波束搜索、核采樣和 top-k 采樣。此外,該指標(biāo)通常用于在語(yǔ)言模型執(zhí)行多選任務(wù)時(shí)對(duì)選項(xiàng)進(jìn)行排名。在 DPO 中,對(duì)于任意三元組 (x, y_w, y_l),滿足獎(jiǎng)勵(lì)排名 r (x, y_w) > r (x, y_l) 并不一定意味著滿足似然排名圖片。事實(shí)上,在使用 DPO 訓(xùn)練時(shí),留存集中大約只有 50% 的三元組滿足這個(gè)條件(見(jiàn)圖 4b)。

構(gòu)建在長(zhǎng)度上歸一化的獎(jiǎng)勵(lì)。很自然地,我們會(huì)考慮使用 (3) 式中的 p_θ 來(lái)替換 DPO 中的獎(jiǎng)勵(lì)構(gòu)建,使其與引導(dǎo)生成的似然指標(biāo)對(duì)齊。這會(huì)得到一個(gè)在長(zhǎng)度上歸一化的獎(jiǎng)勵(lì):

圖片

其中 β 是控制獎(jiǎng)勵(lì)差異大小的常量。該團(tuán)隊(duì)發(fā)現(xiàn),根據(jù)響應(yīng)長(zhǎng)度對(duì)獎(jiǎng)勵(lì)進(jìn)行歸一化非常關(guān)鍵;從獎(jiǎng)勵(lì)公式中移除長(zhǎng)度歸一化項(xiàng)會(huì)導(dǎo)致模型傾向于生成更長(zhǎng)但質(zhì)量更低的序列。這樣一來(lái),構(gòu)建的獎(jiǎng)勵(lì)中就無(wú)需參考模型了,從而實(shí)現(xiàn)比依賴參考模型的算法更高的內(nèi)存和計(jì)算效率。

SimPO 目標(biāo)

目標(biāo)獎(jiǎng)勵(lì)差額。另外,該團(tuán)隊(duì)還為 Bradley-Terry 目標(biāo)引入了一個(gè)目標(biāo)獎(jiǎng)勵(lì)差額項(xiàng) γ > 0,以確保獲勝響應(yīng)的獎(jiǎng)勵(lì) r (x, y_w) 超過(guò)失敗響應(yīng)的獎(jiǎng)勵(lì) r (x, y_l) 至少 γ:

圖片

兩個(gè)類之間的差額已知會(huì)影響分類器的泛化能力。在使用隨機(jī)模型初始化的標(biāo)準(zhǔn)訓(xùn)練設(shè)置中,增加目標(biāo)差額通常能提升泛化性能。在偏好優(yōu)化中,這兩個(gè)類別是單個(gè)輸入的獲勝或失敗響應(yīng)。

在實(shí)踐中,該團(tuán)隊(duì)觀察到隨著目標(biāo)差額增大,生成質(zhì)量一開(kāi)始會(huì)提升,但當(dāng)這個(gè)差額變得過(guò)大時(shí),生成質(zhì)量就會(huì)下降。DPO 的一種變體 IPO 也構(gòu)建了與 SimPO 類似的目標(biāo)獎(jiǎng)勵(lì)差額,但其整體目標(biāo)的效果不及 SimPO。

目標(biāo)。最后,通過(guò)將 (4) 式代入到 (5) 式中,可以得到 SimPO 目標(biāo):

圖片

總結(jié)起來(lái),SimPO 采用了與生成指標(biāo)直接對(duì)齊的隱式獎(jiǎng)勵(lì)形式,從而消除了對(duì)參考模型的需求。此外,其還引入了一個(gè)目標(biāo)獎(jiǎng)勵(lì)差額 γ 來(lái)分離獲勝和失敗響應(yīng)。

實(shí)驗(yàn)設(shè)置

模型和訓(xùn)練設(shè)置。該團(tuán)隊(duì)的實(shí)驗(yàn)使用了 Base 和 Instruct 兩種設(shè)置下的兩類模型 Llama3-8B 和 Mistral-7B。

評(píng)估基準(zhǔn)。該團(tuán)隊(duì)使用了三個(gè)最常用的開(kāi)放式指令遵從基準(zhǔn):MT-Bench、AlpacaEval 2 和 Arena-Hard v0.1。這些基準(zhǔn)可評(píng)估模型在各種查詢上的多樣化對(duì)話能力,并已被社區(qū)廣泛采用。表 2 給出了一些細(xì)節(jié)。

圖片

基線方法。表 3 列出了與 SimPO 做對(duì)比的其它離線偏好優(yōu)化方法。

實(shí)驗(yàn)結(jié)果

主要結(jié)果與消融研究

SimPO 的表現(xiàn)總是顯著優(yōu)于之前已有的偏好優(yōu)化方法。如表 4 所示,盡管所有的偏好優(yōu)化算法的表現(xiàn)都優(yōu)于 SFT 模型,但簡(jiǎn)單的 SimPO 卻在所有基準(zhǔn)和設(shè)置上都取得了最佳表現(xiàn)。這樣全面的大幅領(lǐng)先彰顯了 SimPO 的穩(wěn)健性和有效性。

基準(zhǔn)質(zhì)量各不相同。可以觀察到,在 Arena-Hard 上的勝率明顯低于在 AlpacaEval 2 上勝率,這說(shuō)明 Arena-Hard 是更困難的基準(zhǔn)。

Instruct 設(shè)置會(huì)帶來(lái)顯著的性能增益。可以看到,Instruct 設(shè)置在所有基準(zhǔn)上都全面優(yōu)于 Base 設(shè)置。這可能是因?yàn)檫@些模型使用了更高質(zhì)量的 SFT 模型來(lái)進(jìn)行初始化以及這些模型生成的偏好數(shù)據(jù)的質(zhì)量更高。

SimPO 的兩種關(guān)鍵設(shè)計(jì)都很重要。表 5 展示了對(duì) SimPO 的每種關(guān)鍵設(shè)計(jì)進(jìn)行消融實(shí)驗(yàn)的結(jié)果。(1) 移除 (4) 式中的長(zhǎng)度歸一化(即 w/o LN);(2) 將 (6) 式中的目標(biāo)獎(jiǎng)勵(lì)差額設(shè)置為 0(即 γ = 0)。

移除長(zhǎng)度歸一化對(duì)結(jié)果的影響最大。該團(tuán)隊(duì)研究發(fā)現(xiàn),這會(huì)導(dǎo)致模型生成長(zhǎng)且重復(fù)的模式,由此嚴(yán)重拉低輸出的整體質(zhì)量。將 γ 設(shè)為 0 也會(huì)導(dǎo)致 SimPO 的性能下降,這說(shuō)明 0 并非最優(yōu)的目標(biāo)獎(jiǎng)勵(lì)差額。

有關(guān)這兩項(xiàng)設(shè)計(jì)選擇的更深度分析請(qǐng)參閱原論文。

深度對(duì)比 DPO 與 SimPO

最后,該團(tuán)隊(duì)還從四個(gè)角度全面比較了 DPO 與 SimPO:(1) 似然 - 長(zhǎng)度相關(guān)性、(2) 獎(jiǎng)勵(lì)構(gòu)建、(3) 獎(jiǎng)勵(lì)準(zhǔn)確度、(4) 算法效率。結(jié)果表明 SimPO 在準(zhǔn)確度和效率方面優(yōu)于 DPO。

DPO 獎(jiǎng)勵(lì)會(huì)隱式地促進(jìn)長(zhǎng)度歸一化。


盡管 DPO 獎(jiǎng)勵(lì)表達(dá)式 圖片(不包含配分函數(shù))缺乏一個(gè)用于長(zhǎng)度歸一化的顯式項(xiàng),但策略模型和參考模型之間的對(duì)數(shù)比可以隱式地抵消長(zhǎng)度偏見(jiàn)。如表 6 與圖 4a 所示,相比于沒(méi)有任何長(zhǎng)度歸一化的方法(記為 SimPO w/o LN),使用 DPO 會(huì)降低平均對(duì)數(shù)似然和響應(yīng)長(zhǎng)度之間的斯皮爾曼相關(guān)系數(shù)。但是,當(dāng)與 SimPO 比較時(shí),其仍然表現(xiàn)出更強(qiáng)的正相關(guān)性。

DPO 獎(jiǎng)勵(lì)與生成似然不匹配。

圖片


DPO 的獎(jiǎng)勵(lì)與平均對(duì)數(shù)似然指標(biāo)之間存在差異,這會(huì)直接影響生成。如圖 4b 所示,在 UltraFeedback 訓(xùn)練集上的實(shí)例中,其中 圖片,幾乎一半的數(shù)據(jù)對(duì)都有圖片。相較之下,SimPO 是直接將平均對(duì)數(shù)似然(由 β 縮放)用作獎(jiǎng)勵(lì)表達(dá)式,由此完全消除了其中的差異。

DPO 在獎(jiǎng)勵(lì)準(zhǔn)確度方面不及 SimPO。

圖片

圖 4c 比較了 SimPO 和 DPO 的獎(jiǎng)勵(lì)準(zhǔn)確度,這評(píng)估的是它們最終學(xué)習(xí)到的獎(jiǎng)勵(lì)與留存集上的偏好標(biāo)簽的對(duì)齊程度。可以觀察到,SimPO 的獎(jiǎng)勵(lì)準(zhǔn)確度高于 DPO,這說(shuō)明 SimPO 的獎(jiǎng)勵(lì)設(shè)計(jì)有助于實(shí)現(xiàn)更有效的泛化和更高質(zhì)量的生成。

SimPO 的內(nèi)存效率和計(jì)算效率都比 DPO 高。

圖片

SimPO 的另一大優(yōu)勢(shì)是效率,畢竟它不使用參考模型。圖 4d 給出了在 8×H100 GPU 上使用 Llama3-Base 設(shè)置時(shí),SimPO 和 DPO 的整體運(yùn)行時(shí)間和每臺(tái) GPU 的峰值內(nèi)存使用量。相比于原版 DPO 實(shí)現(xiàn),得益于消除了使用參考模型的前向通過(guò),SimPO 可將運(yùn)行時(shí)間降低約 20%,將 GPU 內(nèi)存使用量降低約 10%。

 更多詳細(xì)內(nèi)容,請(qǐng)閱讀原文。


責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-09-28 15:35:32

AI模型強(qiáng)化學(xué)習(xí)

2022-07-26 09:56:48

模型AI

2025-02-13 12:23:28

2023-10-12 12:13:16

AI訓(xùn)練

2025-06-25 09:15:38

AI模型LLM

2022-02-17 14:52:10

模型AI谷歌

2025-01-08 13:05:56

2025-11-03 17:29:54

LeCun世界模型多模態(tài)

2025-06-13 09:03:00

2025-01-16 09:00:00

2025-07-04 16:45:24

AI模型評(píng)測(cè)

2025-07-18 09:55:11

2024-04-16 14:01:40

大型語(yǔ)言模型ORPO

2024-07-18 12:58:03

2024-01-16 12:10:33

模型數(shù)據(jù)

2025-07-18 10:12:00

2024-07-02 01:09:02

2025-07-22 10:22:02

2022-02-21 17:22:35

模型

2024-10-17 18:52:41

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

红桃一区二区三区| 国产成人精品免高潮在线观看| 日本wwww色| 精品人人视频| 中文字幕免费不卡| 99久久伊人精品影院| 国产综合精品视频| 天天久久综合| 亚洲美女精品久久| 国内av一区二区| 亚洲v.com| 亚洲精品日韩综合观看成人91| 久久国产精品-国产精品| 国产又粗又猛又爽又黄的| 国产欧美日本| 欧美成年人视频| 性猛交娇小69hd| 韩国女主播一区二区三区| 欧美三级三级三级爽爽爽| 国产精品国产亚洲精品看不卡| 欧美成人三区| 久久综合色综合88| 成人欧美一区二区三区在线观看 | 欧美日韩国产欧| 国产一区二区成人| 日韩av无码一区二区三区不卡 | 亚洲91av| 国产精品初高中害羞小美女文| 美媛馆国产精品一区二区| www.黄色片| 久久97超碰色| 欧美系列亚洲系列| 131美女爱做视频| 污污在线观看| 亚洲四区在线观看| 亚洲高清在线观看一区| 激情小说 在线视频| av电影天堂一区二区在线| 亚洲字幕在线观看| 国产一区二区自拍视频| 免费在线视频一区| 国产国语videosex另类| av大片免费观看| 亚洲高清资源| 欧美夫妻性生活视频| 极品魔鬼身材女神啪啪精品| 久久国产精品亚洲人一区二区三区| 亚洲欧美国产另类| 大又大又粗又硬又爽少妇毛片| 卡一精品卡二卡三网站乱码| 欧美精品一区二区三| 亚洲少妇一区二区三区| 香蕉免费一区二区三区在线观看| 欧美一区三区四区| 日本中文字幕在线不卡| 精品视频一二| 日韩美女一区二区三区四区| 制服下的诱惑暮生| 91综合精品国产丝袜长腿久久| 欧美一区二区网站| 肉丝美足丝袜一区二区三区四| 日本免费精品| 亚洲国产日韩欧美在线99| 97香蕉碰碰人妻国产欧美| 日韩欧美黄色| 亚洲人成网站777色婷婷| 无码人妻aⅴ一区二区三区69岛| 国产一区二区三区探花| 色偷偷av一区二区三区| 亚洲二区在线播放| 激情一区二区| 青草青草久热精品视频在线网站| 无码人妻av免费一区二区三区| 久久久久久夜| 成人h视频在线观看播放| 国产日韩免费视频| 波多野结衣中文字幕一区| 久久精品国产美女| www.在线视频.com| 亚洲精品视频在线观看免费| 日韩一级性生活片| 欧美大胆性生话| 欧美精品在线观看播放| 欧美人与性动交α欧美精品| 人人香蕉久久| 色偷偷av亚洲男人的天堂| 久久国产免费观看| 乱码第一页成人| 亚洲一区二区自拍| 四虎在线免费看| 中文字幕一区二区5566日韩| 成人在线播放网址| av成人在线播放| 日韩精品专区在线| 色无极影院亚洲| 欧美国产91| 庆余年2免费日韩剧观看大牛| 一区二区三区午夜| 99精品在线观看视频| 亚洲精品成人久久久998| 国产91足控脚交在线观看| 91黄色小视频| 最新国产精品自拍| 欧美3p视频| 91精品国产91久久久久久久久| 高潮无码精品色欲av午夜福利| 国产成人在线观看| 日韩欧美精品一区二区| av今日在线| 7777精品久久久大香线蕉| 免费看黄色aaaaaa 片| 久久久人成影片免费观看| 欧美最顶级丰满的aⅴ艳星| 国产按摩一区二区三区| 国产精品欧美经典| av天堂永久资源网| 高清一区二区三区| 久久亚洲精品国产亚洲老地址| 精品人妻一区二区三区潮喷在线| 国产成人免费视频| 老司机av福利| a∨色狠狠一区二区三区| 国产视频亚洲视频| 日韩 国产 在线| 国产丶欧美丶日本不卡视频| 亚洲巨乳在线观看| 秋霞国产精品| 亚洲天堂av图片| 国偷自拍第113页| 成人av在线网| a级免费在线观看| 一区二区视频| 久久91亚洲精品中文字幕奶水| 91成品人影院| 中文字幕在线观看不卡| 国产小视频精品| 日本一区二区三区视频| 国产精品678| 国产无套粉嫩白浆在线2022年| 欧美日韩性视频在线| 久久无码专区国产精品s| 综合久久十次| 999视频在线观看| 亚洲羞羞网站| 精品电影一区二区三区| 久久久久久久国产视频| 国产不卡在线一区| 免费在线黄网站| 91麻豆精品国产91久久久久推荐资源| 欧美成人精品三级在线观看| 999国产精品视频免费| 亚洲精品第1页| 91精品人妻一区二区三区四区| 欧美成人综合| 国产精品视频免费观看| 人狥杂交一区欧美二区| 日韩久久午夜影院| 国产一区二区视频免费| 国产精品美女一区二区在线观看| 成人免费在线观看视频网站| 久久影视一区| 99久久精品免费看国产四区| 国模私拍视频在线播放| 亚洲精品久久久久中文字幕欢迎你| 国产成人愉拍精品久久| 久久久美女艺术照精彩视频福利播放| 99久久国产宗和精品1上映| 成人一区二区| 99热在线播放| 国模套图日韩精品一区二区| 一区二区三区黄色| av无码精品一区二区三区宅噜噜| 亚洲一区二区三区四区在线 | 加勒比久久高清| 欧美一区二粉嫩精品国产一线天| 国产亚洲依依| 欧美一区二区三区思思人| 国产真实乱偷精品视频| 国产三级精品在线| 免费不卡av网站| 先锋亚洲精品| 亚洲五月六月| 国产亚洲成av人片在线观黄桃| 国产999精品久久久| 免费av在线播放| 日韩电影中文字幕在线观看| 中文永久免费观看| 亚洲成年人影院| 女人十八毛片嫩草av| 国产91高潮流白浆在线麻豆| 欧美成人免费高清视频| 欧美freesex交免费视频| 久久资源av| 欧美日韩黄色| 国产精品久久久久99| 国产一线二线在线观看| 揄拍成人国产精品视频| 人妻妺妺窝人体色www聚色窝 | 国产99视频在线| 欧美色播在线播放| 欧美性猛交xxxxx少妇| 99久久国产综合精品女不卡| www.久久久久久久久久久| 亚洲福利一区| 最近免费观看高清韩国日本大全| 性欧美lx╳lx╳| 成人免费视频网站| 亚洲日本中文| 国产精品极品尤物在线观看| xxxx另类黑人| 九色91av视频| 快射视频在线观看| 亚洲午夜国产成人av电影男同| 免费看国产片在线观看| 欧美久久婷婷综合色| 无码人妻丰满熟妇区五十路 | 91麻豆精品在线| 黄色91在线观看| 美女的奶胸大爽爽大片| 国产精品精品国产色婷婷| 大又大又粗又硬又爽少妇毛片| 国产**成人网毛片九色| 国内av一区二区| 精品中文字幕一区二区| 在线视频日韩一区| 母乳一区在线观看| 91猫先生在线| 亚洲乱码久久| 青青青国产在线观看| 国产精品久久| 日本免费成人网| 在线中文字幕第一区| 久久久国产精华液999999| 日韩免费特黄一二三区| 水蜜桃亚洲一二三四在线| 亚洲综合小说图片| 欧美成人蜜桃| 免费黄色成人| 青娱乐一区二区| 神马电影久久| 欧美日本国产精品| 国产一区二区精品福利地址| 欧美少妇一区| 精品国产乱码久久久久久1区2匹| 女同一区二区| 成人在线免费观看网站| 亚洲一区三区| 国产精品久久久久久| 亚洲自拍偷拍一区二区三区| 66视频精品| 国产成人在线小视频| 尤物精品在线| 久久网站免费视频| 久久久久久久波多野高潮日日| 少妇性l交大片| 另类小说综合欧美亚洲| 久久精品一卡二卡| 成人免费观看av| 中出视频在线观看| 国产香蕉久久精品综合网| 又色又爽的视频| 亚洲婷婷在线视频| 国产精选第一页| 欧美性69xxxx肥| 日批视频免费观看| 欧美一区二区三区四区久久| 亚洲男人第一天堂| 亚洲精品影视在线观看| 在线视频1区2区| 欧美成人小视频| 日韩伦理在线一区| 国产精品亚洲网站| 1769国产精品视频| 免费在线一区二区| 五月精品视频| 男人日女人视频网站| 日本中文字幕不卡| 欧美人与性动交α欧美精品| 26uuu国产日韩综合| 国产欧美小视频| 亚洲制服丝袜一区| 亚洲精品一区二三区| 日韩一卡二卡三卡四卡| 少妇激情av一区二区| 少妇av一区二区三区| 污的网站在线观看| 国产精品久久久久久久久借妻| 九九99久久精品在免费线bt| 国产日韩一区欧美| 97精品视频| 久久国产成人精品国产成人亚洲 | 在线免费看黄色片| 国产精品日日摸夜夜摸av| 国产精品6666| 91超碰这里只有精品国产| 污污视频在线观看网站| yellow中文字幕久久| 周于希免费高清在线观看| 成人午夜高潮视频| 国产成人精品一区二区免费看京 | 任我爽在线视频| 欧美日韩亚洲91| 精品国产免费无码久久久| 国产香蕉精品视频一区二区三区| 美女91在线| 成人午夜在线观看| 欧美久久精品一级c片| 日本精品久久久久久久久久| 国内精品视频一区二区三区八戒| 精品少妇人妻一区二区黑料社区| 夜夜精品视频一区二区 | 不卡中文字幕在线| 免费一级欧美片在线播放| 日韩精品国产一区| 综合电影一区二区三区| 国产一级一级国产| 亚洲国产精品久久久久秋霞不卡| av大片在线| 国产在线高清精品| 日韩精品免费一区二区三区| 无码人妻精品一区二区三区在线| 国产成人午夜精品影院观看视频| 亚洲а∨天堂久久精品2021| 五月激情综合婷婷| 亚洲成人第一区| 两个人的视频www国产精品| 日韩福利影视| 亚洲精品一区二区三区四区五区| 三级亚洲高清视频| 亚洲午夜久久久久久久久红桃 | 欧美精品免费在线| vam成人资源在线观看| 一区二区三区国| 免费在线一区观看| 久久久久人妻一区精品色| 欧美性生交片4| wwwxxx在线观看| 国产精品美腿一区在线看| 国产一区二区电影在线观看| 午夜激情福利在线| 国产欧美一区在线| 国产精品第6页| 在线视频国产日韩| 精品久久99| 伊人情人网综合| 国产一区二区免费视频| 午夜精品福利在线视频| 日韩一区二区三免费高清| 婷婷丁香在线| 国产伦精品一区| 亚洲午夜精品久久久久久app| 欧美图片自拍偷拍| 天天做天天摸天天爽国产一区 | 国产精品久久777777换脸| 久久激情视频免费观看| 国产在线视频欧美一区| 韩国无码av片在线观看网站| 99久久99久久精品免费看蜜桃| 天天爽夜夜爽人人爽| 最近中文字幕日韩精品| 成人噜噜噜噜| 丁香六月激情网| 91免费视频观看| 中文字幕乱码中文字幕| 久久精品国产欧美激情| 51vv免费精品视频一区二区| 国产精品一区二区免费在线观看| 国产视频在线观看一区二区三区| 中文字幕欧美人妻精品| 美女啪啪无遮挡免费久久网站| 精品嫩草影院| 欧美自拍小视频| 一区二区三区四区高清精品免费观看| 天堂成人在线视频| 国产精品久久视频| 欧美高清不卡| 人人人妻人人澡人人爽欧美一区| 在线不卡免费欧美| 99riav视频在线观看| 亚洲欧美日韩另类精品一区二区三区 | 丝袜久久网站| 日韩av卡一卡二| 午夜免费久久看| 视频免费一区| 国产专区一区二区三区| 美女视频黄久久| 日韩免费在线视频观看| 中文字幕一区二区精品| 国产精品毛片av| 亚欧激情乱码久久久久久久久| 亚洲午夜三级在线| www日韩tube| 久久国产手机看片| 国产曰批免费观看久久久| 一级黄色免费网站| 美女国内精品自产拍在线播放| 伊人久久大香线蕉综合网蜜芽| 国产伦精品一区二区三区妓女下载| 日韩欧美在线网址| 女同视频在线观看|