精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

【LLM】在線合并優(yōu)化器以提升獎勵并減輕對齊開銷

發(fā)布于 2024-6-7 12:59
瀏覽
0收藏

【LLM】在線合并優(yōu)化器以提升獎勵并減輕對齊開銷-AI.x社區(qū)

一、結(jié)論寫在前面

在強化學(xué)習(xí)人類反饋(RLHF)中,有效對齊大型語言模型(LLMs)與以人為中心的價值,同時防止通過預(yù)訓(xùn)練和監(jiān)督微調(diào)(SFT)獲得的能力退化,是一個核心挑戰(zhàn)。插值RLIF和SFT模型參數(shù)可以調(diào)整人類偏好與基本能力之間的權(quán)衡,從而以犧牲對齊獎勵為代價減少對齊開銷(Alignment Tax)。

受此啟發(fā),論文提出在RLHF的每個優(yōu)化步驟中整合RL策略和SFT模型,以持續(xù)調(diào)節(jié)訓(xùn)練方向,引入在線合并優(yōu)化器。具體而言,論文通過合并SFT與預(yù)訓(xùn)練模型之間的參數(shù)差異來融合梯度,有效地引導(dǎo)梯度向SFT優(yōu)化的方向最大化獎勵。    

對各種骨干LLMs進行的大量實驗表明,與正則化和離線合并基線相比,在線合并優(yōu)化器能更好地緩解對齊成本并實現(xiàn)更優(yōu)的對齊性能。此外,論文提出了step-K在線合并優(yōu)化器,彌合了在線和離線合并之間的差距,并深入分析了超參數(shù)和消融的效果。論文證明了論文的優(yōu)化器適用于不同的LLM家族,如Qwen和LLaMA,跨越從1.8B到8B的各種模型大小,以及DPO和KTO等不同的RLHF算法,以及現(xiàn)有的模型合并方法。它顯著提升了對齊獎勵,同時減輕了對齊成本開銷,在14個基準(zhǔn)測試中實現(xiàn)了更高的整體性能。

限制:在線合并優(yōu)化器的主要限制與參數(shù)效率相關(guān)。在線合并優(yōu)化器增加了內(nèi)存需求,因為它們需要緩存參考模型的額外增量參數(shù),以對應(yīng)訓(xùn)練中的增量更新權(quán)重。同時,除非參考模型也使用LoRA適配器進行訓(xùn)練,否則它們不能應(yīng)用于LoRA訓(xùn)練。然而,通過將GaLore與在線合并優(yōu)化器結(jié)合使用,可以進一步消除這一限制。

二、論文的簡單介紹

2.1 論文的背景

理想情況下,一個最佳的RLHF策略應(yīng)在保持對齊性的獎勵同時避免相關(guān)的代價,力求在最大化獎勵的同時最小化遺忘。依賴于神經(jīng)網(wǎng)絡(luò)的線性模式連通性,模型能力之間的權(quán)衡可簡潔地描述為模型參數(shù)的插值。研究表明,通過權(quán)重插值從同一預(yù)訓(xùn)練模型微調(diào)的不同模型結(jié)合,往往能在原始模型間實現(xiàn)更平衡的性能。

受此啟發(fā),論文初步探索了將RLHF模型與其訓(xùn)練自的參考SFT模型進行合并。論文的觀察表明,這種離線模型合并有效地緩解了對齊成本。如表4所示,離線合并模型在語言基準(zhǔn)和語言熟練度上恢復(fù)了與SFT模型相當(dāng)?shù)男阅堋H欢@種改進是以相對于RLHF模型偏好評分的減少為代價的。

鑒于單次參數(shù)插值僅允許在固定能力的模型之間進行權(quán)衡,離線合并帶來的適度性能提升并不令人意外。在RLHF訓(xùn)練過程中,每個優(yōu)化步驟都提升了模型的能力。因此,論文有機會確保這些變化的方向與參考SFT模型保持一致。本文中,論文將模型合并整合到每個RLIIF優(yōu)化步驟中,并引入了在線合并優(yōu)化器。這一創(chuàng)新的優(yōu)化器在提升獎勵方面比傳統(tǒng)的優(yōu)化器如AdamW更有效,同時也在減少對齊成本方面,類似于離線合并。    

【LLM】在線合并優(yōu)化器以提升獎勵并減輕對齊開銷-AI.x社區(qū)

              圖1:RLHF與在線合并優(yōu)化器的示意圖。在每個RLHF迭代中,論文首先獲取更新權(quán)重A((0,然后對其進行稀疏化處理,并與參考模型的delta參數(shù)達成共識。論文使用這種合并的delta作為本次迭代中策略模型的更新。論文還對比了在線合并與離線合并,如圖下方所示

對齊開銷(Alignment Tax)。通常,使大型語言模型(LLMs)與人類偏好對齊涉及兩個階段:首先進行監(jiān)督微調(diào)(SFT)以建立遵循指令的模型,隨后通過人類反饋強化學(xué)習(xí)(RLHF)來增強人類偏好。當(dāng)前主流的RLHF方法,如PPO和DPO,指導(dǎo)模型在優(yōu)化獎勵的同時,引入Kullback-Leibler(KL)散度懲罰項,該懲罰項存在于學(xué)習(xí)到的RL策略輸出與參考的SFT模型之間。這一懲罰機制防止策略在追求偏好獎勵時偏離其原始目標(biāo),即保持已獲得的語言能力。

論文在DPO設(shè)置中嘗試了不同的KL散度權(quán)重β,如圖4所示。β的增加與基準(zhǔn)性能的平均提升相關(guān),但代價是MT-Bench和AlpacaEval上的性能下降。相反,降低β會導(dǎo)致模型失去其基本能力。在獎勵優(yōu)化與維持語言分類學(xué)之間尋求平衡已成為RLHF訓(xùn)練中的首要挑戰(zhàn)。

2.2 論文的方法--在線合并優(yōu)化器

受到離線合并的啟發(fā),本節(jié)論文探討將模型合并融入到RLHF優(yōu)化步驟中。論文首先審視常用的基于梯度的優(yōu)化器。

2.2.1 從基于梯度的優(yōu)化器到在線合并優(yōu)化器

離線任務(wù)運算技術(shù)通過將LLMs的增量參數(shù)聚合來合并LLMs。相應(yīng)地,論文旨在合并參考SFT模型和第t次訓(xùn)練步驟的政策模型。

然而,論文實證發(fā)現(xiàn)直接優(yōu)化等式是不穩(wěn)定的且難以收斂,并且等式需要額外的緩存來存儲預(yù)訓(xùn)練模型的參數(shù)。因此,論文對等式進行了松弛處理,這種松弛仍然與論文在優(yōu)化步驟中應(yīng)用離線合并的動機很好地一致。這種松弛的另一個重要好處是避免了緩存額外的參數(shù),增強了內(nèi)存效率。通過這種松弛,論文表明在每個優(yōu)化步驟中的在線合并可以通過基于梯度的增量權(quán)重與參考模型的增量參數(shù)之間的整合來近似。    

2.2.2 實現(xiàn)方法

需要注意的是,論文的優(yōu)化器框架具有高度的靈活性,并與現(xiàn)有的模型合并方法兼容。論文基于廣泛使用的模型合并方法DARE和TIES開發(fā)了兩種在線合并優(yōu)化器:

OnDARE優(yōu)化器。DARE采用隨機稀疏化方法和線性組合作為共識方法。

OnTIES優(yōu)化器。TIES使用top-k百分比稀疏化和基于符號的共識方法。具體來說,它從每個合并候選中保留關(guān)于絕對值的top-p百分比的參數(shù)。它根據(jù)符號和范數(shù)計算元素級多數(shù)符號,丟棄與多數(shù)符號不同的參數(shù),并對剩余的參數(shù)進行加權(quán)求和。

2.3 論文的效果

2.3.1 實驗設(shè)置

數(shù)據(jù)集。論文在廣泛使用的偏好數(shù)據(jù)集ULTRAFEEDBACK上進行實驗。與原始版本相比,ULTRAFEEDBACK的訓(xùn)練和評估部分分別包含約61K和2K個偏好對,由GPT-4進行排序,并通過人工努力進行清理,同時使用流行的基準(zhǔn)測試(如TruthfulQA)進行了無害化處理。ULTRAFEEDBACK中的提示規(guī)模龐大、細(xì)粒度且來源多樣。

訓(xùn)練。論文主要探索了在ULTRAFEEDBACK數(shù)據(jù)集上直接偏好優(yōu)化(DPO)中的在線合并優(yōu)化器,因為與近端策略優(yōu)化(PPO)相比,DPO由于其較低的訓(xùn)練成本而在當(dāng)今大規(guī)模LLM對齊中得到廣泛應(yīng)用。一般的DPO包括從策略模型中采樣和標(biāo)注響應(yīng)。在這項工作中,論文使用DPO的離線策略設(shè)置,直接在ULTRAFEEDBACK數(shù)據(jù)集上訓(xùn)練論文的策略模型,這也被證明在提高有益性和無害性方面是有效的。

評估。評估對齊的大型語言模型是一項具有挑戰(zhàn)性的任務(wù)。論文遵循全面評估產(chǎn)生可信評估的直接原則。因此,論文的評估包括7個類別中的12個公共基準(zhǔn),評估對齊LLM的綜合能力:    

數(shù)學(xué):(1)GSM8K(2)Math401(3)Math23K;

編碼:(1)HumanEval(2)MBPP(3)DS1000(4)CodeApex;

指令遵循(IF):(1)IFEval;

閱讀理解(RC):(1)COQA(2)DROP;

知識:(1)MMLU;

agent:(1)NousResearch;

代碼混合;

論文使用類別內(nèi)的平均分?jǐn)?shù)作為最終類別分?jǐn)?shù),使用所有類別中所有基準(zhǔn)的平均分?jǐn)?shù)作為整體評估。論文還使用基于GPT-4的評估器,通過長度控制評分,引入了MT-Bench 4和AlpacaEval 2.0,這是兩個領(lǐng)先且流行的基準(zhǔn),用于評估LLM與人類偏好的一致性。

基線。論文方法的一個簡單基線是普通的AdamW。論文進一步考慮離線合并方法,如線性合并、DARE和TIES作為論文的強基線,因為Lin et al. (2024)表明簡單合并可以減輕對齊成本。由于對齊成本與遺忘有關(guān),論文還將傳統(tǒng)的正則化方法,如KL懲罰、EMA和ChildTuning作為論文的基線。

具體來說,DPO算法使用超參數(shù)β調(diào)整KL懲罰。論文還將LoRA作為論文的基線之一,因為參數(shù)高效方法在訓(xùn)練中應(yīng)用了關(guān)于權(quán)重空間的正則化。

配置。論文使用三種LLM尺寸進行實驗,即Qwen1.5-1.8B、Qwen1.5-7B和LLaMa3-8B系列。

具體而言,論文使用Qwen-1.8B-Base、Qwen-7B-Base和LLaMa-3-8B作為在線優(yōu)化器的基礎(chǔ)模型。論文在Qwen1.5-1.8B-SFT、Qwen1.5-7B-SFT和LLaMa-3-8B-it作為參考模型上對ULTRAFEEDBACK進行直接偏好優(yōu)化。兩個Qwen1.5監(jiān)督微調(diào)模型在多語言指令數(shù)據(jù)上進行了訓(xùn)練,但與ULTRAFEEDBACK數(shù)據(jù)集沒有重疊。    

【LLM】在線合并優(yōu)化器以提升獎勵并減輕對齊開銷-AI.x社區(qū)

2.3.2 主要結(jié)果

論文在表4中展示了論文的主要結(jié)果,其中展示了基線方法和論文提出的在線合并優(yōu)化器在ULTRAFEEDBACK上的性能,分別在Qwen1.5-1.8BChat、Qwen1.5-7B-Chat和LLaMa-3-8B-Chat上訓(xùn)練。總的來說,與原始的AdamW相比,正則化和離線模型合并方法在大多數(shù)設(shè)置下并沒有顯著提高RLHF模型在基準(zhǔn)測試上的平均性能,反而導(dǎo)致MT-Bench和AlpacaEval 2.0的偏好分?jǐn)?shù)下降。這表明,僅僅依靠梯度dropout(ChildTuning)、抑制模型梯度更新的變化(EMA)或基于SFT模型對RLHF模型參數(shù)進行一次性調(diào)整(Merging)等技術(shù),都不能有效解決對齊獎勵-稅收的權(quán)衡問題。    

正則化基線在LLama-3-8B-It上表現(xiàn)特別好,所有正則化方法在平均基準(zhǔn)測試分?jǐn)?shù)以及MT-Bench和AlpacaEval分?jǐn)?shù)上都取得了一致的改進。相比之下,論文提出的在線合并優(yōu)化器,特別是OnDARE變體,在所有測試集上都取得了最顯著的改進。OnDARE在基準(zhǔn)測試平均分上取得了最高的改進,并在所有三個主干LLM上持續(xù)增強了MT-Bench和AlpacaEval 2.0,顯著超過其他基線,尤其是在LLaMa-3-8B-Instruct實驗中,分別在基準(zhǔn)測試、MT-Bench和AlpacaEval上取得了1.3、0.19和1.57的改進。

盡管OnTIES和OnDARE在提高獎勵和減輕稅收方面都顯示出了有效性,但在大多數(shù)情況下,OnDARE在平均基準(zhǔn)測試分?jǐn)?shù)方面略優(yōu)于OnTIES,而OnTIES在AlpacaEval 2.0上有時具有更高的LC勝率。每個基準(zhǔn)測試的詳細(xì)分?jǐn)?shù)在表5、表6、表7中報告。

2.3.3 超參數(shù)效應(yīng)

本節(jié)分析了兩個主要超參數(shù),即參數(shù)保留率和合并權(quán)重,如何影響在線合并優(yōu)化器的整體性能。

參數(shù)保留率是在線合并期間的參數(shù)保留率。論文在Qwen1.5-1.8B-Chat上探索了從1到1e-5的保留率,以在有限的計算資源內(nèi)最大化搜索空間。如圖2所示,即使在低至5e-4的低參數(shù)保留率下,在線合并優(yōu)化器仍然保持穩(wěn)健。這表明,在每個RLHF步驟中丟棄99.95%的基于梯度的參數(shù)修改仍然可以得到穩(wěn)定的訓(xùn)練。與OnDARE相比,OnTIES對極低的參數(shù)保留率更敏感。這種敏感性是由于OnDARE采用了無偏隨機稀疏化方法,而OnTIES使用的top-k稀疏化在訓(xùn)練過程中引入了顯著的偏差。

【LLM】在線合并優(yōu)化器以提升獎勵并減輕對齊開銷-AI.x社區(qū)

    

合并權(quán)重是參考(SFT)模型的梯度和增量參數(shù)的聚合權(quán)重。較大的合并權(quán)重在在線合并優(yōu)化器中引入更強的正則化。論文嘗試了從10?4到10?7的各種合并權(quán)重,并在表2中報告了結(jié)果。

隨著合并權(quán)重的增加,由于訓(xùn)練過程中添加的正則化減少,MT-Bench分?jǐn)?shù)上升,而平均基準(zhǔn)測試分?jǐn)?shù)先增加后減少,在α=5e?7時達到峰值。與EMA訓(xùn)練中的指數(shù)系數(shù)類似,較大的合并權(quán)重會導(dǎo)致訓(xùn)練不穩(wěn)定。因此,論文建議從10?7這樣的小數(shù)字開始合并權(quán)重的超參數(shù)搜索。值得注意的是,特殊情況合并權(quán)重=0使OnDARE等同于梯度dropout正則化方法,如論文基線中的ChildTuning。

2.3.4 RLHF算法的影響

論文進一步研究了它們在其他RLHF算法中的應(yīng)用。具體而言,論文在IPO和KTO中實現(xiàn)了OnDARE和OnTIES。論文在這些設(shè)置下在ULTRAFEEDBACK數(shù)據(jù)集上訓(xùn)練Qwen1.5-7B-Chat,并在表3中展示了結(jié)果。

除了IPO算法的平均基準(zhǔn)測試分?jǐn)?shù)外,在線合并優(yōu)化器OnDARE和OnTIES在MT-Bench上的表現(xiàn)都優(yōu)于AdamW。這表明它們的有效性可以擴展到多個RLHF算法變體。

【LLM】在線合并優(yōu)化器以提升獎勵并減輕對齊開銷-AI.x社區(qū)

論文標(biāo)題:Online Merging Optimizers for Boosting Rewards and Mitigating Tax in Alignment

論文鏈接:??https://arxiv.org/pdf/2405.17931??    

本文轉(zhuǎn)載自 ??AI帝國??,作者: 無影寺



收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
欧美777四色影| 天堂av在线网| 成人激情小说网站| 国产经典一区二区| www欧美com| 私拍精品福利视频在线一区| 欧美日韩亚洲综合一区| 黄色成人在线免费观看| 日本福利在线观看| 国内精品伊人久久久久影院对白| 国内外成人免费激情在线视频| 免费人成又黄又爽又色| 亚洲午夜免费| 欧美日韩在线电影| 亚洲午夜无码av毛片久久| 免费观看在线黄色网| 91一区二区三区在线播放| 成人在线国产精品| 日韩精品一区不卡| 好看的亚洲午夜视频在线| 深夜福利91大全| 亚洲av无码成人精品国产| 精品视频在线一区| 欧美色精品在线视频| 国产成人无码精品久久久性色| 黄色在线免费看| 日本一区免费视频| 久久综合伊人77777麻豆| 国产福利资源在线| 蜜臀av一区二区三区| 2024亚洲男人天堂| 天天操天天射天天爽| 久久福利影院| 国产一区二区三区视频| chinese麻豆新拍video| 免费观看亚洲天堂| 91精品欧美福利在线观看| 一区二区成人网| 成人美女视频| 狠狠色狠狠色综合日日五| 成年在线观看视频| 黄色网址在线免费播放| 国产精品福利一区| 天天综合狠狠精品| 国产三级视频在线| 久久精品这里都是精品| 欧美精品中文字幕一区二区| 图片区 小说区 区 亚洲五月| 国产成人av福利| 成人h在线播放| www.97av.com| 国产精品影音先锋| 亚洲精品日韩激情在线电影| 国产一区二区在线视频聊天| 精品一区精品二区高清| 国产传媒欧美日韩成人精品大片| 成人av网址在线观看| 成人午夜两性视频| 国产永久免费视频| 狠狠色丁香婷婷综合| 国产欧美一区二区三区久久| 亚洲一级特黄毛片| 国产综合成人久久大片91| 国产自摸综合网| 国产偷拍一区二区| 国产不卡一区视频| 国产伦精品一区二区三区在线 | 九九视频免费观看视频精品| 精品亚洲一区二区三区在线播放 | 性久久久久久久久久久久久久| 亚洲成a人片777777久久| 7777精品伊人久久久大香线蕉的 | www日本在线| 91原创在线视频| 视频一区二区综合| 二区三区在线观看| 亚洲国产精品精华液网站| 免费看国产曰批40分钟| 精品裸体bbb| 欧美一二三四区在线| 日韩av无码一区二区三区不卡 | 成人免费黄色在线| 欧美日韩精品一区| 麻豆影视国产在线观看| 亚洲一区视频在线| 精品久久久久久久无码| 天堂久久一区| 亚洲电影第1页| 亚洲av无码国产精品久久| 成人在线免费观看视频| 久久久精品国产一区二区| 欧美被狂躁喷白浆精品| 国产一区日韩一区| 91a在线视频| 在线观看毛片网站| 国产91综合一区在线观看| 狠狠色噜噜狠狠色综合久| 日本ー区在线视频| 17c精品麻豆一区二区免费| 国内自拍中文字幕| 国产免费不卡| 日韩欧美一区二区在线视频| 亚洲黄色在线网站| 综合精品久久| 国产成人激情视频| 天天av天天翘| 成人免费一区二区三区视频| 亚洲人精品午夜射精日韩| avav成人| 精品免费视频.| 国产偷人妻精品一区| 色综合咪咪久久网| 青草热久免费精品视频| 性网爆门事件集合av| 国产午夜精品福利| 97干在线视频| 欧美成人一二区| 日韩大陆毛片av| 国产日产精品一区二区三区的介绍| 欧美一区亚洲| 国产精品丝袜视频| 十九岁完整版在线观看好看云免费| 国产精品久久毛片a| 午夜精品久久久久久久无码| 高清不卡一区| 亚洲无限av看| 日韩欧美高清在线观看| 精品在线一区二区| 久久天堂国产精品| av免费在线视| 日韩一区二区三区精品视频| 妺妺窝人体色WWW精品| 伊人久久亚洲热| 亚洲自拍在线观看| 1pondo在线播放免费| 日韩欧美国产中文字幕| 精品无码av一区二区三区不卡| 五月久久久综合一区二区小说| 热re91久久精品国99热蜜臀| 欧美 日韩 国产 成人 在线| 日韩影视高清在线观看| 亚洲偷欧美偷国内偷| 精品无码人妻一区二区三| 麻豆国产精品视频| 国产精品美女久久久久久久| 国产女大学生av| 51亚洲精品| 欧美成人黑人xx视频免费观看| 精品成人无码久久久久久| 久久综合999| 国产精品秘入口18禁麻豆免会员| www.亚洲一二| 久久久免费观看视频| 成人黄色免费视频| 国产精品美女久久久久久久网站| 国产偷人视频免费| 欧美综合精品| 欧美二区在线播放| 亚洲av无码乱码国产精品| 中文字幕一区二区三区不卡在线| 999精彩视频| 成人在线电影在线观看视频| 国产999在线| 亚洲免费视频一区二区三区| 欧美日韩精品一区二区三区四区 | 国产乱色国产精品免费视频| eeuss中文| 久久久91麻豆精品国产一区| 色偷偷888欧美精品久久久| 99在线精品视频免费观看软件 | 久久偷窥视频| 欧美91看片特黄aaaa| 深夜福利一区二区| 国产乱码久久久| 一区二区三区在线视频免费| 女同性αv亚洲女同志| 亚洲天堂久久| 欧美性色黄大片人与善| 日本一区二区电影| 色哟哟入口国产精品| 亚洲精品一区二区三区区别| 亚洲成人高清在线| 亚欧洲乱码视频| 久久精品国产在热久久| 亚洲色婷婷久久精品av蜜桃| 久久中文字幕导航| 日韩av毛片网| 成人黄视频在线观看| 中文字幕精品一区二区精品| 中文字幕被公侵犯的漂亮人妻| 三级一区在线视频先锋| 三级三级久久三级久久18| 日韩av黄色| 欧美激情精品久久久久久蜜臀 | 在线中文字幕第一区| 国产精品一区二区在线| 中文字幕中文字幕在线中高清免费版| 精品国产a毛片| 久久久久久久久久成人| 中文字幕一区日韩精品欧美| www.桃色.com| 日韩精品成人一区二区在线| av影院在线播放| 竹菊久久久久久久| 91视频最新| 精品123区| 欧美激情视频一区二区| 天天操天天干天天爽| 337p亚洲精品色噜噜| 欧美成人精品欧美一级乱黄| 国产精品电影一区二区三区| 在线观看成人动漫| 麻豆freexxxx性91精品| 国产视频一视频二| 五月开心六月丁香综合色啪 | 无码av天堂一区二区三区| 国产午夜一区| 精品一区久久久久久| 欧美国产日韩电影| 国产999精品久久久影片官网| 日本动漫理论片在线观看网站| 亚洲天堂av综合网| 性网爆门事件集合av| 91精品国产综合久久久久久| 国产剧情在线视频| 亚洲动漫第一页| 久久国产高清视频| 国产精品视频在线看| 国产熟女高潮一区二区三区 | 亚洲AV无码一区二区三区性| 在线观看免费视频综合| 亚洲欧美偷拍一区| 亚洲福利视频一区二区| 成人免费视频网站入口::| 久久久精品国产免大香伊| 国产二级一片内射视频播放| 国内精品在线播放| 九色porny自拍| 久久久久99| 人妻有码中文字幕| 亚洲国产影院| 日韩精品在线中文字幕| 伊人久久大香线| 一区二区三区欧美成人| 成人精品天堂一区二区三区| 日本一区二区三不卡| 九九精品在线| 欧美亚洲免费在线| 网友自拍一区| 国产中文一区二区| 免费成人蒂法| 国产精品12| 小说区图片区色综合区| 成人欧美一区二区| 国产精品久久久久久久久久白浆| 99久久精品久久久久久ai换脸| 精品久久亚洲| 亚洲bt欧美bt日本bt| 精品女同一区二区三区在线观看| 91日韩在线视频| 精品国产麻豆| 69堂成人精品视频免费| 66精品视频在线观看| 亚洲影视中文字幕| 国内视频在线精品| 麻豆成人在线播放| 九九综合在线| 亚洲国产午夜伦理片大全在线观看网站| 国产99久久精品一区二区300| 欧美日韩国产不卡在线看| 香蕉视频一区| 宅男一区二区三区| 亚洲一区二区| 搞av.com| 丝袜诱惑制服诱惑色一区在线观看| 久久精品网站视频| 喷水一区二区三区| 97免费公开视频| 99久久99久久免费精品蜜臀| 国产男男chinese网站| 欧美极品少妇xxxxⅹ高跟鞋| 三级在线观看免费大全| 亚洲精品一二三| 亚洲婷婷综合网| 欧美人xxxx| 亚洲国产剧情在线观看| 亚洲精品资源美女情侣酒店| 成人精品福利| 久久中文精品视频| 欧美三级精品| 91超碰rencao97精品| 五月天亚洲一区| 亚洲精品影院| 影音先锋久久资源网| 亚洲国产日韩欧美在线观看| 国产69精品一区二区亚洲孕妇| 少妇光屁股影院| 1024国产精品| 91蜜桃视频在线观看| 欧美色图片你懂的| 亚洲乱码在线观看| 亚洲日韩欧美视频一区| www红色一片_亚洲成a人片在线观看_| 久久男人的天堂| 成人黄色毛片| 好吊妞www.84com只有这里才有精品 | 亚洲精品v日韩精品| 久久黄色精品视频| 欧美另类videos死尸| 三级做a全过程在线观看| 欧美黑人一级爽快片淫片高清| 欧亚一区二区| 国产精品国色综合久久| 色综合久久一区二区三区| 国产v片免费观看| 爽好多水快深点欧美视频| 日本性生活一级片| 中文字幕一区二区三中文字幕| 成人在线免费看视频| 日韩限制级电影在线观看| а天堂8中文最新版在线官网| 久久久久久久久久久人体| 国产69精品久久| 欧美不卡1区2区3区| 亚洲一级二级| www.偷拍.com| 久久久99精品久久| 久久精品视频5| 亚洲成人网在线| 宅男网站在线免费观看| 国产免费观看久久黄| 欧美**字幕| 青青草原av在线播放| 成人黄色在线网站| 亚洲综合视频网站| 欧美日韩二区三区| 国产精品无码2021在线观看| 日本aⅴ大伊香蕉精品视频| 高潮久久久久久久久久久久久久| 老司机av福利| 美女性感视频久久| 亚洲女优在线观看| 精品视频一区三区九区| 免费在线观看污视频| 98精品国产自产在线观看| 精品欧美午夜寂寞影院| 久久99久久久久久| av在线不卡免费看| 国产精品第二十页| 欧美日韩国产中文精品字幕自在自线| 黄瓜视频污在线观看| 亚洲香蕉伊在人在线观| 精品国产99久久久久久宅男i| 日韩一中文字幕| 久久久久久久久成人| 欧美h视频在线观看| 狠狠色狠狠色合久久伊人| 亚洲综合久久av一区二区三区| 欧美日免费三级在线| 欧美精品电影| 日韩免费电影一区| 麻豆tv入口在线看| 91精品国产综合久久男男| 婷婷久久综合| 日本成人在线免费观看| 中文字幕亚洲一区二区av在线| 国产suv一区二区| 久久久久久高潮国产精品视| 国产精品对白久久久久粗| 日韩伦理在线免费观看| 国产精品系列在线播放| 好吊操这里只有精品| 国产视频精品免费播放| 素人一区二区三区| 老汉色影院首页| 99亚偷拍自图区亚洲| 国产精品一区无码| 伊人av综合网| 日本在线视频一区二区三区| 国产自产在线视频| 国产免费成人在线视频| 91影院在线播放| 欧美日韩福利电影| 女同一区二区三区| 精品日韩久久久| 亚洲一区二区三区爽爽爽爽爽 | 日韩一级片网址| missav|免费高清av在线看| 麻豆精品蜜桃一区二区三区| 免费在线观看成人| 91香蕉在线视频| 色久欧美在线视频观看| 最新国产精品精品视频| 欧美a v在线播放| 中文字幕一区二区三中文字幕| 成人乱码一区二区三区| 国产97免费视| 狠狠综合久久| 日本少妇高潮喷水xxxxxxx| 日韩一区二区三区四区|