精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從繁雜技巧到極簡方案:ROLL團(tuán)隊(duì)帶來RL4LLM新實(shí)踐

人工智能 新聞
阿里巴巴淘天集團(tuán)和愛橙科技聯(lián)合多所高校,基于自研并開源的 RL 框架?ROLL, 開展了系統(tǒng)化研究。

本研究由淘天集團(tuán)算法技術(shù)—未來生活實(shí)驗(yàn)室與愛橙科技智能引擎事業(yè)部聯(lián)合完成,核心作者劉子賀,劉嘉順, 賀彥程和王維塤等。未來生活實(shí)驗(yàn)室匯聚淘天集團(tuán)的算力、數(shù)據(jù)與頂尖技術(shù)人才,專注于大模型、多模態(tài)等前沿 AI 方向,致力于打造基礎(chǔ)算法、模型能力及各類 AI Native 應(yīng)用,引領(lǐng) AI 在生活消費(fèi)領(lǐng)域的技術(shù)創(chuàng)新。愛橙科技則在大模型訓(xùn)練與優(yōu)化方面具有豐富的實(shí)踐經(jīng)驗(yàn)。雙方此前聯(lián)合開源了高效大模型強(qiáng)化學(xué)習(xí)訓(xùn)練框架 ROLL,此次論文工作同樣是基于 ROLL 框架的實(shí)踐探索。

近年來,強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)在提升大語言模型(LLM)復(fù)雜推理能力方面展現(xiàn)出顯著效果,廣泛應(yīng)用于數(shù)學(xué)解題、代碼生成等任務(wù)。通過 RL 微調(diào)的模型常在推理性能上超越僅依賴監(jiān)督微調(diào)或預(yù)訓(xùn)練的模型。也因此催生了大量的相關(guān)研究。但隨之而來的,是一系列令人困惑的現(xiàn)象:不同研究提出了不同的 RL 優(yōu)化技巧,卻缺乏統(tǒng)一的實(shí)驗(yàn)對比和機(jī)制解釋,有的甚至得出相互矛盾的結(jié)論。對于研究者和工程師而言,這種 “方法多、結(jié)論亂” 的局面,反而增加了落地應(yīng)用的難度。

為此,阿里巴巴淘天集團(tuán)和愛橙科技聯(lián)合多所高校,基于自研并開源的 RL 框架 ROLL, 開展了系統(tǒng)化研究。通過大規(guī)模實(shí)驗(yàn),全面評估了當(dāng)前主流 RL for LLM 方法中的關(guān)鍵技術(shù)組件,揭示其在不同設(shè)置下的有效性以及每類策略的底層機(jī)制,并最終提出一種僅包含兩項(xiàng)核心技術(shù)的簡化算法 ——Lite PPO,在多個(gè)基準(zhǔn)上表現(xiàn)優(yōu)于集成多種技巧的復(fù)雜方案。

  • 論文《Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning》
  • 論文鏈接:https://arxiv.org/pdf/2508.08221

問題背景:技術(shù)多樣性帶來的選擇困境

當(dāng)前 RL4LLM 領(lǐng)域發(fā)展迅速,但存在以下問題:

  • 標(biāo)準(zhǔn)不一:歸一化方式、剪裁策略、損失聚合、樣本過濾規(guī)則等策略存在多種實(shí)現(xiàn)方案,彼此之間缺乏統(tǒng)一比較基礎(chǔ)。
  • 結(jié)論不一:不同研究因模型初始性能、數(shù)據(jù)分布、超參設(shè)置等差異,得出相互矛盾的結(jié)果,導(dǎo)致實(shí)際應(yīng)用中難以判斷某項(xiàng)技術(shù)是否真正有效。
  • 機(jī)制解釋不足:多數(shù)方法缺乏對 “為何有效” 的理論或?qū)嵶C分析,導(dǎo)致技術(shù)使用趨于經(jīng)驗(yàn)化,形成 “調(diào)參依賴”。

針對上述問題,該研究旨在回答兩個(gè)核心問題:

  • 不同 RL 優(yōu)化技術(shù)在何種條件下有效?背后的機(jī)制是什么?
  • 是否存在更簡單、穩(wěn)定且通用的技術(shù)組合?

公平競技場:用統(tǒng)一框架拆解 RL 技巧

為了確保公平對比和結(jié)論可靠,該研究設(shè)計(jì)了嚴(yán)格的實(shí)驗(yàn)體系:

  • 統(tǒng)一實(shí)現(xiàn)平臺(tái):所有實(shí)驗(yàn)基于開源的 ROLL 框架完成,避免因工程實(shí)現(xiàn)差異引入偏差。
  • 清晰基線設(shè)定:以基于 REINFORCE 算法計(jì)算優(yōu)勢值的 PPO 損失(無價(jià)值函數(shù))作為基線,逐項(xiàng)添加對應(yīng)算法技術(shù),精確量化每個(gè)模塊的真實(shí)效果。
  • 多種場景覆蓋:涵蓋不同模型規(guī)模(4B/8B)、模型類型(Base 模型 與 Instruct 模型)、任務(wù)難度(Easy/Medium/Hard)下的實(shí)驗(yàn)分析。訓(xùn)練集從開源數(shù)據(jù)集(SimpleRL-Zoo-Data, DeepMath 等)中采樣過濾,按照難度等級劃分為為:Easy, Medium, Hard

各難度數(shù)據(jù)集中 rollout 8 次的正確次數(shù)分布。

  • 解耦式評估:將歸一化、剪裁策略、損失形式、過濾機(jī)制等關(guān)鍵模塊獨(dú)立測試,避免多因素耦合干擾判斷。
  • 多維度評估任務(wù):在六個(gè)數(shù)學(xué)推理數(shù)據(jù)集上進(jìn)行測試,覆蓋從基礎(chǔ)算術(shù)到國際數(shù)學(xué)奧林匹克難度的問題。

不同模型在不同數(shù)據(jù)難度下的準(zhǔn)確率和回答長度變化趨勢。為了確保對比清晰直觀,所有曲線均使用相同的參數(shù)進(jìn)行平滑處理。

核心發(fā)現(xiàn):技巧并非普適,需因 “場景” 而異

優(yōu)勢歸一化:Group-Mean + Batch-Std 最穩(wěn)健

理論介紹

優(yōu)勢歸一化通過平移 / 縮放優(yōu)勢值,降低梯度方差,穩(wěn)定更新。常見的兩種歸一化方式包括:

  • 組內(nèi)歸一化(Group-level):同一問題的 K 條響應(yīng)之間做對比,強(qiáng)化組內(nèi)相對優(yōu)劣。

  • 批次歸一化(Batch-level):對整個(gè)批次內(nèi)的 N*K 個(gè)響應(yīng)進(jìn)行獎(jiǎng)勵(lì)歸一化,利用更大樣本估計(jì)方差,抑制極端樣本主導(dǎo)梯度。

關(guān)鍵發(fā)現(xiàn)

1. 對獎(jiǎng)勵(lì)分布的敏感性:

  • 組內(nèi)歸一化(Group-level)在不同獎(jiǎng)勵(lì)設(shè)置下都更穩(wěn)定,尤其在稀疏 / 偏斜分布下。
  • 批次歸一化(Batch-level)對獎(jiǎng)勵(lì)分布的偏斜高度敏感,在數(shù)據(jù)分布不平衡的情況下更容易崩潰,因?yàn)樯贁?shù)極端樣本會(huì)主導(dǎo)優(yōu)勢估計(jì)。

各個(gè)模型在不同優(yōu)勢歸一化方式下的準(zhǔn)確率變化趨勢。

2. 標(biāo)準(zhǔn)差項(xiàng)的風(fēng)險(xiǎn):

  • 當(dāng)樣本獎(jiǎng)勵(lì)分布高度集中的場景下(例如簡單數(shù)據(jù)集下幾乎全對的樣本分布),標(biāo)準(zhǔn)差極小會(huì)放大梯度,導(dǎo)致訓(xùn)練不穩(wěn)定乃至崩潰。
  • 去掉標(biāo)準(zhǔn)差(僅做均值平移)在此類場景更穩(wěn)??;在高方差場景下,兩種方式差異不大。

左圖:在不同難度數(shù)據(jù)上的標(biāo)準(zhǔn)差變化趨勢。右圖:在批次歸一化下移除標(biāo)準(zhǔn)差前后的準(zhǔn)確率變化趨勢。

3. 混合方案的優(yōu)勢:

  • 實(shí)驗(yàn)發(fā)現(xiàn),“組內(nèi)均值 + 批次標(biāo)準(zhǔn)差”的混合歸一化更穩(wěn)健,旨在兼顧局部相對比較的語義合理性與全局方差估計(jì)的統(tǒng)計(jì)穩(wěn)健性。

各個(gè)模型上不同標(biāo)準(zhǔn)差計(jì)算方式的準(zhǔn)確率變化趨勢。

裁剪機(jī)制:Clip-Higher 并非普適

理論介紹

PPO 通過限制新舊策略概率比的變化,避免過大步長導(dǎo)致策略崩塌。但其同等限制上 / 下方向變化,常會(huì)過度壓制低概率 token 的提升,導(dǎo)致熵快速下降、探索不足。

  • Clip-Higher:DAPO 提出將上界放寬(上行允許更大更新,下行保持保守),給 “潛力 token” 更大爬升空間,緩解熵塌陷,促進(jìn)結(jié)構(gòu)性探索。

生效機(jī)制解析:

1. 模型能力依賴性:

  • 對于對齊后的 Instruct 模型,提升上剪裁閾值(ε_(tái)high)能有效減緩熵值下降,促進(jìn)探索。。
  • 對于未對齊的 Base 模型,單純擴(kuò)大上剪裁范圍作用十分有限,甚至可能擾亂優(yōu)化過程、降低整體表現(xiàn)。
  • 形成這一差異的原因可能在于:基礎(chǔ)模型初始表現(xiàn)不穩(wěn)定,如果一開始就貿(mào)然增大探索空間,容易出現(xiàn)非預(yù)期行為導(dǎo)致優(yōu)化偏離正確方向;相反,經(jīng)過對齊的模型分布更均勻,適度增加上限能釋放潛藏 “優(yōu)質(zhì)” 輸出(詳見論文 Figure 10)。

各個(gè)模型在不同裁剪上限下的訓(xùn)練趨勢對比。

各個(gè)模型在使用不同裁剪上限下的熵變化趨勢。

2. 從語言結(jié)構(gòu)視角解析:

  • 當(dāng)采用低上界時(shí),被剪裁頻發(fā)的是 “語篇連接詞”(如 "therefore,"" "if"),它們往往開啟新推理分支,被抑制會(huì)壓縮思維路徑。
  • 將上界放寬后,剪裁焦點(diǎn)轉(zhuǎn)向 “功能詞”(如 "is", "the" 等),連接詞更自由,推理結(jié)構(gòu)更豐富,同時(shí)保留句法骨架穩(wěn)定。

左圖:不同裁剪上限下的 token ratio 可視化展示。右圖:出現(xiàn)頻率最高的前 20 個(gè)被剪裁的 token

3. 上界選擇的 “Scaling Law”:

  • 針對不同大小的模型,參數(shù)調(diào)節(jié)需要差異化:在較小規(guī)模(如 4B 參數(shù))情況下,隨著剪裁閾值增加,模型性能持續(xù)提升;
  • 而更大規(guī)模(如 8B),性能提升存在拐點(diǎn),閾值過高則效果反而減弱。因此,剪裁參數(shù)應(yīng)根據(jù)模型體量靈活設(shè)置,尋求最優(yōu)解。

各個(gè)模型使用不同裁剪上限的準(zhǔn)確率變化趨勢。

損失聚合方式:token-level 更適合 Base 模型

理論介紹

當(dāng)前主流方案分別有 sequence-level loss 和 token-level loss:

  • 序列級損失:聚焦于句子或樣本整體,適合結(jié)構(gòu)已對齊、輸出穩(wěn)定的模型。

  • 詞元級損失:以 token 為基本單位,每個(gè) token 都對總 loss 平均貢獻(xiàn),抑制短句偏置,補(bǔ)足長推理激勵(lì);

關(guān)鍵發(fā)現(xiàn):

  • 基礎(chǔ)模型:采用 token-level 的損失聚合方式更優(yōu),收斂速度和準(zhǔn)確率大幅提升;
  • 對齊模型:采用 sequence-level 的損失聚合方式普遍更優(yōu)。

各個(gè)模型上采用不同損失聚合方式的準(zhǔn)確率變化趨勢。

過長樣本過濾:效用依賴于模型輸出特征

理論介紹

訓(xùn)練時(shí)設(shè)定最大生成長度,復(fù)雜推理常被截?cái)?,尚未給出結(jié)論就被判負(fù),形成 “錯(cuò)誤懲罰” 噪聲,污染學(xué)習(xí)信號。過濾策略:對超長 / 截?cái)鄻颖镜莫?jiǎng)勵(lì)進(jìn)行屏蔽,避免把 “尚未完成” 當(dāng)成 “錯(cuò)誤”, 從而引入噪聲。

實(shí)驗(yàn)發(fā)現(xiàn)

1. 推理長度影響:

  • 當(dāng)最大生成長度設(shè)為 8k tokens 時(shí),應(yīng)用過長樣本過濾能有效提升模型的訓(xùn)練質(zhì)量,并且能夠縮短輸出的響應(yīng)長度。
  • 當(dāng)長度限制放寬至 20k tokens,模型有更充分的空間完成復(fù)雜推理,生成的響應(yīng)長度增加。此時(shí),被過濾的樣本更多是重復(fù)或無法自然終止的退化輸出,而這類樣本本身占比有限且學(xué)習(xí)價(jià)值較低,從而導(dǎo)致過濾操作帶來的增益減弱。
  • 結(jié)果表明,overlong filtering 的實(shí)際效用高度依賴于模型在當(dāng)前數(shù)據(jù)下的輸出特征,需按場景動(dòng)態(tài)調(diào)整。

不同訓(xùn)練長度下是否使用超長樣本過濾的實(shí)驗(yàn)表現(xiàn)。

2. 生效機(jī)制探究:

  • 通過對過濾掉的樣本類型進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)引入 Overlong Filtering 能夠降低訓(xùn)練中 “不能正確預(yù)測 EOS 導(dǎo)致重復(fù)生成” 的比例(repeat-ratio),這表明其增強(qiáng)了模型的終止建模能力。

左圖:在不同訓(xùn)練長度下,正確回答和錯(cuò)誤回答的重復(fù)樣本分布。右圖:在采用和未采用超長樣本截?cái)鄨鼍跋碌闹貜?fù)樣本分布。

極簡新范式:Lite PPO—— 兩步勝五技

綜合上述系統(tǒng)分析,該研究提出 Lite PPO—— 一個(gè)僅包含兩項(xiàng)技術(shù)的簡化 RL 流程:

  • 混合優(yōu)勢歸一化(組內(nèi)均值 + 批次標(biāo)準(zhǔn)差);
  • token-level 損失聚合。

在以基礎(chǔ)模型為初始策略的設(shè)置下,Lite PPO 在多個(gè)數(shù)學(xué)推理任務(wù)上達(dá)到甚至超過 DAPO 等融合五項(xiàng)技巧的復(fù)雜方法的表現(xiàn)。其優(yōu)勢體現(xiàn)在:

  • 訓(xùn)練過程更穩(wěn)定;
  • 超參敏感性更低;
  • 工程實(shí)現(xiàn)簡單;
  • 性能更優(yōu)。

這充分說明:“技巧堆疊” 并非性能提升的主要途徑,合理的組合能帶來更強(qiáng)的魯棒性和高效性。

結(jié)論

本文貢獻(xiàn)主要體現(xiàn)在三方面:

1. 建立首個(gè)系統(tǒng)性對比框架

對歸一化、剪裁、損失聚合、樣本過濾等關(guān)鍵技術(shù)進(jìn)行了獨(dú)立、可控的實(shí)證分析,明確了各項(xiàng)技術(shù)的適用邊界。

2. 驗(yàn)證極簡設(shè)計(jì)的優(yōu)越性

提出的 Lite PPO 方案表明,復(fù)雜的 “多技巧堆疊” 并非必要。在多數(shù)實(shí)際場景下,精簡而有針對性的技術(shù)組合反而更具魯棒性和可擴(kuò)展性。

3. 推動(dòng)可復(fù)現(xiàn)與標(biāo)準(zhǔn)化研究

基于開源 ROLL 框架開展實(shí)驗(yàn),所有配置公開,為后續(xù)研究提供了可復(fù)現(xiàn)基準(zhǔn),有助于提升領(lǐng)域透明度與協(xié)作效率。

從中我們獲得如下啟發(fā):

  • 給開發(fā)者的建議:別再追求 “trick 大全”,應(yīng)根據(jù)模型類型(Base/Align)、任務(wù)特性(長度、難度)、獎(jiǎng)勵(lì)設(shè)計(jì)等實(shí)際需求,有針對性地配置合理技巧。
  • 對學(xué)術(shù)界的啟示:新方法若想 “立得住”,必須重視廣泛適用性與易復(fù)現(xiàn)性。Lite PPO 的成功案例表明,RL 優(yōu)化未必復(fù)雜即優(yōu),而是貴在精粹。

關(guān)于 ROLL 團(tuán)隊(duì)

本研究由阿里巴巴 ROLL 團(tuán)隊(duì)完成。ROLL 是一套面向高效、可擴(kuò)展、易用的強(qiáng)化學(xué)習(xí)訓(xùn)練框架,支持從十億到千億參數(shù)大模型的優(yōu)化訓(xùn)練,已在多個(gè)場景中展現(xiàn)出顯著性能提升。

此次論文正是 ROLL 團(tuán)隊(duì)在開源框架實(shí)踐中的又一次探索成果,未來,ROLL 團(tuán)隊(duì)將持續(xù)關(guān)注 RL 社區(qū)發(fā)展并分享更多實(shí)踐經(jīng)驗(yàn)。同時(shí),我們也將繼續(xù)完善自研的 ROLL 框架,以靈活地適應(yīng)各種技術(shù),為在各種場景中有效應(yīng)用強(qiáng)化學(xué)習(xí)提供實(shí)用支持。

項(xiàng)目地址:github.com/alibaba/ROLL

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-11-11 08:40:00

AI系統(tǒng)開源

2011-12-16 16:19:58

移動(dòng)Web

2025-10-11 04:00:00

2025-07-03 09:41:27

2011-12-29 10:38:19

移動(dòng)Web

2024-02-01 09:41:01

AI算法

2024-11-15 10:16:58

2025-06-06 04:10:00

LLM人工標(biāo)注RL

2021-10-28 16:04:04

以太全光網(wǎng)銳捷網(wǎng)絡(luò)

2021-06-21 09:34:46

CIO敏捷團(tuán)隊(duì)業(yè)務(wù)領(lǐng)導(dǎo)者

2025-01-14 13:04:08

2025-05-07 08:03:10

2021-04-06 09:26:17

js前端通信極簡

2016-10-18 11:28:21

2019-09-25 09:05:52

Python 機(jī)器學(xué)習(xí)編程語言

2020-08-17 10:50:29

Python代碼get

2021-05-25 11:18:16

敏捷實(shí)踐敏捷創(chuàng)新團(tuán)隊(duì)

2023-05-31 15:47:52

銳捷

2016-12-06 10:07:01

銳捷網(wǎng)絡(luò)

2014-05-04 13:47:39

銳捷網(wǎng)絡(luò)極簡網(wǎng)絡(luò)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

午夜精品www| 欧美午夜视频网站| 玛丽玛丽电影原版免费观看1977| 99视频在线看| 狠狠做六月爱婷婷综合aⅴ | 国产又粗又大又爽| 影音国产精品| 自拍亚洲一区欧美另类| 国产chinesehd精品露脸| 在线观看特色大片免费视频| 中文字幕在线观看一区| 国产综合欧美在线看| 中文字幕av免费观看| 欧美日韩综合| 伊是香蕉大人久久| 人妻体内射精一区二区三区| 99久久精品一区二区成人| 亚洲一区二区视频| 亚洲一区二区三区涩| 色窝窝无码一区二区三区| 蜜臀精品一区二区三区在线观看 | 波多野结衣在线一区| 国产精品一区二区电影| 成人免费看片98欧美| 综合一区二区三区| 在线精品播放av| 国产偷人妻精品一区| 四虎国产精品成人免费影视| 色素色在线综合| 国产美女主播在线播放| 国产超级va在线视频| 久久精品视频在线免费观看| 国模精品娜娜一二三区| 精品国自产在线观看| 久久精品国产精品亚洲精品| 日韩免费av片在线观看| 日本一区二区免费在线观看| 亚洲激情久久| 日韩中文字幕国产精品| 日本性高潮视频| 杨幂一区二区三区免费看视频| 欧美成人猛片aaaaaaa| 亚洲综合av在线播放| 欧美电影免费观看| 午夜欧美视频在线观看| 国产尤物av一区二区三区| 蜜桃视频在线观看www社区| 国产色婷婷亚洲99精品小说| 免费日韩av电影| 熟妇高潮一区二区三区| 成人美女视频在线观看18| 5566中文字幕一区二区| 99久久精品国产成人一区二区| 久久精品72免费观看| 国产精品自产拍在线观看| 欧美性受xxx黑人xyx性爽| 日日夜夜一区二区| 国产精品久久久久久久app| 91porny九色| 蜜桃视频免费观看一区| 国产日韩欧美在线看| 国产精品羞羞答答在线| 国产乱码精品一区二区三区五月婷 | av在线小说| 婷婷综合五月天| 久久美女福利视频| 新片速递亚洲合集欧美合集| 在线观看视频一区二区欧美日韩| 欧美精品成人网| 国产第一亚洲| 日韩三级视频在线观看| 黑人玩弄人妻一区二区三区| 色狼人综合干| 综合网中文字幕| 男人的天堂久久久| 在线欧美亚洲| 日本伊人精品一区二区三区介绍| 黄色网址中文字幕| 精品一区二区av| 高清视频一区| 国产青青草在线| 亚洲欧美日韩国产综合在线| 人妻夜夜添夜夜无码av| 日韩中文影院| 91麻豆精品国产91久久久使用方法| 天天操夜夜操很很操| 精品亚洲自拍| 中文字幕亚洲欧美| 免费在线一级片| 午夜在线精品偷拍| 成人激情视频在线观看| 蜜桃视频在线观看www| 国产夜色精品一区二区av| eeuss中文| 亚洲优女在线| 3atv一区二区三区| 大乳护士喂奶hd| 久久麻豆精品| 97在线视频免费| 国产精品久久久久精| 99国产一区二区三精品乱码| 亚洲一区尤物| 蜜桃视频m3u8在线观看| 欧美日本不卡视频| 五十路六十路七十路熟婆| 日本不卡电影| 97久久精品国产| 亚洲中文字幕在线一区| 白白色 亚洲乱淫| 亚洲一区三区| 亚洲女色av| 精品国产电影一区二区| 日韩av片在线免费观看| 模特精品在线| 国产欧美日韩视频一区二区三区| 日韩伦理在线观看| 色94色欧美sute亚洲线路一ni| 成年人看片网站| 91亚洲国产| 国产盗摄xxxx视频xxx69| 蜜臀久久99精品久久久| 亚洲欧美日韩在线| 亚洲欧美日韩一级| 九九视频免费观看视频精品 | 亚洲精品8mav| 欧美舌奴丨vk视频| 日韩av在线直播| 国产性生活网站| 国产精品一区二区果冻传媒| 一级日韩一区在线观看| 韩国三级一区| 国产亚洲成av人片在线观看桃| 久草国产精品视频| 成人免费视频视频| 国产精品成人久久电影| 日韩08精品| 欧美成人一二三| 国产女人18毛片18精品| 中文字幕亚洲一区二区av在线 | 粉嫩91精品久久久久久久99蜜桃| 日韩黄在线观看| 国产成人愉拍精品久久| 波多野结衣精品在线| 欧美成人精品免费| 91蜜桃臀久久一区二区| 欧美日韩成人精品| 亚洲国产精品一| 亚洲图片欧美一区| 完美搭档在线观看| 亚洲美女视频在线免费观看| 国产一区二区中文字幕免费看 | 国产精品美女在线观看| 触手亚洲一区二区三区| 欧美视频第二页| 99久久99久久精品免费看小说.| 日韩激情一二三区| 五月天婷亚洲天综合网鲁鲁鲁| 日韩视频网站在线观看| 日日骚av一区| 国产av一区二区三区| 亚洲午夜影视影院在线观看| xxxxxx黄色| 久久国产日韩| 日韩aⅴ视频一区二区三区| 成人福利片在线| 久久亚洲春色中文字幕| 高清乱码毛片入口| 日韩欧美一区视频| 日本污视频网站| 国产精品一级片| 久久国产亚洲精品无码| 国产一区二区精品久| 成人黄色激情网| a'aaa级片在线观看| 亚洲精品一区二区久| 亚洲性在线观看| 亚洲午夜一区二区三区| 亚洲久久久久久久| 久久99久久久久| www在线观看免费| 日韩a一区二区| 国产超碰91| 日韩欧美少妇| 欧美激情网站在线观看| 巨骚激情综合| 日韩欧美一二三区| 久久亚洲精品石原莉奈| 亚洲女子a中天字幕| 黄色性生活一级片| 麻豆精品新av中文字幕| 国产二区视频在线| 日韩精品欧美| 久久av一区二区| japansex久久高清精品| 欧美一级免费视频| 成人福利在线观看视频| 亚洲人成绝费网站色www | 日韩精品中文字幕久久臀| 一级片视频播放| 欧美日韩一区二区免费在线观看| 国产高清视频免费在线观看| 91美女在线观看| 免费国偷自产拍精品视频| 日日摸夜夜添夜夜添精品视频| 996这里只有精品| 欧美激情成人| 日本婷婷久久久久久久久一区二区 | 成人在线直播| 国产一区二区三区视频在线观看| 亚洲乱色熟女一区二区三区| 精品视频资源站| 欧美激情黑白配| 亚洲成人av中文| 丝袜 亚洲 另类 欧美 重口| 欧美国产一区在线| 国产男女猛烈无遮挡a片漫画 | 小向美奈子av| 中文字幕欧美激情| av无码一区二区三区| 国产精品亚洲一区二区三区在线| 男操女免费网站| 美女黄网久久| 久久综合色视频| 亚洲黄色精品| 99久久免费观看| 亚洲欧洲日韩| 中文字幕一区二区三区乱码| 日韩久久久久| 日日夜夜精品网站| 久久99国产成人小视频| 韩日午夜在线资源一区二区| 一区二区三区亚洲变态调教大结局 | 神马久久av| 精品一区二区三区视频日产| 盗摄系列偷拍视频精品tp| 91视频国产一区| 国产999精品在线观看| 国产乱肥老妇国产一区二| 久久天堂av| 国产精品国产三级国产aⅴ9色| 精品91久久| 日韩美女写真福利在线观看| 久久爱91午夜羞羞| 3344国产精品免费看| 麻豆理论在线观看| 97精品国产91久久久久久| 成人性生交大片免费看网站 | 国产丝袜一区二区三区免费视频| 无码精品人妻一区二区| 日韩精品免费在线| 欧美日韩国产综合视频| 亚洲欧美中文日韩在线| 国产精品99999| 中文字幕综合一区| 日本在线看片免费人成视1000| 日韩最新av在线| 成人影院www在线观看| 久久夜精品va视频免费观看| 色婷婷av在线| 91av成人在线| 视频一区在线免费看| 国产精品永久免费在线| 91精品视频一区二区| 超碰97人人在线| 久久精品亚洲成在人线av网址| 精品日本一区二区三区| 精品国产一区二区三区小蝌蚪| 亚洲人一区二区| 在线观看日韩| 成年人午夜视频在线观看| 久久久久国内| 三级av免费看| 99久久综合国产精品| 久久久久久久毛片| 最新日韩在线视频| 香蕉视频一区二区| 日本久久电影网| 国产男女无套免费网站| 日韩精品中文字幕有码专区| av电影在线播放高清免费观看| 久久成人精品视频| 国产免费拔擦拔擦8x高清在线人| 国产99视频精品免视看7| 成人激情久久| 欧美大香线蕉线伊人久久| 欧美www视频在线观看| 欧美视频在线观看视频| 男人操女人的视频在线观看欧美| 免费高清视频在线观看| 黑人无套内谢中国美女| 国产亚洲精品超碰| 免费一级片在线观看| 欧洲av一区二区嗯嗯嗯啊| www.四虎在线观看| 亚洲欧美中文另类| 波多野结衣中文在线| 国产精品免费福利| 大陆精大陆国产国语精品 | 免费毛片在线| 欧美日韩成人黄色| 成人四虎影院| 久精品国产欧美| 久久久久亚洲| 手机看片福利盒子久久| 成人激情小说网站| 欧美日韩午夜视频| 日本精品视频一区二区| 懂色av一区二区三区四区| 色琪琪综合男人的天堂aⅴ视频| 蜜桃视频在线观看免费视频| 91美女片黄在线观看游戏| 精品国产视频| 免费在线激情视频| 国产成人精品三级麻豆| 亚洲少妇xxx| 在线一区二区三区四区| 丝袜+亚洲+另类+欧美+变态| 欧美日本高清一区| 成人短视频软件网站大全app| 欧美亚洲免费在线| 宅男噜噜噜66一区二区| 少妇熟女视频一区二区三区| 中文字幕亚洲精品在线观看| 久草视频在线免费| 日韩精品在线看| 欧亚在线中文字幕免费| 国产亚洲精品久久飘花| 欧美网站在线| 日本女人性视频| 亚洲欧美在线aaa| 一级片在线观看视频| 最近2019年日本中文免费字幕| 播放一区二区| 日本不卡免费新一二三区| 免费欧美在线| 美女久久久久久久久久| 欧美色播在线播放| 天天摸天天干天天操| 午夜精品久久久久久99热软件| 91成人精品在线| www.国产在线视频| 国产91丝袜在线观看| 劲爆欧美第一页| 欧美变态口味重另类| 福利网站在线观看| 国产一区二区三区黄| 亚洲国产精品一区| 污污内射在线观看一区二区少妇| 香蕉成人啪国产精品视频综合网| 免费a级片在线观看| 亚洲2020天天堂在线观看| 欧美综合自拍| 国产精品少妇在线视频| 欧美经典一区二区| 亚洲一线在线观看| 麻豆成人在线看| jazzjazz国产精品麻豆| 成年人午夜免费视频| 久久亚洲综合色| 中文字幕 视频一区| 久久精品国产亚洲一区二区| 亚洲高清在线一区| a在线视频观看| 国产精品视频一区二区三区不卡| 一级特黄aaa大片在线观看| 欧美精品少妇videofree| 高清欧美性猛交xxxx黑人猛| 日本不卡在线观看视频| 国产精品色呦呦| 99热这里只有精品99| 亚洲18私人小影院| jizzjizz欧美69巨大| 亚洲在线观看网站| 亚洲高清免费视频| 国产精品无码2021在线观看| 成人激情视频网| 一本久道久久综合狠狠爱| 精品无码在线观看| 日韩女优制服丝袜电影| 天堂av中文在线观看| 亚洲一区综合| 北条麻妃国产九九精品视频| 中文字幕免费高清网站| 久久国产精品视频| 窝窝社区一区二区| 九色porny自拍| 午夜电影一区二区三区| 在线免费看a| 精品国产免费久久久久久尖叫| 免费黄网站欧美| 奇米影视第四色777| 色噜噜狠狠色综合网图区| 国产在线播放精品| 免费一区二区三区在线观看 | 欧美巨乳在线观看| 久久99高清| 美女又爽又黄免费| 777a∨成人精品桃花网| 精品国产第一福利网站| www.日本在线视频|