精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無需標注數據!TTRL用“少數服從多數”解鎖大模型測試時強化學習新范式

發布于 2025-5-6 07:09
瀏覽
0收藏

今天分享一篇來自清華大學和上海人工智能實驗室的文章,標題為 TTRL: Test-Time Reinforcement Learning(測試時強化學習)。

這篇文章探討了一個重要且具有挑戰性的問題:如何在沒有顯式標簽(ground-truth) 的情況下,利用強化學習(RL)在測試階段提升大型語言模型(LLM)在推理任務上的性能。核心挑戰在于測試時無法獲得真實的獎勵信號。

研究者們發現,像多數投票(majority voting) 這類在測試時擴展(Test-Time Scaling, TTS)中常用的策略,可以驚人地產生有效的獎勵信號來驅動RL訓練。基于此,他們提出了TTRL(Test-Time Reinforcement Learning),一種新穎的在無標簽數據上使用RL訓練LLM的方法。TTRL使得LLM能夠利用其預訓練模型中蘊含的先驗知識進行自我進化(self-evolution)

核心方法:TTRL通過重復采樣生成多個候選答案,利用多數投票機制估計“偽標簽”,并基于此計算獎勵,最后通過RL算法(如GRPO、PPO)更新模型策略,整個過程僅依賴無標簽的測試數據。

主要亮點

1. 無需標簽:在無標簽測試數據上即可通過RL提升模型性能,降低對標注數據的依賴。

2. 效果顯著:實驗表明TTRL在多種任務和模型上都能穩定提升性能,例如在AIME 2024數學競賽數據集上,僅用無標簽測試數據就將Qwen-2.5-Math-7B的pass@1性能提升了約159%。

3. 超越自洽:TTRL訓練后的模型性能能夠超越其自身用于生成獎勵信號的多數投票基線(Maj@N),甚至接近使用真實標簽進行RL訓練的性能上限。

4. 自我進化:展示了LLM在測試階段進行自我學習和改進的潛力。

一、概述

Title: TTRL: Test-Time Reinforcement Learning

URL:?? https://arxiv.org/abs/2504.16084??

Authors: Yuxin Zuo1, Kaiyan Zhang1, Shang Qu1,2, Li Sheng1,2, Xuekai Zhu1, Biqing Qi2, Youbang Sun1, Ganqu Cui2, Ning Ding?1,2, Bowen Zhou?1,2 (*表示同等貢獻, +表示通訊作者)

Institutions: 1Tsinghua University, 2Shanghai AI Lab

Code:?? https://github.com/PRIME-RL/TTRL??

1.Motivation

缺乏測試時獎勵信號:在LLM推理任務中,尤其是在部署或面對新數據流時,往往缺乏真實的標簽或獎勵信息,這使得應用傳統的RL方法進行在線或測試時優化變得困難。

持續學習與適應需求:現實世界任務復雜多變,模型需要能夠適應新的、未標記的數據分布。僅依賴大規模訓練數據進行預訓練和微調不足以應對這種動態性。

測試時擴展(TTS)的潛力未充分挖掘:現有的TTS方法(如自洽性、多數投票)主要用于提升單次推理的準確性,但這些方法產生的聚合信號(如多數投票結果)本身可能蘊含著可用于模型訓練的監督信息,這一潛力尚未被用于測試時訓練。

2.Methods

省流版總結:

TTRL的核心思想是在測試階段,利用模型自身生成的多個輸出來構造一個“偽”獎勵信號,然后用這個信號通過RL來優化模型自身。具體來說:模型針對一個無標簽的測試問題生成多個(N個)答案,通過多數投票選出最頻繁的答案作為“偽標簽”。然后,將每個生成答案與這個“偽標簽”進行比較,匹配則獎勵為1,否則為0。最后,使用這個基于規則生成的獎勵信號,通過標準的RL算法(如GRPO或PPO)來更新模型參數,使其傾向于生成更符合“共識”(即多數投票結果)的答案。這個過程完全在無標簽的測試數據上進行。

詳細方法和步驟:

TTRL方法結合了測試時推理(TTI,如多數投票)和測試時訓練(TTT)的思想,具體步驟如下(參考Figure 2):

1)輸入 (Input): 給定一個無標簽的測試數據(問題/prompt) ??x??。

2)候選生成 (Candidate Generation): 使用當前的模型策略 ??πθ(y|x)???(參數為θ)對輸入 ??x??? 進行多次(N次)采樣,生成一組候選輸出(答案) ??{??, ??, ..., ?N}??。實踐中,會使用較高的temperature(如1.0)來增加多樣性。

3) 標簽估計 (Label Estimation):

? 對每個候選輸出 ?????? 進行答案提取(例如,提取數學題的最終數字答案)。

? 使用多數投票 (Majority Voting, MV) 機制,統計所有提取出的答案,選擇出現次數最多的那個答案作為該問題的估計標簽(偽標簽) ??y??。

4)獎勵計算 (Reward Calculation):

? 根據預定義的獎勵函數(如Listing 1所示的規則),計算每個候選輸出 ??????? 相對于估計標簽 ??y??? 的獎勵 ??R(??, y)??。

? 最簡單的獎勵函數是:如果 ?????? 的提取答案等于 ??y??,則獎勵為1;否則獎勵為0。

5)RL 策略更新 (RL Update):

? 將生成的候選 ??{??}???、計算出的獎勵 ??{R(??, y)}??? 和原始輸入 ??x?? 作為經驗數據。

? 使用選定的RL算法(文章主要使用GRPO,也驗證了PPO)和這些經驗數據來計算策略梯度 ???θ E[R(y, y)]??。

? 根據梯度上升規則更新模型參數 ??θ???: ??θ ← θ + η ?θ E[R(y, y)]???,其中 ??η?? 是學習率。

6)迭代: 對測試集中的每個樣本重復以上過程,或者進行多輪(episodes)訓練。

關鍵點:

?無監督:整個過程不需要任何真實標簽。

?測試時:訓練發生在模型部署后的測試階段,利用的是當前的測試數據。

?自生成獎勵:獎勵信號是基于模型自身輸出的共識(多數投票)產生的。

3.Conclusion

?顯著性能提升:TTRL能夠在使用無標簽測試數據的情況下,顯著提升LLM在多種推理任務(尤其是數學推理)上的性能,例如在AIME 2024上提升Qwen-7B模型性能達159.3%,平均在三個基準上提升84.1%。

?超越自身信號上限:TTRL訓練后的模型性能不僅超過了其初始狀態,甚至超越了其用于生成訓練信號的多數投票性能指標(Maj@N),并能接近使用真實標簽進行RL訓練(RL Leakage)的性能上限。

?可行且有效的無監督RL:證明了在無監督(無標簽)條件下,通過巧妙設計獎勵函數(如多數投票),可以實現有效且穩定的LLM強化學習,為模型的持續學習和自我進化提供了可能途徑。

4.Limitation

?依賴先驗知識和模型能力:TTRL的效果很大程度上取決于基礎模型的初始能力和對目標任務的先驗知識。如果模型太弱或任務太難,多數投票可能無法產生有意義的偽標簽,導致TTRL失效(如在AIME 2024上對1.5B模型效果不明顯)。

?超參數敏感:作為一種RL方法,TTRL對超參數(如采樣溫度、學習率、訓練輪數/Episodes)比較敏感,需要仔細調整才能達到最佳效果和訓練穩定性。不當的設置可能導致訓練失敗(如Figure 10所示)。

?多數投票的局限性:依賴多數投票作為獎勵來源,可能不適用于所有類型的任務,例如那些沒有唯一正確答案或需要創造性輸出的任務。此外,當模型輸出高度一致(即使是錯誤的一致)時,多數投票可能失效。

?泛化性待驗證:目前實驗主要集中在數學推理基準上。TTRL在更廣泛、更開放的任務(如對話、代碼生成、Agentic任務)上的有效性和泛化能力有待進一步驗證。

二、詳細內容

1.TTRL 與多數投票基線性能比較 (Majority voting performance comparison)

無需標注數據!TTRL用“少數服從多數”解鎖大模型測試時強化學習新范式-AI.x社區

?說明:比較了基礎Qwen模型和經過TTRL訓練后的模型在Avg@64(平均性能)和Maj@64(多數投票性能)兩個指標上的表現。

?總結:TTRL不僅提升了模型的平均性能(Avg@64),也提升了多數投票性能(Maj@64)。關鍵在于,TTRL訓練后的Maj@64顯著高于訓練前的Maj@64,證明模型超越了其初始的、用于生成獎勵的信號質量。

2.訓練指標深度分析 (Comparison of Majority Ratio, Label Accuracy, and Reward Accuracy)


  • ?說明:在AIME 2024上,繪制了TTRL訓練過程中三個關鍵指標隨步數的變化:多數票占比(Majority Ratio)、偽標簽準確率(Label Accuracy,與真實標簽對比)、獎勵準確率(Reward Accuracy,與真實獎勵對比)。
  • ?總結:揭示了TTRL工作的關鍵:盡管偽標簽準確率可能很低(20%-50%),但由于獎勵是基于偽標簽計算的,其準確率(衡量獎勵信號是否正確反映了相對于偽標簽的優劣)卻出奇地高(初始接近92%),這為有效的RL優化提供了可靠的基礎。

3.主要實驗結果 (Main results of TTRL on each task)

?說明:列出了Qwen2.5-Math (1.5B, 7B) 和 LLaMA-3.1-8B-Instruct 模型在應用TTRL前后,以及與其他基線模型(包括Instruct版本和其他RL模型)在AIME 2024, AMC, MATH-500三個基準上的Pass@1準確率對比。

?總結:提供了TTRL有效性的核心量化證據。TTRL在所有測試模型和任務上均帶來提升,尤其是在7B模型和AIME 2024這種挑戰性任務上提升巨大。其性能可與其他在大量標注數據上訓練的RL模型相媲美甚至超越。

4.Why it work?

TTRL之所以有效,主要歸功于以下兩點:

1)強化學習(RL)本身對獎勵噪聲具有一定的容忍度,并且自生成的獎勵信號可能更適合引導當前模型的學習。

2)基于多數投票的獎勵計算機制,即使在偽標簽估計不準確的情況下,也能提供足夠有效且“稠密”的獎勵信號來指導學習。

下面是更詳細的解釋:這一部分從兩個關鍵方面分析TTRL有效的原因:標簽估計 (Label Estimations) 和 獎勵計算 (Reward Calculations)

1)標簽估計 (Label Estimations)

?挑戰:TTRL的核心是使用模型自身通過多數投票生成的“偽標簽”來代替真實標簽進行RL訓練。這自然會引入不準確性,因為偽標簽可能與真實標簽不符。

?為什么可行?

?(i) RL的魯棒性:論文指出,強化學習(RL)與監督微調(SFT)不同。SFT傾向于記憶訓練數據,而RL更側重于探索和學習一個能最大化累積獎勵的策略。RL過程中的獎勵信號通常是比較“模糊”的(vague),主要起方向性引導作用,因此RL本身就能容忍一定程度的獎勵噪聲(引用了 Razin et al., 2025 和 Chu et al., 2025 的研究)。TTRL利用多數投票產生的帶噪聲的獎勵信號,正好符合RL的這一特性。

?(ii) “好老師”不等于“最準確”:論文引用了 Wang et al. (2020) 的觀點,即從優化角度看,一個更準確的獎勵模型并不一定是一個更好的“老師”。有時候,由策略模型自身估計出的獎勵信號(即使不完美),可能為當前策略的學習提供更“合適”的指導。

2)獎勵計算 (Reward Calculations)

?核心問題: 當模型能力較弱,無法通過多數投票準確估計標簽時(例如在困難的AIME 2024任務上),TTRL為什么還能工作?

?根本原因: 關鍵在于RL中基于規則的獎勵是如何定義的。獎勵是根據模型的預測答案是否匹配“標簽”來分配的。在TTRL中,這個“標簽”就是多數投票產生的偽標簽

?重要洞見: 即使估計出的偽標簽是錯誤的,只要模型產生的某個(同樣是錯誤的)預測答案與這個錯誤的偽標簽不同,那么這個預測答案仍然會收到一個正確的“負獎勵”(例如獎勵為0)。 這使得系統即使在偽標簽不準的情況下,也能從區分“與偽標簽相同”和“與偽標簽不同”中學習。

?案例分析 (AIME 2024, Figure 8 & 9):

獎勵比標簽更“稠密” (Rewards are denser than labels): 即使偽標簽錯了,在一次Rollout(N次采樣)中,可能有很多個預測答案。只要這些預測答案與錯誤的偽標簽不同,它們都會得到正確的“負獎勵”(獎勵=0)。這比僅僅依賴于是否匹配真實標簽(如果知道的話)要提供了更多的學習信號。Figure 9 的玩具示例形象地說明了這一點:偽標簽是2(真實是3),預測1/4/5/6雖然也是錯的,但因為它們不等于偽標簽2,所以它們都收到了值為0的正確獎勵信號(相對于偽標簽而言是正確的負反饋),只有預測2會收到錯誤的獎勵1。這使得整體的獎勵信號對偽標簽錯誤更加魯棒。

模型越弱,獎勵反而可能越準 (Paradoxical Phenomenon): 當基礎模型能力較弱時(如Figure 8中AIME任務初期),它的輸出會非常多樣化且大部分是錯誤的。這意味著,雖然通過多數投票選出的偽標簽準確率(Label Accuracy)很低(Figure 8顯示在20%-50%波動),但絕大多數生成的錯誤答案都不會恰好等于那個(可能也是錯誤的)偽標簽。因此,計算出的獎勵準確率 (Reward Accuracy)(即獎勵信號是否正確反映了預測相對于偽標簽的匹配度)反而會非常高(Figure 8顯示初始可達92%)。這種高準確率的(相對)獎勵信號為模型初期的自我改進提供了可靠的基礎。

三、總結

核心結論:

1.TTRL是一種有效的測試時優化方法:它成功地利用強化學習在沒有真實標簽的測試數據上提升了大型語言模型的推理能力,尤其是在數學等需要精確推理的任務上表現突出。

2.多數投票是關鍵:通過巧妙地利用多數投票機制生成偽標簽和獎勵信號,TTRL克服了測試時缺乏監督信息的挑戰,為RL訓練提供了有效(盡管有噪聲)的指導。

3.模型可實現自我進化:TTRL證明了LLM有能力通過利用自身輸出的“共識”進行學習和改進,其性能可以超越初始的自洽水平,展現了通向更自主、持續學習模型的潛力。

亮點與價值:

?降低標注成本:為模型在部署后適應新數據、提升特定任務性能提供了一條低成本(無需人工標注)的路徑。

?提升模型上限:TTRL發掘了模型在測試階段進一步優化的潛力,其性能可以逼近使用真實標簽訓練的上限,顯示出比傳統“訓練-評估”范式更高的效率潛力。

?范式創新:TTRL是探索LLM自我改進和無監督強化學習的重要一步,對持續學習、終身學習和Agent智能體領域具有啟發意義。

本文轉載自????NLP PaperWeekly????,作者:NLP PaperWeekly

收藏
回復
舉報
回復
相關推薦
久久久久久亚洲精品美女| 亚洲一区二区三区高清视频| 久草在线综合| 欧美日韩亚洲激情| 神马一区二区影院| 性生活黄色大片| 国产日韩亚洲| 俺也去精品视频在线观看| 国内精品免费视频| 伊人久久高清| 亚洲无线码一区二区三区| 欧美久久在线| 精品人妻午夜一区二区三区四区| 国产精品久久久久毛片大屁完整版| 亚洲情综合五月天| 一卡二卡三卡四卡五卡| 在线中文字幕播放| 亚洲色大成网站www久久九九| 国产精品裸体一区二区三区| 日韩xxx视频| 伊人蜜桃色噜噜激情综合| 在线成人激情黄色| 免费日本黄色网址| 91麻豆精品国产综合久久久 | 亚洲欧洲国产精品久久| 日本人妻丰满熟妇久久久久久| 免费观看30秒视频久久| 海角国产乱辈乱精品视频| 性少妇xx生活| 香蕉视频一区| 精品国精品国产| 色www免费视频| 国产精品高清乱码在线观看 | 日韩经典在线观看| 91精品国产乱码久久久久久| 亚洲人成伊人成综合网久久久 | 黄色大片在线免费看| 男人在线资源站| 国产欧美一区二区精品久导航| 国产欧美韩日| 亚洲国产视频一区二区三区| 精品一二线国产| 国产精品久久久久77777| 黄色一级片免费在线观看| 亚洲午夜视频| 久久99热这里只有精品国产| www.97视频| 91麻豆精品国产91久久久平台 | 欧美又粗又大又爽| 久久婷婷国产精品| 亚洲欧美韩国| 欧美性jizz18性欧美| 懂色av粉嫩av蜜臀av| 三区四区电影在线观看| 国产欧美一区二区精品忘忧草| 麻豆成人在线播放| 欧美亚洲日本| 久久精品在线观看| 欧美极品jizzhd欧美| 亚洲欧洲视频在线观看| 91在线码无精品| 精品日本一区二区三区| 神马电影在线观看| 成人午夜精品一区二区三区| 国产91亚洲精品一区二区三区| 国产夫妻性生活视频| 国产精品123| 成人激情直播| 五月婷婷在线播放| 久久综合丝袜日本网| 青娱乐一区二区| yourporn在线观看视频| 国产精品久久久久影视| 喜爱夜蒲2在线| 狼人综合视频| 91国偷自产一区二区三区观看| 男人插女人下面免费视频| av在线成人| 精品三级在线观看| 一本色道久久综合亚洲精品图片| 国产一区二区三区天码| 俺去啦;欧美日韩| 国产一级久久久| 久久天天综合| 成人国产在线视频| 国产综合视频在线| 久久久久久久久免费| 亚洲一区3d动漫同人无遮挡| 在线看三级电影| 精品成人乱色一区二区| 成人性生生活性生交12| 久久av网站| 亚洲精品网站在线播放gif| 超碰人人人人人人人| 欧美a级片网站| 欧美专区在线播放| 国产精品一二三四五区| 99热这里都是精品| 国产精品12p| 高清在线视频不卡| 欧美男生操女生| 在线观看国产网站| 亚洲国产精品综合久久久| 97成人精品视频在线观看| 伊人免费在线观看| av电影在线观看一区| 亚洲免费精品视频| 松下纱荣子在线观看| 欧美猛男超大videosgay| 亚洲一区二区三区黄色| 日韩毛片视频| 欧美又大又硬又粗bbbbb| 国产孕妇孕交大片孕| 91免费国产在线| 丰满人妻一区二区三区53号| 男人皇宫亚洲男人2020| 日韩精品一区二区三区视频播放 | 欧美在线视频一二三| 国产男女猛烈无遮挡| 久久久久久久久久久久久女国产乱| 2025韩国大尺度电影| 亚洲成人一区在线观看| 亚洲精品国产精品国自产在线| 成年人二级毛片| 日本在线播放一区二区三区| 国产一区二区在线网站| 中中文字幕av在线| 欧美日韩mp4| 国产精品美女高潮无套| 国产精品久久久久9999高清| 国产精品对白一区二区三区| 91高清在线观看视频| 欧美午夜精品电影| 受虐m奴xxx在线观看| 野花国产精品入口| 国产欧美日韩伦理| 国产白丝在线观看| 欧美不卡视频一区| 欧美精品久久久久性色| 韩国毛片一区二区三区| 夜夜爽99久久国产综合精品女不卡| 2022成人影院| 亚洲免费精彩视频| 青草视频在线观看免费| 99re这里只有精品视频首页| 激情小视频网站| 77成人影视| 久久久噜噜噜久久久| 国产毛片久久久久| 亚洲卡通动漫在线| 亚洲三级在线视频| 欧美精品麻豆| 97人摸人人澡人人人超一碰| 影音先锋中文在线视频| 日韩一区二区三区观看| 九九视频免费看| 国产成人精品三级| 国产爆乳无码一区二区麻豆| 色妞ww精品视频7777| 欧美激情视频一区二区| 神马午夜精品95| 欧美视频中文字幕在线| 亚洲精品午夜视频| 麻豆久久久久久| 亚洲AV无码成人精品一区| 国产精品99久久免费| 欧美乱妇40p| 四虎免费在线观看| 欧美网站在线观看| 亚欧精品视频一区二区三区| 黄色精品一二区| 成人免费在线视频播放| 免费看久久久| 日韩免费在线看| 在线免费黄色| 日韩亚洲欧美在线观看| 日本三级欧美三级| 日本一区二区视频在线| 三级黄色片播放| 亚洲精品影视| 亚洲高清乱码| 97久久亚洲| 国产成人精品免高潮费视频| 黄色免费在线观看| 亚洲а∨天堂久久精品喷水| 亚洲 欧美 中文字幕| 亚洲人午夜精品天堂一二香蕉| 国产情侣久久久久aⅴ免费| 久久精品在线| 国产又粗又长又爽视频| 最新亚洲精品| 亚洲中国色老太| 日本在线啊啊| 另类视频在线观看| 免费在线看v| 日韩欧美一区在线观看| 黄色av网站免费观看| 亚洲免费观看高清完整版在线| 日本黄色录像片| 精品无人区卡一卡二卡三乱码免费卡| 国产精品www在线观看| 欧美激情欧美| 欧美一区少妇| jizz性欧美23| 成人网中文字幕| 伊人色综合一区二区三区影院视频 | 第一会所亚洲原创| 国产精品日韩一区二区免费视频| 成人黄色视屏网站| 91wwwcom在线观看| 日韩电影免费观看| 日韩在线观看免费全集电视剧网站| 日韩一级片免费看| 欧美一级片在线观看| 中文字幕免费在线看| 午夜国产精品一区| 欧美日韩三级在线观看| 国产精品私房写真福利视频| 久久无码人妻精品一区二区三区| 国产一区二区三区国产| 狠狠热免费视频| 亚洲专区免费| 男人添女人下部高潮视频在观看 | 国产69精品久久久久999小说| 日韩精品一区二区久久| 久久久久久欧美精品色一二三四| 亚洲三级av| 91色精品视频在线| 亚洲国产综合在线观看| 国产精品激情av电影在线观看| cao在线视频| 神马久久桃色视频| 国产女主播在线写真| 日韩福利在线播放| 五月天婷婷社区| 亚洲国产精品久久91精品| 精品国产乱码一区二区三| 宅男在线国产精品| 91亚洲欧美激情| 欧美无人高清视频在线观看| 成人av网站在线播放| 日韩欧美有码在线| 手机看片久久久| 日韩欧美国产网站| 久久中文字幕免费| 色综合久久中文字幕综合网 | 操你啦视频在线| 久久精品中文字幕电影| av免费在线网站| 欧美国产日韩中文字幕在线| 久久av色综合| 午夜精品在线视频| 少妇在线看www| 日韩av免费在线看| av免费在线一区| 国产精品精品视频一区二区三区| 视频二区不卡| 国产精品吴梦梦| 亚洲欧美在线人成swag| 91在线视频导航| 成人三级毛片| 久久青青草综合| 欧美精品一区二区久久| 亚洲制服中文| 国产精品第十页| 精品视频免费在线播放| 老司机午夜精品视频在线观看| 欧美精品无码一区二区三区| 蜜臀av一级做a爰片久久| 999久久久精品视频| 国产精品91xxx| 无码精品一区二区三区在线播放| 久久亚洲一区二区三区明星换脸 | 日韩美女精品在线| 欧美极品aaaaabbbbb| 欧美日韩综合视频网址| 一级特黄特色的免费大片视频| 欧美一区二区三区免费| 好吊视频一区二区三区| 亚洲无线码在线一区观看| 欧美18一19xxx性| 国内精品模特av私拍在线观看| 一区二区三区四区日本视频| 国产精品自产拍在线观看中文| 亚洲精品一区二区三区中文字幕| 久久视频在线观看中文字幕| 色综合久久网| 精品视频在线观看一区| 久久先锋影音| 免费高清视频在线观看| 久久久久国产精品厨房| а天堂中文在线资源| 一区二区三区精品| 男人天堂视频网| 日韩欧美精品在线视频| 国产一区二区影视| 欧美精品日韩三级| 久久天堂av| 国产午夜精品一区| 婷婷综合亚洲| 国产日韩一区二区在线观看| 国产精品一区2区| www..com.cn蕾丝视频在线观看免费版 | 国产乱码精品一区二区三区卡| 国产探花在线精品| 激情五月婷婷六月| 精品一区二区三区免费毛片爱| 一起草在线视频| 亚洲女厕所小便bbb| 波多野结衣不卡| 日韩成人激情视频| 任你弄在线视频免费观看| 国产美女高潮久久白浆| 亚洲69av| 国产人妻777人伦精品hd| 国产一区二区三区视频在线播放| 一区二区黄色片| 亚洲国产sm捆绑调教视频 | 亚洲精品xxx| h网站久久久| 国产欧美精品日韩| 欧美精品色图| 麻豆av免费在线| 91免费国产在线| 久久久久久久久影院| 日韩女优制服丝袜电影| 黄色国产网站在线播放| 国产欧美日韩最新| 成人在线免费观看网站| 日韩精品一区二区三区不卡| 99天天综合性| 久久久久99精品| 日韩精品专区在线| 欧美卡一卡二| av免费观看久久| 欧美va亚洲va日韩∨a综合色| 亚洲第一天堂久久| 国产精品国产三级国产有无不卡| 中文字幕在线观看视频免费| 亚洲欧美国产制服动漫| 在线毛片观看| 欧美成ee人免费视频| 国产精品综合| 中文字幕丰满孑伦无码专区| 午夜成人在线视频| 四季av日韩精品一区| 91国产中文字幕| 丝袜连裤袜欧美激情日韩| 热99这里只有精品| av一二三不卡影片| 丁香六月婷婷综合| 亚洲欧洲一区二区三区久久| abab456成人免费网址| 日韩午夜视频在线观看| 老司机精品视频一区二区三区| 国产精品麻豆免费版现看视频| 欧美精品乱人伦久久久久久| 超碰在线最新| 国产精品三区www17con| 国产精品久久久亚洲一区| 亚洲女优在线观看| 欧美日韩视频在线第一区| 成人片在线看| 国产精品一区二区三区免费观看| 亚洲理论在线| 亚洲色成人网站www永久四虎| 欧美日韩在线电影| 91极品在线| 美女黄毛**国产精品啪啪| 日韩高清在线不卡| 视频这里只有精品| 亚洲精品一区二区三区香蕉 | 91免费福利视频| 激情偷拍久久| 乐播av一区二区三区| 67194成人在线观看| 99thz桃花论族在线播放| 欧洲精品国产| 国产成人免费视| 国产美女激情视频| 日韩中文字幕视频在线观看| 日韩精品一区二区三区中文 | 欧洲猛交xxxx乱大交3| 亚洲缚视频在线观看| 99只有精品| 韩日视频在线观看| 欧美国产综合一区二区| 亚洲精品97久久中文字幕无码| 欧美有码在线视频| 综合一区二区三区| 扒开jk护士狂揉免费| 欧美一卡在线观看| 欧美xxx网站| 六月婷婷激情综合| 中日韩av电影| 日批视频免费播放| 91美女福利视频高清| 久久亚洲图片| 久久久精品人妻一区二区三区四| 亚洲欧美在线磁力|