精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!

發布于 2025-9-2 06:37
瀏覽
0收藏

當671B參數的DeepSeek-R1仍被視為數學推理領域的“重量級選手”時,一款僅14B參數的模型卻以更短的推理路徑實現了性能超越——微軟研究院推出的rStar2-智能體(rStar2-Agent),通過智能體強化學習(Agentic Reinforcement Learning)技術,讓小模型擺脫了“靠長度堆性能”的傳統路徑,具備了“更聰明思考”的能力。這款模型僅用64張MI300X GPU、510步強化學習訓練,便在AIME24數學競賽中取得80.6%的pass@1準確率,超越OpenAI o3-mini、Claude-Opus-4.0等主流模型。其背后的技術創新,不僅解決了智能體強化學習的規模化難題,更為小模型高效推理提供了可復用的框架。

我們解讀最新技術,文末有相關信息。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

1 引言:AI數學推理的“兩難困境”

當前AI數學推理的進步,很大程度上依賴“延長思維鏈(CoT)”——通過讓模型生成更長的推理步驟,提升復雜問題的求解能力。微軟研究院的研究員指出,OpenAI o系列、DeepSeek-R1、Gemini-2.5等領先模型雖通過這一思路實現性能突破,但面臨兩大核心困境:

一是內部反思的局限性。對于需中間驗證或思路切換的難題(如多步驟代數推導、數論證明),模型依賴內部反思檢測錯誤,但這種“自檢查”常失效——一旦初始推理方向偏差,后續步驟會持續偏離正確路徑。

二是工具使用的環境噪聲干擾。為彌補內部反思的不足,研究人員引入Python編碼工具(如SymPy符號計算、NumPy數值分析)輔助推理,但工具環境會引入新問題:模型生成的代碼可能存在語法錯誤或邏輯漏洞,導致執行反饋(如報錯信息)與推理任務無關,浪費 tokens 修正工具錯誤而非推進推理。更關鍵的是,傳統強化學習(RL)依賴“僅結果獎勵”(僅根據最終答案是否正確打分),即便中間工具調用出錯,只要最終答案正確,軌跡仍會被賦予正獎勵,導致模型默認“錯誤可接受”,生成低質量推理過程。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

此外,大規模智能體強化學習的基礎設施瓶頸也不容忽視:單訓練批次可能觸發數萬次并發工具調用,傳統本地Python解釋器無法應對,且GPU資源因軌跡長度不均常處于空閑狀態,訓練效率極低。

rStar2-智能體的核心目標,正是通過技術創新破解上述困境——讓小模型在有限計算資源下,通過“智能使用工具+環境反饋學習”實現高效推理。

2 核心突破一:支撐大規模訓練的智能體RL基礎設施

要實現智能體強化學習的規模化,穩定、高效的基礎設施是前提。微軟研究院的研究員團隊設計了兩套關鍵組件,解決了“高并發工具調用”和“GPU負載不均”兩大痛點:

2.1 高吞吐量隔離式代碼環境

針對工具調用的并發與安全問題,研究員構建了分布式代碼執行服務,核心設計包括:

  • ?隔離部署:將代碼執行任務與主訓練流程分離,部署在64張MI300X GPU集群的CPU核心上,避免LLM生成的異常代碼(如死循環、外部庫調用)影響訓練進程;
  • ?批量調度機制:通過集中式任務隊列管理工具調用請求,32個“發送worker”持續從隊列中抓取任務,每批最多整合64個工具調用(或超時后觸發調度),減少通信開銷;
  • ?動態負載分配:worker節點通過輕量級任務調度器,將代碼執行任務分配給空閑的“執行worker”(每節點部署1024個),確保資源利用率。

該環境可支持45K并發工具調用,平均執行延遲僅0.3秒(含調度與執行時間),且通過“答案驗證離線化”進一步優化效率——將CPU密集型的數學答案驗證任務(如規則-based驗證器)也納入該服務,避免阻塞訓練循環。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

2.2 負載均衡軌跡生成(Rollout)調度器

傳統強化學習中,軌跡生成任務按“靜態均勻分配”方式分發到GPU,導致兩大問題:一是軌跡長度差異大(部分推理需多輪工具調用,部分短步驟完成),短軌跡GPU需等待長軌跡完成,產生大量空閑時間;二是KV緩存溢出——Inference引擎(如SGLang)無法預測軌跡長度,并行啟動任務時易超出緩存容量,需驅逐已部分計算的軌跡重新執行,浪費資源。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

研究員設計的動態調度器通過KV緩存剩余容量分配任務:根據各GPU當前可用的KV緩存空間,估算可處理的軌跡數量(而非均勻分配),軌跡生成過程中異步觸發工具調用,避免等待;當某GPU完成任務釋放緩存后,立即分配新任務。實驗顯示,該調度器可將GPU利用率提升30%以上,顯著縮短訓練周期。

3 核心突破二:GRPO-RoC算法——應對環境噪聲的智能體RL方案

智能體強化學習的關鍵挑戰是“環境噪聲干擾”——工具調用錯誤、格式違規等噪聲會導致“高質量推理軌跡被淹沒”。微軟研究院的研究員在Group Relative Policy Optimization(GRPO)基礎上,提出GRPO-RoC(Resample-on-Correct)算法,通過“軌跡重采樣策略”過濾噪聲,同時避免復雜獎勵設計帶來的風險。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

3.1 傳統GRPO的局限與改進方向

GRPO是一種面向推理任務的強化學習算法,通過“分組軌跡對比”計算優勢函數(Advantage):對每個問題采樣G條軌跡,基于軌跡組內的獎勵分布(而非全局分布)計算每條軌跡的相對優勢,提升訓練穩定性。但在工具環境中,該算法存在明顯缺陷:

  • ? 僅結果獎勵(0/1,根據最終答案是否正確)無法區分“中間步驟完美”與“中間錯誤但答案巧合正確”的軌跡,后者會被賦予相同正獎勵,導致模型學習到“容忍錯誤”的策略;
  • ? 環境噪聲(如代碼錯誤、格式違規)會導致正獎勵軌跡中約10%-15%存在工具調用問題,長期訓練會讓模型生成冗長低質的推理過程。

研究員的核心思路是:不修改獎勵函數(保持僅結果獎勵以避免獎勵hacking),而是通過軌跡采樣策略篩選高質量正軌跡

3.2 GRPO-RoC的核心邏輯:重采樣與質量篩選

GRPO-RoC的軌跡處理流程分為兩步:過采樣(Oversampling)與選擇性下采樣(Selective Downsampling):

1. 過采樣階段:對每個問題采樣2G條軌跡(而非傳統GRPO的G條),擴大候選集;

2. 下采樣階段:將軌跡分為正軌跡(獎勵1)與負軌跡(獎勵0),分別采用不同策略篩選,最終保留G條用于訓練:

? 負軌跡:均勻下采樣至目標數量,保留多樣化的失敗模式(如工具調用錯誤、推理思路偏差),確保模型學習到“避免各類錯誤”的信號;

? 正軌跡:按“質量評分”逆概率采樣——評分越低(工具錯誤多、格式違規)的軌跡,被選中的概率越低。

質量評分由兩部分構成:

工具錯誤率(p_err):若軌跡無工具調用,默認p_err=0.5(鼓勵工具使用);否則為“錯誤工具調用次數/總工具調用次數”;

格式違規率(p_format):若軌跡無答案標簽(如缺失標簽),p_format=1;若存在多個答案標簽,按“(標簽數-1)/推理輪次”計算,懲罰重復標注。

總評分p_total = p_err + p_format,采樣概率與1/p_total正相關,確保高質量正軌跡(低p_total)被優先選中。

3.3 算法優勢:穩定與高效的平衡

與“在獎勵函數中加入工具錯誤懲罰”的方案相比,GRPO-RoC有兩大優勢:

避免獎勵hacking:無需人工設計復雜的步驟級獎勵(如“代碼正確得0.5分”),減少因獎勵規則不完善導致的模型“鉆空子”行為(如刻意簡化代碼以避免錯誤,而非優化推理);

提升訓練穩定性:通過篩選高質量正軌跡,模型學習到的是“正確推理+正確工具使用”的聯合策略,實驗顯示,GRPO-RoC可將正軌跡中的工具錯誤率從15%降至5%以下,同時推理長度縮短20%。

4 核心突破三:低計算成本的多階段訓練方案

大規模模型訓練常依賴“大參數量+長訓練周期”,而rStar2-智能體通過“非推理SFT+多階段RL”的設計,讓14B模型在有限計算資源下快速達到前沿水平。

4.1 非推理SFT:避免過擬合的“冷啟動”

傳統推理模型在RL前會進行“推理導向SFT”(用大量數學推理數據微調),但研究員發現,這種方式易導致模型“過擬合初始推理模式”,且初始響應長度過長,增加RL階段的計算成本。

rStar2-智能體的SFT階段僅聚焦基礎能力培養,不涉及數學推理優化:

  • ? 數據選擇:165K函數調用數據(ToolACE、APIGen-MT等)、30K指令跟隨數據(Tulu3數據集,用o4-mini優化響應質量)、27K對話數據(LLaMA-Nemontron數據集);
  • ? 目標:讓模型掌握“工具調用格式(如JSON結構化調用)”“指令跟隨邏輯”“基礎Python編碼能力”,保持初始響應長度約1K tokens。

實驗顯示,該SFT后模型的數學推理能力與基線模型(Qwen3-14B-Base)持平,但工具使用準確率提升40%,為RL階段奠定基礎。

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

4.2 多階段RL:逐步提升難度與效率

研究員將RL分為3個階段,逐步增加任務難度與軌跡長度上限,避免資源浪費:

?階段1(8K長度):用42K高質量數學題(整數答案,確保驗證可行性)訓練,強制模型在短長度約束下優化推理效率,平均響應長度從1K增至4K,AIME24準確率從3.3%(SFT后)提升至72.1%;

?階段2(12K長度):當階段1的軌跡截斷率(超過長度上限的軌跡比例)穩定在10%時,提升長度上限至12K,釋放模型推理空間,AIME24準確率進一步提升至77.0%;

?階段3(聚焦難題):用階段2的模型對42K題目生成8條軌跡,移除“8條全對”的簡單題,保留17.3K難題訓練,重置優化器狀態,最終AIME24準確率達80.6%,AIME25達69.8%。


微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

整個RL過程僅510步,在64張MI300X GPU上1周內完成,計算成本僅為傳統大模型訓練的1/10。

5 實驗驗證:性能與泛化能力的雙重突破

rStar2-智能體的核心價值,不僅體現在數學推理性能的突破,更在于“小模型+高效推理”的性價比,以及跨領域泛化能力。

5.1 數學推理性能:超越大模型的小模型

在三大數學競賽數據集上,rStar2-智能體(14B)表現突出:

AIME24:80.6% pass@1,超越OpenAI o3-mini(79.6%)、DeepSeek-R1(671B,79.8%)、Claude-Opus-4.0(76.0%);

AIME25:69.8% pass@1,與DeepSeek-R1(70.0%)基本持平,遠超DeepSeek-R1-Zero(53.3%);

HMMT25:52.7% pass@1,僅次于OpenAI o3-mini(53.0%),遠超DeepSeek-R1(44.4%)。


微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區

更關鍵的是推理效率:rStar2-智能體的平均推理長度僅10943 tokens,遠短于DeepSeek-R1-Zero(17132 tokens)、QWQ-32B(15865 tokens),證明其“思考更高效”而非“思考更長”。

5.2 跨領域泛化:數學訓練賦能多任務

盡管僅用數學數據訓練,rStar2-智能體在非數學任務上仍表現出強泛化能力:

微軟rStar2智能體:破解AI推理 “工具噪聲 + GPU 閑置” ,“智能體RL” 14B 逆襲 671B!-AI.x社區


科學推理(GPQA-Diamond):60.9%準確率,超越DeepSeek-V3(59.1%),證明數學推理習得的“工具使用+邏輯驗證”能力可遷移至科學問題;

智能體工具使用(BFCL v3):60.8%準確率,與SFT后基線(63.1%)基本持平,未因數學訓練丟失工具能力;

通用對齊(IFEval、Arena-Hard):IFEval 83.4%、Arena-Hard 86.6%,與基線水平一致,說明數學RL訓練不影響通用對齊性能。

6 技術啟示與未來展望

rStar2-智能體的突破,為AI推理領域提供了三大核心啟示:

1. 小模型的潛力:通過“智能體強化學習+工具協作”,小模型可在特定領域超越大模型,降低AI推理的部署成本;

2. 環境交互的價值:相比“純文本思維鏈”,讓模型與工具環境實時交互(接收反饋、修正錯誤),是提升推理可靠性的關鍵路徑;

3. 簡化獎勵設計:復雜獎勵函數易導致模型“鉆空子”,而“僅結果獎勵+高質量軌跡篩選”的組合,是平衡訓練穩定性與推理質量的高效方案。

微軟研究院的研究員表示,未來將進一步擴展rStar2-智能體的應用場景,如工程計算、學術研究輔助等,并通過開源代碼(https://github.com/microsoft/rStar)推動智能體強化學習技術的普及。對于行業而言,rStar2-智能體的技術框架為“高效AI推理系統”提供了可復用的模板——從基礎設施到算法再到訓練方案,每一環的創新都指向“用更少資源實現更強能力”的核心目標。

參考資料

? 標題:rStar2-Agent: Agentic Reasoning Technical Report

? 作者:Ning Shang, Yifei Liu, Yi Zhu, Li Lyna Zhang, Weijiang Xu, Xinyu Guan, Buze Zhang, Bingcheng Dong, Xudong Zhou, Bowen Zhang, Ying Xin, Ziming Miao, Scarlett Li, Fan Yang, Mao Yang

? 單位:微軟研究院(Microsoft Research)

? 鏈接:https://arxiv.org/pdf/2508.20722

本文轉載自??旺知識??,作者:旺知識

已于2025-9-2 06:37:23修改
收藏
回復
舉報
回復
相關推薦
国产精品videossex| 日本成人一区二区三区| 午夜国产精品视频免费体验区| 91麻豆精品国产91久久久| 欧美一级爱爱视频| 久久久资源网| 国产福利精品一区二区| 欧美一区第一页| av最新在线观看| 日本亚洲不卡| 91精品婷婷国产综合久久竹菊| 欧美性潮喷xxxxx免费视频看| 久久综合九色综合久| 国产高清在线精品| 国产精品高潮在线| 黄色小说在线观看视频| 欧美hd在线| 日韩精品极品在线观看| 成人三级做爰av| 国产私拍福利精品视频二区| 亚洲第一狼人社区| 亚洲美女自拍偷拍| 九色在线观看| 成人网在线免费视频| 国产日本欧美在线观看| 亚洲熟女综合色一区二区三区| 性xxxx欧美老肥妇牲乱| 中文字幕av日韩| a级在线观看视频| 精品国产一区二区三区不卡蜜臂| 欧美精品久久一区二区三区| 国产三级日本三级在线播放| 国产伦子伦对白在线播放观看| 中文字幕综合网| 五月天亚洲综合| 理论视频在线| 91美女在线观看| 国产日产精品一区二区三区四区| 国产女同91疯狂高潮互磨| 秋霞午夜av一区二区三区| 奇米4444一区二区三区| 亚洲日本韩国在线| 亚洲精品四区| 午夜精品www| 久久久美女视频| 国产一区激情| 欧美韩国理论所午夜片917电影| 久草福利资源在线| 色琪琪久久se色| 这里只有精品视频| 农村老熟妇乱子伦视频| 久久大综合网| 日日狠狠久久偷偷四色综合免费| 天堂资源在线视频| 91久久夜色精品国产按摩| 色吧影院999| 很污很黄的网站| 欧美激情电影| 色综合天天综合网国产成人网| 欧美日韩在线视频免费| 激情五月***国产精品| 欧美成人精品h版在线观看| 日韩一级片大全| 欧美区日韩区| 69精品小视频| 中文字幕免费高清网站| 日本美女视频一区二区| 国产欧美一区二区三区在线| 国产精品久久久久久久久久久久久久久久| 国产综合久久久久影院| 国产精品18毛片一区二区| 天天干在线观看| 久久久精品免费免费| 亚洲欧美丝袜| 羞羞的视频在线看| 性久久久久久久| 五月天婷婷激情视频| 只有精品亚洲| 亚洲第一在线视频| 欧美性猛交xxxx乱| 国产精品99一区二区三区| 欧美高清自拍一区| 日韩精品在线观看免费| 麻豆精品国产传媒mv男同| 超碰97人人人人人蜜桃| 三级无遮挡在线观看| ㊣最新国产の精品bt伙计久久| 日韩美女爱爱视频| 综合在线影院| 日韩一区二区三| 日韩人妻一区二区三区| 国产二区精品| 欧美成人精品在线视频| 亚洲欧美自拍视频| 国产乱色国产精品免费视频| 激情小说综合网| 中文字幕日本在线观看| 午夜在线成人av| av污在线观看| 精品国产一区二区三区不卡蜜臂| 一区二区av在线| 欧美一级高潮片| 美女视频一区在线观看| 国产日韩久久| 黄色片免费在线观看| 欧美日韩美女视频| 久久精品久久99| av一区二区高清| 97人人做人人爱| 97超碰国产在线| 国产欧美日韩卡一| 免费看黄在线看| 精品一区二区三区视频在线播放| 亚洲欧美成人一区二区在线电影| 欧美三级在线免费观看| 日本午夜一区二区| 久久精品国产一区二区三区不卡| jizzjizz亚洲| 欧美日韩中文字幕一区| 最新中文字幕视频| 亚洲精品偷拍| 国产欧美日韩综合精品二区| a级影片在线观看| 欧美日韩卡一卡二| 免费污网站在线观看| 中文日韩欧美| 国产一区二区高清视频| 18加网站在线| 91麻豆精品国产91久久久更新时间 | 国产乱肥老妇国产一区二| 污视频在线免费| 亚洲国产另类av| 中文字幕1区2区| 亚洲最大av| 成人在线国产精品| 欧美jizzhd欧美| 欧美日韩电影在线播放| 欧美一区二区三区粗大| 琪琪一区二区三区| 色噜噜狠狠色综合网| 三级成人黄色影院| 亚洲色图18p| 天堂网免费视频| 久久日一线二线三线suv| 国产v片免费观看| 国产乱人伦精品一区| 久久久久久久久网站| 亚洲精品久久久久久久久久| 一区二区在线免费观看| 亚洲精品成人无码毛片| 欧美久久综合| 国产一区二区三区av在线 | 国产成人精品综合| 免费成人av电影| 欧美在线小视频| 国产精品视频在| 久久黄色级2电影| 三年中文高清在线观看第6集| 97成人超碰| 久久久国产精品一区| 99热这里只有精| 亚洲国产精品一区二区www在线| 女同性恋一区二区三区| 免费看的黄色欧美网站| 亚州欧美一区三区三区在线| 95精品视频| 久久久亚洲精选| 欧美女同网站| 欧美美女直播网站| 精品无码人妻一区二区三| 99国产精品国产精品毛片| 欧美视频第一区| 日韩欧美伦理| 国产精品中出一区二区三区| 亚洲天堂资源| 最新日韩中文字幕| 亚洲xxxx天美| 色婷婷激情久久| 中国一级片在线观看| 成人av电影免费在线播放| 久久久久久久久久久久久国产精品| 国产精品亚洲片在线播放| 成人午夜在线观看| 久久青草伊人| 日韩中文字幕免费看| 午夜精品久久久久久久99老熟妇| 欧美日韩国产精品| 亚洲女人毛茸茸高潮| 成人黄色小视频在线观看| 久久久久免费精品| 欧美久久综合| 亚洲精品无人区| 久久综合另类图片小说| 91精品久久久久久久久久另类| 羞羞网站在线免费观看| 一区二区三区亚洲| 欧美一区二区公司| 欧美区在线观看| 国产精品一区二区6| 亚洲丝袜精品丝袜在线| 免费在线观看你懂的| 国产一区二区三区四| 成人免费毛片播放| 在线欧美日韩| 精品国产三级a∨在线| 国产欧美日韩免费观看| 国产成人av一区二区三区| 992tv国产精品成人影院| 久久免费精品日本久久中文字幕| 成年人在线观看视频| 日韩av最新在线观看| www.黄色国产| 欧美日韩大陆在线| 精人妻无码一区二区三区| 天天综合色天天综合色h| 99鲁鲁精品一区二区三区| 国产亚洲制服色| 波多野结衣影院| 国产成人日日夜夜| 第一区免费在线观看| 日韩avvvv在线播放| www.亚洲天堂网| 亚洲免费激情| 99热久久这里只有精品| 五月精品视频| 亚洲三级一区| jizzjizz欧美69巨大| 欧美日韩精品久久| 日韩高清成人在线| 精品麻豆av| 日本一区福利在线| 久久久久久a亚洲欧洲aⅴ| 欧美三级午夜理伦三级在线观看| 国产精品99久久久久久久| 久久久91麻豆精品国产一区| 成人免费在线视频网站| 香蕉久久一区| 国产日韩欧美黄色| 深夜福利亚洲| 91亚洲国产成人久久精品网站| 国产成人77亚洲精品www| 国产精品久久中文| 国产精品诱惑| 国产精品久久久久久久久免费 | 激情国产在线| 26uuu另类亚洲欧美日本老年| 秋霞伦理一区| 奇米成人av国产一区二区三区| 亚洲同志男男gay1069网站| 欧美洲成人男女午夜视频| 亚洲天堂av影院| 国产成人精品视| 久久精品xxxxx| 亚洲一区亚洲二区| 白嫩白嫩国产精品| 精品人伦一区二区三区| 国产成人久久| 椎名由奈jux491在线播放| 午夜日韩av| 久久久久久久久久久99| 在线亚洲精品| 日本新janpanese乱熟| 久久超碰97中文字幕| 妖精视频在线观看| 91婷婷韩国欧美一区二区| 第一次破处视频| 亚洲天堂成人在线观看| 免费在线视频观看| 黑人巨大精品欧美一区二区| 国产午夜无码视频在线观看 | 色婷婷综合在线观看| 成人污视频在线观看| 九色porny自拍视频| 亚洲欧洲一区二区三区| 国产大片aaa| 欧美亚洲综合色| 国产人妻精品一区二区三| 亚洲第一网站免费视频| 国产在线电影| 欧美另类第一页| 伊人久久综合一区二区| 91精品久久久久久久久久久久久| 97成人在线| 五月天亚洲综合情| 亚洲特级毛片| jizzzz日本| www.成人在线| 欧美特黄一级片| 疯狂做受xxxx高潮欧美日本 | 亚洲第一二三四区| 91青青草免费观看| 久久综合欧美| 国产高清不卡无码视频| 视频一区视频二区在线观看| 51自拍视频在线观看| 久久综合九色综合欧美就去吻| 国产免费美女视频| 色综合天天做天天爱| 99国产揄拍国产精品| 亚洲偷熟乱区亚洲香蕉av| 欧美伦理免费在线| 国产精品专区h在线观看| 欧美人妖在线观看| xxxxxx在线观看| 麻豆精品视频在线观看| 免费a级黄色片| 亚洲一区二区三区美女| 一区二区三区精| 亚洲丝袜av一区| 99爱在线视频| 999热视频| 国产精品99久久精品| 无码人妻精品一区二区三区66| 成人黄色一级视频| 久久精品一区二区三区四区五区 | 日本私人网站在线观看| 欧美大片在线看免费观看| 成人日韩在线| 欧美日韩在线观看一区| 亚洲美女一区| 麻豆短视频在线观看| 亚洲三级电影全部在线观看高清| 99久久久无码国产精品免费蜜柚| 亚洲国产欧美精品| 丁香高清在线观看完整电影视频| 3d动漫精品啪啪一区二区三区免费| 欧美中文一区二区| 国产视频一区二区三区在线播放| 99久久er热在这里只有精品15 | 91久久亚洲| 精品国产乱码久久久久夜深人妻| 亚洲欧美日韩在线| 国产露脸91国语对白| www.亚洲成人| 亚洲精品一区av| 国产精品一区在线免费观看| 久草这里只有精品视频| 九九热久久免费视频| 欧美乱熟臀69xxxxxx| 在线激情免费视频| 国产在线999| 91精品啪在线观看国产18| 国产精品自在自线| 亚洲精品免费在线| www.超碰在线.com| 欧美激情欧美激情| 国产主播性色av福利精品一区| 蜜臀av色欲a片无码精品一区| 成人视屏免费看| 成人免费a视频| 亚洲性视频网址| 国产精品久久久久久吹潮| 亚洲国产精品日韩| 国产一区二区精品久久91| 欧美成人aaa片一区国产精品| 精品国产一区二区三区久久影院| 日本乱理伦在线| 久久精品午夜一区二区福利| 午夜在线一区| 国产又粗又猛又爽又黄的视频四季 | 久久久久久久97| 竹菊久久久久久久| 免费激情视频在线观看| 国产精品久久午夜| 亚洲av永久纯肉无码精品动漫| 91国内在线视频| av资源久久| 蜜桃视频无码区在线观看| 福利微拍一区二区| 在线视频91p| av在线不卡一区| 国产精品人人爽人人做我的可爱| 手机看片日韩av| 日韩视频免费直播| 黑森林国产精品av| 亚洲欧美日韩在线综合| 国产jizzjizz一区二区| 在线视频一区二区三区四区| 中文字幕亚洲综合久久筱田步美| 欧美2区3区4区| 国产高清精品在线观看| 国产精品国产三级国产aⅴ入口| a天堂在线视频| 日韩免费在线播放| 亚洲自拍偷拍网| 瑟瑟视频在线观看| 日韩一区二区三区精品视频| 樱桃视频成人在线观看| 黄色一级片网址| 91小视频免费看| 国产毛片毛片毛片毛片毛片| 茄子视频成人在线| 亚洲乱码免费伦视频| 手机免费看av| 精品对白一区国产伦| 欧美大陆国产| 久久久久久久久久久福利| 一区二区三区四区精品在线视频| 成人高潮成人免费观看| 国产欧美日韩综合精品二区|