精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首創Mid-training范式破解RL奧秘,Llama終于追平Qwen!

人工智能 新聞
一份來自上海創智學院、上海交通大學的前沿研究論文吸引了人工智能領域的廣泛關注。

近期,一份來自上海創智學院、上海交通大學的前沿研究論文吸引了人工智能領域的廣泛關注。該論文深入探討了不同基礎語言模型家族(如 Llama 和 Qwen)在強化學習(RL)訓練中迥異表現的背后原因,并提出創新性的中期訓練(mid-training)策略,成功地將 Llama 模型改造成高度適配強化學習的推理基礎模型,顯著縮小了其與天生擅長 RL 擴展的 Qwen 模型之間的性能差距,為下一代 reasoning 能力 AI 系統的開發提供了關鍵的科學基礎和技術路徑。

論文發布后在社交媒體引發廣泛關注,Meta AI 研究科學家、即將赴 UMass Amherst 任助理教授的 Wenting Zhao 率先盛贊:“Truly impressed by how an academic lab just figured out a lot of mysteries in mid-training to close the RL gap between Llama and Qwen。” 此外,卡內基梅隆大學副教授 Graham Neubig、MIT CSAIL/Databricks Research 研究科學家,DSPy 項目的開發者 Omar Khattab 以及 AI2 數據負責人 Loca Soldaini 也共同肯定了這項系統性分析的重要價值。來自 Pleias AI Lab 的研究員 Alexander Doria 指出,他們的獨立實驗也證明,只要配合適當的數據預處理,任何模型都能顯著提升 RLVR 或 RL 性能,進一步佐證了該方法的普適性。

此外,和 Octothinker 一同發布的 MegaMath-Web-Pro-Max 數據集發布即獲得下載熱潮,使用者覆蓋了 MIT、EPFL、UW、Columbia、NUS、CMU、Princeton、THU、HKUST 等諸多頂尖高校,以及 Apple、Microsoft、TII、Moonshot、DatologyAI、AI2、IBM、Cohere、Tencent 等知名科研機構和企業,體現了學術界和工業界對這一工作的高度重視。

圖片

  • 論文鏈接:https://arxiv.org/abs/2506.20512
  • 代碼倉庫:https://github.com/GAIR-NLP/OctoThinker
  • 開源模型 & 數據:https://huggingface.co/OctoThinker

圖片

研究團隊通過大規模 mid-training 成功將 Llama 模型改造成 highly RL-compatible 的推理基礎模型,在數學推理上可以與 Qwen 媲美。

研究背景

將大規模強化學習(RL)引入語言模型顯著提升了復雜推理能力,尤其是在數學競賽題解等高難度任務上。然而,近期的各項研究呈現出一系列耐人尋味的現象:(i) 只有 Qwen 系列基礎模型表現出近乎 “魔法般” 的 RL 提升;(ii) 關鍵的 Aha moment 似乎主要在數學場景中出現;(iii) 不同評測設置往往暗含偏差,影響對 RL 成效的判斷;(iv) RL 在下游看似 “歲月靜好”,卻在很大程度上依賴上游的 Pre-/Mid-training 質量 ^[1]。

與此同時,團隊和其他研究者們都發現,盡管 Qwen 在 RL 擴展上高度穩健,Llama 卻頻繁出現提前給出答案和重復輸出,難以獲得同等級的性能增益。這一系列對比引出了核心科學問題:哪些基座特性決定了模型對 RL scaling 的適應性?Mid-training 能否作為可控干預手段,彌合不同基座在 RL 中的表現鴻溝?

為了探索這些問題,團隊毫無保留地交出了一份詳盡的技術報告記錄了他們的研究過程,和一份完全開源的數據方案和基于 Llama 充分強化性能的新系列模型 OctoThinker。

核心問題:為什么 RL 訓練在 Llama 上頻頻失效?

當 Qwen 系列模型通過強化學習(如 PPO、GRPO)在數學推理任務上獲得顯著提升時,同體量的 Llama 模型卻常陷入重復輸出或過早給出答案的困境。如下圖所示,Llama 系列模型在直接進行強化學習訓練的時候,總是會遇到 Reward Hacking、表現提升有限等一系列問題。

圖片

深入挖掘:通過可控的中期訓練探索關鍵因素

研究團隊通過對 Llama-3.2-3B 進行大量的可控 mid-training 實驗(每次實驗訓練 20B tokens),然后進行強化學習訓練觀察訓練動態。

圖片

圖片

中等訓練策略的關鍵發現

  • 高質量數學語料庫的重要性:研究發現,像 MegaMath-Web-Pro 這樣的高質量數學語料庫,相較于 FineMath-4plus 等現有替代方案,能顯著提升基礎模型和 RL 性能。例如,在使用 MegaMath-Web-Pro 時,模型在下游 RL 任務中的表現明顯優于使用 FineMath-4plus 的情況。
  • QA 格式數據與指令數據的增益:在高質量數學預訓練語料庫基礎上,加入 QA 樣式數據(尤其是長鏈推理示例)可增強 RL 效果,而少量指令數據的引入能進一步釋放 QA 數據潛力。研究發現,指令數據可以幫助模型更好地理解任務要求,從而在 RL 階段表現更佳。
  • 長鏈推理的雙刃劍效應:長鏈推理雖能提升推理深度,但也可能引發模型響應冗長及 RL 訓練不穩定問題,凸顯數據格式化的重要性。例如,在實驗中發現,模型在處理長鏈推理數據時容易出現輸出過長或訓練過程中的性能波動。為此研究團隊通過以下方案來解決訓練不穩定問題:
  • 設計指令增強提示模板,抑制重復輸出(相比基礎模板錯誤率↓37%)
  • 設置漸進最大響應長度調度器,按照訓練進度解決長鏈推理引發的訓練不穩定
  • 中等訓練規模擴展的效益:增加中等訓練數據量可帶來更強勁的下游 RL 性能,即使基礎模型評估中未明顯體現這些增益。這表明,中等訓練階段的擴展對于提升模型的最終 RL 表現具有重要意義。

自建高質量數學語料庫 

MegaMath-Web-Pro-Max

在準備語料時,團隊還發現了另一個問題,即開源高質量語料的缺乏。以預訓練語料為例,目前最高質量的數學語料 MegaMath-Web-Pro 包含了不到 20B tokens,但如果混合質量稍低的 FineMath 語料,則容易出現 RL 訓練時的不穩定。

為了支持大規模消融研究和中期訓練,研究團隊創建了 MegaMath-Web-Pro-Max。該語料庫通過一個高效的分類器從 MegaMath-Web 中召回文檔,并進一步利用一個大語言模型進行精煉構建。

具體而言,研究團隊從 MegaMath-Web 語料庫中按文檔的年份分層,均勻隨機采樣了數百萬篇文檔,并使用 Llama-3.1-70B-instruct 對其進行標注。每篇文檔根據其在數學學習中的實用程度,被打分為 0 到 5 分,評分過程使用特定的評分提示(見論文附錄)。研究團隊采用啟發式方法從模型的評論中提取評分:得分低于 3 的文檔被標注為負例,得分在 3 分及以上的文檔被視為正例。研究團隊觀察到,現有的分類器(如 inemath-classifier)在數據收集過程中對文本提取器的選擇非常敏感。

因此,研究團隊訓練了自己的分類器,并選擇效率較高的 fasttext 作為分類器。與 MegaMath 的發現一致,研究團隊發現預處理步驟對召回性能至關重要。研究團隊的預處理流程包括將文本轉換為小寫、過濾過長的單詞,以及去除換行符和多余的非字母數字字符。

如下圖所示,研究團隊按照 MegaMath-Web 提出的逐年數據集比較設定,評估了不同召回閾值下所召回語料的質量。召回閾值決定了數據質量與數量之間的權衡:較高的閾值(如 0.9)帶來更高的數據質量,但保留的 token 數量較少。最終,研究團隊選擇了 0.4 作為召回閾值。

圖片

圖:研究團隊重新召回的數據與 MegaMath-Web 的按照 Common Crawl 年份逐年數據質量對比(不同的 fasttext 閾值)。

考慮到許多文檔存在噪聲大、結構差等問題,研究團隊使用 Llama-3.1-70B-instruct 對文本進行了精煉,所用提示設計借鑒了 MegaMath-Web-Pro。最終構建的 MegaMath-Web-Pro-Max 數據集包含的 token 數量約為 MegaMath-Web-Pro 的 5.5 倍。預訓練過程中的實證評估表明,MegaMath-Web-Pro-Max 在保持數據質量的同時,具備成為大規模中期訓練基礎語料的潛力。

此外,研究團隊也嘗試通過從常見數學問題求解數據集中引入長鏈式思維數據來擴充正例種子集合,以提升分類器召回推理密集型內容的能力。然而,這種方法最終僅保留了約 20B tokens,研究團隊認為其規模不足,因此未被采用。

突破性方案:OctoThinker 的兩階段

「穩定 - 衰減」訓練方案

基于上述發現,研究者提出兩階段中等訓練策略:

第一階段:構建強推理基座(200B tokens)

使用恒定學習率對 Llama 模型進行 200B tokens 訓練,主要依賴高質量預訓練語料庫(如 MegaMath-Web-Pro 和 DCLM-Baselines),輔以少量合成數據,構建穩固的推理基礎。這一階段的目標是使模型在大規模數據上逐步提升推理能力,為后續的 RL 訓練打下堅實基礎,產出:OctoThinker-Base-Stable 系列基模型;

第二階段:分支專業化訓練(20B tokens)

學習率衰減(余弦衰減至初始 LR 的 10%),引入不同數據混合(短鏈推理、長鏈推理及其混合),訓練三個分支模型,塑造多樣化模型行為。這一階段旨在通過數據多樣性和學習率調整,進一步提升模型的推理能力和適應性。

三大推理分支:

圖片

OctoThinker 基礎模型系列的顯著提升

經兩階段中等訓練后的 OctoThinker 基礎模型系列,在數學推理基準測試中表現出色,相較于原始 Llama 基礎模型,在所有模型尺寸上均實現了 10%-20% 的顯著性能提升,為 RL 擴展奠定了堅實基礎。例如,在 GSM8K 和 MATH500 等基準測試中,OctoThinker 基座模型的準確率和推理深度均有明顯提升。

圖片

圖: OctoThinker 中期訓練后的數學榜單表現跑分,圖中所示為 1B 規模的模型結果

圖片

圖: OctoThinker 中期訓練后的數學榜單表現跑分,圖中所示為 3B 規模的模型結果

圖片

圖: OctoThinker 中期訓練后的數學榜單表現跑分,圖中所示為 8B 規模的模型結果

OctoThinker-Zero 家族在 RL 訓練中的卓越表現

進一步對 OctoThinker 基礎模型進行 RL 訓練后,生成的 OctoThinker-Zero 家族(包括短鏈、混合鏈和長鏈推理分支)在數學推理任務中展現出與 Qwen2.5 模型相當的性能。特別是 OctoThinker-Long-Zero 分支,在 3B 模型規格上,成功媲美以強大推理能力著稱的 Qwen2.5-3B 模型,有力證明了中等訓練策略對提升 Llama 模型 RL 兼容性的有效性。在多個數學推理基準測試中,OctoThinker-Zero 模型的表現與 Qwen2.5 模型不相上下,甚至在某些任務上略有超越。

圖片

圖: OctoThinker 系列、Qwen-2.5、Llama-3.2 在 RL 訓練中的數學基準測試動態曲線

未來展望

研究團隊計劃在多個方向持續探索:一是進一步精煉數學預訓練語料庫以增強中等訓練效果;二是采用開放配方設計無需從強大長鏈推理模型蒸餾的 RL 友好型基礎模型;三是深入解耦 QA 格式與內容的獨立貢獻;四是拓展 OctoThinker 家族,增加如工具集成推理等新分支,以期為預訓練與強化學習的交互機制提供更深入洞見。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-14 10:22:03

2025-01-21 08:00:00

2025-01-03 11:16:38

2023-04-14 17:17:49

2020-11-03 17:21:33

人工智能技術宇宙

2025-07-10 10:25:23

2025-10-11 04:00:00

2025-09-18 09:00:47

2024-06-07 12:46:11

2019-10-11 09:45:19

代碼開發密碼

2024-12-04 07:00:00

2025-08-08 09:06:00

2024-12-18 15:34:07

2025-03-06 09:22:00

模型強化學習訓練

2009-03-09 09:05:22

MID移動終端移動OS

2025-03-13 11:07:30

2024-12-13 14:03:44

模型訓練AI

2025-09-01 14:22:03

AI開源模型

2025-02-24 08:40:00

開源模型訓練
點贊
收藏

51CTO技術棧公眾號

亚洲а∨天堂久久精品9966 | 欧美黑人一区二区三区| 久久久精品视频国产| 免费毛片在线看片免费丝瓜视频 | 久久久久无码国产精品一区| 中国一区二区视频| 国内精品99| 尤物yw午夜国产精品视频| 秋霞午夜鲁丝一区二区| 三上悠亚一区二区| 在线中文免费视频| 亚洲国产三级| 精品久久久91| 国精产品一区一区三区免费视频| 国内精品伊人| 精品国产乱码久久久久久天美| 日韩免费av一区二区三区| va婷婷在线免费观看| 久久一区激情| 国内伊人久久久久久网站视频 | 中文字幕免费在线观看视频一区| 亚洲在线www| 中文在线a天堂| 亚洲综合99| 久久91亚洲精品中文字幕| 亚洲一区视频在线播放| 国产suv精品一区二区四区视频| 欧美视频中文字幕| 波多野结衣家庭教师在线| 污污片在线免费视频| 国产精品网站一区| 欧美亚洲一级二级| 欧洲精品久久一区二区| 国产精品18久久久久久久网站| 国产精品精品一区二区三区午夜版| 久久午夜鲁丝片午夜精品| 欧美激情黄色片| 亚洲欧美中文日韩在线v日本| 特级特黄刘亦菲aaa级| 精品久久免费| 欧美一区二区三区视频免费播放 | 一区二区三区四区精品| 亚洲成人日韩在线| 网曝91综合精品门事件在线| 亚洲成人激情在线| 最新中文字幕日本| 日韩成人18| 日韩美女天天操| 日韩欧美中文视频| 深夜福利一区| 日韩精品一区二区三区在线播放 | 一区二区成人网| 日韩欧美另类一区二区| 欧美性生交xxxxx久久久| 国产高清av在线播放| 欧美人体视频xxxxx| 亚洲综合色丁香婷婷六月图片| 黄色录像特级片| 中文字幕在线播放网址| 一区二区三区91| 欧美一级欧美一级| 黄色在线观看www| 日韩欧美国产中文字幕| 中文字幕欧美人妻精品一区| 偷拍中文亚洲欧美动漫| 欧美日韩免费不卡视频一区二区三区| 超碰在线公开97| 一区二区三区日本视频| 日韩亚洲欧美在线| 人妻互换一二三区激情视频| 国产精品香蕉| 亚洲美女黄色片| www.黄色在线| 国产精品7m凸凹视频分类| 久久这里只有精品视频首页| 在线观看成人毛片| 亚洲毛片一区| 日韩免费观看网站| 国产又粗又猛又爽| 成人免费精品视频| 日韩欧美亚洲在线| 国产色在线观看| 欧美日韩国产激情| 欧美婷婷精品激情| 香蕉成人app| 亚洲男人天堂古典| 91香蕉视频在线播放| 精品二区视频| 国产精品欧美日韩一区二区| 国产精品自拍电影| 91美女在线视频| 亚洲精品在线免费| 欧美家庭影院| 欧美日韩一区二区在线观看视频| 男人添女人荫蒂国产| 婷婷成人综合| 久久久精品日本| 波多野结衣视频网站| 精品一区二区影视| 激情五月综合色婷婷一区二区| 国产在线超碰| 亚洲一区视频在线| 欧美伦理片在线观看| 4438全国亚洲精品观看视频| 国产亚洲精品久久久久久777| 欧美色图亚洲天堂| 美女国产一区二区| 久久av一区二区三区亚洲| 成人在线网址| 欧美中文字幕久久| 黄色污在线观看| 999精品视频| 国产成人精品免高潮在线观看| 国产成人三级在线播放| 欧美国产日韩亚洲一区| 麻豆tv在线播放| 国产精品一级在线观看| 一区二区三区视频在线| 一区二区三区视频免费看| 精品一区二区久久| 日本高清久久一区二区三区| 91豆花视频在线播放| 欧美精品电影在线播放| 成人免费毛片糖心| 亚洲茄子视频| 5g国产欧美日韩视频| 午夜激情视频在线观看| 色婷婷精品久久二区二区蜜臂av| 成人区人妻精品一区二| 欧美国产三区| 91在线免费视频| a天堂中文在线88| 日韩欧美在线视频观看| 毛茸茸free性熟hd| 国内自拍视频一区二区三区| 亚洲影院色在线观看免费| 嫩草在线视频| 欧美老女人在线| 国产三级在线观看完整版| 久久激情一区| 欧美一区二区综合| 久久91导航| 亚洲午夜激情免费视频| 国产免费一区二区三区四区五区 | 六月婷婷久久| 麻豆mv在线观看| 亚洲国产精品久久久久秋霞不卡| 久久久久久欧美精品se一二三四| 国产成人亚洲精品青草天美| 潘金莲一级淫片aaaaa免费看| 日韩三级成人| 久久艳片www.17c.com| 国产情侣av在线| 亚洲精品国产无天堂网2021| 一级黄色片国产| 欧美二区视频| 国产精选在线观看91| 日韩av影片| 亚洲午夜av久久乱码| 中文字幕在线2019| 亚洲欧美自拍偷拍| 欧美性猛交乱大交| 国产一区二区三区四区老人| 国产日韩欧美二区| 日韩在线影院| 中文字幕视频一区二区在线有码 | 精品日韩视频| 日韩中文字幕免费视频| 国产免费一区二区三区最新不卡 | 91.com在线| 亚洲成aⅴ人片久久青草影院| 国产成一区二区| 免费超碰在线| 精品国产乱码久久久久久影片| 午夜精品久久久久久久久久久久久蜜桃| 久久一区二区视频| 99热一区二区| 在线看片日韩| 天天人人精品| 综合中文字幕| 国产精品91在线| 香蕉成人app免费看片| 亚洲国产精品久久91精品| 亚洲精品久久久久久久蜜桃| 中文字幕成人av| 91人人澡人人爽| 美女网站久久| 日本a级片在线播放| 少妇高潮一区二区三区| 国产欧美 在线欧美| 超碰中文在线| 最好看的2019年中文视频| 草逼视频免费看| 欧美性生活久久| 久久久美女视频| 日本一区二区三区四区在线视频| 中文字幕一二三| 奇米777欧美一区二区| 国产性生活免费视频| 激情综合网五月| 高清国产一区| 伦一区二区三区中文字幕v亚洲| 久久久久久国产精品久久| 成人在线观看网站| 日韩成人在线免费观看| 国产男女裸体做爰爽爽| 色婷婷久久久综合中文字幕| 欧美黑吊大战白妞| 国产精品丝袜在线| www.超碰97| 另类小说第一页| 99国产精品99久久久久久粉嫩| 在线一区高清| 最新亚洲精品| 狠狠色综合网站久久久久久久| 在线观看亚洲精品福利片| 日韩av三级在线观看| 蜜桃成人365av| 久久亚洲成人精品| 阿v免费在线观看| 精品伊人久久97| 人妻无码一区二区三区久久99| 欧美电影一区二区三区| 亚洲av无码乱码国产精品fc2| 偷拍与自拍一区| 久久久久久久久久综合| 亚洲精品视频免费观看| 日韩av毛片在线观看| 国产人成亚洲第一网站在线播放| 亚洲第一黄色网址| www.日韩在线| 中国特级黄色大片| 国产v日产∨综合v精品视频| 三级av免费看| 国产美女精品一区二区三区| 国产精品欧美激情在线观看| 亚洲每日更新| 欧美变态另类刺激| 国产日韩一区| 国产91美女视频| 国产欧美69| av免费观看网| 国产日韩欧美一区二区三区在线观看| 久草视频国产在线| 亚洲精品影视| 国产视频九色蝌蚪| 亚洲欧美日韩国产一区| 亚洲色成人一区二区三区小说| 亚洲在线黄色| aⅴ在线免费观看| 日本系列欧美系列| 尤物国产在线观看| 国产在线精品一区二区| 日本一区二区三区在线免费观看| 国产一区二区精品久久99| 亚洲天堂伊人网| 国产精品综合视频| 国产香蕉精品视频| 91一区二区三区在线观看| 9.1成人看片| 国产亚洲一区二区三区在线观看| 黄色片在线观看免费| 国产精品免费丝袜| 欧美精品一区二区蜜桃| 亚洲成a天堂v人片| 麻豆成人免费视频| 欧美日韩精品一区二区| 99在线无码精品入口| 亚洲成色www8888| 国家队第一季免费高清在线观看| 中文字幕久久精品| 18视频在线观看网站| 久久久久亚洲精品成人网小说| 国产社区精品视频| 国产精品精品视频一区二区三区| 亚洲网站免费| 精品国产乱码久久久久软件| 国产影视一区| 亚洲小视频在线播放| 99精品视频免费| 999精品视频在线| 国产美女一区二区| 艳妇乳肉亭妇荡乳av| 国产女主播视频一区二区| 全网免费在线播放视频入口| 欧美日韩国产在线播放| 亚洲图片视频小说| 亚洲成人网在线观看| 在线日本视频| 久久久久免费视频| 国产福利91精品一区二区| 高清国产在线一区| 成人影院在线| 国产素人在线观看| 久久精品72免费观看| 欧美精品欧美极品欧美激情| 中文字幕一区二区三区在线观看| 好吊操这里只有精品| 欧美日韩国产免费| 亚洲欧洲国产综合| 美女福利视频一区| 欧美日韩五码| 国产精品一区二区在线观看| 999国产精品永久免费视频app| 国产特级黄色大片| 国产精品88888| 日本精品久久久久中文| 岛国精品视频在线播放| 国产99999| 少妇av一区二区三区| 一二三四视频在线中文| 97视频资源在线观看| 日本a级不卡| 女人另类性混交zo| 成人免费av网站| 国产精品 欧美激情| 欧美性感一区二区三区| 日韩私人影院| 性欧美xxxx视频在线观看| 精品国产一区二区三区2021| 亚洲人成人77777线观看| 久久福利影视| 免费看黄色aaaaaa 片| 洋洋av久久久久久久一区| 91丨九色丨丰满| 中文日韩在线视频| 国产v综合v| 欧美日韩综合精品| 国产精品美女久久久| 中文在线永久免费观看| 亚洲高清在线视频| 韩国av免费在线| 久久久久久久久爱| 在线观看视频一区二区三区| 只有这里有精品| 久久电影网站中文字幕| 中文字幕第4页| 色久综合一二码| 久久电影视频| 国产成人精品久久二区二区| 免费av一区| 久久精品一区二| 国产网站一区二区三区| 销魂美女一区二区| 尤物精品国产第一福利三区 | 147欧美人体大胆444| 欧美fxxxxxx另类| 国产精品二区视频| 亚洲伊人伊色伊影伊综合网| 99久久亚洲精品日本无码| 久久久久北条麻妃免费看| 国产aa精品| 日本中文字幕在线视频观看| www.色精品| 国产一级淫片a视频免费观看| 国产亚洲综合久久| 国产精品久久久久久吹潮| 一级日韩一区在线观看| 精品一区二区三区蜜桃| 三级影片在线看| 亚洲国产97在线精品一区| 日韩伦理在线一区| 午夜午夜精品一区二区三区文| 蜜桃av一区二区三区| 最新一区二区三区| 精品乱人伦小说| 在线观看网站免费入口在线观看国内| 欧美日韩国产综合在线| 麻豆成人综合网| 欧美精品成人久久| 日韩精品免费综合视频在线播放| 麻豆精品蜜桃| 日韩人妻一区二区三区蜜桃视频| av一区二区不卡| 最近中文字幕av| 欧美激情手机在线视频 | 日韩精品一区二区在线视频| 成人免费观看av| 亚洲 国产 日韩 欧美| 久久综合伊人77777蜜臀| 大桥未久女教师av一区二区| 欧美视频第三页| 亚洲三级在线看| 亚洲色图欧美视频| 成人xxxxx| 夜夜嗨一区二区三区| 国产精品久久久久久久久电影网| 2001个疯子在线观看| 一区二区三区欧美日韩| 天堂在线观看av| 国产精品亚洲激情| 在线看片日韩| 国产精品免费在线视频| 亚洲精品久久久一区二区三区 | 国产精品免费一区二区| 日韩电影在线观看一区| 久久久久久激情| www.日韩av.com| 欧美色图婷婷| 国产精品igao网网址不卡|