精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek 系列模型詳解之 DeepSeek Math

人工智能
DeepSeek Math發布于2024年2月,雖然是一個7B參數量的模型,但在Math基準榜單上的表現卻超過了多個30B~70B參數量的開源模型。

DeepSeek Math發布于2024年2月,雖然是一個7B參數量的模型,但在Math基準榜單上的表現卻超過了多個30B~70B參數量的開源模型。

一、技術亮點

1. 數據集

使用Common Crawl提取的120B(1200億個)高質量數學網頁數據(具體包括與數學相關的token,以及自然語言和代碼數據等),總數據量是開源數據集OpenWebMath的9倍。如此大規模且高質量的數據集為模型提供了豐富的數學知識背景,使得它在處理數學相關任務時具有更強的能力。

2. 訓練策略

基于代碼領域模型DeepSeek-Coder-v1.5進行初始化,而不是從通用語言模型開始。從而賦予模型更好的數學推理能力。

3. 對齊技術

引入了一種近端策略優化(PPO)的變體——群組相對策略優化(GRPO)。GRPO通過將相似的任務或狀態分組,并根據它們之間的相對關系來調整獎勵信號,從而增強了模型的泛化能力和推理性能。此外,GRPO丟棄了Critic Model,顯著減少了訓練所需的顯存,提高了訓練效率和對齊效果。

4. 數學基準表現

在中文和英文數學基準榜單上,DeepSeek Math的表現超過了Mistral 7B、Llemma-34B等模型,并且其數學推理能力逼近GPT-4,與Minerva 540B的效果相當。

二、數據

1. 數據采集

如圖所示,是一個迭代Pipeline,展示了如何從一個種子語料庫(例如,一個小規模但質量高的數學相關數據集)開始,系統地從Common Crawl收集大規模數學語料庫。

整體數據采集過程是迭代式的。經過四輪數據收集迭代,最終收集了3550萬個數學網頁,總計1200億個token。具體流程如下:

  • 選擇OpenWebMath(一個高質量數學網頁文本的集合)作為初始種子語料庫。并使用這個語料庫,訓練fastText模型。
  • 利用訓練好的FastText模型,在包含400億網頁的Common Crawl中召回更多與數學相關的網頁。
  • 在召回的數學網頁中,通過統計識別出與數學相關的域名(例如,mathoverflow.net)。
  • 對這些域名下的URL路徑進行人工標注,標記出與數學內容相關的路徑(例如,mathoverflow.net/questions)。
  • 將這些特定路徑下的網頁,如果它們未被前述步驟召回,則將它們作為正樣本加入到種子集合中,以供下一輪迭代使用。重復這一過程直到完成四輪迭代。

為了避免基準污染,沿用DeepSeek-Coder的n-gram過濾方法,過濾掉包含來自英語數學基準(如GSM8K和MATH)以及中文基準(如CMATH和AGIEval)的問題或答案的網頁。過濾標準如下:

  • 10-gram匹配:任何包含與評估基準中的子字符串完全匹配的10-gram文本段落都將從數學訓練語料庫中移除。
  • 短文本精確匹配:對于長度不足10-gram但至少有3-gram的基準文本,采用精確匹配方法過濾受污染的網頁。

2. 與開源數據對比

為了驗證DeepSeekMath數據的質量,采用相同的初始化模型(DeepSeek-Coder-v1.5)和訓練設置,在多個不同的數學數據集上分別訓練了1500億個token,并對比最終模型的效果。

如下圖展示了不同數學數據集訓練模型的效果對比。紅線代表使用DeepSeekMath數據訓練的模型,其在多個數學基準上的表現顯著領先于其他數據集。特別地,在一個epoch范圍內(例如對于Proof-Pile-2是50B tokens),DeepSeekMath數據訓練的模型效果更好,進一步證明了其數據質量的優越性。

下表展示了更多詳細的榜單和數據集結果對比,DeepSeekMath數據在以下幾個方面表現出優勢:中英雙語、更大規模、更高質量。

三、訓練設置

DeepSeek Math對一個具有13億參數的通用預訓練語言模型進行數學訓練。該模型與DeepSeek LLM采用相同框架,記為DeepSeek LLM 1.3B。在每個數學語料庫上分別對模型進行1500億token的訓練。所有實驗均使用高效輕量的HAI-LLM訓練框架進行。以下是詳細的訓練設置:

(1) 使用AdamW優化器,參數設置如下:

  • 動量參數 (\beta_1 = 0.9)
  • 動量參數 (\beta_2 = 0.95)
  • 權重衰減系數 (weight_decay = 0.1)

(2) 采用多步學習率調度策略:

  • 預熱階段:學習率在前2000個warmup steps后線性增加到最大值。
  • 第一階段:在訓練進程的80%時,學習率降低到峰值的31.6%。
  • 第二階段:在訓練進程的90%時,學習率進一步降低到峰值的10.0%。

(3) 最大學習率設置為

(4) 使用400萬個token的批量大小(batch size)。

(5) 上下文長度設置為4000個token(context length)。

四、對齊階段

1. 監督式微調SFT

(1) 數據集

DeepSeek Math構建了一個數學指令微調數據集,涵蓋來自不同數學領域、具有不同復雜程度的中英文數學問題。這些問題與鏈式思維(Chain-of-Thought, CoT)、程序思維(Program-of-Thought, PoT)和工具集成推理格式(Tool-Integrated Reasoning Format)呈現的解決方案一一配對。總共有776,000個訓練樣本。

  • 英語數學數據集:為GSM8K和MATH問題標注了工具集成解決方案,并采用了MathInstruct的一個子集,以及Lila-OOD的訓練集,其中的問題通過思維鏈(CoT)或程序思維(PoT)解決。英文數據集涵蓋了數學的多個領域,如代數、概率、數論、微積分和幾何等。
  • 中國數學數據集:收集了涵蓋76個子主題(如線性方程)的中文 K-12 數學問題,并標注了 CoT 和工具集成推理格式的解決方案。

(2) 微調訓練

基于 DeepSeekMath-Base 進行數學指令調優,得到DeepSeekMath-Instruct 7B。訓練樣本隨機拼接,直到達到4K token的最大上下文長度。對模型進行500個步驟的訓練,批量大小為256,恒定學習率為

2. 強化學習RL

(1) 從PPO到GRPO

近端策略優化(Proximal Policy Optimization,PPO)是一種基于演員-評論家(actor-critic)的強化學習算法,廣泛應用于大語言模型的強化學習微調階段。PPO通過最大化以下替代目標來優化大模型:

其中,

  • 分別是當前策略模型和舊策略模型
  • q和o分別是從問題數據集和舊策略模型中采樣得到的問題和輸出。
  • 參數是PPO中引入的剪切相關超參數,用于穩定訓練。
  • 是優勢值,通過廣義優勢估計(Generalized Advantage Estimation, GAE)計算得出。

在PPO中,獎勵函數  和一個學習的價值函數  起著關鍵作用。因此,價值函數需要與策略模型一同訓練,為了緩解獎勵模型的過優化問題,標準方法是在每個 token 的獎勵中添加來自參考模型的每個 token 的 KL 散度懲罰項,即:

其中,

  •  是獎勵模型。
  • 是參考模型,通常是初始的監督微調(SFT)模型。
  •  是KL懲罰的系數。

由于PPO中使用的價值函數通常是與策略模型規模相當的另一個模型,這帶來了巨大的內存和計算負擔。此外,在強化學習訓練期間,價值函數在優勢值計算中被用作基線以減少方差。然而,在大語言模型的情境中,通常只有最后一個 token 由獎勵模型賦予獎勵分數,這可能會使在每個 token 上都準確的價值函數的訓練變得復雜。

為了解決這些問題,DeepSeekMath提出了群組相對策略優化(Group Relative Policy Optimization,GRPO)。GRPO無需像PPO那樣進行額外的價值函數近似,而是使用針對同一問題生成的多個采樣輸出的平均獎勵作為基線。如下圖所示:

對于每個問題q,GRPO從舊策略中采樣個輸出然后通過最大化以下目標來優化策略模型:

其中,

  • 是超參數。
  • 是基于同一組內輸出的相對獎勵計算的優勢值。

具體步驟如下:

① 初始化策略模型:使用初始策略模型

② 迭代優化:

  • 參考模型更新:將當前策略模型作為參考模型
  • 采樣輸出:對于每個問題,從舊策略模型中采樣個輸出
  • 計算獎勵:使用獎勵模型計算每個采樣輸出的獎勵
  • 計算優勢值:通過組相對優勢估計計算每個 token 的優勢值
  • 更新策略模型:通過最大化 GRPO 目標函數更新策略模型
  • 更新獎勵模型:通過連續訓練使用回放機制更新獎勵模型

GRPO利用組相對的方式計算優勢值,這與獎勵模型的比較性質非常契合,因為獎勵模型通常是在關于同一問題的輸出之間的比較數據集上進行訓練的。

此外,與PPO中使用的KL懲罰項不同,GRPO通過以下無偏估計器估計KL散度:

(2) 采用GRPO的結果監督強化學習

對于每個問題,從舊策略模型中采樣個輸出。然后,使用獎勵模型對這些輸出進行評分,得到 個獎勵

接下來,這些獎勵通過減去組平均值并除以組標準差進行歸一化。歸一化后的獎勵用于設置每個輸出的優勢值,即

最后,通過最大化目標函數來優化策略模型。

(3) 采用GRPO的過程監督強化學習

結果監督(Outcome Supervision)僅在每個輸出的末尾提供獎勵,這在復雜的數學任務中可能不夠充分和高效。過程監督(Process Supervision)在每個推理步驟的末尾提供獎勵。

具體來說,給定問題和從舊策略模型中采樣的個輸出 ,使用過程獎勵模型對每個步驟的輸出進行評分,得到相應的獎勵:

其中,

  • 是第步的結束token索引。
  • 是第個輸出的總步數。

接下來,這些獎勵通過減去組平均值并除以組標準差進行歸一化:

然后,過程監督計算每個 token 的優勢值為后續步驟的歸一化獎勵之和:

最后,通過最大化目標函數來優化策略模型。

(4) 迭代強化學習

在強化學習訓練過程中,舊的獎勵模型可能不足以監督當前的策略模型。因此,DeepSeek Math還探索了迭代強化學習(Iterative RL)與GRPO的結合。

如下算法所示,在迭代 GRPO 中,根據策略模型的采樣結果為獎勵模型生成新的訓練集,并使用一種納入 10% 歷史數據的回放機制持續訓練舊的獎勵模型。然后,將參考模型設置為策略模型,并使用新的獎勵模型持續訓練策略模型。

具體步驟詳解如下:

(1) 初始化策略模型和獎勵模型

(2) 迭代過程:

  • 參考模型更新:將當前策略模型 作為參考模型
  • 采樣輸出:對于每個問題,從舊策略模型 中采樣個輸出
  • 計算獎勵:使用獎勵模型 計算每個采樣輸出  的獎勵 。
  • 歸一化獎勵:對獎勵進行歸一化處理,得到
  • 計算優勢值:計算每個 token 的優勢值 為后續步驟的歸一化獎勵之和。
  • 更新策略模型:通過最大化 GRPO 目標函數更新策略模型 
  • 更新獎勵模型:通過連續訓練使用回放機制更新獎勵模型,并保留10%的歷史數據以確保獎勵模型的穩定性。

五、模型效果

下表評估的是模型未使用工具情況下,通過自身CoT解決數學題的能力。在MATH數學競賽數據集上,DeepSeekMath-RL 7B超過了7B~70B所有開源模型,以及大多數閉源模型(例如Inflection-2和Gemini Pro)13%的絕對值,非常接近GPT-4和Gemini Ultra性能。

其中值得注意的是,DeepSeekMath-RL 7B所有評估指標上都超過了基準模型DeepSeekMath-Instruct 7B,展示了GRPO強化學習訓練的有效性。

參考:https://arxiv.org/abs/2402.03300

責任編輯:趙寧寧 來源: 小喵學AI
相關推薦

2025-02-13 11:00:30

2025-03-06 07:28:31

DeepSeek大模型人工智能

2025-02-17 09:03:26

DeepSeekAI工具人工智能

2025-02-17 09:00:00

DeepSeek人工智能AI

2025-05-08 08:10:25

大模型DeepSeekAPI

2025-02-13 08:30:11

2025-04-03 15:40:41

機器學習大模型DeepSeek

2025-03-19 07:37:54

2025-02-27 09:17:41

DeepSeekPythonAI

2025-02-08 09:30:00

2025-02-27 10:41:53

2025-09-23 18:18:41

DeepSeekAPI

2025-02-20 09:27:46

2025-08-19 21:23:45

DeepSeekAPP接口

2025-02-14 09:00:00

火山引擎大模型DeepSeek

2025-02-17 00:25:00

SpringAIOpenAI

2025-03-05 09:10:00

AI生成模型

2025-05-19 08:41:00

AI模型開發者
點贊
收藏

51CTO技術棧公眾號

亚洲精品国产精品久久清纯直播| 成人教育av在线| 亚洲午夜av久久乱码| 国产成人一二三区| 99精品人妻无码专区在线视频区| 亚洲精品久久| 日韩一区二区三| 男人添女人荫蒂免费视频| 亚洲国产成人精品一区二区三区| 黄色成人精品网站| 亚洲精品久久久久久久久久久| 日本日本19xxxⅹhd乱影响| 艳母动漫在线看| 日韩网站在线| 中文字幕亚洲一区二区三区五十路 | 国产精品日韩精品欧美精品| 亚洲国产精品成人精品| www国产精品内射老熟女| 欧洲成人午夜精品无码区久久| 女同一区二区免费aⅴ| www国产精品av| 亚洲aⅴ日韩av电影在线观看 | 最新中文字幕视频| 韩国一区二区三区视频| 色一情一乱一乱一91av| 成人在线免费高清视频| 国产精品麻豆一区二区三区| 成人av免费观看| 成人妇女免费播放久久久| 九一国产在线观看| 午夜久久福利| 日韩视频精品在线| www.av天天| 欧美美女啪啪| 精品99一区二区| 奇米777在线视频| 91tv亚洲精品香蕉国产一区| 精品成人国产在线观看男人呻吟| 干日本少妇视频| 老司机av在线免费看| 欧美激情一区二区三区四区| 免费在线成人av| 亚洲色图欧美视频| av在线不卡电影| 国产精品初高中精品久久| 国产免费黄色录像| 狠狠色丁香婷婷综合久久片| 国产精品狼人色视频一区| 手机在线看片1024| 亚洲精品1区| 国内外成人免费激情在线视频 | 欧美精品一级| 久久av.com| 色欲人妻综合网| 亚洲国产一区二区三区在线播放| 色妞久久福利网| 一级免费黄色录像| 天天久久综合| 欧美成人免费va影院高清| 欧美性x x x| 综合天堂久久久久久久| 久久亚洲精品中文字幕冲田杏梨| 91激情视频在线观看| 精品视频黄色| 色天天综合狠狠色| 成人免费视频国产免费观看| 亚洲精品99| 欧美丰满少妇xxxxx| 久久久久噜噜噜亚洲熟女综合| 欧美日本国产| 国内久久久精品| 日韩精品久久久久久免费| 日韩一区欧美二区| 国产欧美日韩丝袜精品一区| 国产理论视频在线观看| 国产一区激情在线| 国产精品污www一区二区三区| 全国男人的天堂网| 国产亚洲一区二区三区在线观看 | 黄色大片在线免费观看| 欧美激情一二三区| 2021狠狠干| h片在线观看| 色综合网站在线| 日本黄大片一区二区三区| 国产高清精品二区| 亚洲第一福利视频| 无码少妇精品一区二区免费动态| 免费精品国产| 久久久久999| 日本一区二区欧美| 日韩国产在线观看| 69堂成人精品视频免费| 少妇av在线播放| 中文字幕久久午夜不卡| 亚洲色婷婷久久精品av蜜桃| zzzwww在线看片免费| 色噜噜久久综合| 亚洲男人天堂2021| 神马香蕉久久| 久久夜精品va视频免费观看| 日韩成人一区二区三区| 麻豆一区二区三| 国产精品美女xx| av中文在线| 亚洲成人动漫一区| 天天综合天天添夜夜添狠狠添| 成人自拍在线| 日韩中文字幕网址| 亚洲另类欧美日韩| 国产精选一区二区三区| 日本在线观看一区二区三区| 欧美1234区| 在线不卡一区二区| 三级网站在线免费观看| 最新国产精品| 国产精品视频1区| 少妇激情av一区二区| 亚洲伦在线观看| 日本一二区免费| 精品在线播放| 国内外成人免费激情在线视频网站 | 欧美中文在线| 午夜精品久久久久久久99水蜜桃| 涩多多在线观看| 综合国产视频| 久久久久久久久久婷婷| 国产精品视频a| 亚洲国产高清不卡| 丰满人妻中伦妇伦精品app| 777久久精品| 欧美大成色www永久网站婷| 进去里视频在线观看| 久久久一区二区| 北条麻妃在线视频观看| 豆花视频一区二区| 九九热在线精品视频| 国产精品羞羞答答在线| 国产精品成人免费精品自在线观看 | 成人在线视频亚洲| 欧美日韩国产一区二区三区地区| 免费黄色在线视频| 亚洲综合激情| 久久资源亚洲| 欧美xxx网站| 亚洲欧美国产制服动漫| 欧美特黄aaaaaa| 久久日韩粉嫩一区二区三区| 日韩在线视频在线观看| 天堂综合网久久| 欧美有码在线观看| 日韩三级电影网| 色偷偷久久人人79超碰人人澡| 激情综合丁香五月| 午夜在线精品| 欧美一区亚洲二区| 青青热久免费精品视频在线18| 亚洲欧美日韩中文在线制服| 国产一级淫片a视频免费观看| 久久美女艺术照精彩视频福利播放| 欧美 国产 日本| 亚洲电影一级片| 国产精品r级在线| 91亚洲欧美| 日韩一区二区精品葵司在线| 久久久一区二区三区四区| 成人av先锋影音| 老熟妇仑乱视频一区二区| 欧美日韩国产在线观看网站 | 91在线精品一区二区三区| 国产高清av在线播放| 清纯唯美亚洲经典中文字幕| 日本午夜人人精品| 男人的天堂在线视频免费观看 | 亚洲日本久久久| 亚洲欧美大片| 亚洲一区二区三区精品动漫| 国产精品美女久久久久人| 欧美极品第一页| 黄色免费在线播放| 91精品国产91热久久久做人人| 国产一二三四在线| 国产亚洲精品7777| 一级日本黄色片| 午夜亚洲影视| 中文一区一区三区免费| 国产一区二区三区不卡av| 国产成人精品免费久久久久| 国产黄色在线观看| 亚洲精品久久久一区二区三区 | 免费麻豆国产一区二区三区四区| 国产麻豆日韩欧美久久| 黄色一级视频片| 97偷自拍亚洲综合二区| 国产精品自拍首页| yiren22亚洲综合| 午夜精品久久久久久久99黑人 | 2025国产精品视频| 中文字幕日本在线观看| 亚洲成人xxx| 亚洲视频在线观看免费视频| 亚州成人在线电影| 91麻豆精品国产91久久综合| 国产高清久久久久| 欧美日韩大尺度| 伊人久久大香线蕉综合热线| 亚洲精品视频一二三| 日韩极品在线| 91久久国产综合久久蜜月精品| 三上悠亚国产精品一区二区三区| 欧美日韩成人精品| 成人高清在线| 日韩激情av在线播放| 成人av手机在线| 欧美日韩一区 二区 三区 久久精品| 欧美一二三区视频| 亚洲欧美激情视频在线观看一区二区三区 | 亚洲精品a区| 91免费在线视频网站| 亚洲综合av一区二区三区| 97免费中文视频在线观看| www.在线视频| 久久精品国产精品亚洲| av在线女优影院| 亚洲欧美在线磁力| 日韩一区二区三区不卡| 日韩欧美一区中文| 国产毛片在线视频| 欧美少妇一区二区| 青青视频在线免费观看| 福利微拍一区二区| 日本少妇裸体做爰| 夜夜揉揉日日人人青青一国产精品 | 日本熟妇人妻中出| 久久人人超碰| 免费在线观看毛片网站| 欧美亚洲在线| 人妻熟女一二三区夜夜爱| 亚洲免费高清| 欧美成人三级在线视频| 影音先锋久久久| 欧美久久在线观看| 亚洲国产免费| 国产毛片视频网站| 国产视频亚洲| 欧美日韩在线视频一区二区三区| 一区二区三区精品视频在线观看| 99在线精品免费视频| 亚洲精品综合| 国产精品无码一区二区在线| 在线视频精品| 欧美污视频网站| 日韩专区一卡二卡| 污污的网站18| 极品美女销魂一区二区三区| 999久久久精品视频| 国产在线精品不卡| 北条麻妃亚洲一区| 丁香六月综合激情| 一起草在线视频| 久久久精品国产99久久精品芒果| 69视频在线观看免费| 国产精品久久久99| 玖玖爱这里只有精品| 亚洲一区二区在线观看视频| 五月婷婷开心网| 欧美亚洲图片小说| 国产精品九九九九| 日韩欧美一区二区在线视频| 天天操天天射天天舔| 日韩高清免费在线| 3p在线观看| 欧美理论电影在线播放| 91超碰在线播放| 国产极品jizzhd欧美| 国产亚洲高清一区| 精品一区二区三区日本| 国产成人调教视频在线观看 | 大片免费在线看视频| 久久99视频精品| 小草在线视频免费播放| 国产精自产拍久久久久久| 亚洲午夜免费| 欧美日韩亚洲综合一区二区三区激情在线| 欧美在线电影| 男人添女人下部视频免费| 久久福利毛片| 青青草精品在线| 久久综合资源网| 一级黄色片日本| 欧美性xxxx极品hd欧美风情| 91在线精品入口| 日韩av网站大全| 看女生喷水的网站在线观看| 69久久夜色精品国产69| 日韩国产大片| 久久99精品久久久久久久青青日本| 99热在线成人| 97成人在线观看视频| 国产精品一区二区在线观看不卡 | 国产福利精品一区二区三区| 99久久99精品久久久久久 | 亚洲va韩国va欧美va| 亚洲一级片免费看| 日韩电影第一页| 97超碰在线公开在线看免费| 国产精品91久久久| 大型av综合网站| 糖心vlog在线免费观看| 日韩精品亚洲一区| 国产精品手机在线观看| 亚洲色图视频免费播放| 国产一卡二卡三卡| 亚洲黄在线观看| 自拍亚洲图区| 国产男人精品视频| 精品高清在线| 亚洲成熟丰满熟妇高潮xxxxx| 丁香激情综合国产| 成人免费精品动漫网站| 欧美性大战xxxxx久久久| 无码精品在线观看| 欧美激情综合色综合啪啪五月| 国产成人免费av一区二区午夜| 先锋影音网一区| 久久久蜜桃一区二区人| 在线观看国产免费视频| 亚洲综合一区二区| av加勒比在线| 久久久久99精品久久久久| 久久er热在这里只有精品66| 日韩区国产区| 日一区二区三区| 亚洲最大成人综合网| 色94色欧美sute亚洲线路二| 欧美一区二区少妇| 欧美夜福利tv在线| 日本在线中文字幕一区| 欧美,日韩,国产在线| av影院午夜一区| 国产午夜性春猛交ⅹxxx| 日韩成人在线观看| 国产网站在线| 蜜桃免费一区二区三区| 乱码第一页成人| 受虐m奴xxx在线观看| 色噜噜狠狠色综合中国| 国产成人天天5g影院在线观看| 国产精品久久久久久av| 精品成av人一区二区三区| 亚洲福利精品视频| 亚洲国产成人一区二区三区| 一级黄色片视频| 久久网福利资源网站| 国产精品一级在线观看| 国产欧美123| 成人免费毛片片v| 五月天综合激情网| 亚洲欧美三级伦理| 精品176极品一区| 黄色影视在线观看| 国产成人免费在线| 日韩少妇裸体做爰视频| 亚洲另类图片色| 黄色成人小视频| 日本一道在线观看| 成人h精品动漫一区二区三区| 亚洲熟女综合色一区二区三区| 亚洲欧洲在线视频| av久久网站| 屁屁影院ccyy国产第一页| 91蜜桃传媒精品久久久一区二区| 无码免费一区二区三区| 日韩中文字幕国产精品| 一区二区三区国产好| 日韩人妻精品无码一区二区三区| 欧美国产1区2区| www久久久久久| 国产成人激情视频| 中文在线日韩| 黄色正能量网站| 91 com成人网| 天堂在线中文网官网| 这里只有精品66| 91视视频在线观看入口直接观看www | 国产91av视频在线观看| 高清不卡一区二区| 中文字幕69页| 欧美国产日韩精品| 精品久久影视| a级片在线观看视频| 欧美在线免费播放| 日本片在线观看| 午夜精品亚洲一区二区三区嫩草| 国产jizzjizz一区二区| 久久久久久在线观看| 欧美精品激情在线| 欧美3p在线观看| 无码人妻精品一区二区三区温州| 欧美精品aⅴ在线视频|