精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek同款GRPO訓練大提速!魔搭開源全流程方案,支持多模態(tài)訓練、訓練加速和評測全鏈路

人工智能 新聞
GRPO訓練是來自于PPO算法的一種改進,旨在利用采樣原理對value model進行簡化,以增大訓練的穩(wěn)定性和可維護性。

GRPO訓練又有新的工具鏈可以用,這次來自于ModelScope魔搭社區(qū)。

隨著DeepSeek-R1的成功出圈,其使用的GRPO算法受到了業(yè)界的廣泛關(guān)注。GRPO訓練是來自于PPO算法的一種改進,旨在利用采樣原理對value model進行簡化,以增大訓練的穩(wěn)定性和可維護性。

目前圍繞R1模型的技術(shù)方案,社區(qū)也已經(jīng)有一些開源實現(xiàn),比如來自Hugging Face的Open-R1,以及其他一些RL框架,包括veRL,OpenRLHF等等。然而,在GRPO訓練方面,大部分方案仍然面臨著諸多挑戰(zhàn),包括訓練速度較低、集群配置復(fù)雜,以及對多模態(tài)擴展能力差、訓練后不好評測等等。

為了支持開源社區(qū)在GRPO這個方向上的探索,ModelScope魔搭社區(qū)圍繞MS-SWIFT訓練框架以及EvalScope評估框架,推出了相對完整高效的GRPO全鏈路解決方案,和社區(qū)分享。

GRPO訓練提速

GRPO訓練的耗時主要來自于采樣、訓練等幾個方面。其中,采樣本身是PPO算法的重要組成部分。尤其是GRPO在PPO的基礎(chǔ)上,使用采樣代替value model的方案,這使得在GRPO訓練中,采樣的耗時的占比,更是大大的增加了。而且GRPO中單query的采樣數(shù)(即group size),一般比較大(DeepSeekMath論文中為64個),高采樣頻率對于推理引擎的挑戰(zhàn)是巨大的。優(yōu)化采樣效率是提升GRPO整體訓練速度的核心所在。

基于這些特點,魔搭社區(qū)的SWIFT框架進行了有針對性的優(yōu)化:

多實例數(shù)據(jù)并行采樣

對于GRPO算法,單實例采樣往往無法滿足需求。團隊觀察發(fā)現(xiàn),7B模型在訓練期間,單iter的采樣時間占比約為70%,這意味著應(yīng)該允許訓練資源根據(jù)實際情況,針對性的傾斜分配給采樣計算

尤其在采樣量以及batch_size較大時,采樣耗時對訓練速度影響會更為顯著。因此,在SWIFT中對vLLM和LMDeploy進行了一定的patch(同時也與相關(guān)框架負責同學進行了討論,將會將相關(guān)實現(xiàn)在vLLM/LMDeploy上原生支持),支持在任意比例的訓練卡上拉起采樣實例。例如對于8卡訓練中,配置4張卡負責模型訓練,4張卡負責采樣;或者6張卡負責訓練,2張卡負責采樣。

下圖展示了在同樣的8卡訓練設(shè)置下,分別使用1卡/2卡部署推理引擎進行采樣,剩余卡負責訓練,vLLM/LMDeploy的采樣耗時和訓練耗時如下:

圖片
圖片

可以看到,基于LMDeploy分配2卡進行采樣時,訓練時長約為1卡采樣的87%。而vLLM2卡采樣時,時長為1卡采樣的78%。在這兩個例子中,通過更合理多卡數(shù)分配,對采樣資源進行一定傾斜,都達到了有效降低訓練所需時長都目的。

異步采樣

GRPO訓練中,采樣和模型訓練需要交替進行,即訓練時采樣卡閑置,采樣時訓練卡閑置。對于這個問題,不同的框架給出了不同的解決方案。

例如veRL允許將采樣和訓練部署在同一GPU上,在不同階段讓不同的權(quán)重offload到CPU中;或者針對LLM的不同Layer、不同Tensor進行異構(gòu)式切分,在加載權(quán)重時不必all_gather(而是部分weights進行g(shù)ather并同步),使訓練模型和采樣模型的效率達到最高。然而在中小模型的體量上,這樣的切分未必是最優(yōu)的。

因為隨著模型尺寸和batch_size增大,采樣、訓練的耗時占比會有本質(zhì)差別。對此SWIFT采用了不一樣的技術(shù)路線,即異步采樣(replay buffer),其原理是在訓練時同時進行采樣,采樣結(jié)果用于下一iter的模型訓練。由于采樣使用的是old policy model,因此訓練過程需要額外增加對于logits差異的CLIP。由于old policy model和policy model僅相差一個iter,因此其訓練穩(wěn)定性幾乎沒有下降。二者唯一需要等待(或者stop the world)的過程是權(quán)重加載。

圖片

同樣訓練設(shè)置下的實驗測試表明,在單卡部署LMDeploy的情況下,異步采樣的訓練時間約為同步采樣的2/3。

模型placement

SWIFT除了支持上述訓練和rollout使用兩個資源組進行異步訓采流程之外,也支持二者共用同一資源組。即,在actor模型訓練時,vLLM將開啟sleep模式以減少顯存占用。

這兩種模式的架構(gòu)圖如下:

圖片

并且,SWIFT也支持vLLM的tensor_parallel(MP)模式。

LMDeploy推理框架支持

LMDeploy是來自于上海浦江實驗室的優(yōu)秀推理加速框架。該框架不僅支持了純文本和多模態(tài)模型的推理加速,并且自研了基于FasterTransformer實現(xiàn)的Turbomind推理加速引擎。在推理速度上,LMDeploy相較vLLM在一眾模型上速度有顯著的提升。對Qwen2.5-7B-Instruct模型進行實驗測試,具體配置如下:使用AI-MO/NuminaMath-TIR數(shù)據(jù)集,批量大小設(shè)置為7,每條query采樣24條結(jié)果,訓練50個steps。以下是vLLM框架和LMDeploy框架在相同條件下的推理時長對比。

圖片
圖片

可以看到使用LMDeploy作為采樣的推理引擎,在整體的訓練速度上從44分/50steps加速到37分/50steps,加速比大約為16%。

注:最后50steps的訓練耗時包括了保存模型權(quán)重,測試集評測

SWIFT框架在TRL框架以及vLLM采樣的基礎(chǔ)上,額外引入了LMDeploy采樣的支持。得益于其推理速度和權(quán)重加載速度,可以做到整體采樣耗時只有基礎(chǔ)實現(xiàn)的70%。

多輪更新

多輪更新的核心思想是:讓一次采樣得到的數(shù)據(jù)可以被多次使用。通過這種方式,可以減少采樣的頻率,從而讓采樣和訓練的資源分配更加均衡。

通過設(shè)置參數(shù)num_iterations, 可設(shè)置每輪采樣數(shù)據(jù)的迭代更新輪數(shù),增大該參數(shù)值可以多次利用采樣數(shù)據(jù),緩解采樣過程對訓練的速度影響,從而提高訓練速度。在該值設(shè)置不太大(例如小于等于4)的情況下,基本不會對模型訓練效果有不良影響。這里的更新輪次對應(yīng)論文中的mu值。

多輪更新是TRL庫提供的機制,發(fā)現(xiàn)該機制和團隊提供的其他機制結(jié)合起來有更好的加速效果。

基于1卡部署LMDeploy的設(shè)置下,對比num_iterations從1-4的訓練時間,下面給出了完整的實驗結(jié)果:

圖片

可以看到,在設(shè)置多輪更新輪次為4時(mu=4),整體訓練耗時約為單輪更新的一半。

綜合測試

針對八卡環(huán)境的SWIFT、veRL和trl框架的訓練效率進行了對比。在實驗設(shè)置中整合了前文提到的多種訓練加速技術(shù),并選用LMDeploy作為推理引擎。

具體配置上,采用雙卡進行推理采樣,結(jié)合異步采樣策略,并將多輪更新輪次設(shè)定為4輪。同時,為了更好模擬真實訓練場景,將batch_size調(diào)整為48(每輪6個query,梯度累計步數(shù)為 8),group size設(shè)置為24,基于Qwen2.5-7B-Instruct模型和AI-MO/NuminaMath-TIR數(shù)據(jù)集(1),對多框架的GRPO訓練速度進行了對比評測。

SWIFT:
圖片
veRL:
圖片
trl(mu=4):
圖片
trl(mu=1)
圖片

實驗結(jié)果表明,SWIFT框架的訓練耗時約為120秒/步,而veRL框架訓練耗時約為280秒/步,TRL框架在采用多步更新下約為144秒/步,而不采用多步更新則約為320秒/步。通過整合多種訓練加速技術(shù),SWIFT框架在GRPO的中小集群訓練效率上實現(xiàn)了顯著提升。下圖展示了SWIFT框架下的訓練獎勵走勢,可以看出模型成功實現(xiàn)了獎勵值的提升。

圖片

多模態(tài)GRPO訓練

多模態(tài)GRPO訓練目前已經(jīng)有一些開源解決方案,例如R1-V,open-r1-multimodal等,都是基于Open-R1進行了簡單的擴展。

SWIFT框架目前已經(jīng)支持多模態(tài)模型(圖文、視頻、音頻)的GRPO訓練,只要在數(shù)據(jù)集中給定’images’/‘videos’/‘a(chǎn)udios’字段,GRPO會將多模態(tài)內(nèi)容輸入多模態(tài)模型中進行強化訓練。SWIFT目前在微調(diào)中支持的多模態(tài)模型近兩百個,這些模型均天然支持GRPO訓練。參考R1-V的任務(wù)設(shè)置,在多模態(tài)計數(shù)任務(wù)上進行了訓練,訓練數(shù)據(jù)集為CLEVR-70k-Counting(2)。訓練選取的獎勵函數(shù)一共有兩個,一個是 Deepseek-R1 中提到的格式獎勵函數(shù),用于評估模型輸出格式的準確性;另一是自定義的準確性獎勵函數(shù),用于計算模型輸出的計數(shù)是否與真值一致,目前兩個獎勵函數(shù)都已經(jīng)定義在SWIFT框架中,通過—reward_funcs external_r1v_acc format參數(shù)指定。
選取Qwen2.5-VL-3B-Instruct 作為基礎(chǔ)模型進行訓練,選取 instruct 而不是base模型的主要原因是可以更快地獲取 format reward。整體實驗在8卡 GPU 上完成。當前SWIFT GRPO訓練已支持多卡部署模型以加速rollout,因此設(shè)置num_infer_workers為2,進程數(shù)為6:即2卡vLLM部署采樣,6卡模型訓練。設(shè)置模型的最大輸出為1024,學習率設(shè)置為1e-6,其他參數(shù)設(shè)置詳見最佳實踐(3)。

實驗結(jié)果如下圖所示:
圖片

模型訓練了500個epoch已經(jīng)基本收斂,準確性獎勵(圖中為ClevrCountORM)和格式獎勵(圖中為Format)在不斷增加,證明模型學習到了如何完成這一任務(wù),最終任務(wù)成功率從初始的0.4攀升到1左右;在大概300step左右,reward_std已經(jīng)將到0.1左右,證明模型已經(jīng)基本收斂;completion length最終穩(wěn)定在60-80,模型學習到的任務(wù)推理范式是逐個列舉圖中的物體。
訓練后的模型輸出樣例如下:

user:
How many items are there in the image?
assistant:
<think> Counting the number of items in the image:\n1. Green matte sphere\n2. Large metallic yellow sphere\n3. Small metallic brown cube\n\nThere are three distinct objects in total.\n</think>\n<answer>3</answer>

Reasoning模型評測

EvalScope框架是魔搭社區(qū)上開源的大模型評測工具(4),提供了完整的大模型全面評測框架。

不僅提供O1/R1等推理類模型的推理性能的評測能力,還支持評測結(jié)果的可視化,如下圖所示。

同時,團隊將MATH-500、GPQA-Diamond和AIME-2024三個數(shù)據(jù)集整合為一個數(shù)據(jù)集合,放置于modelscope/R1-Distill-Math-Test數(shù)據(jù)集(5)中,用戶可以直接使用該數(shù)據(jù)集的ID進行評測操作,具體使用流程參考:模型推理能力評測最佳實踐(6)。

圖片
圖片

除此之外,針對Reasoning模型在推理過程中存在Underthinking(思考不足,指模型在推理時頻繁思路跳轉(zhuǎn),無法專注于正確的思路,導致錯誤答案)和Overthinking(過度思考,指模型簡單問題上生成過長思維鏈,浪費計算資源)的問題。

該框架實現(xiàn)了模型思考效率評測能力,可以評估如DeepSeek-R1-Distill-Qwen-7B(7)等推理模型的思考效率,如下圖所示,從token效率、思考長度、子思維鏈數(shù)量和準確率四個方面進行衡量,可以用來評測并優(yōu)化模型在短輸出中獲取正確答案的能力,具體使用流程參考教程:模型思考效率評測最佳實踐(8)。

圖片

效果

從簡單的數(shù)學任務(wù)Countdown Game出發(fā),對SWIFT框架的GRPO有效性進行驗證,并給出了完整的實驗流程(9)。

Coundown Game 的任務(wù)目標是根據(jù)給定的幾個數(shù)字和加減乘除四種運算,得到目標數(shù)字,給出運算公式,因此在模型的輸入中給定了任務(wù)描述、已有數(shù)字和目標數(shù)字。訓練選取的獎勵函數(shù)一共有兩個,一個是標準的格式獎勵函數(shù),用于評估模型輸出格式的準確性;另一是自定義的準確性獎勵函數(shù),用于評估模型輸出運算公式是否能得到目標值,目前兩個獎勵函數(shù)都已經(jīng)定義在SWIFT框架中,通過—reward_funcs external_countdown format參數(shù)指定。

選取Qwen2.5-3B-Instruct模型進行全參數(shù)GRPO訓練,具體參數(shù)設(shè)置詳見實驗流程。發(fā)現(xiàn)GRPO的訓練過程是比較不穩(wěn)定的,一個比較大的學習率和beta(KL散度的權(quán)重)雖然會是模型更快收斂,但往往出現(xiàn)梯度過大而訓練崩潰的情況。最終選取學習率為7e-5,beta為0.001。
實驗結(jié)果如下圖所示:

圖片

一共訓練了2000個step,各項曲線證明了SWIFT GRPO的有效性,從實驗結(jié)果中也能看到模型的收斂過程。

準確性獎勵(CoundownORM)和格式獎勵(Format)的穩(wěn)步上升證明模型逐步學習到了如何更好地完成這一任務(wù),同時reward_std最終處在0.2-0.3左右也證明了模型仍有繼續(xù)上升的空間。

從completion_length的變化上能明確地看到模型思考方式的轉(zhuǎn)變。從初始的500左右降到200,然后又增長到300-400 tokens,能明確看到各個階段模型的思考方式。初始時,模型會直接從結(jié)果出發(fā),反推需要的數(shù)字;然后,模型逐漸精簡了反推過程,顯著縮減了輸出場地;最后,模型發(fā)現(xiàn)完成任務(wù)最好的方式是列舉已有數(shù)字和運算的組合,并逐步運算,輸出范式基本收斂。最終的輸出樣例如下:

user:
"Using the numbers [71, 92, 80], create an equation that equals 59. You can use basic arithmetic operations (+, -, *, /) and each number can only be used once. Show your work in <think> </think> tags. And return the final equation and answer in <answer> </answer> tags, for example <answer> (1 + 2) / 3 = 1 </answer>."

assistant:
"<think>\nWe need to form an expression using the numbers 71, 92, and 80 which results in 59. Let's try some combinations:\n(92 - 80) + 71 = 83 + 71 = 154 (too high)\n(92 - 71) + 80 = 21 + 80 = 101 (too high)\n(92 - 80) + 71 = 12 + 71 = 83 (too high)\n(92 - 71) + 80 = 21 + 80 = 101 (too high)\n(92 + 80) - 71 = 172 - 71 = 101 (too high)\n(92 + 71) - 80 = 163 - 80 = 83 (too high)\n(80 + 71) - 92 = 151 - 92 = 59\n\nSo our solution is: (80 + 71) - 92 = 59</think>\n\n<answer>(80 + 71) - 92 = 59</answer>"

寫在最后

SWIFT正在添加vLLM的MP模式以適配更大體量模型的訓練,并希望在已有的優(yōu)秀框架的技術(shù)沉淀上以差異化技術(shù)的方式為開發(fā)者提供簡單快速的中、小集群RL訓練方案,給開發(fā)者提供新的技術(shù)選型。目前SWIFT已經(jīng)支持的訓練領(lǐng)域有數(shù)學、ReACT結(jié)構(gòu)的Agent、多模態(tài)VQA等,代碼領(lǐng)域的支持也在陸續(xù)更新中。對于Megatron結(jié)構(gòu)的模型SWIFT在支持中,不僅僅是GRPO訓練,SFT和PreTrain也將得到相應(yīng)支持。

評測領(lǐng)域,EvalScope后續(xù)會針對Reasoning models進一步探索模型的“思考效率”問題;另外,從目前的趨勢看,多模態(tài)Reasoning的范式也逐漸引起重視,團隊也會在該領(lǐng)域積極探索最新的評測基準、指標和方法。

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-08-10 15:05:02

機器學習人工智能計算機

2023-05-04 15:53:34

強化學習開發(fā)

2024-12-12 00:25:09

2025-04-07 00:00:00

多模態(tài)大模型

2025-03-24 10:00:00

2025-03-19 09:20:00

2024-11-04 13:30:00

模型AI

2023-07-18 15:05:00

開源大模型

2025-08-04 08:49:00

2009-12-21 09:13:09

Ubuntu啟動速度

2023-09-12 13:43:00

智能技術(shù)

2009-09-23 18:14:48

2020-07-13 14:30:35

人工智能機器學習技術(shù)

2023-01-05 09:33:37

視覺模型訓練

2025-04-07 02:25:00

DeepSeek模型訓練GRPO

2024-12-16 13:34:35

2024-06-17 00:00:00

MiCo模態(tài)人腦

2025-08-24 09:24:07

2021-07-22 15:25:14

開源技術(shù) 框架
點贊
收藏

51CTO技術(shù)棧公眾號

欧美高清视频| 久久精品国产亚洲AV无码男同| 日韩精品一区二区三区国语自制| 黄色av一区二区| 妖精视频一区二区三区免费观看| 色综合久久天天| 青青草原亚洲| 在线黄色av网站| 婷婷综合久久| 欧美一区二区国产| 国产在线播放观看| 国产黄色片在线观看| 伊人成人在线视频| 亚洲日韩第一页| 精品亚洲一区二区三区四区| 国产日产一区二区| 国产成人精品免费看| 欧美亚洲午夜视频在线观看| 亚洲第一综合网| 在线观看中文字幕2021| 久久社区一区| 欧美一卡2卡3卡4卡| 久久国产午夜精品理论片最新版本| 无码国精品一区二区免费蜜桃| 香蕉亚洲视频| 久久久999精品免费| 午夜免费福利影院| 欧美123区| 亚洲国产日韩综合久久精品| 国产精品永久入口久久久| 无码人妻久久一区二区三区| 婷婷综合伊人| 日韩精品视频免费| 久久6免费视频| 高潮在线视频| 最新日韩在线视频| 欧美日韩精品综合| 在线观看免费黄色小视频| 欧美日一区二区三区在线观看国产免| 亚洲第一黄色网| 中文久久久久久| 91吃瓜在线观看| 人妻一区二区三区四区| 欧美黄色一级视频| 亚洲色图第三页| 中文在线字幕观看| 日本成人一区二区| 色视频一区二区| 国产一二三区在线播放| 69视频在线| 91网页版在线| 成人黄色免费网站在线观看| 黄色av一级片| 91久久综合| 久久99热精品| 久久久久人妻一区精品色| 秋霞蜜臀av久久电影网免费| 日韩午夜av一区| 毛片毛片毛片毛| 亚洲一区二区三区四区| 五月天一区二区| 国产欧美123| 欧美性天天影视| 中文字幕国产一区二区| 欧洲久久久久久| 亚洲色偷精品一区二区三区| 高清国产一区二区三区| 亚洲在线第一页| 97人妻精品一区二区三区软件 | 成人免费在线网址| 久久久久在线视频| 免费日韩av片| 欧美亚洲国产日本| 国产精品a成v人在线播放| 综合久久精品| 欧美精品一区二区三区国产精品 | 亚洲日本护士毛茸茸| 一区二区免费电影| 日本在线观看免费| 中文字幕日韩欧美一区二区三区| 欧美成aaa人片在线观看蜜臀| 久热国产精品视频一区二区三区 | 欧美一二三区精品| 国产探花在线看| 日韩久久99| 69av一区二区三区| 97人人模人人爽人人澡| 99视频有精品高清视频| 欧美一卡二卡三卡| 国产污在线观看| 欧美大胆a级| 亚洲人在线视频| 欧美色图17p| 亚洲精品中文字幕乱码| 欧美激情xxxx性bbbb| 国产真实夫妇交换视频| 中文一区在线| 国产精品88a∨| 国产情侣自拍小视频| 国产精品夜夜嗨| 久久国产精品-国产精品| 久青青在线观看视频国产| 欧美国产成人精品| 欧美另类videos| 1234区中文字幕在线观看| 欧美日韩亚洲高清| 在线观看亚洲色图| 日本精品一区二区三区在线观看视频| 精品久久久久一区二区国产| 大尺度在线观看| 蜜桃精品wwwmitaows| 亚洲香蕉伊综合在人在线视看| 能直接看的av| 国产精品a级| 国产99久久精品一区二区永久免费| 中文字幕丰满人伦在线| 国产精品18久久久久久久久 | 夜夜爽99久久国产综合精品女不卡| √新版天堂资源在线资源| 亚洲激情欧美激情| av无码久久久久久不卡网站| 欧美成人免费电影| 欧美一区二区日韩一区二区| 欧美日韩爱爱视频| 久久久久亚洲AV成人| 亚洲综合激情| 91丨九色丨国产| 国产在线观看精品一区| 亚洲女女做受ⅹxx高潮| 亚洲美免无码中文字幕在线| 四虎精品永久免费| 日韩精品视频在线观看网址| 亚洲欧洲综合网| 99国产精品私拍| 国产精品久久久亚洲| 黄色片一区二区| 国产精品久久久久影院色老大| 国产欧美日韩小视频| 国产91亚洲精品久久久| 亚洲国产天堂久久综合网| 国产探花在线视频| 久久久亚洲人| 国产高清精品一区二区| 在线免费观看的av网站| 午夜在线电影亚洲一区| 在线观看av网页| 国产综合久久久| 青青青国产精品一区二区| 亚洲欧美日本在线观看| 欧美日韩精品在线播放| aaaa黄色片| 日韩视频在线一区二区三区 | 亚洲男人都懂的| 日韩成人av免费| 久久精品青草| 99精品在线直播| 日韩123区| 亚洲精品在线观| 亚洲国产精品成人无久久精品| 岛国精品在线播放| r级无码视频在线观看| 福利电影一区| 欧美洲成人男女午夜视频| 青青久在线视频| 在线观看视频91| 国产福利在线导航| 国产精品一区专区| 成人黄色大片网站| 亚洲春色h网| 日本麻豆一区二区三区视频| 国产精品视频免费一区二区三区| av资源中文在线| 亚洲欧美一区二区三区情侣bbw| 韩国av中文字幕| 国产视频911| 91丨九色丨蝌蚪| 欧美视频不卡| 久久久久成人精品免费播放动漫| 成人短视频app| 色偷偷av亚洲男人的天堂| 国产不卡精品视频| 狠狠色狠狠色综合日日小说| 精品人妻无码一区二区三区换脸| 捆绑调教美女网站视频一区| 777久久精品一区二区三区无码| 麻豆一区二区| 国产成人久久久| 在线午夜影院| 亚洲欧美国产日韩天堂区| 伊人久久成人网| 亚洲最快最全在线视频| 成年人在线观看av| 激情综合网天天干| aa在线免费观看| 88国产精品视频一区二区三区| 国产精品久久久对白| 999国产精品亚洲77777| 久久91精品国产91久久久| 视频福利在线| 日韩一级成人av| 精品视频一二三区| 亚洲综合成人网| 日韩视频在线观看免费视频| 高清av一区二区| 精品www久久久久奶水| 在线国产一区二区| 日韩电影免费观看在| 超碰精品在线观看| 国产一区二中文字幕在线看| 免费h在线看| 欧美成人激情视频免费观看| 国产日产精品久久久久久婷婷| 日韩一级片网站| 亚洲午夜激情视频| 欧美视频裸体精品| 免费在线一级片| 一区在线播放视频| 免费黄色片网站| 99视频一区二区三区| 伊人国产精品视频| 另类人妖一区二区av| 91成人福利在线| 成人免费毛片东京热| 91免费在线播放| 久久久精品人妻一区二区三区| 日韩和欧美一区二区三区| 妺妺窝人体色777777| 国产精品88久久久久久| 日韩欧美精品在线不卡 | 日韩午夜在线观看| www.久久视频| 欧美性20hd另类| 亚洲欧美在线视频免费| 亚洲一二三区不卡| 2021亚洲天堂| 亚洲精品美国一| 91高清免费观看| 一色桃子久久精品亚洲| 日本免费网站视频| 国产精品全国免费观看高清| 日韩免费成人av| 欧美激情一区三区| 丁香六月激情综合| 亚洲国产精品精华液ab| 亚洲精品成人av久久| 国产丝袜美腿一区二区三区| 亚洲午夜久久久久久久久红桃| 久久综合一区二区| 自拍偷拍中文字幕| 国产亚洲精品资源在线26u| 精品人妻无码一区二区三区| 久久你懂得1024| 国产免费看av| 国产女同性恋一区二区| 色婷婷国产精品免| 综合在线观看色| 欧美成人片在线观看| 亚洲午夜久久久| 日本在线小视频| 婷婷综合久久一区二区三区| 午夜婷婷在线观看| 欧美中文字幕一区二区三区亚洲| 中文字幕在线一| 9191久久久久久久久久久| 99热这里只有精品在线| 欧美xxxx老人做受| 色网站免费观看| 日韩精品在线视频| eeuss影院在线观看| 中文字幕欧美日韩va免费视频| yiren22综合网成人| www.亚洲成人| 在线h片观看| 97精品国产91久久久久久| 97成人资源| 国产精品久久久久久久午夜| 国产精品日韩精品在线播放| 国产欧美日韩一区| 国产传媒欧美日韩成人精品大片| 亚洲综合网中心| 亚洲天堂偷拍| 激情综合网俺也去| 国产精品69毛片高清亚洲| 亚洲av无码国产精品久久| 中文字幕一区二区三区在线播放| 久久久久成人网站| 色综合久久久久综合体桃花网| 97人妻精品一区二区三区动漫| 亚洲精品一区二区三区福利| av在线资源站| 久久久久免费精品国产| 亚洲精品在线影院| 99re在线观看| 精品午夜久久| a级黄色小视频| 蜜臀av性久久久久蜜臀aⅴ四虎 | 中文字幕 国产精品| 欧美一区二区高清| 黄色免费在线播放| 欧美大成色www永久网站婷| 亚洲欧美电影| 亚洲综合国产精品| 精品免费视频| 青草青青在线视频| 精品一区二区综合| 91成年人网站| 亚洲国产一区视频| 亚洲在线视频播放| 日韩理论片久久| 欧美xxxx免费虐| 国产精品亚洲网站| 西野翔中文久久精品国产| 99re8这里只有精品| 日韩二区三区四区| av网站有哪些| 亚洲国产日韩av| 国产精品久久久久久久久毛片 | 日韩三区免费| 国内视频一区| 国产精品xvideos88| 欧美日韩在线观看不卡| 久久老女人爱爱| 日韩精品人妻中文字幕| 日韩视频一区二区| 一本一道波多野毛片中文在线| 欧美一区二区三区免费视| 97久久亚洲| 中文字幕在线中文| 国产综合一区二区| 男人天堂资源网| 欧美亚洲一区三区| 蜜桃视频在线观看网站| 2019亚洲男人天堂| 久久夜色电影| 婷婷无套内射影院| 丰满亚洲少妇av| 久久久久无码国产精品| 这里只有精品99re| 黄色网在线免费看| 91久久国产精品| 91精品国产91久久久久久密臀 | 国产精品第5页| 日韩成人网免费视频| www中文字幕在线观看| 99中文字幕| 国内在线观看一区二区三区| xxxxwww一片| 亚洲成av人影院| 天堂在线观看av| 69视频在线播放| 亚洲丁香日韩| 少妇高清精品毛片在线视频| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 超碰精品在线| 日本a视频在线观看| 99久久99久久综合| youjizz在线视频| 国产亚洲日本欧美韩国| 欧美a一级片| 强开小嫩苞一区二区三区网站| 国产电影一区二区三区| 国产无遮挡又黄又爽又色| 日韩精品999| 希岛爱理一区二区三区av高清| 台湾成人av| 国产自产v一区二区三区c| 久久一二三四区| 亚洲美女久久久| 视频91a欧美| 草草草视频在线观看| 不卡电影免费在线播放一区| 国产一级av毛片| 亚洲色图综合网| 福利精品在线| 老司机午夜网站| 91蝌蚪porny| 国产伦理吴梦梦伦理| 久久久久久69| 欧美亚洲国产精品久久| 欧美日韩理论片| 亚洲成人午夜影院| 国产黄色在线播放| 99c视频在线| 久久精品卡一| 久热这里有精品| 日韩乱码在线视频| 国产区一区二| 欧美牲交a欧美牲交aⅴ免费真| 国产精品久久久久婷婷| 懂色av成人一区二区三区| 国产a级全部精品| 欧美1区2区| 日本免费www| 精品成a人在线观看| 成人自拍视频网| 国产免费观看高清视频| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 日本在线免费网| 蜜桃视频在线观看成人| 国产精一品亚洲二区在线视频|