精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4輪暴訓,Llama 7B擊敗GPT-4!Meta等讓LLM「分飾三角」自評自進化

人工智能 新聞
Meta、UC伯克利、NYU共同提出元獎勵語言模型,給「超級對齊」指條明路:讓AI自己當裁判,自我改進對齊,效果秒殺自我獎勵模型。

LLM對數據的大量消耗,不僅體現在預訓練語料上,還體現在RLHF、DPO等對齊階段。

后者不僅依賴昂貴的人工標注數據,而且很可能讓人類水平限制LLM的進一步發展。

今年1月,Meta和NYU的團隊就提出了語言模型的自我獎勵機制,使用LLM-as-a-Judge的提示機制,讓模型在訓練期間進行自我反饋。

圖片

論文地址:https://arxiv.org/abs/2401.10020

論文發現,即使不依靠人類標注者,LLM也能通過評價自己的響應實現性能提升。

最近,這個團隊又發表了一篇研究,將LLM「自我獎勵」這件事情再拔高了一個層次。

圖片

論文地址:https://arxiv.org/abs/2407.19594

畢竟是自己給自己打分,因此不能只關注模型作為actor如何從反饋中優化,也需要保證模型作為judge具備優秀的自我評價能力。

之前的研究就因為過于關注前者而忽略后者,造成了迭代訓練期間性能的過快飽和。

甚至,還有可能造成比飽和更差的情況,即對獎勵信號的過度擬合(reward hacking)。

因此,來自Meta、NYU、UC伯克利等機構的研究者們提出,還需要增加一個「元獎勵」步驟——讓模型評價自己的評價,從而提升評價能力。

雖然聽起來有點繞,但實際是合理的。而且實驗發現,加上這一層嵌套有顯著的提升效果。

比如Llama-3-8B-Instruct在AlpacaEval 2上的勝率就從22.9%增至39.4%,比GPT-4的表現更佳;在Arena-Hard上則從20.6%提升至29.1%。

如果說,今年1月發表的研究是LLM-as-a-Judge,那么這篇論文提出的「元獎勵」,就相當于LLM-as-a-Meta-Judge。

不僅Judge不需要人類,Meta-Judge也能自給自足,這似乎進一步證明,模型的自我提升可以擺脫對人類監督的依賴。

Meta科學家Yann LeCun也轉發了這篇研究,并親自下場玩起了雙關梗——

圖片

Meta提出的Meta-Judge,FAIR能否實現fair?

研究不重要,重要的是Meta FAIR這一波曝光率拉滿了。

元獎勵(Meta-Rewarding)

用更直白的話說,「元獎勵」方法就是在原有的actor-judge的互動中再引入meta-judge,且由同一個模型「分飾三角」,不需要額外人類數據的參與。

圖片

其中,actor負責對給定提示生成響應;judge負責為自己的響應進行評價和打分;而meta-judge會對自己的打分質量進行對比。

最終的優化目標,是希望actor能生成更好的響應,但訓練效率依賴于judge的準確率。

因此,meta-judge作為訓練judge的角色,可以同時提升模型作為actor和judge的性能。

這三種角色組成的迭代訓練模式如圖1所示,在第t個步驟中,先收集模型M_t對提示x的響應,由再讓M_t對自己進行評價,由此得到用于訓練actor的偏好數據。

之后,給定同一個響應內容y,讓M_t生成各種不同評價的變體,由meta-judge進行打分和排名,由此得到用于訓練judge的偏好數據。

結合上述的兩類偏好數據,通過DPO方法對模型M_t進行偏好優化,就完成了一輪迭代,得到模型M_(t+1)。

長度偏好

之前的工作曾經發現,作為judge的模型會偏好更長的響應,這會導致多輪迭代后答案的「長度爆炸」。

因此,作者引入了一種簡潔的「長度控制」(length-control)機制——使用參數ρ∈[0,1],權衡judge的評分和響應文本長度。

比如,對于分數在第一梯隊的模型響應,即分數范圍為[(1-ρ)Smax+ρSmin, Smax],選擇其中最短的響應作為最優答案。

Judge偏好數據的創建

首先,選擇judge最沒有把握的模型響應,通過分數方差衡量judge的確定性。對于每個選中的響應y,我們有最多N個對應的模型評價{j1, … , jN}。

之后,對其中的每一對(jm, jn)進行成對評估,使用如圖2所示的meta-judge提示模板。

圖片

除了給出評價結果,meta-judge還需要生成CoT推理過程。

為減少meta-judge可能存在的位置偏好(可能傾向于選擇最先出現的Judgment A),對同一對數據(jm, jn)會交換順序讓meta-judge進行兩次評價,得到單次結果rmn

圖片

引入參數w1、w2用于表征可能存在的位置偏好:

圖片

其中win1st和win2nd表示在meta-judge的整個評價過程中,兩個位置的評價分別有多少次勝出。

用以上變量構建「對決矩陣」(battle matrix)B記錄每一次的最終結果:

圖片

利用Elo評分,可以從矩陣B計算meta-judge給每個judge賦予的元獎勵分數。

圖片

作者發現,meta-judge和judge一樣,也會展現出「長度偏好」,傾向于選擇更長的評價意見。

為了避免最終訓出的模型過于啰嗦,構建judge數據集時也采取了過濾措施。如果meta-judge選中的評價意見超過一定長度,整個數據對都會被直接舍棄。

評估實驗

實驗準備

實驗使用Llama-3-8B-Instruct作為種子模型,其他方面的實驗設置與之前發表的論文《Self-Rewarding Language Models》一致。

在元獎勵訓練之前,實驗首先在EFT(Evaluation Fine-Tuning)數據集上對種子模型進行監督微調(SFT)。

EFT數據集是根據Open Assistant構建的,并提供初始的LLM-as-a-Judge訓練數據,包含經過排名的人類響應,能訓練模型充當法官。

對于元獎勵迭代,實驗利用2萬個提示,由Llama-2-70B-Chat經過8-shot提示生成。

圖片

如上圖所示,訓練所用的提示在分布上更接近AlpacaEval數據集,而Arena-Hard的提示集中分布于訓練提示的一個子集。

對于每次迭代,實驗從該種子集中抽取5,000個提示,總共進行四次迭代。

迭代過程如下:

- Iter 1:從初始的SFT模型開始,使用DPO(Direct Preference Optimization)對生成的actor和judge的偏好對進行訓練,獲得M1。

- Iter 2:使用DPO對M1生成的actor和judge偏好對進行訓練,獲得M2。

- Iter 3/4:使用DPO僅對M2/M3生成的actor偏好對進行訓練,獲得M3/M4。

每個prompt都讓模型生成K=7個響應,每次迭代總共生成3.5萬個響應。然后,我們過濾掉相同的響應(通常刪除不超過50個重復項)。

接下來,使用相同的采樣參數為每個響應生成N = 11^2個不同的判斷。

評估方法

元獎勵模型的目標是要讓模型既能自己「演」,還能自己「評」,因此實驗也要評估模型在這兩個角色中的表現如何。

基線模型是前述論文中提出的自我獎勵模型,帶有相同的「長度控制」機制,可以直接對比出元獎勵機制帶來的性能增益。

首先,先看看如何評判「演」的怎么樣。

實驗利用三個基于GPT4-as-a-Judge的自動評估基準,包括AlpacaEval 2、Arena-Hard和MT-Bench,分別側重于模型的不同方面。

例如,AlpacaEval主要關注聊天場景,提示集涵蓋了各種日常問題。

相比之下,Arena-Hard包含更復雜或更具挑戰性的問題,要在預定義的7個方面(創造力、復雜性、問題解決能力等)滿足更多的標準。

MT-Bench有8個不同的問題類別,主要評估模型的多輪對話能力。

另一方面,為了評估LLM法官「評」的怎么樣,實驗測量了LLM給的分數與人類偏好的相關性。如果沒有可用的人類標注數據,則使用較強的AI法官代替。

指令跟隨評估

圖3展示了在AlpacaEval基準上,元獎勵方法(帶有長度控制機制)勝率隨訓練迭代的變化。

總體來看,元獎勵的勝率從22.9%大幅提升到39.4%,超過了GPT-4,并接近Claude Opus模型。

圖片

考慮到種子模型參數量只有8B,并且,除了在SFT階段使用的EFT數據集,沒有引入任何額外的人工數據,這是一個相當優秀的結果。

另外,結果也證明了meta-judge和長度控制機制的重要性。

自我獎勵模型訓練到超過3輪時,開始出現飽和跡象,但帶有元獎勵的模型并沒有,到第4輪時仍保持性能增長。

這表明了對模型評價能力進行訓練的重要性,以及meta-judge這一角色的有效性。

如表1所示,經過4輪迭代,無論是自我獎勵模型還是元獎勵模型,平均響應長度(以字符為單位)都沒有顯著增加,證明長度控制機制的有效性。

圖片

元獎勵機制有以下三個較為明顯的改進。

首先,將AlpacaEval中的805個類別細分為18個類別進行詳細分析,可以看到,元獎勵幾乎改進了所有類別的響應(圖4),包括需要大量知識和推理的學科,例如科學(Science)、游戲(Gaming)、文學(Literature)等。

值得注意的是,旅游(Travel)和數學(Mathematics)這兩類,模型并沒有實現顯著提升。

圖片

第二,元獎勵改進了對于復雜和困難問題的回答。

實驗進一步使用Arena-Hard評估在元獎勵方法在回答復雜和具有挑戰性的問題上的表現。

表2中的評估結果顯示,元獎勵在4次迭代中都能提高分數,與種子模型(20.6%)相比,顯著提高了8.5%。

圖片

第三,元獎勵在僅訓練單輪對話的情況下也并未犧牲多輪對話能力。

論文進行了MT-Bench評估,以檢查在僅訓練單輪數據的情況下多輪對話能力的損失。

結果如下表顯示,元獎勵模型的4次迭代顯著提高了第一輪對話得分,從8.319(種子模型)提高到8.738,而第二輪對話得分僅下降了不超過 0.1。

圖片

這是對基線模型中自我獎勵+長度控制(Self-Rewarding + LC)的巨大改進,因為后者通常會在第二輪對話得分上,下降超過 0.2,同時沒有提高第一輪對話得分。

獎勵模型評估

實驗評估了模型對種子模型Llama3-8B-Instruct生成響應的判斷準確性。

在缺乏人工標注的情況下,作者選擇測量元獎勵模型與當前最強的判斷模型gpt-4-1106-preview之間的評分相關性。

分析采用了兩種略有不同的設置,主要區別在于它們如何處理判斷模型給出的平局,因此使用了兩種指標:將平局計為0.5的一致性分數(agreement)和舍棄平局結果的一致性分數。

結果顯示,模型在進行訓練后判斷能力有所提高。

表3中的分析顯示,與基線模型相比,在兩種評估設置中,元獎勵與強大的GPT-4判斷模型之間的相關性顯著提高。

圖片

這些結果表明,元獎勵方法能夠改進模型判斷能力,使其評估結果與更復雜的語言模型GPT-4的評估結果更加接近。

此外,實驗對比了模型判斷結果與Open Assistant數據集中人類響應排名的相關性(表7),發現元獎勵訓練提高了與人類的判斷相關性。

圖片

然而,這種改進在后續訓練迭代中沒有持續,可能是由于模型生成的響應與人類響應之間的分布差異導致的。

分析

長度控制機制

長度控制機制對于保持模型響應的全面性和簡潔性之間的平衡至關重要。

實驗比較了最后一次訓練迭代中不同長度控制參數ρ的結果,如表4所示:

圖片

ρ = 0,相當于在偏好數據選擇中不進行任何長度控制。

正如預期的那樣,這種訓練方式使得模型生成的響應變得過于冗長,LC勝率降低。

使用外部獎勵模型進行訓練

元獎勵機制讓模型自己作為judge,來評估其自身的響應;實驗嘗試了使用強大的外部獎勵模型Starling-RM-34B作為對比。

然而,結果發現StarlingRM-34B未能在第一次迭代中提高AlpacaEval的LC勝率(24.63% vs. 27.85%),這可能是由于其長度偏見。

meta-judge偏見

在元獎勵訓練的第一次迭代之后,meta-judge幾乎總是更傾向于更高分數的判斷,如表5所示。

圖片

這種分數偏見顯著地將判斷的評分分布向滿分5分傾斜。對于位置偏見,我們也看到在訓練過程中有增加的趨勢,特別是在比較兩個相同分數的判斷時。

判斷評分變化:為了調查在元獎勵訓練迭代過程中判斷評分分布的變化,實驗使用與獎勵建模評估相同的驗證提示。

使用Llama-3-8B-Instruct在每個提示上生成7個響應,然后為每個響應生成11次判斷。圖5是評分分布的可視化,密度是使用高斯核密度估算的。

圖片

可見,使用meta-judge訓練判斷進一步增加了其生成高分的可能性。

然而,判斷訓練的前兩次迭代使其傾向于分配4.5、4.75、4.9的分數,根據根據指示這些分數應該是整數。

盡管這些是高分,但它們提供了更細致的區分能力,以區分不同質量的響應。

結論

實驗提出了一種新機制,通過使用meta-judge為作為judge的模型分配元獎勵(meta-rewards),從而提高模型的評判能力。

這解決了自獎勵(Self-Rewarding)框架的一個主要限制,即缺乏對模型評判能力的訓練。

為了使元獎勵訓練(Meta-Rewarding training)更加有效,實驗還引入了一種新的長度控制技術,以緩解在使用AI反饋進行訓練時出現的長度爆炸問題。

通過自動評估基準AlpacaEval、Arena-Hard和MT-Bench,元獎勵方法的有效性也得到了驗證。

值得注意的是,即使在沒有額外人類反饋的情況下,這種方法也顯著改進了Llama-3-8B-Instruct,并超越了依賴大量人類反饋的強基線方法自獎勵(Self-Rewarding)和SPPO。

此外,評估模型的評判能力時,它在與人類評判和強大的AI評判(如 gpt-4-1106-preview)的相關性上表現出顯著的改進。

總體而言,研究結果提供了有力的證據,證明無需任何人類反饋的自我改進模型是實現超級對齊(super alignment)的一個有前途的方向。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-01-22 08:50:00

AI訓練

2024-06-11 14:30:18

2024-02-07 12:39:00

AI數據

2023-07-25 09:23:23

Llama 2GPT-4

2024-05-13 12:38:08

AI訓練

2023-09-11 15:57:16

人工智能模型GPT-4

2023-06-19 08:19:50

2024-05-10 09:10:56

模型訓練

2025-04-08 02:26:00

2024-04-19 10:32:08

2025-04-16 09:35:03

2024-01-23 14:39:30

2024-05-09 08:33:33

2023-12-11 19:16:25

2024-04-19 14:52:13

MetaGPT-4模型

2024-02-02 17:04:35

UCLALLMGPT-4

2025-05-30 07:40:56

2024-06-28 13:40:03

2023-11-03 13:07:00

AI模型

2024-07-24 13:18:17

點贊
收藏

51CTO技術棧公眾號

欧美白人最猛性xxxxx69交| 国产精品久久久久天堂| 97久久国产精品| 女人被狂躁c到高潮| 怡红院成人在线| 成人欧美一区二区三区1314| av资源站久久亚洲| 亚洲熟妇无码乱子av电影| 色综合咪咪久久网| 亚洲国产精品成人精品| 奇米影视四色在线| av电影免费在线看| 中文字幕日本乱码精品影院| 国产一区再线| 国产免费高清视频| 西西人体一区二区| 欧美日韩999| 成人激情五月天| 精品日产乱码久久久久久仙踪林| 欧美色国产精品| 国产免费一区二区视频| 日本中文在线| 久久蜜桃一区二区| 国产精品免费一区二区三区在线观看 | 成人在线免费播放视频| 黄网av在线| 国产精品嫩草99a| 欧美三级华人主播| 人妻一区二区三区| 国产成人在线视频免费播放| 国产精品三级久久久久久电影| 久草视频免费在线播放| 日韩片欧美片| 国产亚洲美女精品久久久| 国产精品无码电影| 精品视频在线观看免费观看| 欧美性色综合网| 午夜精品久久久内射近拍高清| 1024在线播放| |精品福利一区二区三区| 日韩电影在线播放| 国产黄色在线播放| 久久视频一区二区| 欧美xxxx黑人又粗又长精品| 人妻中文字幕一区| 成人高清视频免费观看| 成人做爰66片免费看网站| 国产日韩欧美一区二区东京热| 蜜臀av一区二区三区| 国产精品久久久久久久一区探花| 国产伦精品一区二区三区视频网站| 激情婷婷久久| 国内精品小视频在线观看| 国产无码精品一区二区| 国内一区二区三区| 久久久久久18| 日本污视频在线观看| 伊人久久综合| 97超级碰碰碰| 色老头在线视频| 奇米精品一区二区三区四区 | 麻豆精品一区| 日韩女优av电影| 免费看91视频| 久久国产精品色av免费看| 亚洲高清av在线| 精品中文字幕在线播放| 亚洲深夜福利在线观看| 亚洲日本aⅴ片在线观看香蕉| 免费看污片网站| 欧美色图激情小说| 久久久精品国产亚洲| 少妇影院在线观看| 亚洲二区在线| 国产成人极品视频| 国产精品一级二级| 成人动漫视频在线| 日韩一区二区三区资源| 黄色在线免费看| 亚洲国产aⅴ天堂久久| 日韩av资源在线| 日本成人一区二区| 精品国产乱码久久久久久闺蜜| 中文视频在线观看| 国产欧美日韩在线观看视频| 中文字幕亚洲欧美日韩在线不卡| 国产高潮流白浆| 亚洲国产专区校园欧美| 国产成人啪精品视频免费网| 亚洲一区二区天堂| 福利电影一区二区| 日本公妇乱淫免费视频一区三区| 免费网站成人| 欧美日韩免费看| 怡红院亚洲色图| 欧美重口另类| 久久亚洲精品成人| 久久中文字幕免费| 国产在线视频不卡二| 精品亚洲欧美日韩| 黄色精品在线观看| 色综合天天做天天爱| 国产一级免费大片| 久草在线成人| 久久久久久久97| 亚洲视频在线观看免费视频| 国产1区2区3区精品美女| 日韩精品久久一区二区三区| 丁香花在线影院| 欧美日韩黄视频| www.免费av| 欧美精品国产一区| 欧美日韩高清在线| 中文字幕avav| 国产一区二区三区四区五区传媒 | 日韩av在线免费观看| 少妇高潮一区二区三区喷水| 一道本一区二区| 亚洲xxxx做受欧美| av在线电影观看| 五月天精品一区二区三区| 成人综合久久网| 久草成人在线| 欧美一区二三区| 丰满人妻一区二区三区无码av| 亚洲国产成人在线| 青青草原av在线播放| 在线精品自拍| 久久视频国产精品免费视频在线| 国产性生活视频| 99精品视频在线免费观看| av不卡在线免费观看| 日韩大尺度黄色| 亚洲国产日韩一区| 国产无码精品在线观看| 国产高清亚洲一区| 中文网丁香综合网| 久久xxx视频| 亚洲人在线视频| 在线观看日本网站| 久久亚洲精品小早川怜子| 日韩av在线第一页| 秋霞影视一区二区三区| 97高清免费视频| 老熟妇高潮一区二区高清视频| 亚洲欧美日韩成人高清在线一区| 亚洲免费av一区| 国产精品久久占久久| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 久久久最新网址| 男人的天堂a在线| 亚洲国产欧美在线| 在线播放第一页| 久久久久久影院| 成人黄色av免费在线观看| 麻豆免费在线观看| 7777精品伊人久久久大香线蕉的| 免费成人深夜蜜桃视频| 精品一区二区三区的国产在线播放| 亚洲欧洲一区二区福利| 五月天色综合| 欧美成人免费在线观看| 成人久久精品人妻一区二区三区| 亚洲午夜免费视频| 国产真实乱人偷精品| 亚洲伊人观看| 四虎一区二区| 免费精品一区| 国内精品久久久久久中文字幕| 视频一区二区免费| 在线一区二区观看| 永久免费未视频| 成人国产免费视频| aa在线免费观看| 操欧美老女人| 97久久人人超碰caoprom欧美| 岛国在线视频网站| 一区二区成人精品| 精品国产亚洲一区二区麻豆| 亚洲第一福利视频在线| 91国模少妇一区二区三区| 免费黄网站欧美| 免费的一级黄色片| 国产成人精品999在线观看| 国产一区二区视频在线观看| 女囚岛在线观看| 亚洲欧洲黄色网| 国产视频第一页| 欧美性色19p| 日韩精品一区二区亚洲av性色| 成人av在线观| 美女在线视频一区二区| 亚洲第一黄色| 中文字幕一区二区三区四区五区六区 | 国产乱码精品一区二区三区不卡| 亚洲电影观看| 欧美大胆a视频| 成人高潮成人免费观看| 亚洲精品在线电影| 91国产精品一区| 欧美日韩亚洲一区二区三区| 日韩av手机在线免费观看| 99re这里只有精品6| 中国黄色片一级| 国产农村妇女精品一二区 | 亚洲黄色视屏| 伊人色综合久久天天五月婷| 日韩深夜影院| 97netav| 深夜福利亚洲| 日本久久久久久久久久久| 在线免费观看的av| 视频在线一区二区| 久草视频在线看| 亚洲高清av在线| 国内老熟妇对白xxxxhd| 欧美一a一片一级一片| 日本午夜视频在线观看| 一区二区三区欧美视频| www成人啪啪18软件| 久久久久久久久久久久久女国产乱| 日本美女久久久| 蜜桃在线一区二区三区| aaa毛片在线观看| 日韩视频精品在线观看| 国产一区二区三区播放| 91成人影院| 一区二区精品在线观看| 欧美亚洲在线日韩| 日本高清一区| 国产亚洲一区| 欧美日韩综合另类| 免费观看不卡av| 久久精品五月婷婷| 欧美交a欧美精品喷水| 国产日韩欧美一区二区| av日韩在线播放| 97视频中文字幕| 国产亚洲观看| 51蜜桃传媒精品一区二区| 久久影院一区二区三区| 91在线视频导航| 欧美h版在线观看| 成人免费观看网站| 国产劲爆久久| 麻豆成人小视频| 奇米色欧美一区二区三区| 日本午夜一区二区三区| 欧美呦呦网站| 在线视频不卡国产| 亚洲精品a级片| 欧美乱做爰xxxⅹ久久久| 国产精品国码视频| 欧美精品一区二区三区三州| 国产视频一区免费看| av免费在线播放网站| 免费成人性网站| 日本亚洲一区二区三区| 国产白丝网站精品污在线入口| 成人啪啪18免费游戏链接| av影院午夜一区| 丰腴饱满的极品熟妇| 欧美国产精品v| 国产大片免费看| 亚洲国产精品久久人人爱蜜臀 | 在线看三级电影| 国内成人精品一区| 三上悠亚国产精品一区二区三区| 国产精品福利在线观看网址| 日韩专区视频| 国产精品高清一区二区三区| 色狠狠久久av综合| 亚洲成人一区二区三区| 亚洲澳门在线| 国产中文字幕视频在线观看| 秋霞av亚洲一区二区三| 亚洲一二区在线观看| 成人国产精品免费网站| 天堂在线中文视频| 一区二区三区欧美久久| 天天干在线播放| 欧美绝品在线观看成人午夜影视| 午夜精品久久久久久久爽 | 四虎国产成人精品免费一女五男| 亚洲毛片av在线| 欧美videossex极品| 欧美精品粉嫩高潮一区二区| 黄色a在线观看| 在线看片第一页欧美| 国产精品69xx| 国产精品久久久久久久久影视| 中文字幕一区二区三区中文字幕| 六十路精品视频| 91精品一区国产高清在线gif| 3d动漫一区二区三区| 蜜桃精品视频在线观看| 亚洲一区二区三区综合| 亚洲天堂精品在线观看| 二区视频在线观看| 欧美一区二区网站| 九一在线视频| 国内免费久久久久久久久久久| 亚洲日本在线观看视频| 国内精品视频免费| 亚洲最新av| 五月婷婷激情久久| 99精品视频在线免费观看| caoporn91| 欧美少妇性性性| 黄色在线观看网| 97视频在线观看免费| 精品国产乱码久久久久久樱花| 欧美高清性xxxxhdvideosex| 欧美福利影院| 国产亚洲视频一区| 欧美激情一区在线| 日本免费在线观看视频| 亚洲国产成人在线播放| a视频在线免费看| 国产日韩欧美在线视频观看| 蜜桃一区二区三区| 国产网站免费在线观看| 丰满白嫩尤物一区二区| 午夜爱爱毛片xxxx视频免费看| 在线免费观看不卡av| 你懂的在线播放| 欧美亚洲视频一区二区| 人妖一区二区三区| 黄色一级视频在线播放| 国产成人午夜视频| 日本少妇高清视频| 91.麻豆视频| 免费av网站在线看| 国产综合视频在线观看| 成人aaaa| 中文久久久久久| 国产欧美久久久精品影院 | 欧美一区二区性放荡片| 美女羞羞视频在线观看| 国产男人精品视频| 国产精品久久久久久| 中文字幕中文在线| 亚洲日本电影在线| 99久久国产热无码精品免费| 久久香蕉国产线看观看网| 蜜桃精品一区二区三区| 欧美日韩午夜爽爽| 丁香桃色午夜亚洲一区二区三区| 九九视频免费在线观看| 日韩欧美国产综合| 国产高清在线a视频大全| 国产成人一区二区三区免费看| 狠狠入ady亚洲精品| 亚洲啪av永久无码精品放毛片| 亚洲高清一区二区三区| 视频福利在线| 国产精品1234| 五月婷婷亚洲| 亚洲一区和二区| 色综合天天综合色综合av| 成人在线播放视频| 91精品久久久久久久久久另类| 天天射成人网| 美女久久久久久久久| 福利精品视频在线| 99reav在线| 成人欧美视频在线| 久久av最新网址| 国产又粗又长免费视频| 欧美一区中文字幕| 免费看男女www网站入口在线| 色婷婷精品国产一区二区三区| 久久er精品视频| 国产一级特黄视频| 亚洲一级黄色片| 国产在线一区不卡| 久久成人免费观看| 日韩一区有码在线| 人妻偷人精品一区二区三区| 国产精品极品美女粉嫩高清在线| 97精品国产福利一区二区三区| 原创真实夫妻啪啪av| 欧美性猛交丰臀xxxxx网站| 激情在线小视频| 蜜桃av久久久亚洲精品| 韩国女主播成人在线观看| 国产午夜精品无码| 中文字幕免费精品一区| 国产精品45p| 日韩av片专区| 欧美日韩加勒比精品一区| 免费在线午夜视频| 免费精品视频一区| 国产成人免费在线观看| 日本中文字幕在线观看视频| 欧美超级免费视 在线| 国产99久久久国产精品成人免费 | 亚洲国产精品无码久久久| 欧美成人性生活| 波多野结衣的一区二区三区|