精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RLHF vs RL「AI」F,谷歌實證:大模型訓練中人類反饋可被AI替代

人工智能 新聞
眾所周知,RLHF 是 ChatGPT 和 Bard 等 LLM 成功路上不可或缺的重要一環(huán),而現(xiàn)在谷歌的一項研究表明可以把 RLHF 中的 H(人類)替換成 AI,而且新提出的根據(jù)人工智能反饋的強化學習(RLAIF)在實驗中的表現(xiàn)大體上與 RLHF 接近。可以預見,如果這項技術的有效性得到進一步驗證,人類離 LLM 的訓練流程又會更遠一步,同時 AI 訓練 AI 的構想也會更接近現(xiàn)實。

根據(jù)人類反饋的強化學習(RLHF)是一種對齊語言模型與人類偏好的有效技術,而且其被認為是 ChatGPT 和 Bard 等現(xiàn)代對話語言模型的成功的關鍵驅(qū)動因素之一。通過使用強化學習(RL)進行訓練,語言模型可以優(yōu)化用于復雜的序列級目標 —— 使用傳統(tǒng)的監(jiān)督式微調(diào)時,這些目標不是輕易可微的。

在擴展 RLHF 方面,對高質(zhì)量人類標簽的需求是一大障礙;而且人們很自然地會問:生成的標簽是否也能得到可媲美的結果?

一些研究表明大型語言模型(LLM)能與人類判斷高度對齊 —— 在某些任務上甚至優(yōu)于人類。

2022 年,Bai et al. 的論文《Constitutional AI: Harmlessness from AI Feedback》最早提出使用 AI 偏好來訓練用于強化學習微調(diào)的獎勵模型,該技術被稱為根據(jù)人工智能反饋的強化學習(RLAIF)。這項研究表明,通過混合使用人類與 AI 偏好,并組合 Constitutional AI 自我修正技術,可讓 LLM 的表現(xiàn)超越使用監(jiān)督式微調(diào)的方法。不過他們的研究并未直接對比使用人類反饋和 AI 反饋時的效果,于是能否使用 RLAIF 適當?shù)靥娲?RLHF 就仍舊是一個有待解答的問題。

Google Research 決定填補這一空白,憑借強大的實驗資源,他們直接比較了 RLAIF 和 RLHF 方法在摘要任務上的表現(xiàn)。

論文:https://arxiv.org/pdf/2309.00267.pdf

給定一段文本和兩個候選響應,研究者使用現(xiàn)有的 LLM 為其分配一個偏好標簽。然后再基于該 LLM 偏好,使用對比損失訓練一個獎勵模型(RM)。最后,他們使用該 RM 來提供獎勵,通過強化學習方法微調(diào)得到一個策略模型。

結果表明,RLAIF 能與 RLHF 媲美,這體現(xiàn)在兩個方面:

圖片

一、谷歌觀察到,RLAIF 和 RLHF 策略分別在 71% 和 73% 的時間里比監(jiān)督式微調(diào)(SFT)基準更受人類青睞,而這兩個勝率在統(tǒng)計學意義上沒有顯著差別。

二、當被要求直接比較 RLAIF 與 RLHF 的結果時,人類對兩者的偏好大致相同(即 50% 勝率)。這些結果表明 RLAIF 可以替代 RLHF,其不依賴于人類標注,并且具有良好的擴展性。

此外,該團隊還研究了能盡可能使 AI 生成的偏好與人類偏好對齊的技術。他們發(fā)現(xiàn),通過 prompt 為 LLM 提供詳細的指示并借助思維鏈推理能提升對齊效果。

他們觀察到了出乎意料的現(xiàn)象:少樣本上下文學習和自我一致性(采樣多個思維鏈原理并對最終偏好進行平均的過程)都不能提升準確度,甚至會導致準確度下降。

他們還進行了縮放實驗,以量化打標簽 LLM 的大小與偏好示例數(shù)量之間的權衡。

這項研究的主要貢獻包括:

  • 基于摘要任務表明 RLAIF 能取得與 RLHF 相當?shù)谋憩F(xiàn)。
  • 比較了多種用于生成 AI 標簽的技術,并為 RLAIF 實踐者確定了最優(yōu)設置。

RLAIF 方法

這一節(jié)將描述使用 LLM 生成偏好標簽的技術、執(zhí)行強化學習的方法以及評估指標。

圖片

使用 LLM 標記偏好

谷歌在實驗中的做法是使用一個現(xiàn)成可用的 LLM 來在成對的候選項中標記偏好。給定一段文本和兩個候選摘要,LLM 的任務是評判哪個摘要更好。LLM 的輸入的結構如下(表 1 給出了一個示例):

圖片

  1. 序言 —— 描述當前任務的介紹和指示
  2. 少樣本示例(可選)—— 一段示例文本、兩個摘要、一個思維鏈原理(如果可用)和一個偏好判斷
  3. 所要標注的樣本 —— 一段文本和一對要標記的摘要
  4. 結尾 —— 一段用于提示 LLM 的結束字符串(如 Preferred Summary=)

通過為 LLM 提供輸入而得到的偏好結果 1 和 2,可以得到生成 1 和 2 的對數(shù)概率,然后計算 softmax,得到偏好分布。

從 LLM 獲取偏好標簽的方法有很多,比如從模型中解碼自由形式的響應并以啟發(fā)式方法提取偏好(比如輸出 =「第一個偏好更好」)或?qū)⑵梅植急硎境梢粋€單樣本表征。但是,谷歌這個團隊并未實驗這些方法,因為他們的方法已能得到較高的準確度。

對于序言,研究者實驗了兩種類型:

  • 基本型:就是簡單地問:「哪個摘要更好?」
  • OpenAI 型:模仿了給人類偏好標注者的評級指令,該指令生成了 OpenAI TL;DR 偏好數(shù)據(jù)集并且包含有關組成優(yōu)良摘要的內(nèi)容的詳細信息。完整序言見下表。

圖片

研究者還實驗了上下文學習,即在 prompt 中添加少樣本示例,其中的示例是人工選取的以覆蓋不同的主題。

解決位置偏見

眾所周知,LLM 有位置偏見,也就是候選項在輸入中的位置會影響 LLM 給出的評估結果。

為了緩解偏好標注中的位置偏見,這個研究團隊采用的做法是為每一對候選項做兩次推理 —— 兩次中候選項在輸入中的位置相互調(diào)換。然后再對兩次推理的結果做平均,得到最終的偏好分布。

思維鏈推理

他們也使用了思維鏈(CoT)推理來提升與人類偏好的對齊程度。為此,他們將結尾的標準 prompt 替換成了「Consider the coherence, accuracy, coverage, and overall quality of each summary and explain which one is better. Rationale:」然后解碼 LLM 給出的響應。最后,再將原始 prompt、響應和原始結尾字符串「Preferred Summary=」連接到一起,按照前述的評分流程得到一個偏好分布。圖 3 給出了圖示說明。

自我一致性

對于思維鏈 prompt,研究者也實驗了自我一致性 —— 這項技術是通過采樣多個推理路徑并聚合每個路徑末尾產(chǎn)生的最終答案來改進思維鏈推理。研究者使用非零解碼溫度對多個思想鏈原理進行采樣,然后得到每個思維鏈的 LLM 偏好分布。然后對結果進行平均,以得到最終的偏好分布。

根據(jù)人工智能反饋的強化學習

使用 LLM 標記好偏好之后,就可以用這些數(shù)據(jù)來訓練一個預測偏好的獎勵模型(RM)。由于這里的方法是得到軟標簽(如 preferences_i = [0.6, 0.4] ),因此他們對 RM 生成的獎勵分數(shù)的 softmax 使用了交叉熵損失。softmax 會將 RM 的下限分數(shù)轉(zhuǎn)換成一個概率分布。

在 AI 標簽數(shù)據(jù)集上訓練 RM 可以被視為一種模型蒸餾,尤其是因為打標簽的 AI 往往比 RM 強大得多。另一種方法是不用 RM,而是直接把 AI 反饋用作強化學習的獎勵信號,不過這種方法計算成本要高得多,因為打標簽的 AI 比 RM 大。

使用訓練得到的 RM 就能執(zhí)行強化學習了,這里研究者使用了一種針對語言建模領域修改過的 Advantage Actor Critic (A2C) 算法。

評估

這項研究使用了三個評估指標:打標簽 AI 對齊度、配對準確度和勝率。

打標簽 AI 對齊度衡量的是 AI 標注的偏好與人類偏好對齊的程度。對于各個示例,其計算方式是將軟性的 AI 標記的偏好轉(zhuǎn)換成二元表征(如 preferences_i = [0.6, 0.4] → [1, 0]);如果 AI 給出的標簽與目標人類偏好一致,則分配 1,否則分配 0。其可以表示為:

圖片

其中 p_ai 和 p_h 分別是 AI 和人類偏好的二元表征,x 是索引,D 是數(shù)據(jù)集。

配對準確度衡量的是訓練好的獎勵模型相對于一個保留的人類偏好集的準確度如何。給定共享的上下文和一對候選響應,如果 RM 給人類偏好的候選項的分數(shù)高于人類不偏好的候選項,那么配對準確度為 1。否則其值為 0。將多個示例的該值平均之后,可以衡量 RM 的總準確度。

勝率則是通過人類更喜歡兩個策略中哪個策略來端到端地評估策略的質(zhì)量。給定一個輸入和兩個生成結果,讓人類標注者標記自己更喜歡的那一個。在所有實例中,相比于來自策略 B 的結果,人類標注者更偏好來自策略 A 的結果的百分比稱為「A 對 B 的勝率」。

實驗

結果表明 RLAIF 與 RLHF 的表現(xiàn)相當,如圖 1 所示。相比于基礎 SFT 策略,人類標注者在 71% 的情況下都更偏愛 RLAIF。

研究者實驗了三種類型的 prompt 設計方案 —— 序言具體指定、思維鏈推理、和少樣本上下文學習,結果見表 2。

圖片

總體而言,研究者觀察到,最優(yōu)配置為:采用詳細的序言、思維鏈推理、不采用上下文學習(OpenAI + COT 0-shot)。這一組合的打標簽 AI 對齊度為 78.0%,比使用最基礎的 prompt 時高 1.9%。

在自我一致性方面,研究者實驗了 4 和 16 個樣本的情況,而解碼溫度設置為 1。

圖片

結果發(fā)現(xiàn),相比于不使用自我一致性,這兩種情況下對齊度都下降了 5% 以上。研究者以人工方式檢查了思維鏈原理,但未能揭示出自我一致性導致準確度更低的常見模式。

他們也實驗了不同模型大小的標注偏好,并觀察到對齊度與模型大小之間存在緊密關聯(lián)。

圖片

研究者也通過實驗觀察了獎勵模型(RM)準確度隨訓練樣本數(shù)量的變化模式。結果如圖 5 所示。

圖片

定性分析

為了更好地理解 RLAIF 和 RLHF 孰優(yōu)孰劣,研究者讓人類評估了這兩個策略生成的摘要。很多時候,這兩個策略得到的摘要很相近,這也反映在它們相近的勝率上。但是,研究者也找到了兩種它們會出現(xiàn)差異的模式。

其中一個模式是 RLAIF 似乎比 RLHF 更不容易出現(xiàn)幻覺。RLHF 中的幻覺往往看似合理,但又與原文本不一致。

另一個模式是:相比于 RLHF,RLAIF 有時候會生成更不連貫和更不符合語法的摘要。

總體而言,盡管這兩個策略各自有一定的傾向性,但卻能產(chǎn)生相當接近的高質(zhì)量摘要。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-09-05 19:43:05

模型RLHFAI

2025-11-20 12:54:43

2023-09-05 12:59:33

模型數(shù)據(jù)

2025-04-01 09:54:09

AI算法大模型AI

2023-02-27 14:55:54

技術研究

2024-01-23 10:35:09

ChatGPT人工智能

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2025-01-09 08:01:10

2023-07-14 11:47:08

AI醫(yī)生

2023-12-26 12:07:14

模型訓練

2023-09-18 13:13:00

人工智能訓練

2023-08-30 13:09:43

AI數(shù)據(jù)

2023-05-22 09:19:19

2024-12-25 08:02:17

人工智能AI運維

2024-03-12 10:36:17

AI大模型人工智能

2025-05-28 02:25:00

2024-05-13 13:37:10

模型數(shù)據(jù)

2024-06-20 07:23:29

2023-12-12 10:57:05

AI谷歌
點贊
收藏

51CTO技術棧公眾號

91在线中字| 成熟妇人a片免费看网站| 婷婷激情四射五月天| 日韩久久久久久久久久| 99精品视频在线观看播放| 国产精品全国免费观看高清 | 亚洲免费在线播放| 欧美与黑人午夜性猛交久久久| 图片区偷拍区小说区| 亚洲免费不卡视频| 福利欧美精品在线| 国产精品久久久久久福利一牛影视 | 俄罗斯一级**毛片在线播放| 欧美日韩免费观看一区=区三区| 欧美精品一区二区三区在线 | 亚洲三级在线观看视频| 成人久久久精品国产乱码一区二区| 91精品动漫在线观看| 国产日韩欧美综合一区| 91精品国产综合久久香蕉麻豆| 精品嫩模一区二区三区| 国产美女福利视频| 日本www在线观看视频| 亚洲精品乱码| 色婷婷av久久久久久久| 国产日韩欧美视频| 91久久免费视频| 国产精品扒开腿做爽爽爽视频软件| 久久综合九色综合欧美就去吻| 中文字幕久热精品在线视频| 一区二区三区我不卡| 日产电影一区二区三区| 欧美一区二区三| 亚洲h在线观看| 日韩在线第一区| 手机看片福利在线| 欧美高清视频手机在在线| 亚洲色图制服诱惑| 国产成人亚洲综合91精品| 你懂的在线观看网站| 粉嫩一区二区三区| 黄色一区二区在线| 乱子伦一区二区| 丰满熟女人妻一区二区三| 在线成人av| 久久精品亚洲94久久精品| 中文字幕狠狠干| 国产一区二区三区不卡av| 欧美日韩精品是欧美日韩精品| www.日本在线视频| 亚洲视频一区二区三区四区| 免费观看亚洲天堂| 一本色道久久综合亚洲精品按摩| 91久久久久久久久| 中文字幕在线观看视频免费| 超碰成人福利| 欧美日韩中文一区| 日韩欧美手机在线| 天堂中文资源在线| 99久久夜色精品国产网站| 久久精品2019中文字幕| 久久一级免费视频| 成人不卡视频| 欧美日韩免费在线观看| 91九色丨porny丨国产jk| 国产99视频在线| 国产精品日韩精品中文字幕| 色综合色狠狠综合色| 日韩亚洲欧美一区二区| 国产露脸91国语对白| 日韩精品亚洲一区二区三区免费| 日韩av免费在线播放| 精品人妻一区二区三区香蕉| 精精国产xxxx视频在线野外| 亚洲国产精品视频| 96久久精品| 91精品国产乱码久久久久| 秋霞电影一区二区| 国产精品mp4| 欧美成人精品欧美一级| 亚洲91网站| 一区二区在线观看视频| 一区二区视频国产| 91国内在线| 亚洲人午夜精品天堂一二香蕉| 在线丝袜欧美日韩制服| 国产在线观看av| 国产高清久久久久| 国产精品v欧美精品v日韩| 国产v片在线观看| 久久国产精品第一页| 91在线观看免费高清完整版在线观看| 中文字幕在线网址| 国产综合色视频| 日韩在线观看成人| 青娱乐精品在线| 精精国产xxxx视频在线中文版| 久久一留热品黄| 欧美一区二区福利| 99福利在线| 午夜精品久久久久久久久久| 欧美精品卡一卡二| 欧美日韩精品免费观看视完整| 欧美在线影院一区二区| 色婷婷777777仙踪林| 日韩伦理在线一区| 在线一区二区三区四区| 日本黄色www| 欧美a一欧美| 亚洲最新av网址| 91香蕉视频在线观看视频| 日韩影片在线观看| 日韩电影免费观看中文字幕 | 东方aⅴ免费观看久久av| 2019中文字幕在线| 国产又粗又大又爽| 国产乱码一区二区三区| 成人自拍网站| 天堂中文在线8| 久久久久久久久久久久久女国产乱| 97se亚洲综合| 理论视频在线| 亚洲精品乱码久久久久久久久 | 四虎久久免费| 久久综合精品国产一区二区三区 | 草久视频在线观看| 精品亚洲国产成人av制服丝袜| 欧美俄罗斯乱妇| 五月婷婷亚洲综合| 国产精品88888| 日韩精品一区二区三区色偷偷| 福利在线导航136| 欧美日韩免费视频| 国产一二三四五区| 亚洲免费精品| 亚洲free嫩bbb| 免费在线观看av网站| 欧美午夜丰满在线18影院| 色悠悠久久综合网| 91精品尤物| 欧美人动与zoxxxx乱| 亚洲av永久无码精品| 欧美日中文字幕| 91精品国模一区二区三区| 人人妻人人藻人人爽欧美一区| 一区二区三区在线电影| 中文字幕欧美精品日韩中文字幕| 久久人人爽人人爽人人| 日本午夜精品视频在线观看| 99精品国产高清在线观看| 国产精品一区二区人人爽| 91在线视频播放| 激情久久av| 成年人视频免费在线播放| 欧美日韩精品高清| 色一情一交一乱一区二区三区 | 欧美a v在线播放| 成人福利一区| 久久影院模特热| 中国一级特黄视频| 国产精品入口麻豆九色| 日本成年人网址| 日本在线成人| 精品国偷自产在线| 国产又大又粗又长| 亚洲欧洲国产日韩| 久久人人爽av| 欧美freesex| 亚洲免费成人av电影| 国产黄色片视频| 国产成人午夜电影网| 日韩一级片免费视频| 福利一区三区| 精品国产一区二区国模嫣然| 少妇太紧太爽又黄又硬又爽小说| 爽好多水快深点欧美视频| 精品一区久久久久久| 麻豆免费版在线观看| 亚洲精品福利在线观看| 国产精品视频看看| 久久99精品久久久久婷婷| 欧洲一区二区在线观看| 欧美日韩破处视频| 视频一区视频二区国产精品 | 免费一区二区三区在在线视频| av老司机免费在线| 欧美日韩高清一区二区不卡| 最新中文字幕视频| 日韩精品成人一区二区在线| 自拍偷拍99| 精品国产一区二区三区性色av| 久久国产加勒比精品无码| 丰满少妇高潮在线观看| 精品二区三区线观看| 国产精成人品免费观看| 狠狠网亚洲精品| 日本精品久久久久久久久久| 精品一区二区三| 成人天堂噜噜噜| 丰满肥臀噗嗤啊x99av| 五月激情综合婷婷| 成人片黄网站色大片免费毛片| 久久99在线观看| youjizz.com在线观看| 久草在线综合| 国产女精品视频网站免费| 直接在线观看的三级网址| 亚洲美女精品久久| 日本一区二区三区久久| 一区二区日韩电影| 麻豆一区在线观看| 国产成人免费在线观看| 免费看欧美一级片| 欧美日韩在线二区| 91精品国产一区二区三区动漫| 亚洲美女尤物影院| 另类视频在线观看| 丰满熟妇人妻中文字幕| 欧美情侣在线播放| 国产 欧美 日韩 在线| 风间由美性色一区二区三区| aa免费在线观看| 亚洲影视一区| 亚洲欧洲日夜超级视频| 精品欧美视频| 国产精品美女在线| 精品久久在线观看| 中文成人综合网| 韩国三级在线播放| 日韩成人一区二区三区在线观看| 亚洲精品日韩精品| 国产亚洲一卡2卡3卡4卡新区| 成人av资源在线播放| 精品免费av在线| 91国内产香蕉| 黄网页在线观看| 亚洲丝袜av一区| 日本一二三区不卡| 亚洲欧美日韩国产成人精品影院| 国精产品一区二区三区| 国产成人免费视频一区| 91精品视频国产| 蜜臀av性久久久久蜜臀aⅴ| 亚洲国产精品日韩| 神马久久影院| 91精品久久久久久久久久久久久久| 香蕉成人影院| 4k岛国日韩精品**专区| 国产高清自产拍av在线| 久久国产精品久久久久久久久久| 国产理论电影在线观看| 亚洲欧美日韩一区二区三区在线| 人成网站在线观看| 精品国产三级电影在线观看| 国产a级免费视频| 在线成人免费视频| 国产乱人乱偷精品视频| 欧美美女黄视频| 国产三区在线播放| 性欧美疯狂xxxxbbbb| 中文字幕在线有码| 一二三区精品视频| 国产亚洲精品久久777777| 亚洲伊人伊色伊影伊综合网| 久久艹精品视频| 国产成人精品影视| 国产伦精品一区二区三区妓女下载| 精品一区二区三区久久久| 婷婷六月天在线| 久久99久国产精品黄毛片色诱| 国产妇女馒头高清泬20p多| 亚洲成人免费| 亚洲爆乳无码精品aaa片蜜桃| 欧美手机视频| 国产精品啪啪啪视频| 国色天香一区二区| 大桥未久一区二区| 欧美天天视频| 极品美女扒开粉嫩小泬| 日韩主播视频在线| 9久久婷婷国产综合精品性色 | www国产精品av| 亚欧美在线观看| 国精品一区二区| 成人黄色片免费| 欧美午夜不卡| 男人添女荫道口图片| 久久在线91| 日韩成人精品视频在线观看| 国产在线精品一区二区夜色| 无码国产69精品久久久久网站| aa级大片欧美| 国产成人免费观看网站| 中文字幕亚洲不卡| 91精品国产高潮对白| 亚洲一区免费视频| 欧美激情黑白配| 欧美精品一卡二卡| 丰满人妻一区二区三区无码av| 国产亚洲精品久久久久久| 日本高清中文字幕在线| 色久欧美在线视频观看| 国产黄大片在线观看画质优化| 欧美大奶子在线| 国产韩日精品| 国产伦精品一区二区三区视频黑人| 国产精品1luya在线播放| 亚洲激情啪啪| 天天射天天综合网| 国产l精品国产亚洲区久久| 另类小说一区二区三区| www.日本高清| 亚洲成人直播| 日本精品一区二区三区四区| 精品一区二区在线播放| 国产精品日日摸夜夜爽| 91在线精品一区二区三区| 日本妇女毛茸茸| 色婷婷综合激情| 国产三区在线播放| 精品日产乱码久久久久久仙踪林| eeuss一区二区三区| 久久99影视| 亚洲自拍另类欧美丝袜| 国产极品模特精品一二| 水蜜桃亚洲一二三四在线| 日韩福利在线视频| 亚洲精品国产a| 国模私拍一区二区| 亚洲第一精品夜夜躁人人爽| caoporn免费在线| 国产精品成人免费视频| 999久久精品| 一区精品在线| 欧美亚洲一级| www.四虎精品| 国产午夜精品一区二区三区视频 | 日本免费一区二区三区视频| 欧美一区二区三区四区在线观看地址| 久久久久久久久久久久久久久久久久| 亚洲精品一二三四五区| 99综合电影在线视频| 国产一级片久久| 欧美极品aⅴ影院| www.99re7| 91精品国产综合久久福利| 欧洲免费在线视频| 久久久久久久久久久成人| 久久国产精品美女| 亚洲一区二区三区加勒比| 久久精品91| 日批在线观看视频| 黄网动漫久久久| 无码精品人妻一区二区| 国产视频一区在线| h片在线观看视频免费免费| 97se国产在线视频| 亚洲无吗在线| 色悠悠在线视频| 亚洲国产精品久久不卡毛片| 亚洲精品国产av| 日韩在线视频网站| 欧美a视频在线| 日韩欧美精品一区二区| 日韩1区2区3区| 深爱五月激情网| 午夜精品成人在线视频| 手机av在线免费观看| 69久久夜色精品国产69| 免费视频一区三区| 成人在线观看a| 亚洲欧洲性图库| 国产三级漂亮女教师| 久久久久国产精品www| 国产精品久久久久av蜜臀| 91传媒免费视频| 精品一区二区三区免费| 亚洲av鲁丝一区二区三区| 亚洲成人在线网| 中文不卡1区2区3区| 天天好比中文综合网| 久草中文综合在线| 久久久夜色精品| 日韩成人中文字幕| 新片速递亚洲合集欧美合集| 欧美在线一二三区| 日日嗨av一区二区三区四区| 2018天天弄| 亚洲国产三级网| 欧美黄页免费| 日b视频免费观看| 久久免费的精品国产v∧| 中文字幕 欧美激情| 久久精品国产视频| 粉嫩一区二区三区四区公司1| 欧洲精品视频在线| 久久综合99re88久久爱| 亚洲综合精品国产一区二区三区| 久久久久www| 国产精品欧美大片|