精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)

發(fā)布于 2024-3-27 15:28
瀏覽
0收藏

多輪對(duì)話中大語言模型在做出正確判斷后,如果面對(duì)追問中的質(zhì)疑、否定、誤導(dǎo)等干擾它還能堅(jiān)持先前的正確判斷嗎?

最近來自南京理工大學(xué)(NJUST)的研究者們發(fā)現(xiàn)大語言模型(LLMs)在面對(duì)追問時(shí)經(jīng)常會(huì)在其判斷上動(dòng)搖,即使原始判斷是正確的。這種判斷的不一致性為生成可靠回應(yīng)和建立用戶信任帶來了重大挑戰(zhàn)。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

論文標(biāo)題:

Ask Again, Then Fail: Large Language Models' Vacillations in Judgement

論文地址:

??https://arxiv.org/abs/2310.02174??

項(xiàng)目網(wǎng)站:

??https://github.com/NUSTM/LLMs-Waver-In-Judgements??

數(shù)據(jù)集地址:

??https://huggingface.co/datasets/NUSTM/judgement-consistency-preference-data??


生成式對(duì)話大型語言模型(LLMs)如 ChatGPT,被認(rèn)為是最新的技術(shù)突破,已逐步融入人們的日常生活并應(yīng)用于各個(gè)領(lǐng)域。盡管它們?cè)谏蓪?duì)用戶詢問的相關(guān)回應(yīng)方面具有優(yōu)越能力,研究者們發(fā)現(xiàn),當(dāng)用戶繼續(xù)與模型對(duì)話并對(duì)它的判斷表示懷疑或提出不同意見時(shí),它們往往開始在判斷上出現(xiàn)動(dòng)搖。這導(dǎo)致模型的回應(yīng)與之前的發(fā)生顯著偏離,即使模型初始的判斷是準(zhǔn)確的。


研究者們將此問題稱為模型的“判斷一致性問題”,它涉及到模型在具有固定答案的客觀問題上的判斷搖擺。這個(gè)問題引發(fā)了對(duì)這些 LLMs 驅(qū)動(dòng)的應(yīng)用的安全性、可靠性和信任度的關(guān)注。


值得強(qiáng)調(diào)的是,目前對(duì)這個(gè)問題的關(guān)注程度仍然不足,盡管一些最近的研究已經(jīng)從特定的角度識(shí)別了這個(gè)問題。但研究者們認(rèn)為,關(guān)于這個(gè)問題還有兩個(gè)主要挑戰(zhàn)


(1)如何全面評(píng)估判斷一致性問題并采用適當(dāng)?shù)闹笜?biāo)準(zhǔn)確量化結(jié)果;

(2)如何通過技術(shù)手段緩解這個(gè)問題,無論是對(duì)于開源還是閉源模型。


針對(duì)第一個(gè)挑戰(zhàn),研究者們?cè)O(shè)計(jì)了一個(gè)追問機(jī)制(Follow-up Questioning Mechanism)以及兩個(gè)指標(biāo)(M. 和 M. Rate),以系統(tǒng)地評(píng)估對(duì)話式 LLMs 的判斷一致性。


針對(duì)第二個(gè)挑戰(zhàn),對(duì)于閉源模型,研究者們嘗試了多種提示策略來減輕這一問題;對(duì)于開源模型,研究者們引入了一個(gè)簡(jiǎn)單而有效的框架 Unwavering-FQ,通過合成高質(zhì)量的偏好數(shù)據(jù)來教導(dǎo)語言模型保持其最初正確的判斷,實(shí)驗(yàn)結(jié)果驗(yàn)證了上述緩解方法的有效性。


01 全面評(píng)估 & 深入分析     

受到教育學(xué)中“提問策略”理論的啟發(fā),研究者們?cè)O(shè)計(jì)了一個(gè)追問機(jī)制,如下圖所示。這一思想源于教學(xué)過程,教師通過在學(xué)生回應(yīng)后增加質(zhì)疑或誤導(dǎo)性的提示來延伸對(duì)話,旨在確定他們對(duì)知識(shí)理解的深度。

具體來說,研究者們?yōu)樽穯枡C(jī)制引入三類追問:封閉性、開放性和引導(dǎo)性問題,并將它們組織成兩種形式:直接式和漸進(jìn)式。在初始問答中模型給出正確回應(yīng)后,直接式使用三類追問中的任意一種進(jìn)行后續(xù)追問,類似于教師可能會(huì)在學(xué)生給出正確答案后,通過簡(jiǎn)單的質(zhì)疑、否定或提出不同意見來測(cè)試學(xué)生對(duì)自己的答案是否堅(jiān)定。

相比之下,漸進(jìn)式則是依次使用上述三類問題,類似于教師更有策略地追問以驗(yàn)證學(xué)生的正確回應(yīng)是真正掌握知識(shí)的表現(xiàn)還是偶然。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

研究者們還提出了兩個(gè)度量指標(biāo),用來量化使用追問機(jī)制前后模型判斷一致性的變化。首先,使用準(zhǔn)確率(Accuracy)表示模型在處理某類客觀問題的性能,可以得到使用追問機(jī)制前后模型的準(zhǔn)確率( 和 )。


然后,將 Modification(M.)定義為模型在面對(duì)追問機(jī)制前后的性能之差,即 M.=-,將 Modification Rate(M. Rate)定義為在追問機(jī)制下 Modification 發(fā)生的比率,即 M. Rate=(-)/ ?


結(jié)合上述兩個(gè)指標(biāo),可以較為全面地反映模型的判斷一致性。這是因?yàn)槿绻P驮谔幚砟愁惪陀^問題時(shí)的初始性能就很差,那么 Modification 的最大值就較低。因此,僅使用 Modification 不能準(zhǔn)確地反映出模型的判斷一致性,特別是當(dāng) Modification 的值較小時(shí),需要結(jié)合 Modification Rate 的值才能反映出模型判斷一致性的真實(shí)情況。


研究者們選擇當(dāng)前具有代表性的 ChatGPT 作為主要評(píng)估模型,在涉及算術(shù)、常識(shí)、符號(hào)和知識(shí)推理任務(wù)的 8 個(gè)基準(zhǔn)上進(jìn)行了廣泛實(shí)驗(yàn)。結(jié)果顯示,盡管 ChatGPT 在處理大部分推理問題上表現(xiàn)出不錯(cuò)的性能,但它非常容易在其判斷上動(dòng)搖。下圖展示了 ChatGPT 在面對(duì)追問機(jī)制中兩種追問形式的判斷一致性結(jié)果。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

為了確定通過此機(jī)制引起的大語言模型中判斷一致性下降問題是否是一個(gè)普遍現(xiàn)象,研究者們還評(píng)估了其他 LLMs 面對(duì)追問機(jī)制時(shí)的判斷一致性。


實(shí)驗(yàn)結(jié)果顯示,無論是目前非常先進(jìn)的閉源模型(如目前最強(qiáng)大的 GPT-4 和 PaLM2-Bison),還是最近公開且能力較強(qiáng)的開源模型(如 Vicuna-13B,UltraLM-13B,XwinLM-13B 和 Zephyr-7B),它們的判斷一致性均出現(xiàn)普遍下降,這提示相關(guān)研究者們?cè)诖竽P偷拈_發(fā)和部署時(shí)需要重點(diǎn)關(guān)注和調(diào)查該問題。


此外,研究者們分別從不同的追問提示,采樣溫度,不同追問的語氣強(qiáng)弱等角度進(jìn)行了全面的消融研究,并進(jìn)行了細(xì)致的錯(cuò)誤分析以驗(yàn)證這一問題存在的普遍性。下圖展示了模型面對(duì)不同的追問提示時(shí)判斷一致性的變化。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)


02 緩解方法


除了評(píng)估之外,研究者們進(jìn)一步探索了緩解這一問題的策略。教會(huì)大語言模型堅(jiān)持自己的判斷仍然是一個(gè)充滿挑戰(zhàn)和不確定性的任務(wù)。對(duì)于像 ChatGPT 這樣的閉源模型,研究者們嘗試使用多種提示策略來減輕這一問題,并驗(yàn)證了它們的有效性。


對(duì)于開源模型,研究者們引入了一個(gè)簡(jiǎn)單而有效的框架 Unwavering-FQ,旨在使語言模型能夠在面對(duì)追問時(shí)產(chǎn)生堅(jiān)定的判斷,特別是在保持其初始正確判斷方面。


針對(duì)閉源模型,研究者們嘗試使用 Zero-shot Prompting 和 Few-shot Prompting 緩解該問題。對(duì)于 Zero-shot Prompting,研究者們使用 Zero-shot-CoT(“*Let's think step by step.”)和 EmotionPrompt(“This is very important to my career.”)鼓勵(lì)模型在回答追問時(shí)慎重考慮再給出回復(fù)。


對(duì)于 Few-shot Prompting,研究者們通過從訓(xùn)練集中隨機(jī)選擇 K 個(gè)樣本并人工編寫反映人類思考過程的追問響應(yīng)來構(gòu)建多輪對(duì)話的演示示例,與 ChatGPT 經(jīng)常在后續(xù)回應(yīng)中直接承認(rèn)錯(cuò)誤不同,演示響應(yīng)首先澄清思考過程,然后一步一步重新考慮。


以 “Please wait for a moment. In order to answer your question, I need to take a moment to reconsider. I will now clear my mind of distractions and approach this step by step.*” 作為后續(xù)回應(yīng)的開始,使模型的思維過程與人類的思維過程更緊密地聯(lián)系在一起。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)

針對(duì)開源模型,研究者們提出了一個(gè)基于訓(xùn)練的框架 Unwavering-FQ,如上圖所示,這個(gè)框架涉及三個(gè)步驟:


1. 數(shù)據(jù)準(zhǔn)備(Data Preparation):研究者們收集了一個(gè)用于初始推理問題的數(shù)據(jù)集和一個(gè)用于后續(xù)追問的問題集。前者包含從 18 個(gè)數(shù)據(jù)集的訓(xùn)練集中隨機(jī)抽樣得到的 4.6k 個(gè)樣本,這些數(shù)據(jù)集因其高質(zhì)量、多樣的類型以及在算術(shù)、常識(shí)、符號(hào)和知識(shí)推理方面不同的難度水平而被選中。后者由分為三種類型的問題組成:封閉性、開放性和引導(dǎo)性,每種類型包括五種不同的提示。


極化偏好上下文蒸餾(Polarized Preference Context Distillation):在追問機(jī)制下,模型在一輪追問后可能給出的判斷類型有 True-True,F(xiàn)alse-True,F(xiàn)alse-False 和 True-False。第一個(gè) True 或 False 表示模型在初始問答中判斷的正確性,第二個(gè)表示模型面對(duì)追問時(shí)判斷的正確性。


理想的模型應(yīng)當(dāng)是在給出正確判斷后,面對(duì)追問時(shí)能夠保持其判斷;相反,如果判斷錯(cuò)誤,則應(yīng)識(shí)別并糾正其錯(cuò)誤。因此,研究者們將模型對(duì)后續(xù)干擾響應(yīng)的偏好排名定義為 True-True ? False-True ? False-False ? True-False


由于從更強(qiáng)的語言模型中自然地生成 “chosen” 和 “rejected” 響應(yīng)具有挑戰(zhàn)性,為了在追問場(chǎng)景下構(gòu)造偏好數(shù)據(jù),研究者們引入了一種稱為極化偏好上下文蒸餾的上下文蒸餾技術(shù),用于生成模型學(xué)習(xí)的偏好對(duì)。


具體而言,研究者們首先讓高級(jí)模型對(duì)初始問題生成響應(yīng),然后根據(jù)響應(yīng)的正確性使用不同的上下文提示引導(dǎo)模型向相反方向發(fā)展。若合成偏好優(yōu)先級(jí)高的示范對(duì)話數(shù)據(jù)(chosen demonstration data),目標(biāo)是讓模型在面對(duì)追問后做出正確的判斷。


因此,如果模型在初始問題回答中判斷正確,在后續(xù)追問期間會(huì)添加一個(gè) "Believe yourself." 的提示,以鼓勵(lì)模型堅(jiān)持其正確的判斷;如果模型最初判斷錯(cuò)誤,則會(huì)添加一個(gè) "The correct answer is {Ground_Truth}." 的提示,通過提供正確信息以引導(dǎo)模型做出正確的判斷。


若合成偏好優(yōu)先級(jí)低的示范對(duì)話數(shù)據(jù)(rejected demonstration data),目標(biāo)是讓模型在面對(duì)追問后做出錯(cuò)誤的判斷。因此,如果模型在初始問答中判斷正確,在后續(xù)干擾期間會(huì)添加一個(gè) "The correct answer is {Misleading_Answer}." 的提示,用錯(cuò)誤答案誤導(dǎo)模型。


如果模型最初判斷錯(cuò)誤,則添加一個(gè) "Believe yourself." 的提示,以鼓勵(lì)模型堅(jiān)持其錯(cuò)誤的判斷。這些額外添加的提示是用于指導(dǎo)模型生成所需響應(yīng),在最終數(shù)據(jù)中不會(huì)保留這些額外添加的提示。


考慮到并非所有數(shù)據(jù)都能按預(yù)期合成,研究者們手動(dòng)篩選和過濾了合成的對(duì)話數(shù)據(jù),得到 3.6k 高質(zhì)量的 chosen demonstration data。然后,根據(jù)預(yù)定義的偏好等級(jí),將它們與過濾后的 rejected demonstration data 配對(duì),最終獲得 2.6k 對(duì)偏好數(shù)據(jù)。


偏好優(yōu)化訓(xùn)練(Preference Optimization):研究者們首先使用 chosen demonstration data(即 True-True 和 False-True 對(duì)話數(shù)據(jù))對(duì)模型進(jìn)行監(jiān)督微調(diào)以緩解 DPO 階段的數(shù)據(jù)分布偏移,然后使用偏好對(duì)數(shù)據(jù)通過直接偏好優(yōu)化(DPO)算法對(duì)模型進(jìn)行優(yōu)化。


具體結(jié)果可見下圖,實(shí)驗(yàn)結(jié)果表明 Unwavering-FQ 框架可以將 Vicuna 對(duì)最初正確判斷的修改率平均降低 32%,這表明其在判斷一致性和可靠性方面有顯著的提升。此外,研究者們?cè)?MT-Bench 基準(zhǔn)上評(píng)估發(fā)現(xiàn),該框架不僅沒有損害還能提高模型的通用能力,經(jīng)過 SFT 和 DPO 訓(xùn)練后模型的 MT-Bench score 從 6.17 提升到 6.40。這些結(jié)果肯定了該框架的有效性和適用性。

能否在追問中堅(jiān)持判斷?揭秘大語言模型的判斷一致性挑戰(zhàn)-AI.x社區(qū)


03 總結(jié)?

該研究發(fā)現(xiàn)大語言模型在面對(duì)追問時(shí)經(jīng)常會(huì)在其判斷上動(dòng)搖,即使原始判斷是正確的。這種判斷的不一致性為生成可靠回應(yīng)和建立用戶信任帶來了重大挑戰(zhàn)。


為了全面評(píng)估這個(gè)問題,研究者們引入了一個(gè)追問機(jī)制(Follow-up Questioning Mechanism)以及兩個(gè)指標(biāo)(M. 和 M. Rate)來量化這種不一致性,并通過全面的消融、細(xì)致的錯(cuò)誤分析確認(rèn)了該問題在當(dāng)前大語言模型中普遍存在。


為了緩解這一問題,針對(duì)閉源模型,他們探索了多種提示策略;針對(duì)開源模型,他們提出了一個(gè)基于訓(xùn)練的框架 Unwavering-FQ,通過合成高質(zhì)量的偏好數(shù)據(jù)來教導(dǎo)語言模型保持其最初正確的判斷。實(shí)驗(yàn)結(jié)果驗(yàn)證了該框架的有效性,以及其能提升模型通用能力的能力。


研究者們強(qiáng)調(diào)雖然該工作提出的緩解方法一定程度上緩解了該問題,但由于模型的穩(wěn)定性并非始終如一,仍有廣闊的研究空間待探索。此外,研究者們?cè)趯?shí)驗(yàn)過程中發(fā)現(xiàn)讓模型堅(jiān)持自身判斷與知錯(cuò)就改也是一種權(quán)衡,如何在二者之間取得平衡也許會(huì)成為未來工作的新挑戰(zhàn)。


如想進(jìn)一步了解大語言模型在追問下的判斷一致性評(píng)估結(jié)果、深入分析和緩解方法的設(shè)計(jì)細(xì)節(jié),歡迎閱讀原論文。

?

?本文轉(zhuǎn)自 PaperWeekly ,作者:謝淇名


原文鏈接:??https://mp.weixin.qq.com/s/1c5CN-SGd6_xG3B_IkD3Sw??

標(biāo)簽
已于2024-3-28 09:46:02修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久av高潮av| 欧美性猛交99久久久久99按摩| 97在线免费视频| www日本在线观看| 性国产高清在线观看| 国产精品夜夜嗨| 久久久久久久久久久网站| 成人区人妻精品一区二| 97天天综合网| 久久精品日韩一区二区三区| 国产精品羞羞答答| 中文字幕在线观看2018| 9国产精品午夜| 午夜国产精品影院在线观看| 欧美成人在线免费观看| 日韩精品一区二区三| 日韩极品在线| 欧美在线小视频| 色婷婷777777仙踪林| 人妻少妇精品无码专区| 日韩精品视频网站| 久久视频国产精品免费视频在线| 国产精品91av| 日本综合字幕| 一区二区三区欧美日韩| 免费久久99精品国产自| 91av久久久| 欧美国产高潮xxxx1819| 亚洲精品99久久久久中文字幕| 日韩福利视频在线| 欧洲在线视频| 国产日产欧美一区二区视频| 成人性教育视频在线观看| 国产一级免费av| 精品免费视频| 亚洲第一色在线| 一区二区三区四区毛片| 精精国产xxx在线视频app| 国产精品久久久久一区| 国产欧美亚洲日本| 91在线观看喷潮| 国产一区二区你懂的| 亚洲精品丝袜日韩| 国产伦理在线观看| 综合久久2023| 樱花影视一区二区| 日韩jizzz| 熟妇人妻中文av无码| 奇米影视一区二区三区| 午夜欧美不卡精品aaaaa| 国产美女网站视频| 欧美男gay| 亚洲国产美女久久久久| 国产欧美精品一二三| 99thz桃花论族在线播放| 亚洲人成网站精品片在线观看 | 国产一区二区三区黄| 福利网址在线观看| 精品不卡视频| 精品国内产的精品视频在线观看| 中文字幕在线看高清电影| 亚洲高清999| 欧美精品少妇一区二区三区 | 天堂在线中文| 不卡电影一区二区三区| 91在线免费看片| 91tv国产成人福利| 久久精品国产99久久6| 日本不卡免费高清视频| 亚洲免费激情视频| 亚洲激情网站| 久久国产精彩视频| 永久免费看片直接| 国产高清欧美| 久久久91精品国产| 欧美爱爱免费视频| 欧美日韩激情| 在线电影av不卡网址| 亚洲综合色一区| 久久综合欧美| 国产亚洲精品日韩| 五月天婷婷丁香网| 97久久视频| 精品国模在线视频| 精品亚洲乱码一区二区 | 四虎永久在线精品免费一区二区| 蜜桃视频在线观看视频| 久久久久久影视| 日韩高清dvd| 又爽又大又黄a级毛片在线视频| 国产午夜精品在线观看| 亚洲ai欧洲av| 精精国产xxxx视频在线| 亚洲精品大片www| 精品人妻大屁股白浆无码| 国精产品一区一区三区mba下载| 一区二区免费在线| 精品久久一二三| 免费看av不卡| 91精选在线观看| 丰满人妻一区二区三区大胸| 国偷自产视频一区二区久| 精品在线欧美视频| avhd101老司机| 亚洲国产精品91| 久久免费成人精品视频| 无码人妻黑人中文字幕| 另类成人小视频在线| 亚洲va欧美va国产综合剧情| 空姐吹箫视频大全| 久久久亚洲欧洲日产国码αv| 午夜精品一区二区三区在线观看 | 另类视频在线观看| 国产成人在线播放视频| 美女视频网站久久| 国产激情一区二区三区在线观看| 日韩偷拍自拍| 国产婷婷色一区二区三区四区| 亚洲欧美成人一区| 另类视频在线| 欧美在线你懂的| 麻豆tv在线观看| 国产精品一国产精品| 久久天天躁夜夜躁狠狠躁2022| 国产又色又爽又黄的| 久久国产精品露脸对白| 国产99在线免费| a中文在线播放| 亚洲第一成年网| 国产精品嫩草影院8vv8| 久久成人福利| 久久夜色精品亚洲噜噜国产mv| 国产精品老女人| 国产最新精品免费| 日韩福利影院| 午夜久久中文| 日韩免费性生活视频播放| 久久久久亚洲av无码a片| 欧美日韩三级电影在线| 国产精品视频一区二区三区四| 四季av日韩精品一区| 欧美国产日韩a欧美在线观看 | 中国免费黄色片| 成人精品天堂一区二区三区| 91高清在线免费观看| 国产三级在线观看视频| av资源网一区| 欧美这里只有精品| 国产激情久久| 亚洲人午夜精品免费| 91嫩草|国产丨精品入口| 视频一区二区三区中文字幕| 精品视频在线观看| 懂色av一区| 欧美一区二区三区在| 欧美日韩生活片| 日韩高清在线一区| 欧美一区亚洲二区| 蜜桃av在线| 日韩亚洲欧美中文三级| 国产三级精品三级观看| 日本视频一区二区| 色吧亚洲视频| 欧美自拍电影| 亚洲欧美自拍一区| 少妇久久久久久久| 中文字幕av一区二区三区| 亚洲天堂网一区| 91精品精品| 超碰97在线人人| 国产伦理精品| 亚洲性无码av在线| 国产又大又粗又长| 亚洲精品欧美在线| 私密视频在线观看| 性欧美xxxx大乳国产app| 免费影院在线观看一区| 麻豆精品蜜桃| 久久国产色av| 天天插天天干天天操| 色综合婷婷久久| 人妻互换一区二区激情偷拍| 国产一区二区三区免费播放| 精品人妻少妇一区二区| 天天久久夜夜| 国产成人在线视频| 看黄网站在线观看| 亚洲成年人影院在线| 男人天堂2024| 综合色中文字幕| 免费不卡的av| 日韩在线一二三区| 日韩不卡一二区| 欧美sss在线视频| 国产精品主播视频| 成年人视频免费在线播放| 精品成人一区二区三区| 国产又粗又猛又黄视频| 亚洲精品欧美专区| 成人无码av片在线观看| 国产成人精品一区二区三区网站观看| 日本www在线播放| 亚洲精品中文字幕乱码| 免费成人深夜夜行视频| 日本免费一区二区视频| 国产999精品| 国产在线xxx| www.日本久久久久com.| 视频在线观看你懂的| 欧美电影影音先锋| 中文字幕在线看人| 亚洲精品ww久久久久久p站| 玖玖爱在线观看| 国产成人免费在线观看| 欧美一级黄色影院| 伊人狠狠色j香婷婷综合| 色999五月色| 亚洲理论电影| 国产精品欧美久久| 国产一区二区三区免费观看在线 | 国产大尺度在线观看| 亚洲桃色综合影院| 国产高清自拍一区| 99er精品视频| 国产美女91呻吟求| 高清不卡亚洲| 91wwwcom在线观看| 女人天堂av在线播放| 日韩在线观看免费av| 美女欧美视频在线观看免费 | 91pony九色| 视频一区二区中文字幕| 亚洲色成人一区二区三区小说| 欧美精品一卡| 黄瓜视频免费观看在线观看www | 激情五月六月婷婷| 五月开心六月丁香综合色啪| 日韩不卡av| 国内精品久久久久久久影视简单| 精品一区二区日本| 成人春色在线观看免费网站| av观看久久| 免费一级欧美片在线观看网站| 国产精品男女猛烈高潮激情| 日韩av中字| 国产成人一区二区三区电影| 手机看片久久| 国产精品第一第二| 亚洲综合av一区二区三区| 日本精品视频在线| 成人免费直播| 国产成人精品免费久久久久| 亚洲美女尤物影院| 欧美专区在线播放| 蜜臀国产一区| 国产精品久久久久久久9999| 欧美xx视频| 国产精品你懂得| 欧美国产视频| 亚洲aⅴ日韩av电影在线观看 | 久久激情中文| 成人黄色片视频| 美女诱惑一区二区| 亚洲综合av在线播放| 日本女优在线视频一区二区| 日本中文字幕高清| 韩国欧美一区二区| 亚洲理论中文字幕| 国产91综合网| 最新在线黄色网址| 国产三级三级三级精品8ⅰ区| 女人黄色一级片| 亚洲天堂免费看| 国产亚洲欧美久久久久| 五月婷婷综合在线| 国产91精品看黄网站在线观看| 在线观看日产精品| 国产精品天天操| 精品盗摄一区二区三区| 欧美日韩影视| 色婷婷综合久久久久| 直接在线观看的三级网址| 久久久久久久999| 欧美日韩国产v| 91九色在线免费视频| 女同另类激情重口| 伊人色综合久久天天五月婷| 亚洲视屏一区| 日本激情综合网| 成人精品国产一区二区4080| 三上悠亚影音先锋| 亚洲欧美福利一区二区| 日韩av男人天堂| 欧美日韩亚洲综合在线| www.午夜激情| 亚洲人在线观看| av在线免费网站| 欧洲美女7788成人免费视频| 四虎精品永久免费| 精品久久久久久亚洲| 日韩系列欧美系列| 男女猛烈激情xx00免费视频| 蜜桃久久av一区| 中文字幕天堂网| 国产精品国产自产拍在线| 日本熟妇毛耸耸xxxxxx| 欧美日韩高清一区二区三区| 天天综合天天色| 欧美成人免费va影院高清| 久九九久频精品短视频| 97人人做人人人难人人做| 国产一区二区观看| aa视频在线播放| 国产一区二区在线电影| av电影网站在线观看| 亚洲第一精品在线| 国产内射老熟女aaaa∵| 亚洲日本中文字幕| www.综合| 99在线观看视频网站| 日韩一区自拍| 苍井空浴缸大战猛男120分钟| 成人免费毛片aaaaa**| 青青操在线视频观看| 在线精品视频一区二区三四| 手机看片1024国产| 欧美激情精品久久久久久久变态| a∨色狠狠一区二区三区| 久久精品日产第一区二区三区乱码 | 性欧美疯狂猛交69hd| 在线视频一区二区三区| 爽爽视频在线观看| 69av在线视频| 都市激情久久| www污在线观看| 岛国av在线一区| 妺妺窝人体色www婷婷| 欧美一区二区三区视频| 国产在线高清理伦片a| 国产精品亚洲欧美导航| 成人精品影视| 亚洲成人福利在线观看| 国产日产亚洲精品系列| www.com亚洲| 亚洲毛茸茸少妇高潮呻吟| 美女露胸视频在线观看| 久久久久久久有限公司| 国产亚洲福利| 成人h动漫精品一区| 精品欧美国产一区二区三区| 偷拍精品一区二区三区| 2019中文字幕在线| 女人抽搐喷水高潮国产精品| 国产乱子伦农村叉叉叉| 91天堂素人约啪| 在线观看日本视频| 国产性色av一区二区| 免费高清视频在线一区| 一区二区成人国产精品 | 国产欧美日韩免费看aⅴ视频| 日韩欧美自拍| 99九九99九九九99九他书对| 亚洲私人影院在线观看| 午夜精品久久久久久久99 | 成年人av电影| 欧美精品一区二区三区视频| 蜜桃在线视频| 日本成人三级| 麻豆成人综合网| 深夜福利影院在线观看| 精品国产乱码久久久久久夜甘婷婷| 96av在线| 日韩精品第一页| 久久99久久精品欧美| 欧美精品色哟哟| 亚洲福利视频免费观看| 欧美天堂视频| 浴室偷拍美女洗澡456在线| 国产**成人网毛片九色 | 成人片在线看| 国产精品香蕉视屏| 久久一区欧美| 日韩欧美国产成人精品免费| 欧美大片在线观看一区二区| 高清视频在线观看三级| 先锋影音一区二区三区| 国产精品亚洲第一区在线暖暖韩国| 国产精品第一页在线观看| 国产婷婷色一区二区三区| 色综合久久久无码中文字幕波多| 亚洲一区二区三区不卡国产欧美| 亚洲日本中文字幕在线| 国产精品三级美女白浆呻吟| 欧美在线亚洲| 丰满少妇一区二区| 7777女厕盗摄久久久| 校园春色亚洲| 7777在线视频| 久久综合久久综合久久综合| 91国偷自产中文字幕久久|