精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何分析GPT4作為裁判自動(dòng)化評(píng)測(cè)其他大模型的效果

人工智能
實(shí)際上,LLM-as-a-judge提供了兩個(gè)關(guān)鍵的好處:可擴(kuò)展性和可解釋性,可以減少了對(duì)人類(lèi)參與的需求,實(shí)現(xiàn)了可擴(kuò)展的基準(zhǔn)和快速迭代。此外,LLM充當(dāng)裁判不僅提供分?jǐn)?shù)還提供解釋?zhuān)顾麄兊妮敵隹梢越忉尅?/div>

在當(dāng)前大模型領(lǐng)域,最為普遍或者最為認(rèn)可的評(píng)估方式就是使用參數(shù)更大或者GPT模型作為評(píng)估基準(zhǔn),用于評(píng)估其他的大模型,以滿(mǎn)足自動(dòng)化評(píng)測(cè)的目標(biāo)。

但是即使是使用GPT4等模型進(jìn)行打分,也存在著各種問(wèn)題,比如,使用GPT對(duì)兩個(gè)候選結(jié)果進(jìn)行打分時(shí),如果出現(xiàn)交換問(wèn)題次序就可能產(chǎn)生相互沖突的結(jié)果,即:GPT模型評(píng)測(cè)時(shí)可能會(huì)偏向于某個(gè)特定位置的回答。

在文章《Judging LLM-as-a-judge with MT-Bench and Chatbot Arena》提出了3種LLM-as-a-judge的實(shí)現(xiàn)方式,它們可以獨(dú)立或組合實(shí)施:

1)成對(duì)比較(pairwise comparison)

成對(duì)比較的思想是采用下圖的prompt,使用評(píng)估LLM的能力,針對(duì)問(wèn)題和給出的不同答案,來(lái)確定哪個(gè)答案更為合適或者宣布一個(gè)平局。

這種方案實(shí)際上就是內(nèi)容理解的一種綜合應(yīng)用,也是當(dāng)前內(nèi)容生成的主要研究方向之一。

圖片圖片

2)單一答案的評(píng)分(single answer grading)

單一答案評(píng)分思想在于:是讓LLM評(píng)委直接給一個(gè)答案打分單一答案。這種方案實(shí)際上在評(píng)測(cè)集的使用中非常適用,比如評(píng)估測(cè)試集的毒性,或者生成內(nèi)容與問(wèn)題的相關(guān)性等等。

圖片圖片

3)參考資料指導(dǎo)下的評(píng)分(Reference-guided grading)

參考資料指導(dǎo)下的評(píng)分的思想是,在某些情況下,提供一個(gè)可參考解決方案,這個(gè)方案的提供對(duì)于評(píng)價(jià)體系可能是有益的,主要是給出一個(gè)評(píng)分的樣例。

實(shí)際上,在吳恩達(dá)老師的prompt指導(dǎo)中也提到了類(lèi)似的能力,也就是通過(guò)示例提升LLM的生成效果。

prompt書(shū)寫(xiě)最重要的原則就是詳細(xì)明確,其中涉及四個(gè)策略: 

1)合理使用分隔符 

2)確定輸出格式要求,如JSON或者HTML 

3)使用GPT對(duì)執(zhí)行的必要條件進(jìn)行校驗(yàn),類(lèi)似于開(kāi)發(fā)過(guò)程中的參數(shù)校驗(yàn) 

4)給出一定的示例讓GPT按照用戶(hù)的需求進(jìn)行輸出

圖片圖片

可以看到這些方法,本質(zhì)上都是基于prompt在工作,也存在不同的問(wèn)題,例如:

對(duì)于pairwise comparison的評(píng)價(jià)數(shù)量會(huì)猛增,當(dāng)待評(píng)估數(shù)量增加時(shí),pairwise comparison可能缺乏可擴(kuò)展性;

單一答案評(píng)分可能無(wú)法辨別特定對(duì)子之間的細(xì)微差別,而且其結(jié)果可能變得不穩(wěn)定,因?yàn)槿绻门心P桶l(fā)生變化,絕對(duì)分?jǐn)?shù)可能比pairwise comparison結(jié)果波動(dòng)更大。

更進(jìn)一步的,以上的方式都對(duì)充當(dāng)評(píng)委的大模型本身提出了很高的要求。

實(shí)際上,LLM-as-a-judge提供了兩個(gè)關(guān)鍵的好處:可擴(kuò)展性和可解釋性,可以減少了對(duì)人類(lèi)參與的需求,實(shí)現(xiàn)了可擴(kuò)展的基準(zhǔn)和快速迭代。此外,LLM充當(dāng)裁判不僅提供分?jǐn)?shù)還提供解釋?zhuān)顾麄兊妮敵隹梢越忉尅?/p>

那么,其工作的基本原理是什么呢?

早期的工作工作《Large Language Models are not Fair Evaluators》(https://arxiv.org/pdf/2305.17926v1.pdf)表明,大型語(yǔ)言模型(如GPT-4)評(píng)估不同模型表現(xiàn)時(shí)存在系統(tǒng)性偏見(jiàn),通過(guò)改變不同模型的答案在評(píng)價(jià)模版中的順序,可以輕松篡改它們的質(zhì)量排名,從而扭曲評(píng)估結(jié)果。如下圖所示:

圖片圖片

《Judging LLM-as-a-judge with MT-Bench and Chatbot Arena》這一工作則更進(jìn)一步地分成了Position bias位置偏見(jiàn)、Verbosity bias啰嗦性偏見(jiàn)、elf-enhancement bias自我增強(qiáng)的偏見(jiàn)以及Limited capability in grading math and reasoning questions對(duì)數(shù)學(xué)和推理問(wèn)題的評(píng)分能力有限四個(gè)方面,具體如下:

1)Position bias,位置偏見(jiàn)

與上一個(gè)工作類(lèi)似,該工作也發(fā)現(xiàn),GPT4表現(xiàn)出傾向于某些位置上的結(jié)果,比如a放在b前,a的得分會(huì)更高。

圖10顯示了一個(gè)位置偏差的例子。當(dāng)問(wèn)答助理A被放在第一個(gè)位置時(shí),GPT-4認(rèn)為A更好,但當(dāng)我們交換A和B的位置時(shí),它的判決就會(huì)改變。

圖片圖片

此外,為了分析位置上的具體偏見(jiàn),通過(guò)調(diào)用兩次GPT-3.5,并設(shè)置溫度為0.7(保證多樣性),在MT-bench中為每個(gè)第一輪問(wèn)題構(gòu)建兩個(gè)類(lèi)似的答案,然后使用兩個(gè)不同的提示語(yǔ)嘗試三個(gè)LLM:"default "表示默認(rèn)提示,"rename "是對(duì)默認(rèn)提示中的助手進(jìn)行重命名,以查看偏見(jiàn)是在位置還是名字上。

如下表2所示,所有模型都表現(xiàn)出強(qiáng)烈的位置偏見(jiàn)。大多數(shù)LLM評(píng)委偏愛(ài)第一個(gè)位置。有趣的是,Claude-v1也表現(xiàn)出名字上的偏向,這使得它偏向于 "助理A",這一點(diǎn)在 "重命名"提示中得到了說(shuō)明。而位置偏差可能是非常顯著的,只有GPT-4在超過(guò)60%的情況下輸出一致的結(jié)果。

圖片圖片

不過(guò),工作中也提到,這個(gè)測(cè)試是具有挑戰(zhàn)性的,因?yàn)榇鸢甘欠浅O嗨频模袝r(shí)甚至對(duì)人類(lèi)來(lái)說(shuō)是無(wú)法區(qū)分的,位置偏差在某些情況下不太突出。至于這種偏差的起源,懷疑它可能源于訓(xùn)練數(shù)據(jù)或Transformer從左到右的固有結(jié)構(gòu)。

2)Verbosity bias,啰嗦性偏見(jiàn)

啰嗦性偏見(jiàn),指的是GPT4偏愛(ài)較長(zhǎng)的、啰嗦的回答,即使不如較短的回答清晰、高質(zhì)量或準(zhǔn)確。

那么,這個(gè)是怎么發(fā)現(xiàn)的?

該工作使用MT-bench的模型答案設(shè)計(jì)了一個(gè) "重復(fù)列表 "攻擊。

具體的,首先從MT-bench中選擇了23個(gè)包含編號(hào)列表的示范答案,然后要求GPT-4在不增加任何新信息的情況下重寫(xiě)清單,并將重寫(xiě)后的新清單插入到原始清單的開(kāi)頭,從而使其變得不必要的冗長(zhǎng)。

例如,如果原始回答包含5個(gè)項(xiàng)目,那么新的回應(yīng)將包含10個(gè)項(xiàng)目,但前5個(gè)項(xiàng)目是由原來(lái)的5個(gè)項(xiàng)目改寫(xiě)的。

圖11展示了一個(gè)"重復(fù)列表 "攻擊的例子,除了兩個(gè)重新措辭的片段(以紅色標(biāo)示)之外,助理A的答案與助理B完全相同,如果LLM法官認(rèn)為新的回答比舊的回答好,那么定義該攻擊是成功的。

圖片圖片

現(xiàn)在我們來(lái)看測(cè)試結(jié)果,表3顯示了在這種攻擊下LLM法官的失敗率,表明所有的LLM都可能容易出現(xiàn)言語(yǔ)偏差,盡管GPT-4的防御效果明顯好于其他。

圖片圖片

作為校準(zhǔn)評(píng)估,該工作發(fā)現(xiàn)LLM評(píng)委能夠正確判斷相同的答案,大模型總是對(duì)兩個(gè)相同的答案返回一個(gè)平局,但不能通過(guò)更高級(jí)的 "重復(fù)列表 "攻擊。

也可以看到,GPT-3.5和Claude-v1都顯示出對(duì)較長(zhǎng)和重復(fù)的答案的動(dòng)詞性偏見(jiàn),只有GPT-4成功地檢測(cè)到這種攻擊。

3)Self-enhancement bias,自我增強(qiáng)的偏見(jiàn)

自我增強(qiáng)的偏見(jiàn),指的是GPT4可能偏愛(ài)自己產(chǎn)生的答案的效果,誰(shuí)跟它更接近,他就給誰(shuí)打高分。

該工作從統(tǒng)計(jì)學(xué)的角度來(lái)研究這種影響,下圖3(b)顯示了在不同的LLM評(píng)委和人類(lèi)的情況下,六個(gè)模型的獲勝率(不含平局)。

圖片圖片

可以看到,與人類(lèi)相比,確實(shí)觀(guān)察到一些大模型偏愛(ài)某些模型。例如:

GPT-4對(duì)自己有利,勝率高出10%;Claude-v1對(duì)自己有利,勝率高出25%。此外,他們也青睞其他模型,但GPT-3.5并不青睞自己。

不過(guò),需要坦白的是,由于數(shù)據(jù)有限且差異較小,這些研究無(wú)法確定這些模型是否表現(xiàn)出自我增強(qiáng)的偏見(jiàn),而且進(jìn)行對(duì)照研究是具有挑戰(zhàn)性的,因?yàn)椴荒茌p易地重新措辭以適應(yīng)另一個(gè)模型的風(fēng)格而不改變數(shù)據(jù)質(zhì)量本身。

4)Limited capability in grading math and reasoning questions,對(duì)數(shù)學(xué)和推理問(wèn)題的評(píng)分能力有限

這個(gè)是很自然的,讓一群小學(xué)生來(lái)評(píng)價(jià)高中生的表現(xiàn)是一件很扯淡的事情。我們都知道,GPT4的數(shù)學(xué)和推理能力有限,這導(dǎo)致它無(wú)法對(duì)這類(lèi)問(wèn)題進(jìn)行評(píng)分,因?yàn)樗麄兺恢勒_答案。

如圖12所示,在默認(rèn)的提示下,GPT-4顯示出對(duì)數(shù)學(xué)問(wèn)題進(jìn)行評(píng)分的有限能力。盡管能夠回答問(wèn)題本身,但它的判斷受到了給定答案的影響,導(dǎo)致了黃色顯示的算術(shù)錯(cuò)誤。

圖片圖片

又如,圖13顯示了GPT-4對(duì)推理題評(píng)分能力有限的一個(gè)例子。盡管GPT-4知道如何解決這個(gè)問(wèn)題(如果分開(kāi)問(wèn)的話(huà)),但它做出了錯(cuò)誤的判斷,說(shuō)兩個(gè)助手的錯(cuò)誤答案都是正確的。

圖片圖片

上面主要針對(duì)GPT4的一些評(píng)判誤區(qū)或者說(shuō)影響最終評(píng)判結(jié)果的原因和背后原理,在真實(shí)使用場(chǎng)景中,如果發(fā)現(xiàn)結(jié)果牽強(qiáng)人意或者一直不符合預(yù)期,可能也和這些原因相關(guān),可以考慮是否需要做一定修改。

本文主要來(lái)自于http://lechangxia.cc/gpt4/411.html相關(guān)的內(nèi)容,我也做了一定的修改。

責(zé)任編輯:武曉燕 來(lái)源: 陸隊(duì)長(zhǎng)
相關(guān)推薦

2023-08-02 08:44:33

人工智能Kaggle科研繪圖

2024-02-27 11:45:59

2023-04-20 14:43:38

Linux模型GPT4

2023-05-09 15:41:03

2024-06-11 09:20:48

2025-03-12 14:49:29

2023-05-08 15:36:50

模型AI

2023-03-16 10:38:37

GPT4ChatGPT

2024-04-08 10:12:20

GPT4AgentAI

2021-07-13 17:38:49

算法語(yǔ)言模型GPT-4

2025-03-07 08:41:50

2025-11-11 02:11:00

大模型自動(dòng)化標(biāo)注AI

2023-08-14 17:38:58

百度文心一言大模型評(píng)測(cè)

2024-03-14 11:55:33

AI訓(xùn)練

2023-04-04 08:01:35

2023-07-05 09:57:11

2021-07-20 12:21:20

自動(dòng)化威脅瑞數(shù)信息

2024-03-05 09:16:32

AI模型GPT-4

2023-08-17 08:00:00

2023-03-16 10:00:56

GPT-4OpenAI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产绿帽一区二区三区| 少妇精品一区二区三区| 黄色av免费在线观看| 男女激情视频一区| 日韩一中文字幕| 天天色天天干天天色| 色婷婷视频在线观看| av激情亚洲男人天堂| 日韩成人一级| 成人高清伦理免费影院在线观看| 97视频在线观看免费| 一区二区精品免费| 中文字幕综合| 午夜精品一区二区三区电影天堂 | 亚洲激情在线观看| 欧美黄色一级片视频| 中文字幕在线播放| www.久久久久久久久| 国产精品第一第二| 男女免费视频网站| 久久99国内| 欧美一级高清大全免费观看| 99久久久无码国产精品6| 成人黄色网址| 国产丝袜欧美中文另类| 97欧洲一区二区精品免费| 国产又黄又爽又色| 一区二区蜜桃| 亚洲美女久久久| 精产国品一二三区| 欧美日韩五码| 亚洲一区在线看| 一区高清视频| 国产在线观看免费网站| 国产丶欧美丶日本不卡视频| 国产成人jvid在线播放| 日本三级视频在线| 久久久精品免费看| 2022成人影院| 亚洲综合男人的天堂| 亚洲一区综合| 亚洲国产精品久久久久爰性色| 日韩精品电影在线| 国产91对白在线播放| 特级片在线观看| 99久久久国产精品美女| 亚洲色图综合久久| 亚洲av成人无码一二三在线观看| 99热这里有精品| 欧美日韩精品电影| 在线视频日韩一区| 深夜成人在线| 五月天欧美精品| 亚洲色成人www永久在线观看| 日本精品一区二区三区在线播放| 久久久久久久综合日本| 久久精品成人一区二区三区蜜臀| 成人av无码一区二区三区| 另类小说视频一区二区| 国产精品久久电影观看| 亚洲中文字幕无码爆乳av| av电影在线观看| 99a精品视频在线观看| 欧美乱熟臀69xxxxxx| 国产精品天天av精麻传媒| 麻豆视频在线看| 欧美日韩国产黄| 成年人视频网站免费| av片在线观看永久免费| 综合久久一区二区三区| 日本一区美女| 懂色av中文在线| 国产欧美视频一区二区三区| 日本精品一区| 天天操天天干天天舔| 不卡影院免费观看| 国产精品久久久久久久久久久久午夜片 | 久久久免费高清视频| 亚洲国产99| 成人一二三区视频| 欧美大胆在线视频| 精品欧美一区二区久久久久| 在线精品国产| 欧美黑人一区二区三区| 久久免费小视频| av不卡在线看| 国产精品成人播放| 亚洲网站在线免费观看| 六月丁香综合在线视频| 成人午夜在线视频一区| 亚洲第一页视频| 26uuu色噜噜精品一区| 日韩av电影免费在线| 免费成人av电影| 成人欧美一区二区三区小说| 日本一本中文字幕| 亚洲三级欧美| 精品国产91乱高清在线观看 | 美国黄色一级毛片| 成人一区二区| 久久99精品视频一区97| 一区二区三区福利视频| 男女性色大片免费观看一区二区| 成人在线激情视频| 蜜桃视频污在线观看| 久久精品人人做人人综合| 亚洲图色在线| 超碰成人av| 欧美日韩高清在线| 无码国产精品一区二区免费式直播| 伊人春色之综合网| 久久精品国产亚洲精品2020| 日韩欧美高清在线观看| 水蜜桃久久夜色精品一区的特点| 91色在线观看| 青青青草原在线| 亚洲欧美日韩中文播放| 久久久久久香蕉| 日韩精品中文字幕一区二区 | 国产在线观看黄| 一区二区三区精品久久久| 亚洲一区二区三区在线播放| 中文字幕不卡每日更新1区2区| 色呦呦在线观看视频| 在线视频一区二区免费| 五月天视频在线观看| 亚洲区小说区图片区qvod按摩| 久久亚洲精品中文字幕冲田杏梨| 日本黄色一级视频| 激情五月激情综合网| 玖玖玖精品中文字幕| www视频在线看| 欧美日韩中文字幕一区二区| 精品人妻二区中文字幕| 日韩精品久久| 国产91精品黑色丝袜高跟鞋 | 91精品国产综合久久久蜜臀图片| 中文字幕 日本| 中文视频一区| 国产精品视频自拍| 五月天婷婷在线观看| 一区二区三区四区不卡视频| 日本不卡一区二区在线观看| 九九热爱视频精品视频| 久久久久久欧美| av手机免费看| 中文字幕亚洲电影| av免费网站观看| 先锋影音国产精品| 久久全球大尺度高清视频| 国产高清精品软件丝瓜软件| 国产欧美一区二区三区鸳鸯浴 | 成人乱码一区二区三区av| 亚洲成av人电影| 日韩欧美国产一区在线观看| 99国产超薄丝袜足j在线观看 | 日本视频中文字幕一区二区三区| 国产精选一区二区| 色婷婷视频在线观看| 欧美一区二区三区色| 全网免费在线播放视频入口| 国产在线国偷精品产拍免费yy| 亚洲高清在线观看一区| 成人日韩在线观看| 综合136福利视频在线| 中文字幕精品一区二| 欧美国产欧美亚州国产日韩mv天天看完整 | www一区二区三区| 夜夜嗨av一区二区三区免费区| 久久久精品毛片| 国产蜜臀97一区二区三区| 成人3d动漫一区二区三区| 精品亚洲成人| 国产精品中文在线| 日本暖暖在线视频| 日韩一本二本av| 国模视频一区二区| 日本一级黄色大片| 99久久国产综合精品麻豆| 日韩在线观看a| 麻豆一区一区三区四区| 欧美成人午夜激情视频| 黑人精品一区二区三区| 欧美日韩在线另类| 少妇无套高潮一二三区| 久久精品99国产精品| 久久久天堂国产精品| 加勒比色老久久爱综合网| 欧美亚州一区二区三区| 香蕉视频在线播放| 欧美一级高清片在线观看| 91蜜桃视频在线观看| 91网站黄www| 中文字幕国内自拍| 欧美韩国一区| 精品国产乱码久久久久久88av | 精品系列免费在线观看| 日韩视频一二三| 色老板在线视频一区二区| 国产精品自拍网| 国产亚av手机在线观看| 亚洲图片在线综合| a天堂在线观看视频| 都市激情亚洲色图| 国产免费久久久久| 99国产精品久久久久久久久久久| 污视频网站观看| 精品91在线| 亚洲精品一区二区三区四区五区| 我要色综合中文字幕| 久久久久成人精品| 成人亚洲综合天堂| 精品国产污网站| 日韩三级小视频| 精品人人视频| 国产欧美精品在线观看| 佐山爱在线视频| 国产精品日韩欧美一区| 视频一区二区视频| 欧美人与物videos另类xxxxx| 成人午夜小视频| 丁香影院在线| 色综合亚洲精品激情狠狠| 天堂在线中文网| 制服丝袜国产精品| 日韩视频中文字幕在线观看| 国产欧美日韩三区| 亚洲熟女乱综合一区二区三区| 麻豆专区一区二区三区四区五区| 一区二区视频在线观看| 精品福利一区| 亚洲一区二区三区sesese| 3d性欧美动漫精品xxxx软件| 欧美在线视频在线播放完整版免费观看| 免费在线午夜视频| 亚洲色图色老头| 四虎影院在线播放| 亚洲精品成人网| 亚洲精品成av人片天堂无码| 69p69国产精品| 麻豆成人免费视频| 色综合久久久久综合体| 日韩精品一区二区三区国语自制| 亚洲激情六月丁香| 免费网站看av| 一区二区三区欧美激情| 日韩精品一区二区亚洲av性色| 久久九九99视频| av黄色在线免费观看| 92国产精品观看| 99re这里只有| 粉嫩aⅴ一区二区三区四区五区| 91福利视频免费观看| 国产99久久久久久免费看农村| 老司机久久精品| 黄色精品一二区| 在线一区二区不卡| 国产69精品久久777的优势| 国产精品日日摸夜夜爽| 粉嫩aⅴ一区二区三区四区| www.国产福利| 国产精品一区专区| 国产精品嫩草69影院| 久久99最新地址| 亚洲丝袜在线观看| 国产成人免费视频网站| 国产吃瓜黑料一区二区| 99精品黄色片免费大全| 亚洲av片不卡无码久久| 久久欧美一区二区| 国产一区av在线| 国产高清免费观看| 日韩欧美国产成人一区二区| a天堂在线视频| 日韩精品一区二区三区第95| 日本韩国精品一区二区| 亚洲性xxxx| 噜噜噜噜噜在线视频| 日韩视频中文字幕| 日本片在线看| 777777777亚洲妇女| 国产一区二区主播在线| 亚洲最大成人免费视频| 91国内精品| 日韩久久久久久久| 51精产品一区一区三区| 国产成人艳妇aa视频在线 | 国内精品自线一区二区三区视频| 日韩av福利在线观看| 久久综合资源网| 99自拍视频在线| 亚洲高清在线视频| 亚洲精品国产精品国自产网站按摩| 欧美三级一区二区| 性网爆门事件集合av| 精品美女一区二区| 国产黄色片在线播放| 欧美成人精品一区| 三级中文字幕在线观看| 亚洲aa在线观看| 日韩成人一级| 热这里只有精品| 日韩在线卡一卡二| 人妻巨大乳一二三区| 久久嫩草精品久久久久| 992在线观看| 亚洲国产精品久久不卡毛片| 波多野结衣高清在线| 日韩欧美的一区二区| 国产在线视频福利| 欧美激情精品久久久| 波多野一区二区| 亚洲一区亚洲二区| 欧美裸体在线版观看完整版| 五月天男人天堂| 美腿丝袜亚洲色图| 在线观看成人动漫| 亚洲欧洲www| 成人一二三四区| 亚洲激情视频网| 视频在线观看入口黄最新永久免费国产| 欧美亚洲国产视频| 日韩在线观看中文字幕| 亚洲欧洲中文天堂| 一级片中文字幕| 91精品国产综合久久精品图片| 搞黄视频免费在线观看| 久久久久久伊人| 国产精品国产亚洲精品| 亚洲精品成人久久久998| 中日韩男男gay无套| 日韩不卡的av| 亚洲黄色免费网站| 亚洲无码精品在线播放| 亚洲欧美国产精品久久久久久久| 国产福利视频在线观看| 国产精品高潮视频| 日韩三区视频| 男人用嘴添女人下身免费视频| 国产一二三精品| 国产一区在线观看免费| 在线免费一区三区| 三级无遮挡在线观看| 欧美疯狂做受xxxx高潮| 国产91在线播放精品| 日韩影院一区| 天堂在线一区二区| 大又大又粗又硬又爽少妇毛片| 亚洲国产美国国产综合一区二区| 国产一区二区网站| 久久影院资源网| 一区二区三区日本视频| 欧美激情视频一区二区三区| 久久国产精品久久久久久电车| 野花社区视频在线观看| 性欧美大战久久久久久久久| 日本黄色大片视频| 久久久久一本一区二区青青蜜月| 色8久久久久| av不卡在线免费观看| 精品制服美女久久| 成年人av电影| 欧美一区二区三区小说| 日本高清视频在线观看| 亚洲最大成人网色| 亚洲二区视频| 在线播放av网址| 日韩欧美在线免费| 免费黄网站在线观看| 国产一区二区丝袜| 国产精品二区不卡| 亚洲图片 自拍偷拍| 一区二区日韩电影| 免费看黄色一级视频| 91大神福利视频在线| 精品久久综合| 日本在线播放一区二区| wwww国产精品欧美| 岳乳丰满一区二区三区| 日韩一级裸体免费视频| 国产中文欧美日韩在线| 国产精品无码免费专区午夜| 本田岬高潮一区二区三区| 狠狠人妻久久久久久综合| 一区二区在线视频| 精品国产一区二区三区2021| a√天堂在线观看| 国产视频一区二区在线观看| 日韩不卡高清视频| 九九久久久久久久久激情| 欧美绝顶高潮抽搐喷水合集| 粉色视频免费看| 亚洲国产综合在线| 你懂的免费在线观看视频网站| 成人久久精品视频| 在线播放日韩| 免费看黄色的视频| 日韩欧美不卡在线观看视频| 男人av在线播放| 最新日韩中文字幕|