精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型榜單還能信嗎?一個假模型就能登頂排行榜

發布于 2024-10-14 15:07
瀏覽
0收藏

1. 緣起

目前評測大語言模型主要有兩種方法:

? 通過人類投票來進行評估,比如:Chatbot Arena,但是這種往往需要花費較長的時間。

? 為了降低人類標注的依賴,還有另外一種自動化的LLM基準測試。這種方法成本低、容易擴展。

自動化基準測試也成為了眾多模型的熱門選擇,而且測試中的高勝率往往能帶來顯著的宣傳優勢。

但是,自動化基準測試的勝率可能會受到長度和風格偏見的影響。雖然大多數這種影響是來自訓練數據集,但是這也導致存在操縱勝率的可能性。

在本篇論文里,作者通過提交一個“假模型”來對自動化測試進行壓力測試。

2. 作弊策略(假模型策略)

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

從上圖可以看到 suffix策略 (指只使用對抗性后綴策略,不對輸入指令作出有實質內容的回應)情況下,并沒有實質的作弊效果。所以,作者提出了新的作弊策略:

? (1)構建結構化的回答來迷惑LLM自動標注器從而達到作弊效果

? (2)進行基于token級別的隨機搜索來設計對抗性前綴

2.1 結構化作弊響應

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

如上圖,結構化作弊響應策略是指把原來的評判提示詞進行修改,本質上是一種提示詞注入。

例如,在AlpacaEval 2.0中,當提交的目標模型(待評測性能的大模型)的響應位于最后時,標注器傾向于預測“M”。而當它出現在首位時,標注器則傾向于預測“m”:

-(1)用一個虛構的指令-輸出三元組替代了原始的指令-輸出三元組;

-(2)默認位置時,利用標注器模型對最后輸出的普遍偏好,引導其預測“M”;

-(3)當位置被交換時,它利用覆蓋模型“M”的輸出,導致標注器預測“m”。

正確的AlpacaEval 2.0 提示詞

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

目標為模型M的作弊策略

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

目標為模型m的作弊策略

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

上面舉例的這個結構化回應提示詞在AlpacaEval 2.0上達到了76.8%的LC勝率。

原始勝率(Raw Win Rate): 最直接衡量模型獲勝次數的比例。在自動基準測試中,模型的輸出會被與一組標準或參考輸出進行比較,原始勝率即模型被判定為優于或等于參考輸出的頻率。這種勝率計算方式沒有對輸出的長度或風格進行控制,因此可能受到模型輸出長度的影響,即更長的輸出可能更受青睞。

離散勝率(Discrete Win Rate): 離散勝率是在考慮輸出質量的基礎上,對原始勝率進行的一種調整。在計算離散勝率時,評估系統會將模型的輸出與參考輸出進行細致的比較,并對每個輸出的各個方面(如準確性、相關性、完整性等)進行評分。離散勝率可能會排除那些雖然在總體上被判定為獲勝,但在某些關鍵方面表現不佳的輸出,從而提供一個更加關注輸出質量的獲勝比例。

長度控制勝率(Length-Controlled Win Rate,簡稱LC勝率): LC勝率是為了減少模型輸出長度對評估結果的影響而設計的一種指標。在計算LC勝率時,評估系統會控制模型輸出的長度,確保所有參與比較的輸出在長度上是可比的。這樣可以避免因輸出長度不同而導致的評估偏差,提供一個更加公平的模型性能評估。LC勝率可能會在輸出長度相似的條件下計算模型的獲勝次數,從而更準確地反映模型在處理特定任務時的能力。

2.2 通過隨機搜索(RS)設計對抗性前綴

為了進一步提升結構化回應的效果,引入了一個對抗性前綴,并采用基于GPT-4查詢結果的RS策略來優化它。

為了模擬更具挑戰性的場景假設自動基準的輸入指令是保密的。

開發了一個可轉移的前綴,利用公開可用的指令集來設計。通過在不同指令上聚合損失來優化單個對抗性前綴,確保前綴在不同輸入指令和位置上的影響是普遍的。

采用RS算法來優化對抗性前綴。該算法通過采樣修改并選擇在多個指令上最小化聚合損失的變體來完善前綴。

3. 作弊策略的效果如何?

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

上圖展示了作者的結構化響應作弊策略與其他16個固定響應進行比較的效果。下圖展示了其他16個固定響應內容。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

結果表明:結構化回應作弊做略以最低的對數概率勝出,證明作者的策略在欺騙自動標注智能體方面的高效性。

默認配置中,當目標模型響應放在提示詞第二位時,有較低的損失,表明GPT4對第二位偏好。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

上圖將作弊策略的得分與當前(2024年10月1日之前)頂尖模型的勝率進行對比:在所有基準測試中顯著提升了表現,贏得了最高的勝率和評分,達到了76.8%的LC勝率和59.5%的原始勝率。

經過RS優化后,LC勝率提升至86.5%,原始勝率提高至76.9%。

這些成果與經過驗證的SOTA模型相比有了顯著提升,后者僅達到了57.5%的LC和51.3%的原始勝率。

結合隨機搜索的結構化方法在LC勝率上比經過驗證的SOTA高出29.0個百分點,在原始勝率上高出25.6個百分點。

與社區SOTA相比,在LC上表現更佳(86.5%對78.5%),在原始勝率上相當(76.9%對77.6%)。

由于其簡短,作弊的LC勝率普遍高于原始勝率,這表明AlpacaEval 2.0對長度作弊也不夠健壯。

在Arena-Hard-Auto上,結構化響應作弊策略達到了67.2%的勝率,經過隨機搜索后提升至83.0%。

總之,在各種基準測試中都取得了顯著的增益,超越了現有技術,證明了其在不同基準測試中的高效性,并強化了對更健壯的自動LLM基準測試的需求。

4. 消融實驗

4.1 結構化回應在開源自動標注智能體上有效嗎?

在AlpacaEval 2.0測試指令的子集上,使用不同的無效回應評估log p(winner = NullModel)。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

如上圖,結構化響應作弊策略對Llama-3自動標注智能體的影響很小。在Llama-3-8B-Instruct的情況下,結構化回應并未利用該智能體的位置弱點,因為默認位置和交換位置的對數概率與不同的有說服力回應大致相似。

然而,在Llama-3-70B-Instruct上,在交換設置下觀察到,結構化回應成功降低了對數概率。此外,在位置偏見方面,Llama-3-8B-Instruct顯示出很小的位置偏見,因為默認位置和交換位置的概率相當接近。相比之下,Llama-3-70B-Instruct在交換設置下顯示出明顯的位置偏見,更高的對數概率表明該智能體強烈偏好最后輸出(“M”)。

較大的Llama-3-70B-Instruct智能體的行為更接近更先進的GPT-4,因為它對結構化回應和位置偏見的反應比小型8B智能體更為敏感。這表明模型規模可能增加了對我們作弊技術的敏感性

總的來說,與GPT-4相比,結構化響應作弊策略在Llama-3智能體上的效果要小得多。這種差異的可能解釋是,Llama-3智能體,尤其是較小的8B版本,其遵循指令的能力不如GPT-4強大,使它們對作弊回應的敏感性較低

4.2 隨機搜索對開源自動標注智能體成效顯著嗎?

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

如上表,隨機搜索在Llama-3-8B-Instruct和Llama-3-70B-Instruct等開源自動標注智能體上表現出色。

以Llama-3-8B-Instruct為例,缺少隨機搜索時,結構化回應的LC勝率僅為2.9%,原始勝率為1.4%。而一旦采用隨機搜索,勝率便戲劇性地飆升至95.4%(LC)和86.3%(原始),LC勝率提升了92.5個百分點。

對于Llama-3-70B-Instruct,僅憑結構化回應,LC勝率僅為0.4%,總體勝率為0.2%。但隨機搜索的加入使得這些勝率分別躍升至95.1%(LC)和91.6%(原始),分別提升了94.7和91.4個百分點。

這些數據證明**隨機搜索在提升開源自動標注智能體的作弊成功率方面極為有效,勝率直逼100%**。

4.3 直接針對測試指令進行搜索有用嗎?

也探索了直接作弊策略的效果。直接作弊可以看作是作弊效果的上限指標。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

上表的Test列表示是否是直接作弊。結果表明:直接針對測試指令進行搜索顯著增強了作弊的效果。

對于Llama-3-8B-Instruct模型,結合結構化回應和隨機搜索,但不接觸測試指令,LC勝率達到了95.4%,總體勝率為86.3%。

然而,當對抗性前綴直接針對測試指令進行優化時,LC勝率幾乎達到了完美的99.8%,總體勝率提升至99.4%,分別提升了4.6和13.1個百分點。

同樣地,對于Llama-3-70B-Instruct模型,不接觸測試指令的隨機搜索,LC勝率為95.1%,總體勝率為91.6%。

而一旦利用測試指令,這些比率分別攀升至99.4%(LC)和98.2%(原始),LC勝率提升了約4.3個百分點,總體勝率提升了6.6個百分點。

這些結果表明直接針對測試指令進行搜索帶來的顯著優勢,進一步優化了對抗性前綴,幾乎達到了完美的表現。

4.4 結構化作弊策略能與傳統回應相結合嗎?

結構化作弊策略可以與傳統的、有信息量的回應相結合,只需將我們的作弊回應附加到原始回應上即可。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

如上面4個圖所示,當與像GPT-3.5-0613這樣更提供信息的模型結合時,即使在采取重大優化步驟之前,初始勝率已經很高。

這一點在圖b和d中尤為明顯,隨著優化的深入,性能(勝率和長度控制勝率)從高基線穩步提升。

a和c中,由于不提供與輸入查詢相關的任何信息,欺騙自動標注智能體的難度大大增加。

隨著優化步驟的推進,無效模型的性能穩步提升,最終實現了有競爭力的勝率。

即使在模型輸出無關、無信息的回應這一最具挑戰性的場景下,也能操縱基于LLM的基準測試。

5 反作弊策略

5.1 模板改寫術

改寫輸入文本是對抗語言模型破解的有效防御手段。基于此理念,對抗結構化響應作弊策略之一是僅發布自動標注模板的改寫版本,同時保留真實模板的私密性。

本方法是假設改寫后的模板將更難被作弊者直接利用。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

如上表所示,即便模板經過改寫,依然能夠達到高勝率(例如92.1%的LC勝率)。這表明,僅發布改寫模板作為防御機制是不夠的,因為即使原始模板保密,作弊策略仍然有效。需要更強有力的防御措施來徹底解決這一問題。

5.2 困惑度過濾器(PPL filter)

使用GPT-4-1106-Preview作為自動標注智能體,以評估基于困惑度(PPL)的過濾器的有效性。困惑度是利用GPT-2計算的,遵循Alon & Kamfonas(2023)描述的方法。

大模型榜單還能信嗎?一個假模型就能登頂排行榜-AI.x社區圖片

如上圖所示,盡管設定了高閾值,PPL過濾器未能持續識別出對抗性輸出。例如,結構化響應作弊策略即使勝率高達76.8%,其困惑度仍然低于閾值,使得過濾器失效。

僅依賴于困惑度,即使是窗口化配置,也不足以穩健地檢測出旨在影響LLM判斷的對抗性操作

6. 結論

即便是最基礎的模型,也能通過利用評估流程中的結構性缺陷來獲得高勝率。

6.1 局限性

? 首先,主要關注特定的基準測試,盡管結果在這些測試中得到了很好的推廣,但在其他基準測試中的有效性仍然是未知的。

? 此外,結構化響應作弊策略很大程度上依賴于手工構建結構化響應。未來的研究可以探索更自動化的方法來生成對抗性輸出,這將使對手能夠在更廣泛的范圍內利用這些漏洞。

未來研究的一個重要方向是開發更強大的反作弊機制。目前,針對LLM基準測試的作弊緩解措施主要集中在控制輸出的長度和風格上,但這些措施在面對結構化響應時已被證明是不夠的。新的防御策略對于保持LLM基準測試的完整性至關重要。

? 論文原文: https://arxiv.org/pdf/2410.07137

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI ????

收藏
回復
舉報
回復
相關推薦
欧美国产乱视频| 亚洲成人动漫一区| 91久久久久久久久久| 久久国产精品国语对白| 中文字幕久久精品一区二区| 偷窥国产亚洲免费视频| 色综合久久88色综合天天提莫| 国产精品色综合| 亚洲每日更新| www亚洲欧美| 国产人妻黑人一区二区三区| 激情亚洲小说| 亚洲1区2区3区视频| 手机在线观看国产精品| 黑人精品一区二区三区| 免费在线看成人av| 97精品久久久| 午夜爱爱毛片xxxx视频免费看| 免费成人三级| 欧美一级免费观看| 国产福利影院在线观看| 国精产品一区一区三区mba下载| 久久久国产精华| 国产玖玖精品视频| 五月天婷婷激情| 午夜精品免费| 爽爽爽爽爽爽爽成人免费观看| av直播在线观看| 日韩在线亚洲| 在线成人av影院| 欧美 激情 在线| missav|免费高清av在线看| 亚洲欧洲成人自拍| 先锋影音网一区| 青青操视频在线| 成人动漫视频在线| 91入口在线观看| 一本色道久久综合熟妇| 国产高清视频免费观看| 久久99偷拍| 日韩精品最新网址| 91小视频在线播放| 粉嫩91精品久久久久久久99蜜桃 | 麻豆视频在线免费看| 怕怕欧美视频免费大全| 亚洲精品视频播放| 少妇激情一区二区三区视频| 99精品国产高清一区二区麻豆| 欧美精选在线播放| 老司机久久精品| 91大神在线观看线路一区| 色综合久久综合网欧美综合网| 97干在线视频| 91吃瓜在线观看| 亚洲妇熟xx妇色黄| 亚洲精品蜜桃久久久久久| 青草影视电视剧免费播放在线观看| 中文字幕一区二区三区乱码在线| 亚洲精品日韩精品| 色欧美激情视频在线| 国产精品卡一卡二| 在线播放 亚洲| 国产视频一区二区| 亚洲另类一区二区| 欧美这里只有精品| 丝袜诱惑一区二区| 一本色道亚洲精品aⅴ| 天堂社区在线视频| 日本亚洲欧洲无免费码在线| 在线播放日韩导航| 日本r级电影在线观看| 亚洲精品a区| 亚洲成色777777女色窝| 中文字幕av网址| 成人精品亚洲| 久久久国产一区二区三区| 免费毛片在线播放免费| 亚洲精品在线二区| 国产成人精品久久| 国产精品无码久久久久成人app| 国产在线播放一区| 亚洲欧美综合色| 欧美福利精品| a中文在线播放| 亚洲视频 欧洲视频| 日韩不卡一二区| 国产精品原创| 欧美日韩一区小说| 久久久久亚洲AV成人网人人小说| 亚洲高清极品| 久久精品亚洲94久久精品| 久久久久久久久久久久久久免费看| 日韩一级精品| 国产自摸综合网| 亚洲精品免费在线观看视频| 久久伊人中文字幕| 好吊色这里只有精品| а√天堂8资源中文在线| 在线观看免费成人| av av在线| 99久精品视频在线观看视频| 久久久亚洲影院| 中文字幕 亚洲视频| 成人自拍视频在线观看| 亚洲国产精品一区二区第一页| 18+激情视频在线| 91精品1区2区| 26uuu国产| 成人羞羞网站入口| 久久男人资源视频| 国产精品福利电影| 国产女人18毛片水真多成人如厕 | 激情婷婷亚洲| 国产欧美精品一区二区三区介绍| 婷婷开心激情网| 亚洲色大成网站www久久九九| 成人黄色片视频| 北条麻妃一区二区三区在线观看 | 蜜桃免费网站一区二区三区| 动漫精品视频| 黄av在线免费观看| 色8久久精品久久久久久蜜| 老熟女高潮一区二区三区| 日韩国产欧美| 国产精品久久久久久久久久99| 无码精品黑人一区二区三区| 欧美日韩导航| 91精品国产综合久久久久久漫画 | 国产在线观看中文字幕| 国产欧美日韩影院| 91精品国产91久久久久久不卡| a网站在线观看| 中文字幕一区在线| 美女网站色免费| 国产欧美一区| 日韩美女在线播放| 视频二区在线| 欧美日韩性生活视频| 亚洲精品久久一区二区三区777| 正在播放日韩欧美一页 | 国产不卡精品视频| 综合电影一区二区三区| 狠狠躁狠狠躁视频专区| 欧美少妇xxxx| 国产精品嫩草影院久久久| 黄色毛片在线看| 色综合久久66| 69视频在线观看免费| 美女国产精品| 神马影院午夜我不卡影院| 亚洲1234区| 伊人精品在线观看| 亚洲精品国产精品乱码视色| 欧美激情综合五月色丁香| 嫩草av久久伊人妇女超级a| 国际精品欧美精品| 国产精品视频网| 在线观看免费版| 欧美日韩视频第一区| 成人黄色短视频| 国产揄拍国内精品对白| 久久www视频| 精品三级av| 欧美一区第一页| 成年在线观看免费人视频| 欧美另类高清zo欧美| 欧美日韩午夜视频| 国产91丝袜在线18| 免费成人午夜视频| 国产探花在线精品一区二区| 国产欧美一区二区三区在线看| 欧美高清视频| 欧美精品一区二区蜜臀亚洲| 一区二区三区四区| 国产一二三区在线观看| 欧美不卡123| 西西44rtwww国产精品| 国产日本欧洲亚洲| 国产高清999| 亚洲成人资源| 天天好比中文综合网| 久久99精品久久久野外观看| 97视频com| 成黄免费在线| 日韩免费福利电影在线观看| 综合激情网五月| 中文字幕一区二区在线观看| jjzzjjzz欧美69巨大| 日本特黄久久久高潮| www.69av| 九一亚洲精品| 91九色蝌蚪嫩草| 在线观看欧美日韩电影| 色婷婷综合久久久久| 天堂在线资源库| 欧美卡1卡2卡| 全部毛片永久免费看| 成人欧美一区二区三区黑人麻豆 | 波多野结衣家庭教师视频| 99久久九九| 精品久久久久久乱码天堂| 久久久加勒比| 91精品国产高清久久久久久久久| 91porn在线观看| 亚洲大胆人体视频| 国产一区二区在线视频聊天| 欧美日韩精品在线观看| 欧美日韩三级在线观看| 国产日产欧美一区二区三区| 伊人久久一区二区三区| 精品一区二区三区香蕉蜜桃| 日韩av黄色网址| 欧美视频四区| 亚洲成人a**址| 天堂av一区二区三区在线播放| 91免费版网站入口| 成人久久网站| 日本不卡视频在线播放| 欧美人体视频xxxxx| 日韩在线观看免费网站| 日本国产在线| 亚洲高清一二三区| 性一交一乱一色一视频麻豆| 欧美日韩三级一区二区| 波多野结衣电车痴汉| 亚洲成人精品影院| 久久一级黄色片| 亚洲精品大片www| 国产精品久久波多野结衣| 国产一区二区视频免费观看| 欧洲精品中文字幕| 亚洲天堂av片| 欧美日韩国产精品专区| 久久精品视频久久| 亚洲精品成人悠悠色影视| 日本少妇aaa| 中文字幕不卡在线播放| 女女互磨互喷水高潮les呻吟| jvid福利写真一区二区三区| jjzzjjzz欧美69巨大| 成人激情动漫在线观看| 精品久久久久久无码人妻| 福利电影一区二区三区| 韩国三级hd中文字幕有哪些| 国产一区美女在线| 成年人网站av| 国产精品亚洲成人| 精品国产一二区| 国产高清视频一区| 亚洲少妇一区二区三区| av在线播放成人| 制服丝袜第二页| 久久精品一区二区三区四区| 给我看免费高清在线观看| 久久久久青草大香线综合精品| 四虎永久免费在线观看| 中文字幕免费观看一区| 欧美a在线播放| 中文字幕一区二区三区在线不卡| 亚洲欧美精品aaaaaa片| 成人免费视频在线观看| 久草视频在线资源站| 亚洲成在人线免费| 国产午夜精品久久久久| 欧美性受极品xxxx喷水| 国产伦精品一区二区三区四区 | 精品人妻一区二区三区四区不卡| 日韩亚洲欧美成人一区| 好吊视频一二三区| 亚洲女人被黑人巨大进入al| 第九色区av在线| 久久久成人av| h片在线观看视频免费| 国产成人一区二区在线| 91丨精品丨国产| 国产精品国产三级国产专区53 | 91亚洲国产成人精品一区| 日韩美女主播在线视频一区二区三区| 欧美一级特黄aaaaaa大片在线观看| 亚洲国产精品久久91精品| 免费人成在线观看网站| 最近2019年好看中文字幕视频 | 无码人妻精品一区二区蜜桃色欲| 综合精品久久久| 日本三级午夜理伦三级三| 91黄色免费网站| a网站在线观看| 亚洲视频综合网| 影音先锋在线视频| 国产成人精品免费久久久久| 天堂综合在线播放| 久久riav二区三区| 希岛爱理一区二区三区| 国模吧无码一区二区三区| 精品一区二区三区免费观看| 中文字幕在线播放视频| 一区在线观看视频| 五月婷婷色丁香| 欧美一级二级三级蜜桃| 国产中文在线观看| 欧美激情亚洲综合一区| 成人在线视频观看| 久久久精品动漫| 女主播福利一区| 色悠悠久久综合网| 99精品国产视频| 日韩福利小视频| 欧美性极品少妇| 性感美女一级片| 久久影院模特热| 色综合一本到久久亚洲91| 国产日韩久久| 亚洲久久久久| 久久这里只精品| 91麻豆swag| 日本免费观看视| 日韩免费一区二区| 黄色网址在线免费| 国产精品久久久久久久久久久新郎| 老牛影视av一区二区在线观看| 中文字幕欧美日韩一区二区| 水蜜桃久久夜色精品一区的特点| 国产精品麻豆入口| 亚洲精品日韩综合观看成人91| 中文字幕一区二区久久人妻| 国产丝袜精品视频| 999精品网| 成人免费视频网站入口| 91精品1区| 日本人69视频| 亚洲国产精品二十页| 日韩精品一区二区亚洲av| 亚洲黄色在线看| 成年网站在线视频网站| av资源站久久亚洲| 欧美xxx在线观看| 国产999免费视频| 亚洲精选免费视频| 99热这里只有精品5| 欧美成人第一页| 成人97精品毛片免费看| 黄色一级视频播放| 国产乱一区二区| 极品久久久久久| 欧美一卡2卡三卡4卡5免费| caoporn免费在线视频| 亚洲精品日韩激情在线电影| 艳女tv在线观看国产一区| 尤物网站在线看| 亚洲免费av观看| 亚洲福利在线观看视频| 美女网站在线免费欧美精品| 17c国产在线| 亚洲视频一二三区| 国产高清在线免费| 97视频com| 精品美女久久久| 91小视频在线播放| 亚洲一区在线电影| 四虎影视在线观看2413| 国产成人在线一区二区| 日韩综合在线| 天堂va欧美va亚洲va老司机| 婷婷六月综合网| 国产在线免费观看| 91精品国产综合久久久久久久久 | 中文字幕在线日亚洲9| 久久久精品亚洲| 日韩高清影视在线观看| 亚洲 欧美 日韩系列| 一区二区三区四区不卡视频| 色wwwwww| 国产精品第七影院| 真实国产乱子伦精品一区二区三区| 日本一级片在线播放| 欧美日韩一区二区三区在线看| 亚洲按摩av| 欧美性xxxx69| 国产福利一区二区三区视频在线| 91在线看视频| 精品国产欧美成人夜夜嗨| 9l视频自拍蝌蚪9l视频成人| 免费看a级黄色片| 亚洲成人黄色网| 日本精品专区| 国产在线观看91精品一区| 伊人久久大香线蕉综合热线| 国产探花视频在线播放| 日韩欧美在线一区二区三区| 亚洲欧洲高清| 中文字幕色呦呦| 久久久久亚洲蜜桃| 亚洲精品成av人片天堂无码| 国产精品高清在线观看| 欧美私人啪啪vps| 级毛片内射视频| 精品嫩草影院久久| 欧美日韩经典丝袜| 日韩欧美在线观看强乱免费| 国产成人高清视频|