精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準

發(fā)布于 2024-3-28 13:15
瀏覽
0收藏

隨著大語言模型在現(xiàn)實場景中逐漸落地(例如 ChatGPT 和 Gemini),其生成內(nèi)容的安全性也開始逐漸被大眾關(guān)注。通常來講,我們希望大模型避免生成包含危險內(nèi)容的回復,從而減少對用戶的不良影響,因此評測一個大模型的安全性并分析其弱點成為了一件急需完成的事情。

上海人工智能實驗室研究團隊提出了新的大模型安全 Benchmark SALAD-Bench。相比以往的 Benchmarks,SALAD-Bench 有以下優(yōu)勢:

  • 包含三個層次結(jié)構(gòu),數(shù)量超 2 萬條的大規(guī)模分類數(shù)據(jù)集;
  • 通過攻擊方法的增強,其測試數(shù)據(jù)相比以往數(shù)據(jù)提升了難度與復雜度;
  • 提供了穩(wěn)定可復現(xiàn)且高效的評估模型 MD-Judge;
  • 可同時用來評測大模型的安全性以及相應攻擊、防御方法的安全性能。

SALAD-Bench 的出現(xiàn)促進了大語言模型安全性研究的深入,為未來大語言模型的安全應用奠定了堅實的基礎(chǔ)。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

論文地址:https://arxiv.org/abs/2402.05044

項目主頁:https://adwardlee.github.io/salad_bench/

代碼&數(shù)據(jù)地址:https://github.com/OpenSafetyLab/SALAD-BENCH

MD-Judge:https://huggingface.co/OpenSafetyLab/MD-Judge-v0.1

一、當前問題及痛點

隨著大語言模型的生成能力越來越強,其安全性逐漸開始被大眾重視。安全 benchmark 逐步提出,針對大模型的安全性進行評測。但早期的 benchmark 通常存在如下幾個問題:

  • 多數(shù) benchmark 只關(guān)注到特定種類的安全威脅(例如只關(guān)注危險指令或者只關(guān)注不當言論)而不能覆蓋一個范圍更廣且可以導致LLM輸出危險內(nèi)容的分類系統(tǒng)。
  • 早期 benchmark 中的危險問題和指令可以被現(xiàn)代的 LLM 有效防御(防御成功率接近 99%),而更有挑戰(zhàn)的危險問題或包含了更新的攻擊形式的危險問題并沒有包含進來,從而使得當前的 benchmark 不易有效評估 LLMs 在當下的安全性。
  • 當前的 benchmark 通常需要依賴比較耗時的人工評測或比較昂貴的基于 GPT 的評測,全新的大規(guī)模安全數(shù)據(jù)集需要一種精度較高且成本更低的評測方式以滿足大規(guī)模評測的需求。
  • 現(xiàn)有數(shù)據(jù)集的功能性有限,通常只用來評測 LLMs 的安全性或只用來評測攻擊與防御算法的性能,我們需要一個構(gòu)造一個通用的數(shù)據(jù)集以滿足上述全部需求。

二、SALAD-Bench解決方案 

提出了 SALAD-Bench: SAfety benchmark for LLMs, Attack and Defense approaches.

與其他數(shù)據(jù)集相比的優(yōu)勢如下表所示:

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

SALAD-Bench 與以往的大模型安全數(shù)據(jù)集進行比較:SALAD-Bench 在題目類型、多維度評測、層次結(jié)構(gòu)分類、用途與評測工具上均有優(yōu)勢。

  • 覆蓋安全威脅類別廣泛的三級類別大規(guī)模層次分類結(jié)構(gòu)。
  • 通過問題增強過程提升了 benchmark 的難度與復雜度,同時支持基礎(chǔ)問題集,攻擊防御方法增強子集和引入新題型的多項選擇題子集。
  • 利用 LLMs 的指令跟隨(instruction following)能力提供了穩(wěn)定可復現(xiàn)且高效的評估方法與評估指標。
  • 可同時用來評測大模型的安全性以及相應攻擊防御方法的性能。

SALAD-Bench 的增強流程與評測流程示意圖如下圖所示。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

1. 創(chuàng)新分類

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

SALAD-Bench 引入了一個具有三個級別的結(jié)構(gòu)化層次結(jié)構(gòu),分別包含 6 個領(lǐng)域級別分類、16 個任務(wù)級別分類和 65 個具體的安全威脅類別。這種結(jié)構(gòu)化層次結(jié)構(gòu)確保了 SALAD-Bench 能夠在安全評測方面進行深入的評估,不僅關(guān)注 LLMs 的整體安全性,還關(guān)注具體的安全維度,較高的總體安全率并不會掩蓋對可能存在風險的任務(wù)和類別的識別。我們的基準測試的完整層次結(jié)構(gòu)如上圖所示。

完整的多級層次結(jié)構(gòu)類別與包含的樣本數(shù)量如下表所示。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

研究者希望基于上述層次結(jié)構(gòu)分類高效地構(gòu)造 SALAD-Bench。下面介紹數(shù)據(jù)集的構(gòu)造過程。

(1) 樣本收集。SALAD-Bench 的基礎(chǔ)集(base set)測試樣本包含兩個來源。第一部分為來自公開數(shù)據(jù)集的測試樣本,我們從多個早期安全數(shù)據(jù)集中收集了一部分真實的危險問題。第二部分為通過 LLM 生成的數(shù)據(jù)。由于現(xiàn)代的 LLMs 通常會通過安全對齊策略進行微調(diào)減少危險內(nèi)容輸出,因此研究者引入了約 500 條危險問題用來微調(diào)一個 GPT-3.5,從而使微調(diào)后的 LLM 可以根據(jù)輸入的類別構(gòu)造一些典型的危險問題。本階段所使用的 prompt 如下所示。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

(2) 樣本去重與篩選。第一步收集的問題通常包含兩個缺陷,一是會包含重復或高度相似的樣本,二是可能會包含危險程度較低的內(nèi)容。為了解決第一個問題,SALAD-Bench 利用 Sentence-BERT 和 LSH 算法對樣本的特征向量進行去重處理,從而保留多樣程度較高的問題。為了解決第二個問題,SALAD-Bench 利用 Dai 等人提出的度量安全性的獎勵模型(reward model)為去重后的樣本進行打分,保留所有高于特定閾值的樣本,從而完成樣本篩選過程。

(3) 樣本自動標注。最后,為了將收集到的樣本規(guī)劃到特定的安全威脅類別,研究者引入了三個不同的開源 LLMs(Mixtral-8x7B-Instruct, Mistral-7B-Instruct 和 TuluV2-dpo-70B),使用一個預定義的提示詞(prompt)引導三個 LLMs 為所有輸入問題進行分類,然后進行投票操作獲得最終類別。所使用的 prompt 如下所示。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

最終 SALAD-Bench 的 base set 數(shù)據(jù)分布如下所示。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

2. 增強難度

SALAD-Bench 的基礎(chǔ)集(base set)可以做到在廣泛的安全威脅分類上都有足量的測試樣本覆蓋,但上述測試樣本通常并不包含相應的攻擊與防御方法。同時,僅通過問答對來進行模型安全性評測比較單一,需要引入不同的題型對模型安全性進行額外的分析。

(1) 攻擊增強子集(Attack-enhanced subset)

為了有效提升 base set 中問題的難度,從而有效評估 LLMs 的安全性以及防御方法的有效性,SALAD-Bench 利用攻擊方法對基礎(chǔ)問題進行增強,構(gòu)造出了攻擊增強集(attack-enhanced subset)。其構(gòu)造過程分為如下步驟:

  • 使用候選的 LLMs 對 base 集問題生成對應的回復(responses);
  • 通過關(guān)鍵詞篩選出拒答率較高的問題;
  • 給定篩選出的問題,使用候選攻擊方法構(gòu)造新問題;
  • 用我們提出的 MD-Judge 評測工具(后文將介紹該部分)篩選出最終的攻擊增強集(attack-enhanced subset)。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

(2) 防御增強子集(Defense-enhanced subset)

為了能夠有效評測攻擊算法的性能,SALAD-Bench 需要篩選出拒答率較高的問題,并通過防御方法進一步增廣問題構(gòu)造出防御增強集(defense-enhanced subset),從而降低所有攻擊方法的攻擊成功率,避免成功率過高不易判斷性能優(yōu)劣的情況。防御增強集(Defense-enhanced subset)的構(gòu)造過程分為如下步驟:

  • 使用候選的 LLMs 對 base 集問題生成 responses;
  • 通過關(guān)鍵詞篩選出拒答率較高的問題;
  • 給定篩選出的問題,使用候選攻擊方法構(gòu)造新問題,保留攻擊成功率最低的多個問題;
  • 用防御方法增強保留的問題,構(gòu)造出最終的防御增強集(defense-enhanced subset)。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

(3) 多選題子集(Multiple-choice Question subset)

SALAD-Bench 額外引入了多項選擇題(MCQ),可以在驗證 LLMs 安全性的同時,驗證在安全對齊微調(diào)后 LLMs 的可用性。基于 base set 構(gòu)造 MCQ subset 的過程如下:1)對每個問題,生成多個安全回答與多個危險回答;2)隨機選取每道題包含安全回答和不安全回答的數(shù)量(均包含至少一個),構(gòu)成選擇題的選項;3)對于每個問題,以選擇安全選項和選擇危險選項為題目,設(shè)計相應的 prompt,構(gòu)造輸入問題。所使用的 prompt 將在下一節(jié)給出。構(gòu)造多項選擇題時,SALAD-Bench 要求對每一個安全威脅類別采樣相同數(shù)量(30個)的危險問題,因此 MCQ subset 也保證了數(shù)據(jù)集的多樣性和均衡性。

3. 創(chuàng)新評測工具(Evaluator)

為了能夠設(shè)計高效準確且成本可控的評估算法,研究者嘗試充分利用 LLMs 的指令跟隨(instruction following)能力,設(shè)計了兩個評測工具以完成 SALAD-Bench 的評測。

第一個是 MD-Judge 評估工具,該工具受 LlamaGuard 啟發(fā),是一個基于 Mistral-7B-Instruct 的評估網(wǎng)絡(luò),用來對問答對進行是否安全的評價。該模型在包含基礎(chǔ)的危險問答對和使用攻擊算法增強的危險問答對的數(shù)據(jù)集上進行微調(diào),訓練數(shù)據(jù)根據(jù)我們的分類法進行標記,從而能夠在 SALAD-Bench 預設(shè)的分類層次結(jié)構(gòu)上表現(xiàn)良好。下圖為 MD-Judge 使用的 Prompt,該prompt 包含五個部分,分別是任務(wù)定義、分類定義、待測模型返回的問答對、輸出格式和輸出分類結(jié)果。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

第二個是 MCQ-Judge 評測工具,該工具利用待測 LLMs 本身的 instruction following 能力,要求模型將多項選擇題的回答根據(jù)特定的格式(例如<ans>selections<eoa>)進行輸出,這樣在不依賴 GPT-4 等 LLMs 做解析的條件下,通過正則表達式即可抽取多選題回答,從而計算多選題準確率。MCQ-Judge 使用的 prompt 如下所示。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

三、當前在不同測試子集上的結(jié)果

1.評估模型列表

在本階段實驗中,SALAD-Bench 選取多種黑盒與開源大語言模型進行評測,用于評測的 LLMs 如下所示。未來 SALAD-Bench 也將對各種新發(fā)布的 LLMs 及相應的攻擊防御方法進行評測。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

2.評估結(jié)果

(1) LLM 安全率評估(on base set and attack-enhanced subset):

Claude 獲得了最高的安全率。LLM 在基礎(chǔ)集 base set 和攻擊增強集 attack-enhanced subset 上整體安全率結(jié)果如下表:

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

Base set(task-level per-class)結(jié)果:

多數(shù)模型在 Unfair representation 與 Propagating miscronceptions/false beliefs 任務(wù)相關(guān)問題上回復較為安全。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

Multiple-choice subset結(jié)果:

多選題測試 LLM 安全,評測指標包含整體準確率(Acc-O)和有效準確率(Acc-V),其中 Acc-O 表示將拒答問題視為錯誤回答的準確率,Acc-V 表示去掉拒答問題后剩余問題的準確率。GPT-4、Qwen 和 Tulu 準確率較高且拒答率很低,其余模型均面臨拒答率過高或有效準確率有限的問題。這表明當前多數(shù) LLMs 在保證安全性的同時維持同等甚至獲得更優(yōu)的功能可靠性的方面還需要進一步的發(fā)展。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

(2) 評估攻擊方法

評估攻擊方法時,使用的指標是 attack success rate(對攻擊方法該指標越高越有效)。人工構(gòu)造的 jailbreak prompts 攻擊成功率最高,GPTFuzzer 攻擊方法次之。此外 defense-enhanced subset 能夠有效降低各種攻擊方法的成功率,從而能夠為新攻擊方法的設(shè)計留出更多探索空間。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

(3) 評估防御方法

評估防御方法 ,使用的指標同樣是 attack success rate(對防御方法該指標越低防御的越好)。研究者發(fā)現(xiàn) GPT paraphrasing 與 self-reminder prompt 兩種防御方式效果最好。

語言模型安全評估新標桿:SALAD-Bench全面安全評估新基準-AI.x社區(qū)

四、總結(jié)與未來展望

大語言模型及其擴展模型擁有強大的生成能力和廣闊的應用前景,因此其安全性也逐漸被重視起來,成為大模型落地前的關(guān)鍵保障。

SALAD-Bench 的開發(fā)團隊希望以 SALAD-Bench 為基礎(chǔ),構(gòu)造一個通用的基礎(chǔ)模型安全性與可信性的評測體系,并擴展成一個可信人工智能的數(shù)據(jù)整理、訓練與測試平臺,并將向社區(qū)開源包括數(shù)據(jù)準備、模型微調(diào)、性能評測所有相關(guān)數(shù)據(jù)。因此下一步,SALAD-Bench 將逐步擴展出針對多模態(tài)大模型的評測數(shù)據(jù)集,以及提升多模態(tài)基礎(chǔ)模型安全性同時不損失可用性的高效微調(diào)算法。

本文轉(zhuǎn)載自PaperWeekly

原文鏈接:??https://mp.weixin.qq.com/s/0JBH4z_ft9hpRcNKqKE2Xg??

收藏
回復
舉報
回復
相關(guān)推薦
国产剧情日韩欧美| 在线播放亚洲激情| 免费成人在线视频网站| 欧美成熟毛茸茸| 久久99九九99精品| 久久久久久综合网天天| 91l九色lporny| 国内精品视频| 亚洲激情女人| 亚洲激情在线视频| 亚洲乱码国产乱码精品天美传媒| 中文字幕欧美在线观看| 韩日成人在线| 中文字幕一区日韩电影| 国产51自产区| 日韩国产91| 欧美日韩激情视频8区| 在线观看成人av电影| 亚洲国产精品久久久久爰性色| 亚洲专区免费| 久久久成人精品| 亚洲精品乱码久久久久久久久久久久| 日本在线成人| 欧美午夜在线观看| 久在线观看视频| 91三级在线| 国产女主播一区| 99久久免费国| 91亚洲欧美激情| 老鸭窝毛片一区二区三区| 欧美另类极品videosbestfree| 丁香激情五月少妇| 啄木系列成人av电影| 日韩一级二级三级精品视频| 孩娇小videos精品| 免费日韩电影| 精品欧美激情精品一区| 免费网站永久免费观看| 毛片网站在线免费观看| 国产清纯美女被跳蛋高潮一区二区久久w| 国产精品久久久久久久小唯西川| 国产精品爽爽久久| 奇米777欧美一区二区| 欧美影院久久久| 日本视频免费在线| 国产一区日韩一区| 欧美二区乱c黑人| 免费三级在线观看| 国产精品国产三级国产在线观看| 国产亚洲欧洲黄色| 第一次破处视频| 岳的好大精品一区二区三区| 国产丝袜一区二区| 国产国语性生话播放| 欧美精品中文| 亚洲欧美精品一区二区| 人妻无码一区二区三区| 神马香蕉久久| 亚洲欧洲在线视频| 尤物视频最新网址| 日韩免费一区| 久久久精品国产| 一区二区三区四区五区| 综合久久十次| 欧美精品激情在线| 欧美bbbbbbbbbbbb精品| 国产精品最新自拍| 国产97色在线|日韩| 国产精品午夜一区二区| 麻豆成人久久精品二区三区红 | 亚洲自拍欧美另类| 国产三级漂亮女教师| 国产馆精品极品| 国产日韩亚洲精品| 久久久久久久久亚洲精品| 国产网红主播福利一区二区| 日韩欧美一区二区视频在线播放| 992tv免费直播在线观看| 国产精品久久久久久久久免费桃花| 一区二区三区三区在线| av文字幕在线观看| 亚欧色一区w666天堂| 国产精品-区区久久久狼| 99久久久国产精品免费调教网站| 这里只有精品电影| 无码国产精品一区二区免费式直播 | 屁屁影院国产第一页| 天天躁日日躁狠狠躁欧美| 一区二区在线免费视频| 中文字幕在线有码| 亚洲国产高清一区| 国产成人激情小视频| 97久久人国产精品婷婷 | 日本aaa视频| 久久精品亚洲人成影院| 久久男人av资源网站| 婷婷激情五月综合| 国产精品99精品久久免费| 国产一区再线| 日本中文字幕在线观看| 亚洲午夜精品久久久久久久久| 六月丁香激情网| 欧美videos粗暴| 亚洲第一精品自拍| 国产18无套直看片| 亚洲精品黄色| 成人xvideos免费视频| 日批视频免费播放| 国产精品国产精品国产专区不蜜| 欧美视频在线观看视频| 国产成人午夜性a一级毛片| 欧美精品一区男女天堂| 2014亚洲天堂| 午夜在线一区| 动漫美女被爆操久久久| 97人人在线| 无码av免费一区二区三区试看| 亚洲另类第一页| 国产精品午夜一区二区三区| 欧美成人全部免费| 中文字幕777| 91毛片在线观看| 国产成a人亚洲精v品在线观看| 国产精品久久乐| 精品视频一区在线视频| 免费在线黄色片| 久草精品在线观看| 天堂va久久久噜噜噜久久va| 麻豆mv在线看| 精品国产一区二区三区四区四| 久久国产高清视频| 青青草91视频| 欧洲精品国产| 小早川怜子影音先锋在线观看| 日韩美女主播在线视频一区二区三区 | 日韩天堂在线视频| 亚洲久久久久久久| 好看的日韩av电影| 亚洲在线免费看| 夜级特黄日本大片_在线 | 亚洲熟妇av乱码在线观看| 日韩精品高清不卡| 精品欧美国产| 91色在线看| 精品少妇一区二区三区日产乱码| 极品魔鬼身材女神啪啪精品| 国产主播一区二区三区| 亚洲图片欧洲图片日韩av| 日韩制服一区| 中文字幕亚洲一区二区三区| 中文在线字幕免费观| 国产欧美日韩卡一| av网站在线不卡| 日本不卡二三区| 国产欧美日韩免费| 日本www在线| 欧美裸体一区二区三区| 91传媒免费观看| 国内精品在线播放| 伊人再见免费在线观看高清版| 伊人久久大香| 欧美精品免费在线观看| www.亚洲天堂.com| 亚洲成在人线免费| 亚洲av成人片色在线观看高潮 | 97视频在线观看视频免费视频| 神马久久久久久久久久| 精品久久久久久久久久久久| av网站免费在线播放| 日韩精品免费视频人成| 亚洲欧洲日韩精品| 久久gogo国模啪啪裸体| 久久久久久久久久久人体| 天堂在线观看av| 色综合视频一区二区三区高清| 永久免费毛片在线观看| 国产精品综合一区二区| 白白操在线视频| 亚洲精品蜜桃乱晃| 国产日韩欧美在线| 色呦呦网站在线观看| 亚洲精品99久久久久中文字幕| 欧美激情黑白配| 国产精品麻豆久久久| 香蕉在线观看视频| 久久精品123| 中文网丁香综合网| 猫咪成人在线观看| 国产精品美腿一区在线看| 欧美伦理免费在线| 亚洲毛片一区二区| 97在线公开视频| 精品国产91久久久| 毛片视频免费播放| 成人18视频在线播放| 男人插女人下面免费视频| 欧美成人久久| 日韩经典在线视频| 综合久久成人| 国产欧美久久一区二区| jizz一区二区三区| 日韩中文在线中文网在线观看 | 岛国精品在线| 久久久久久亚洲精品中文字幕| 狠狠狠综合7777久夜色撩人| 日韩视频免费观看高清在线视频| 无码人妻熟妇av又粗又大| 亚洲精品综合在线| 成人做爰69片免网站| 99riav一区二区三区| gogogo高清免费观看在线视频| 国产日韩亚洲欧美精品| 91制片厂免费观看| 久久99青青| 国产美女在线精品免费观看| www.久久草.com| 国产精品扒开腿做爽爽爽男男| 男女免费观看在线爽爽爽视频| 少妇高潮久久77777| 完全免费av在线播放| 日韩久久久精品| 亚洲最大成人av| 色噜噜狠狠成人网p站| 免费观看一级视频| 亚洲色图视频免费播放| 国产视频三区四区| 91毛片在线观看| 91九色蝌蚪porny| 国产精品正在播放| 国产欧美激情视频| 蜜臀av性久久久久av蜜臀妖精| 红桃av在线播放| 99re国产精品| av之家在线观看| 影音先锋亚洲电影| 日韩欧美精品免费| 韩日成人在线| 欧美一区二区激情| 一区在线观看| 欧美日韩福利在线| 午夜精品影院| 中文字幕色呦呦| 最新国产精品| 免费cad大片在线观看| 欧美 日韩 国产一区二区在线视频 | 韩国av电影在线观看| 日韩久久久精品| 亚洲成人中文字幕在线| 欧美mv日韩mv国产网站app| 亚洲精品视频网| 精品国产亚洲一区二区三区在线观看| 99久久精品国产一区色| 91精品免费观看| 国产熟女一区二区三区五月婷| 欧美一区二区观看视频| 国产精品亚洲a| 男人天堂一区二区| 欧美一区二区国产| 成 人 免费 黄 色| 亚洲第一区中文字幕| 日本免费不卡视频| 亚洲女人被黑人巨大进入al| 国产在线一在线二| 中文字幕综合一区| 成人在线影视| 久久免费在线观看| 综合在线影院| 国产精品尤物福利片在线观看| 四虎视频在线精品免费网址| 亚洲在线免费观看| 老司机在线精品视频| 欧美日韩三区四区| 久久免费av| 国产在线观看欧美| 国产亚洲在线| 网站一区二区三区| 国产一区高清在线| 国产精品入口麻豆| 国产亚洲视频系列| 国产天堂av在线| 亚洲第一福利视频在线| 久久久国产免费| 91精品中文字幕一区二区三区| 精品久久国产视频| 亚洲精品一区中文| 9191在线观看| 高清欧美性猛交xxxx| 三级成人黄色影院| 97免费资源站| 国产中文精品久高清在线不| 中文字幕久精品免| 精品不卡视频| 久久婷婷综合色| www.日本不卡| 黄色国产在线播放| 亚洲福利一二三区| av毛片在线免费观看| 欧美视频中文字幕| 亚洲男人第一天堂| 在线播放亚洲激情| 国产伦久视频在线观看| 国产自摸综合网| 亚洲+变态+欧美+另类+精品| 熟妇熟女乱妇乱女网站| 久久一区二区三区超碰国产精品| 午夜影院免费观看视频| 国产亚洲一区二区三区四区| 亚洲国产精品久| 欧美三级日韩三级| 四虎影院在线域名免费观看| 欧美成人午夜免费视在线看片| 超碰中文在线| 91牛牛免费视频| 精品99久久| 日韩av三级在线| 国产成人免费视频一区| 精品无码一区二区三区蜜臀| 色婷婷久久99综合精品jk白丝| 成人久久久精品国产乱码一区二区| 中文字幕欧美精品在线| 在线亚洲人成| 国产日韩三区| 欧美日韩免费| 日本高清免费观看| 国产精品理伦片| 中文字幕a级片| 日韩大陆毛片av| 国产盗摄精品一区二区酒店| 91色视频在线观看| 欧美成人milf| 中文字幕天天干| 欧美国产精品久久| 亚洲精品毛片一区二区三区| 亚洲国产精品久久久久| 青春草在线视频| www日韩av| 欧美韩日精品| 免费在线观看日韩av| 亚洲精品第1页| 国产女同91疯狂高潮互磨| 日韩专区在线播放| 国产亚洲欧美日韩精品一区二区三区 | 一区二区精品视频在线观看| 在线播放日韩专区| 成人国产在线| 午夜精品美女久久久久av福利| 免费视频一区| 亚洲激情视频小说| 欧美在线不卡一区| 国产免费视频在线| 国产不卡在线观看| 欧美一区2区| 制服丝袜综合网| 国产精品成人一区二区三区夜夜夜| 中日韩av在线| 日韩视频精品在线| 国内精品视频| 久久99久久久久久| 成人精品鲁一区一区二区| 日韩av片在线播放| 精品亚洲aⅴ在线观看| 伊人网在线播放| 日本精品一区二区| 久久精品久久久精品美女| 91麻豆精品成人一区二区| 欧美一区二区三区四区在线观看| 18+激情视频在线| 精品日本一区二区三区| 一区二区日韩免费看| 日本乱子伦xxxx| 6080亚洲精品一区二区| 亚洲丝袜一区| 好吊色欧美一区二区三区视频| 午夜宅男久久久| 日本少妇aaa| 精品va天堂亚洲国产| av资源亚洲| 在线无限看免费粉色视频| 成人一区在线观看| 日日夜夜操视频| 久久久精品在线观看| 欧美激情99| 国产欧美一区二| 午夜精品福利一区二区三区av| 黄色小视频在线观看| 亚洲va欧美va国产综合久久| 亚洲美女色禁图| 亚洲天堂精品一区| 日韩精品中文字幕一区二区三区 | 91精品久久久久久久久久久| 欧美阿v一级看视频| 欧美狂猛xxxxx乱大交3| 91麻豆精品国产自产在线| 成人黄色动漫| 中文精品一区二区三区| 26uuu欧美| 国产高中女学生第一次| 人妖精品videosex性欧美| 91成人免费| 天天躁夜夜躁狠狠是什么心态|