精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM的考試過程原來是這樣?C-Eval優等生考題實測

人工智能 新聞
在本系列的SOTA!模型社區專欄中,我們將深入探索目前流行的中文大模型評估基準,包括它們的指標設計、評估集構成和適用場景,希望能夠幫助大家更好地使用這些學術指標來指導開源基座的選擇。

隨著最近一年開源基礎LLM的發展和精調技術的日趨成熟,社區已經涌現了大量基于LLM的開源微調和精調模型。其中,以ChatGPT為代表的大語言模型(Large Language Model, LLM)憑借其近乎通用人工智能(AGI)的能力,為自然語言處理領域帶來了新的研究和應用浪潮。

目前,基于社區微調的大模型進一步精調和對齊,再用于應用開發已經成為構建生成式和交互式AI應用的高效手段。但面對眾多的模型,如何挑選適合自己進一步進行精調和對齊的模型成為了一個問題。

雖然學術界已經提供了大量的大模型評估基準和評估數據,但這些基于學術研究的評估基準并不總是能夠完全滿足實際開發的需求。

在本系列的SOTA!模型社區專欄中,我們將深入探索目前流行的中文大模型評估基準,包括它們的指標設計、評估集構成和適用場景,希望能夠幫助大家更好地使用這些學術指標來指導開源基座的選擇。

這篇專欄將為大家探索以下問題

1、C-Eval主要評估什么能力? 覆蓋哪些知識科目?不同科目的難度一樣嗎?不同科目的難度如何?

2、C-Eval的測例庫是如何形成的?使用C-Eval的測例庫進行評測時,提示詞要如何寫?提示詞的編撰方式是否會有影響?

3、C-Eval榜單排名靠前的開源模型基于C-Eval覆蓋科目、同樣的題目提示格式進行場外問題實測,他們回答結果如何呢?

C-Eval 主要評估什么能力?

圖片

圖1. C-Eval 概覽圖。不同顏色的科目表示四個難度等級:初中、高中、大學和專業

自GLUE發布以來,大語言模型評測基準已分化為三類。

1、針對自然語言理解能力的評測,如GLUE和SuperCLUE,主要考察模型對語言文字的基礎理解;

2、針對知識理解和記憶能力的評測,如C-Eval,旨在考察模型在高級知識任務上的推理能力;

3、針對綜合性能力評測,如HELM,重點在于評估模型在各種場景下的表現,包括其反應速度、言語控制和辨別虛假信息的能力。

C-Eval 全稱 A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Model,是首個評估中文基礎模型高級知識和推理能力的廣泛基準。

構造評測基準的第一個問題是確定“區分度”,即,什么是區分模型強弱的核心指標。C-Eval考慮知識推理這兩項核心。

C-Eval的構建從知識型的任務出發,構造數據集測試模型的知識能力,對標MMLU(這個數據集被用于 GPT-3.5, GPT-4, PaLM, PaLM-2, Gopher, Chinchilla 的研發)。

為了進一步衡量模型的高階能力,滿足對推理任務的評估需求,研究團隊把 C-Eval 中需要強推理的學科(微積分,線性代數,概率 …)專門抽出來,命名為 C-Eval Hard 子集,對標MATH (這個數據集被用于 GPT-4, PaLM-2, Minerva, Galactica 的研發)。


評測指標

覆蓋領域

題目形式

評估目標

C-Eval

Acc

包括四個難度級別的多項選擇題:初中、高中、大學和專業。問題涉及涵蓋52個不同的學科領域,從人文學科到科學和工程學科不等

13948個多項選擇題

首個評估中文基礎模型高級知識和推理能力的廣泛基準

論文地址:https://arxiv.org/pdf/2305.08322v1.pdf

github地址:https://github.com/SJTU-LIT/ceval

C-Eval榜單地址:https://cevalbenchmark.com/static/leaderboard.html

數據集地址:https://huggingface.co/datasets/ceval/ceval-exam

C-Eval的科目覆蓋及難度設計

C-Eval包括四個難度級別的多項選擇題:初中、高中、大學和專業。C-Eval還附帶有C-Eval HARD,這是C-Eval中非常具有挑戰性的一部分主題(子集),是從C-Eval中選擇的8個具有挑戰性的數學、物理和化學科目,需要高級推理能力才能解決,具體包括高等數學、離散數學、概率和統計、大學化學、大學物理、高中數學、高中化學和高中物理。這些科目通常涉及復雜的LATEX方程,需要推理能力來解決。

圖片

C-Eval 的問題涉及涵蓋52個不同的學科領域,由13948個多項選擇題組成,從人文學科到科學和工程學科不等。除了英語科目外,包含了初中、高中的標準科目。對于大學,從中國教育部列出的所有13個官方本科專業類別中選擇了25個有代表性的科目、每個類別中至少有一個科目被納入C-Eval,以確保全面性。在專業層面上,參考了中國官方的國家職業資格目錄5并選擇了12個有代表性的科目,如醫生、法律專業和公務員資格考試。還將這些科目按其主題分為四類:STEM(科學、技術、工程和數學)、社會科學、人文學科和其他領域。

C-Eval學科領域的詳細統計數據如下:

圖片

C-Eval的測例庫是如何形成的?

C-Eval 主要測例來源是互聯網上免費提供的模擬考試。一部分大學階段 的試題是來自中國頂尖大學的過去的考試題,由學生公開分享。一小部分大學試題是全國 研究生入學考試的模擬試題,來源是維普網站。

C-Eval 研究組獲取到原始測例數據有多種格式,主要是PDF或Microsoft Word文檔,還有一小部分網頁。PDF文件最初是用OCR工具處理成文本。所有的問題隨后被解析--在可能的情況下自動解析,否則由團隊手動解析--變成結構化格式,即 "問題列表"。對于具有復雜數學符號的科目,如STEM類別中的許多科目,手動將其轉換為標準的LATEX格式。

C-Eval中的所有問題都經過處理,正好包括四個選擇。大部分的原始問題伴隨著四個選擇,還消除了少于四個選項的問題。并對有四個以上選項的問題隨機放棄不正確的選擇。所有的問題也都經過了標準的數據預處理管道,如重復數據刪除和清理。

在此之后,這些問題經過了作者的幾輪人工驗證,所有的LATEX符號都被確保符合要求,沒有語法錯誤。項目組為每個科目處理了至少200個問題,并在每個科目中隨機地將問題分成一個開發集、一個驗證集和一個測試集。每個科目的開發組由五個示例組成,以方便進行少量的評估。這些示范題還附有解釋,以便于進行少量的評估。驗證集和測試集的比例為1:9。

思維鏈(COT)推理可以促使語言學習者生成推理過程的文本序列以及最終答案,在推理繁重的任務中取得了巨大成功。與zero-shot 相比(單輪),few-shot更常用(多輪),并能在各種任務中實現最先進的性能。為了改進 C-Eval 在few-shot中的應用效果,將自動生成和人工注釋結合起來,為開發拆分提供高質量的解釋數據。

使用 C-Eval 做評測,Prompt 不同會有什么影響?

C-Eval官方文檔推薦了四種prompting范式。首先是few-shot answer-only,這是最基礎的方式。其次是few-shot chain-of-thought,這種方式在模型超過65B之后才會顯著有效。接著是zero-shot answer-only,通常在進行instruction tuning之后采用。最后是zero-shot chain-of-thought,只有在instruction tuning之后且模型足夠強大時,才推薦使用這種模式。

C-Eval的官方文檔對于如何編寫測試提示也給出了非常詳細的示例。如果模型還沒有被調成一個 chatbot,那么提示格式如下。其中,對話格式的 prompt 相當于已讓 AI 假裝已經正確回答了五個問題(但實際上是被我們 hard code 到 prompt 里的),然后 AI 實際上只回答最后一輪的問題。相應的,對話格式的 zero-shot 和 chain-of-thought 版本的 prompt 需要分別去掉 in-context 樣本和加上{讓我們一步一步思考 [explanation]} 的內容。

具體來說,如果是 zero-shot (單輪)的話,則去掉 [題目 1] 到 [題目 5] 的 in-context 樣本;如果模型的 context length 裝不下所有的 in-context examples,則去掉一兩個;如果是 chain-of-thought 的話,則需要加上 {讓我們一步一步思考 [explanation]} 的內容。

以下是中國關于{subject}考試的單項選擇題,請選出其中的正確答案。<- 注意把 {subject} 改成具體的科目名稱


[題目 1]
A. [選項 A 具體內容]
B. [選項 B 具體內容]
C. [選項 C 具體內容]
D. [選項 D 具體內容]
答案:A              


...                 <- 題目 2 到 4


[題目 5]
A. [選項 A 具體內容]
B. [選項 B 具體內容]
C. [選項 C 具體內容]
D. [選項 D 具體內容]
答案:C


[測試題目]
A. [選項 A 具體內容]
B. [選項 B 具體內容]
C. [選項 C 具體內容]
D. [選項 D 具體內容]
答案:<模型從此處生成>


此外,C-Eval團隊對于提示方式的影響也分享了自己的發現。

對于沒有經過instruction tuning的預訓練模型,prompt的選擇會導致效果的顯著差異。雖然有default prompt,但它不一定是最佳選擇。在實際操作中,我們需要明確分數的提高是由于模型的進步還是prompt的改進。如果主要目標是模型的開發,那么建議不要過多地優化prompt。

而對于經過指令精調的預訓練模型,prompt的差異對模型效果的影響會減少,但仍然不能被忽視。盡管instruction tuning后,模型對prompt engineering的需求會降低,但這種需求仍然存在。

LLM選手們是如何回答 C-Eval的題目的?

C-Eval中的結構化的大學經濟學實例題目示例如下,為提高可讀性,英文譯文顯示在相應的中文文本下方。我們可以看出,單純從題目只能看出來“洛倫茲曲線”這樣的關鍵信息,但結合給出的答案能夠判斷出考察的是“洛倫茲曲線”與“基尼系數”、收入平等性之間的關系,這需要有一定的經濟學背景,才能理解并識別出問題并給出正確答案。在掌握相關背景知識的前提下,本道題的回答難度并不大,不需要復雜的推理能力。

下面我們給出一個C-Eval中few-shot設置中的潛在使用。首先提示 GPT-4 生成解釋ground-truth答案的步驟解釋,然后手動修改生成的解釋,以獲得最終解釋。下面是一個高中化學題目的示例及解釋。為提高可讀性,在相應的中文文本下方顯示英文翻譯。

最后是一個C-Eval HARD的高等數學的示例。我們可以看出,答對這道題要具備很強的數學計算和推理能力,而非普通的數學題。不過,C-Eval中全部為客觀題,所以我們并不能看到所有推理題目的解題過程。

圖片

C-Eval 頭部選手場外實測

我們選擇了截止2023年9月底 C-Eval 的最新榜單中部分排名前20位的選手中選擇了4個模型進行實測,來看看這些在C-Eval中榜單排名靠前的模型在考場之外的場景中表現又如何呢?

我們收集和整理了一些初高中的學科類題目,這些題目都是我們在日常生活中收集的,而不出自于任何公開的成熟評測基準,所以更加能反應模型在真實場景中的工作能力。

我們整理了五道高中化學、初中數學、公務員考試和大學經濟學的題目,同時按照C-Eval的題目格式將其都組織成客觀題的形式,同時用4個選出的模型進行實測。

我們通過查閱資料,能夠確定上述四道題目的正確答案為D、C、A、D,那么在C-Eval榜單排名靠前的模型答題表現如何呢?

題目

測試提示

正確答案

答對模型

題目1

高中化學

某元素R最外層有5個電子,它的含氧酸鉀鹽的化學式不可能是__

A. KRO3

B. K3RO4

C. KRO2

D. K2RO4

D

題目2

初中數學

下列事件中,屬于必然事件的是__

A. 任意數的絕對值都是正數

B. 兩直線被第三條直線所截,同位角相等

C. 如果a、b都是實數,那么a+b=b+a

D. 拋擲1個均勻的骰子,出現6點朝上

C

ChatGLM2-6B

題目3

公務員考試

不少人喜歡拍攝照片后上傳到各種社交平臺,但專家警告這些照片有可能泄露隱私,給用戶帶來潛在的安全風險,因為每一張數碼照片中都包含一組在拍攝時自動生成的可交換圖像文件格式的信息(簡稱Exif),建議用戶上傳圖片時盡量避免“原圖”上傳。

以下陳述如果為真,哪項是上述觀點的前提___

A. Exif信息包括拍攝時的準確位置和時間,以及拍攝設備的唯一ID

B.主流社交平臺會默認對上傳照片進行裁剪或壓縮處理,原始的Exif信息會被修改

C.數碼照片在進行后期的數字化編輯時,Exif記錄的專業數據可輔助攝影愛好者做專業調試

D. Exif是一種標準信息,他可以幫助用戶在查找、管理、使用照片的過程中進行分類處理

A

題目4

大學經濟學

長期總供給曲線垂直是因為___

A. 總供給中單個產品的供給彈性都為零

B. 總供給中單個產品的供給曲線都垂直

C. 宏觀生產函數是穩定的

D. 經濟中實現了充分就業

D

令人遺憾的是,在總共 4 x 4 =16道 實測題目中,只有ChatGLM2-6B答對了一道初中數學題,其它15道題全部答錯。其中有部分答題格式正確,即,給出了A/B/C/D的選項,而更多的題目連答題格式都不正確。這一結果顯然跟他們在榜單中耀眼的成績并不相符,也從一定程度上佐證了上面知友的意見。

C-Eval核心團隊成員曾提出的“最重要目標是輔助模型開發,而不是打榜”,如何有效利用C-Eval改進自己的模型,而不是不斷地傾斜數據刷到更高的榜單排名,值得更多小伙伴深思。

以下是實測輸出,供老伙計們參考。

第一題 高中化學

某元素R最外層有5個電子,它的含氧酸鉀鹽的化學式不可能是__

A. KRO3

B. K3RO4

C. KRO2

D. K2RO4

ChatGLM2-6B

圖片

InternLM-7B

圖片

MOSS Moon 003 SFT INT4

圖片

Baichuan7B

圖片

第二題 初中數學

下列事件中,屬于必然事件的是__

A. 任意數的絕對值都是正數

B. 兩直線被第三條直線所截,同位角相等

C. 如果a、b都是實數,那么a+b=b+a

D. 拋擲1個均勻的骰子,出現6點朝上

ChatGLM2-6B

圖片

InternLM-7B

圖片

MOSS Moon 003 SFT INT4

圖片

Baichuan7B

圖片

第三題 公務員考試

不少人喜歡拍攝照片后上傳到各種社交平臺,但專家警告這些照片有可能泄露隱私,給用戶帶來潛在的安全風險,因為每一張數碼照片中都包含一組在拍攝時自動生成的可交換圖像文件格式的信息(簡稱Exif),建議用戶上傳圖片時盡量避免“原圖”上傳。

以下陳述如果為真,哪項是上述觀點的前提___

A. Exif信息包括拍攝時的準確位置和時間,以及拍攝設備的唯一ID

B.主流社交平臺會默認對上傳照片進行裁剪或壓縮處理,原始的Exif信息會被修改

C.數碼照片在進行后期的數字化編輯時,Exif記錄的專業數據可輔助攝影愛好者做專業調試

D. Exif是一種標準信息,他可以幫助用戶在查找、管理、使用照片的過程中進行分類處理

ChatGLM2-6B

圖片

InternLM-7B

圖片

MOSS Moon 003 SFT INT4

圖片

Baichuan7B

圖片

第四題 大學經濟學

長期總供給曲線垂直是因為___

A. 總供給中單個產品的供給彈性都為零

B. 總供給中單個產品的供給曲線都垂直

C. 宏觀生產函數是穩定的

D. 經濟中實現了充分就業

ChatGLM2-6B

圖片

InternLM-7B

圖片

MOSS Moon 003 SFT INT4

圖片

Baichuan7B

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2010-11-18 08:59:43

MeeGo

2022-12-14 07:32:40

InnoDBMySQL引擎

2018-04-02 15:13:21

網絡

2023-02-15 08:17:38

2024-04-30 08:22:51

Figma圖形編輯變換矩陣

2025-02-17 09:22:16

MySQLSQL語句

2024-02-06 09:30:25

Figma矩形矩形物理屬性

2022-05-05 08:55:12

工業物聯網IIoT

2023-05-22 15:58:11

2020-05-26 08:52:36

Java JVM多態

2020-11-24 06:20:02

Linux日志文件系統

2016-10-12 08:54:24

2011-05-25 09:58:46

C#

2014-07-21 10:32:52

蘋果公司實習

2021-08-17 07:00:00

雙重檢查鎖Nacos

2015-03-25 09:55:34

程序員程序員修補BUG真正原因

2018-10-26 10:41:19

2020-03-23 08:30:12

程序員男友感受

2024-12-17 12:00:00

C++對象模型

2020-11-12 07:32:53

JavaScript
點贊
收藏

51CTO技術棧公眾號

国产精品久久久久四虎| 日韩精品电影一区亚洲| 亚洲成色www8888| 人妻熟女一二三区夜夜爱| 国产精品久久久久一区二区国产 | 亚洲日本青草视频在线怡红院| 川上优av一区二区线观看| 久久久久久久久久久网| 免费av一区| 日韩三级中文字幕| 日韩手机在线观看视频| 青青草视频在线免费直播| 久久精品一级爱片| 成人免费在线看片| 在线观看中文字幕av| 一本久久知道综合久久| 久久伊人91精品综合网站| 丰满大乳奶做爰ⅹxx视频| 四虎地址8848精品| 日本精品视频一区二区三区| 天天做天天躁天天躁| 国产视频二区在线观看| 成人av在线影院| 91亚洲精品视频| 亚洲无码精品一区二区三区| 91久久亚洲| 九九热最新视频//这里只有精品 | 日韩成人精品一区二区| 亚洲国产黄色片| 天天综合天天添夜夜添狠狠添| 天堂电影一区| 亚洲小说欧美激情另类| 男女爱爱视频网站| 99reav在线| 国产日韩精品一区二区浪潮av| 精品国产免费一区二区三区 | 电影一区二区| 精品国产1区2区| 国产免费裸体视频| 国产激情在线观看| 国产精品亲子伦对白| 色播亚洲婷婷| 第一视频专区在线| 国产日韩欧美亚洲| 日本一区二区三区在线视频| 亚洲欧洲国产综合| 99亚偷拍自图区亚洲| 99re在线观看视频| 亚洲成人黄色片| 国产精品一区二区久激情瑜伽| 成人黄色av网站| 一本一道人人妻人人妻αv| 日本午夜精品一区二区三区电影| 欧美综合一区第一页| 成年人视频在线免费看| 国产精品美女久久久| 69久久夜色精品国产69乱青草| 国产在线观看你懂的| 欧美日韩亚洲国产精品| 欧美黑人巨大xxx极品| 欧美黄片一区二区三区| 欧美久久影院| 国内精品视频在线| 国产一级免费视频| 日韩vs国产vs欧美| 91免费人成网站在线观看18| 国产毛片在线视频| 国产福利精品一区二区| 国产欧美日韩在线播放| 三区在线视频| 国产欧美精品一区二区三区四区| 午夜久久资源| 国产cdts系列另类在线观看| 亚洲尤物在线视频观看| 六月丁香激情网| 欧美××××黑人××性爽| 欧美日韩国产高清一区二区三区 | 91国内精品久久久| 国产一区二区三区观看| 国产精品果冻传媒潘| 丝袜+亚洲+另类+欧美+变态| 日本一区二区三区在线观看| 中文字幕剧情在线观看一区| 四虎av在线| 欧美日韩中文在线| 少妇一级淫免费放| 97久久综合区小说区图片区| 亚洲精品一区中文| 国产一区在线观看免费| 国产一区二区三区四区三区四 | 成人精品在线看| 日韩国产精品91| 亚洲自拍偷拍一区| 青草久久伊人| 亚洲男同性恋视频| 国产免费一区二区三区视频| 国产精品成人**免费视频| 日韩电视剧在线观看免费网站| 极品蜜桃臀肥臀-x88av| 在线日韩欧美| 国产在线视频91| 日本黄色一区二区三区| 国产精品乱码一区二区三区软件| 国产情侣第一页| 欧美成人毛片| 日韩精品视频三区| 中文字幕手机在线观看| 日韩精品电影一区亚洲| 国产伦视频一区二区三区| 中文字幕在线免费| 黄色一区二区三区| 婷婷中文字幕在线观看| 国产真实有声精品录音| 久久久久久久久久国产| 国产精品国产三级国产aⅴ| 91日韩一区二区三区| 亚洲天堂第一区| 国产成人亚洲一区二区三区| 日韩av一区二区在线| 欧美第一页在线观看| 日韩和欧美一区二区| 国产欧美一区二区三区另类精品| 黄色免费在线网站| 欧美亚州韩日在线看免费版国语版| 久久国产劲爆∧v内射| 婷婷激情综合| 国产在线999| 国产粉嫩一区二区三区在线观看 | 国产欧美日韩在线| 波多野结衣家庭教师在线| 亚洲国产中文在线| 久久中文字幕在线视频| 国产一区二区三区视频免费观看| 国产欧美1区2区3区| 爱福利视频一区二区| 久草精品视频| 久久久免费电影| 午夜老司机福利| 亚洲精品va在线观看| 亚洲高清在线不卡| 91精品国产91久久久久久黑人| 国产精品福利久久久| 国产网站在线播放| 色婷婷av一区| av永久免费观看| 久久一区激情| 日韩亚洲欧美精品| 国外成人福利视频| 久久精品一本久久99精品| 一级二级三级视频| 亚洲欧洲精品一区二区三区| 午夜剧场高清版免费观看 | 丝袜亚洲另类欧美重口| 亚洲午夜无码久久久久| 中国av一区二区三区| 一路向西2在线观看| 欧美成人激情| 91精品综合久久久久久五月天| 久久亚洲天堂| 日韩一区二区三区在线| 精品欧美一区二区久久久久 | 欧美三级中文字幕| 2017亚洲天堂| 国产高清亚洲一区| 日本手机在线视频| 日韩高清成人在线| 国产999精品| 日本最新在线视频| 欧美大片顶级少妇| 日韩三级一区二区三区| 久久蜜臀中文字幕| 奇米影音第四色| 欧美激情一级片一区二区| 国产精品一区二区不卡视频| 亚洲精品mv| 最近中文字幕2019免费| 精品国产av一区二区三区| 午夜国产精品一区| 亚洲精品成人av久久| 国产原创一区二区三区| 久久国产精品网| 精品产国自在拍| 亚洲r级在线观看| 国产污视频在线播放| 国产一区二区三区中文| 国产v在线观看| 欧美日韩国产一区中文午夜| 91麻豆精品久久毛片一级| 成人深夜视频在线观看| 日本熟妇人妻中出| 欧美人与禽猛交乱配视频| 麻豆91蜜桃| 国产精品一区免费在线| 国产91成人video| 男人天堂久久久| 日韩av影视综合网| 91欧美日韩麻豆精品| 岛国av午夜精品| 波多野结衣不卡视频| 久久美女艺术照精彩视频福利播放 | 69堂国产成人免费视频| 午夜婷婷在线观看| 亚洲欧美另类小说| 免费看黄色的视频| 懂色一区二区三区免费观看| 午夜免费福利在线| 亚洲清纯自拍| 无码人妻精品一区二区三区99v| 香蕉视频一区二区三区| 91精品国产99久久久久久红楼| 欧美性suv| 97人人模人人爽人人喊中文字| 在线观看免费版| 亚洲美女性视频| 成人h动漫精品一区二区无码| 欧美亚洲国产一卡| 特级毛片www| 亚洲成人在线网站| 校园春色 亚洲| 中文字幕一区二区三区四区 | 亚洲狼人综合网| 欧美三级乱人伦电影| 五月天婷婷久久| 亚洲一级二级在线| 欧美卡一卡二卡三| 国产精品国产三级国产普通话99| a毛片毛片av永久免费| 成人国产在线观看| 亚洲av无一区二区三区久久| 久久国产精品色婷婷| 五月婷婷之综合激情| 久久国产精品99国产| 男人靠女人免费视频网站| 激情久久久久久久| 91.com在线| 欧美日韩日本国产亚洲在线 | 好吊色欧美一区二区三区| 欧州一区二区三区| 亚洲最大的成人网| 国产亚洲字幕| 97se亚洲综合| 久久伊人影院| 亚洲综合色激情五月| 亚洲精品国产九九九| av一区二区三区四区电影| 国产一区二区三区免费观看在线| 成人乱人伦精品视频在线观看| www.精品国产| 国产日韩专区在线| 最新亚洲国产| 91黄色国产视频| 8848成人影院| 国产专区一区二区| 午夜a一级毛片亚洲欧洲| 欧美伦理一区二区| av一区二区在线播放| 伊人天天久久大香线蕉av色| 国产精品久久观看| 黄色三级中文字幕| 亚洲精品1234| 成年人在线观看视频免费| 麻豆精品视频在线观看免费| 亚洲午夜精品一区| 国产精品一色哟哟哟| 日韩无码精品一区二区| 91在线视频观看| 天天干天天舔天天操| 亚洲视频一区二区在线| 久久久久久av无码免费网站| 婷婷夜色潮精品综合在线| 国产性生活视频| 欧美日韩成人激情| 欧美熟妇乱码在线一区| 亚洲男人天堂2019| 免费在线你懂的| 欧美激情视频三区| 暖暖成人免费视频| 成人黄色在线免费| 欧美freesex8一10精品| 色吧亚洲视频| 亚洲天堂黄色| 国产精品天天av精麻传媒| 久久aⅴ国产欧美74aaa| 韩国三级hd中文字幕有哪些| 91美女在线视频| 波多野结衣久久久久| 欧美日韩国产在线播放| 亚洲天堂999| 日韩国产精品一区| 免费人成在线观看播放视频| 高清欧美性猛交| 日韩漫画puputoon| 国产精品久久久久久久免费大片 | 肉大捧一出免费观看网站在线播放 | 中日韩美女免费视频网址在线观看 | 欧美国产欧美亚州国产日韩mv天天看完整| 91香蕉视频网| 欧美色欧美亚洲高清在线视频| 国产精品乱码久久久| 亚洲欧美一区二区三区四区| 国产三级在线播放| 国产91精品在线播放| 日韩免费一级| 免费看av软件| 日韩福利视频导航| 国产又黄又粗又猛又爽的视频| 亚洲欧美另类在线| 超碰在线97观看| 日韩av在线网站| 丝袜美女在线观看| 成人午夜激情网| 久久不见久久见免费视频7| 亚洲中文字幕无码一区二区三区| 日韩电影在线观看电影| 成人无码www在线看免费| 亚洲精品国产视频| 国产精品美女一区| 色一区av在线| 吞精囗交69激情欧美| 久久99精品久久久久久秒播放器| 伊人青青综合网| caoporn超碰97| 久久久国产精品麻豆 | 欧美丝袜第三区| 视频二区在线| 97福利一区二区| 一区二区三区四区高清视频| 国产麻豆电影在线观看| 久久精品国产网站| 午夜影院黄色片| 色视频欧美一区二区三区| 天天综合天天色| 97高清免费视频| 免费日韩一区二区三区 | 久久先锋影音| 国产精品jizz| 欧美性猛交xxxx久久久| 天天综合在线视频| 欧美一级免费视频| 亚洲深夜福利在线观看| 日韩av三级在线| 91免费看片在线观看| 91在线视频在线观看| 亚洲美女精品久久| 九色porny视频在线观看| 国产三区精品| 国产亚洲综合精品| 精品人妻少妇嫩草av无码| 91国偷自产一区二区三区成为亚洲经典| 五十路在线视频| 青青草成人在线| 成人三级视频| 日韩高清第一页| 亚洲女爱视频在线| 免费国产精品视频| 欧美亚洲免费电影| 第一会所亚洲原创| 五月激情婷婷在线| 亚洲蜜臀av乱码久久精品蜜桃| 性生活黄色大片| 2019中文字幕免费视频| 精品久久影院| 亚洲一区二区福利视频| 亚洲午夜国产一区99re久久| 四虎国产精品永远| 91精品美女在线| 国产精品www.| 欧美成人午夜精品免费| 欧美日韩精品一区二区天天拍小说 | 国产日韩精品一区二区三区| 国产精品玖玖玖| 欧美激情亚洲另类| 奇米色欧美一区二区三区| 四季av一区二区三区| 亚洲高清免费一级二级三级| 免费在线观看一级毛片| 91精品久久久久久久久不口人| 欧美日韩国产欧| 色哟哟精品观看| 欧美一区二区三区在线观看| 182在线视频观看| 亚洲高清视频一区二区| 成人精品小蝌蚪| 曰批又黄又爽免费视频| 欧美激情第三页| 成人在线免费观看网站| 国偷自产av一区二区三区麻豆| 都市激情亚洲色图| 成人免费在线| 欧美成人免费在线| 国产精品夜夜嗨| 亚洲成熟少妇视频在线观看| 欧美精品在线观看| 国产精品最新| 国模无码视频一区| 欧美日韩三级一区二区| 欧美a级在线观看| 喜爱夜蒲2在线| 国产亚洲短视频| 污视频在线免费观看|