精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

真實評估!北理發布全球首個「全場景教育」基準,支持4000+情境

人工智能 新聞
發展教育大模型需要新的數據和評估體系!北京理工大學高揚老師團隊推出EduBench,是首個專為教育場景打造的綜合評估基準,涵蓋9大教育場景、12個多視角評估維度、超4000個教育情境。通過多維度評估指標體系和人工標注一致性計算,確保評估可靠性,助力教育大模型發展,推動教育智能化。

為什么發展教育大模型需要新的數據和Eval體系?

AI賦能教育教學,需要從「經驗導向」邁向「證據導向」,真正將AI數據驅動思想賦能到教育場景中,這是核心動力。

教育場景復雜不僅涉及知識深度(基礎教育到高等教育)、知識廣度(涵蓋不同學科),還涉及認知水平不同、個性化需求多樣、教學決策性要求等。

現有面向AGI的通用benchmark側重于知識性的評估,缺乏對真實教育場景的深入探究。

最近,北京理工大學高揚老師團隊近期推出了全球首個全面涵蓋9大教育場景、12個多視角評估維度、超過4000個教育情境,專為教育場景打造的綜合評估基準EduBench??。

為了確保評估的全面性與準確性,EduBench特別設計了一套多維度評估指標體系???,再加上與人工標注者的一致性計算,確保了評估的可靠性。

通過實驗發現,最先進大模型與人之間的評估認知存在的差異,需要進一步對齊。

圖片

論文地址:https://arxiv.org/pdf/2505.16160

代碼開源:https://github.com/DIRECT-BIT/EduBench

模型開源:https://huggingface.co/DirectionAI/EDU-Qwen2.5-7B

數據開源:https://huggingface.co/datasets/DirectionAI/EduBench

EduBench的設計考慮到了教育的多樣性和復雜性,包含18821條數據,在學生側和教師側覆蓋了問題解答、個性化學習支持、自動評分、教學資料生成等9大教育場景,涵蓋從基礎教育到高等教育的多學科和不同難度等級。

通過評估12個關鍵維度,如場景適應性、事實與推理準確性、教學應用效果等,EduBench能從多個角度精準衡量大語言模型在教育中的表現,幫助研究者重新審視大語言模型在教育中的適用性與潛力。

更令人振奮的是,研究團隊還將研究的全部訓練數據、模型、測評數據、人工評估數據全面開源,旨在促進教育領域與大模型領域的研究者相互參考與交流,共同推動教育智能化的未來發展。

EduBench:為真實教育場景而生

為了提升大模型在多種真實教育場景下的泛用性,研究團隊分別以學生和教師為導向設計了9大教育場景。

圖片

學生側

  1. 問題解答(Problem Solving, Q&A):針對不同的難度的知識性問題,智能助手解答題目
  2. 錯誤糾正(Error Correction, EC):用戶給出一個題目和一個錯誤的回答,智能助手找出錯誤并進行了解釋和修改
  3. 思路提供(Idea Provision, IP):用戶對某個題目或者知識點存在疑問,智能助手提供思路/解釋原理并解答疑問
  4. 個性化學習支持(Personalized Learning Support, PLS):用戶給出學生畫像,智能助手設計學習路徑
  5. 情感支持(Emotional Support, ES):用戶說明問題,智能助手對用戶進行心理輔導

教師側

  1. 問題生成(Question Generation, QG):用戶給出學段、科目、知識點等信息,智能助手按照給定要求生成題目
  2. 自動評分(Automatic Grading, AG):用戶給出一個題目和一個答案,智能助手判斷答案正誤并給出評分和理由
  3. 教學資料生成(Teaching Material Generation, TMG):用戶給出學段、科目、知識點等信息,智能助手按照給定要求生成教學素材
  4. 個性化內容創作(Personalized Content Creation, PCC):用戶給出學生畫像,智能助手規劃教學建議

具體情境包括:(9大場景) * (中文 + 英文) * (簡單 + 中等 + 困難) * (K-12科目 + 高等教育科目) * (簡答 + 單選 + 多選) = 4,019個情境。

EduBench評估

EduBench的評估是分層級體系,包括三個核心維度,每個維度下包含四個子指標

例如,在場景適應性維度上,評估模型是否能夠準確理解并執行教育任務;在事實與推理準確性維度上,重點考察模型輸出的事實正確性和推理的邏輯性;在教學應用性維度上,則評估模型是否符合教育原則,并能對學生的學習產生積極影響。

通過這些精細化的評估維度,EduBench不僅為大語言模型在教育領域的應用提供了全面的測量工具,也為未來的模型優化和改進提供了明確的方向。

場景適配性(Scenario Adaptation)


  • 指令遵循與任務完成(Instruction Following & Task Completion)
  • 角色與語氣一致性(Role & Tone Consistency)
  • 內容相關性與范圍控制(Content Relevance & Scope Control)
  • 場景元素整合能力(Scenario Element Integration)

事實性與推理準確性(Factual & Reasoning Accuracy)


  • 基礎事實準確性(Basic Factual Accuracy)
  • 領域知識準確性(Domain Knowledge Accuracy)
  • 推理過程嚴謹性(Reasoning Process Rigor)
  • 錯誤識別與糾正精度(Error Identification & Correction Precision)

教學應用性(PedagogicalApplication)

  • 清晰簡潔與積極啟發(Clarity, Simplicity & Inspiration)
  • 激勵引導與積極反饋(Motivation, Guidance & Positive Feedback)
  • 個性化適應與學習支持(Personalization, Adaptation & Learning Support)
  • 高階思維與技能發展(Higher-Order Thinking & Skill Development)

大模型在真實場景下仍有不足

研究團隊使用EduBench對多個主流大語言模型進行了廣泛評估,包括DeepSeek R1、DeepSeek V3、Qwen Max等,這些模型包括不同的參數規模和訓練方式,涵蓋從數十億到數千億參數的各種類型。

圖片

每條測試集樣本根據其所屬的任務分類,選取對應的評估維度使用大模型和人類標注分別進行基于給定metric的評估,將模型在每個場景的性能進行量化,下圖展示了評估的結果。

圖片

評估結果令人關注:即使是在模型評估中表現最強的模型,在人類標注的結果中某些場景的平均得分也未能突破9分大關。

這一結果表明,模型在適應少數特殊教育場景時仍存在明顯的不足。

{'姓名':'亞歷克斯·約翰遜','年齡':22,'當前技能水平':'初級','學習目標':'在一年內實現流利的會話并理解基本的書面漢語','研究習慣':'喜歡視覺學習材料,最好在早上學習,每天分配1小時用于語言學習','弱點':'發音和字符識別'}根據學生個人資料,提供\\「學習路徑規劃\\」和\\「個性化建議\\」,以JSON格式返回。Deepseek-V3回復:{  "學習路徑規劃": {    "短期目標 (1-3個月)": [      "專注于掌握拼音和基本發音規則。",      "學習100個最常用的漢字及其含義。",      "通過使用閃卡和視頻等視覺輔助練習簡單的日常對話。"    ],    "中期目標 (4-6個月)": [      "擴展詞匯量至300-500個,重點關注日常會話主題。",      "通過閱讀簡單的文本或漫畫提高漢字識別能力。",      "通過慢速音頻材料進行基本的聽力練習。"    ],    "長期目標 (7-12個月)": [      "在日常場景中實現會話流利。",      "閱讀并理解基礎中文書寫內容,例如短文或消息。",      "與母語者或語言交換伙伴練習口語表達。"    ]  },  "個性化建議": {    "學習材料": [      "使用Pleco或Anki等應用進行漢字識別和詞匯擴展。",      "觀看適合初學者的帶字幕中文YouTube頻道或電視劇。",      "利用閃卡、信息圖表及圖解詞典等視覺學習工具。"    ],    "學習計劃": [      "在早晨安排專注學習時段,例如發音練習。",      "每天花30分鐘進行聽力練習,另30分鐘進行閱讀或寫作。"    ],    "練習策略": [      "錄制自己的語音以監測和改善發音。",      "加入HelloTalk或Tandem等在線語言交換平臺,與母語者交流練習。",      "參加中文語言聚會或在線社區以進行沉浸式練習。"    ],    "弱點提升": [      "通過模仿母語者及使用像Pinyin Trainer這樣的應用程序專注改進發音。",      "每天練習漢字識別,通過書寫漢字和使用間隔重復工具進行鞏固。"    ]  }}1.3 場景元素整合能力(人類評估):得分:5/10原因:推薦視覺工具但未具體說明(如"infographics"類型),晨間學習建議籠統。發音改進策略重復問題描述("mimicking native speakers"),未提出創新方法。4.2 個性化適應與學習支持(人類評估):得分:6/10原因:"join online communities"未說明具體類型,"daily 1 hour"未細化為適合初學者的模塊組合。字符練習建議缺乏進階方案(僅提到"spaced repetition")。

{'姓名':'亞歷克斯·約翰遜','年齡':22,'當前技能水平':'初級','學習目標':'在一年內實現流利的會話并理解基本的書面漢語','研究習慣':'喜歡視覺學習材料,最好在早上學習,每天分配1小時用于語言學習','弱點':'發音和字符識別'}根據學生個人資料,提供\\「學習路徑規劃\\」和\\「個性化建議\\」,以JSON格式返回。
Deepseek-V3回復:
{
  "學習路徑規劃": {
    "短期目標 (1-3個月)": [
      "專注于掌握拼音和基本發音規則。",
      "學習100個最常用的漢字及其含義。",
      "通過使用閃卡和視頻等視覺輔助練習簡單的日常對話。"
    ],
    "中期目標 (4-6個月)": [
      "擴展詞匯量至300-500個,重點關注日常會話主題。",
      "通過閱讀簡單的文本或漫畫提高漢字識別能力。",
      "通過慢速音頻材料進行基本的聽力練習。"
    ],
    "長期目標 (7-12個月)": [
      "在日常場景中實現會話流利。",
      "閱讀并理解基礎中文書寫內容,例如短文或消息。",
      "與母語者或語言交換伙伴練習口語表達。"
    ]
  },
  "個性化建議": {
    "學習材料": [
      "使用Pleco或Anki等應用進行漢字識別和詞匯擴展。",
      "觀看適合初學者的帶字幕中文YouTube頻道或電視劇。",
      "利用閃卡、信息圖表及圖解詞典等視覺學習工具。"
    ],
    "學習計劃": [
      "在早晨安排專注學習時段,例如發音練習。",
      "每天花30分鐘進行聽力練習,另30分鐘進行閱讀或寫作。"
    ],
    "練習策略": [
      "錄制自己的語音以監測和改善發音。",
      "加入HelloTalk或Tandem等在線語言交換平臺,與母語者交流練習。",
      "參加中文語言聚會或在線社區以進行沉浸式練習。"
    ],
    "弱點提升": [
      "通過模仿母語者及使用像Pinyin Trainer這樣的應用程序專注改進發音。",
      "每天練習漢字識別,通過書寫漢字和使用間隔重復工具進行鞏固。"
    ]
  }
}
1.3 
場景元素整合能力(人類評估):
得分:5/10
原因:推薦視覺工具但未具體說明(如"infographics"類型),晨間學習建議籠統。發音改進策略重復問題描述("mimicking native speakers"),未提出創新方法。
4.2 
個性化適應與學習支持(人類評估):
得分:6/10
原因:"join online communities"未說明具體類型,"daily 1 hour"未細化為適合初學者的模塊組合。字符練習建議缺乏進階方案(僅提到"spaced repetition")。

盡管這些模型在大多數常見教育任務中展現了較為出色的表現,但在面對一些復雜或特殊的教育情境時,仍難以做到與人類標注者相匹配。

這種差距可能源于模型對這些場景的理解能力和應對策略的局限性,尤其是在涉及復雜推理、情感識別或個性化反饋的任務中,模型的適應性和準確性仍需進一步提升。

為什么模型給分高于人類評分?

在上表可以清楚地觀察到,模型的評分普遍高于人類標注者。在metricdomain兩個層面,模型的得分通常大于人類評分近1分

特別是在Q&A這一領域,模型的得分通常在9分以上,而人類評分僅為6-7分,兩者之間2分的差距,反映在具體metric評分細則上存在較大差異。

研究團隊認為,這種現象可能由以下兩方面原因造成:

  1. 模型對評分細則的理解存在偏差,但這一問題可以通過后續訓練加以解決,特別是因為當前使用的評估模型尚為通用模型,未經過專門的獎勵訓練;
  2. 現有的大模型不傾向于給出負面反饋,導致模型評估中對用戶問題或答案的評價過于寬容。研究團隊認為,后續的訓練和對齊將有助于緩解這一問題,這也是值得進一步探索的重點方向。

多源知識蒸餾方法使小模型反敗為勝

基于EduBench的評估結果,研究團隊根據大模型和人類標注員在驗證集上的評估結果挑選出了在每個教育場景中表現最為出色的模型,并將這些頂尖模型的知識進行融合,構建成一個多源知識蒸餾源模型組合

這一創新策略不僅使得各個模型的優勢得以有效整合,還為訓練小規模模型提供了全新的可能性。通過這一多源知識蒸餾的方式,團隊成功將多個優秀模型的知識精華提取,并應用于一個7B教育模型的訓練。

圖片

實驗結果令人震驚——即便是如此小規模的模型,在使用約17000個篩選后的訓練樣本的情況下,經過蒸餾訓練后,能夠在多個關鍵評估指標上,達到與671BDeepSeek V3相媲美的性能。

這一突破為資源受限的教育場景提供了全新的解決方案,同時也為大語言模型的高效利用開辟了新的路徑。

大模型與人類決策有多大差距?

在使用模型進行評估之后,研究團隊進一步采用Kendall's W來衡量不同評估模型之間,以及評估模型與人類標注之間的一致性。

圖片

整體來看,DeepSeek-V3作為評估模型,與人類標注者的表現展示出了最高的一致性。

盡管模型與人類標注之間的一致性表現得相對明顯,但并未達到高度的一致,具體的分數給定上仍存在一定差距。

打分為什么選擇Point-wise?Pair-wise有什么缺點

在研究的最初階段,研究團隊采用了pair-wise的評估方式,即讓模型從兩個答案中選擇一個最優答案。

然而,在實驗過程中,團隊發現了一個問題:模型選擇答案的結果受到了兩個答案在prompt中組織順序的顯著影響。

圖片

這一現象在GPT-4o上表現得尤為明顯——當兩個答案被對比時,模型傾向于選擇排在前面的答案,選擇的比例甚至達到了70-80%

這表明,模型的選擇過程已經被答案的順序高度干擾,導致評估結果的偏差。相對而言,QwQ-Plus模型展現出了較高的一致性,其選擇結果并未受到答案順序的明顯影響。

基于這一發現,研究團隊最終決定轉向point-wise評估方式,這種方式不僅更加公平,而且避免了順序干擾,能夠更準確地反映模型在各個維度上的表現。

未來工作

  • 當前所有的問題查詢數據均由模型生成,這可能無法全面反映真實或多樣化的用戶意圖。為了進一步提升評估的準確性,研究團隊計劃加入更多人工編寫的查詢,以彌補模型生成數據的局限性。
  • 此外,大多數評估指標和任務場景是手動設計的,自動化這些過程將顯著提高評估的可擴展性與一致性。研究團隊正在探索如何通過自動化手段優化評估流程,確保更廣泛的適用性和更高的效率。
  • 研究團隊將持續維護該評估基準,形成發展的教育場景數據和更完善的評估體系,助力教育大模型發展和智慧教育推廣。

總結

EduBench的發布,為教育大模型的推廣提供了科學全面的評估框架和高質量數據資源。它不僅為研究人員提供了深刻的洞察,幫助他們理解并優化大語言模型在教育場景中的表現,還為教育工作者提供了強有力的工具,助力提升教學效率和質量。

隨著更多教育場景的不斷加入與評估指標的逐步完善,EduBench有望成為推動教育AI發展的核心平臺。

研究團隊也期待與更多對大語言模型在教育應用方面有興趣的學者與從業者合作,共同開拓這一領域的潛力,推動教育走向更加個性化、智能化的未來。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-12 10:12:00

視頻模型AI

2020-07-01 13:10:41

微軟Teams教育

2025-07-22 09:03:00

AI視覺模型

2009-07-16 16:29:46

LTE商用版本華為

2021-09-23 14:22:58

B端字體設計師

2020-10-13 11:17:13

華為UBBF智能聯接

2024-10-12 14:10:00

智能應用

2011-11-25 14:57:01

Radware應用交付

2016-10-31 09:33:08

2015-11-18 17:17:37

100G/博科

2020-09-24 10:55:09

華為智能體全智慧

2011-11-10 10:36:29

全球信息技術主管宣言

2025-03-07 10:12:16

2025-06-16 14:39:56

模型開源框架

2025-06-11 17:46:51

2023-06-30 22:34:34

2025-10-16 08:57:00

2020-07-01 15:53:40

GSMA5G5G網絡新指南
點贊
收藏

51CTO技術棧公眾號

精品资源在线| 一区二区黄色| 欧美精品欧美极品欧美激情| 精品国产乱码久久久久久图片 | 久操视频在线免费播放| 成人免费观看视频在线观看| 色婷婷久久99综合精品jk白丝| 韩国久久久久久| 国产情侣久久久久aⅴ免费| 尤物tv国产一区| 欧美综合二区| 成人乱码一区二区三区 | 成人在线视频你懂的| 韩国黄色一级片| 日韩视频免费观看| 亚洲毛片一区| 亚洲国产精品suv| 91精品国产自产91精品| 国产成人免费视| 亚洲av成人片无码| 亚洲国产精品va| 久久影院一区| 豆国产97在线 | 亚洲| 亚洲资源在线看| 不卡av在线网| 久操av在线| 久久国产激情视频| 久久综合88中文色鬼| 天堂成人免费av电影一区| 日韩伦理在线电影| 99视频在线视频| 爱福利视频一区| 免费一区二区视频| 国产淫片在线观看| 无码人妻丰满熟妇区毛片蜜桃精品| 中文字幕日韩在线观看| 日本中文在线一区| 1024免费在线视频| 牛夜精品久久久久久久| 一区二区三区黄色| 国内欧美视频一区二区| 精品国产丝袜高跟鞋| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 日韩午夜电影av| 68国产成人综合久久精品| 国产999久久久| 国产xxxx振车| 一区二区成人精品| jizzjizzjizz欧美| 小早川怜子久久精品中文字幕| 国产97色在线|日韩| 中文字幕一区二区三区色视频| 自拍偷拍亚洲| 伊人网av在线| 免费黄色日本网站| 国产一区二区三区久久精品| 黑人精品欧美一区二区蜜桃| 蜜臀国产一区| 日本一区二区三区久久久久久久久不 | 日本国产中文字幕| 在线观看精品自拍私拍| 成人综合婷婷国产精品久久免费| 欧美精品总汇| 五月天综合在线| 日本成人在线不卡| 日韩有码在线观看| 久久久久久久性| 白白在线精品| 中国黄色一级视频| 国产免费成人在线| 国内外成人免费激情在线视频网站 | 91在线视频精品| 欧美日韩国产片| 高清一区二区三区av| 欧美色图17p| 日韩国产一区久久| 亚洲欧洲中文天堂| 美女网站色91| 国产一区二区主播在线| 夜夜躁狠狠躁日日躁av| 我看黄色一级片| 国产激情视频一区| 欧美大片顶级少妇| 91影院在线免费观看| 四虎5151久久欧美毛片| 黄网站在线观看| 久久久久久九九九九九| 欧美国产综合视频| 亚洲男子天堂网| 久久久久青草大香线综合精品| 午夜精品影视国产一区在线麻豆| 男男激情在线| 九色porny自拍视频| 欧美一区二区国产| 丁香五精品蜜臀久久久久99网站 | 成人免费91在线看| 777精品伊人久久久久大香线蕉| 久久精品国产亚洲一区二区三区 | 日本一区二区三区久久| 99爱视频在线| 亚洲xxxx3d| 亚洲精品电影网站| 日本一二三不卡| 亚洲久久在线| 亚洲国产欧美在线观看| 亚洲第一精品网站| 日本美女xxx| 99久热在线精品视频| 欧美日韩国产123| 日韩一区二区三区四区五区六区| 欧美激情综合在线| 激情欧美亚洲| 久久亚洲精品中文字幕| 成人77777| youjizz欧美| 欧美日韩中文字幕在线观看| 一本大道熟女人妻中文字幕在线 | 亚洲在线一区二区三区| 国产精品magnet| 成人免费观看49www在线观看| 天天摸天天干天天操| 国产精品50页| 国产日本在线播放| 国产精品视频一区二区三区四| 日韩精品一区二| 中文字幕制服丝袜成人av| 久久精品91| 日韩美女精品| 三妻四妾完整版在线观看电视剧| 成人午夜免费福利| 手机在线看片1024| 亚洲av成人精品一区二区三区 | 欧美高清一区| 国产精品亚洲一区二区在线观看| 98在线视频| 国产麻豆精品一区| 免费在线观看一级片| 三级网站免费看| 国产精品自拍片| 另类视频在线观看+1080p| 欧美—级高清免费播放| 亚洲黄页视频免费观看| 日本乱人伦一区| ㊣最新国产の精品bt伙计久久| 国产资源精品在线观看| 伊人久久成人| 清纯唯美日韩| 99精品在线免费观看| 91桃色在线| 成年人免费在线视频| 中文字幕制服诱惑| 国产一区二区三区四区五区六区 | 免费成人在线网站| 日韩制服丝袜先锋影音| 色综合咪咪久久| 欧美私人情侣网站| 亚洲国产天堂| 一区二区三区视频观看| 秋霞精品一区二区三区| 成人午夜激情视频| 日本韩国精品一区二区在线观看| ...中文天堂在线一区| 国产精品扒开腿做| 超碰在线观看99| 日韩一区中文字幕| 一区二区在线免费看| 欧美精品尤物在线观看| 亚洲视频免费一区| 精品免费99久久| 欧美日韩一区不卡| 欧美午夜影院在线视频| 亚洲女同一区二区| 欧美劲爆第一页| 激情小说中文字幕| 日韩**一区毛片| 亚洲中国色老太| 婷婷丁香在线| 欧美一区二区视频在线观看2020 | 狠狠躁夜夜躁久久躁别揉| www.com黄色片| 欧美特黄一级大片| 国产免费久久av| av大片在线观看| 欧美日韩色综合| 国产极品国产极品| 国产成人av电影在线观看| 国产91沈先生在线播放| 三级欧美日韩| 2018国产精品视频| 国产乱女淫av麻豆国产| 一本色道无码道dvd在线观看| 欧美性大战久久久久xxx | 亚洲五月激情网| 国产毛片一区二区三区va在线| 国产精品亚洲а∨天堂免在线| 欧美精品第一页在线播放| 亚洲精品视频免费| 欧美在线观看一区| 欧美日韩国产大片| 国产一区二区三区免费观看在线| 欧美日韩一区二区在线观看 | 成人网av.com/| 久久精品欧美视频| 亚洲精品久久久久久无码色欲四季| 亚洲va在线va天堂| 欧美成人国产精品一区二区| 麻豆精品一区二区| 日韩欧美亚洲日产国产| av亚洲一区二区三区| 在线激情影院一区| 99久久精品日本一区二区免费| 亚洲色图在线播放| 亚洲av成人片色在线观看高潮 | 欧美最近摘花xxxx摘花| 毛片网站在线| 欧洲视频一区二区| 我要看黄色一级片| 国产清纯在线一区二区www| 色哟哟网站在线观看| 日本网站在线观看一区二区三区| 亚洲国产精品123| 任你躁在线精品免费| 国产精品网站大全| 欧美91看片特黄aaaa| 欧美激情精品久久久久久免费印度| 国产区视频在线| 日韩高清中文字幕| 亚洲黄色片视频| 欧美日精品一区视频| 国产在线视频第一页| 亚洲免费毛片网站| 殴美一级黄色片| 久久蜜桃av一区精品变态类天堂 | 欧美精品久久一区二区| 可以在线看的黄色网址| 亚洲综合图色| 精品91免费| 成人直播在线观看| 成人激情视频在线播放| 51一区二区三区| 国产成人久久精品| 黄瓜视频成人app免费| 久久精品男人天堂| 精品51国产黑色丝袜高跟鞋| 亚洲欧美色婷婷| 五月婷在线视频| 日韩精品在线播放| 日韩av成人| 亚洲国产欧美一区二区三区同亚洲| 亚洲成人一级片| 欧美www视频| 欧美熟妇另类久久久久久不卡 | 国产黄色免费在线观看| 亚洲大胆人体av| 日本美女一级片| 欧美va亚洲va香蕉在线| 韩国av在线免费观看| 欧美另类z0zxhd电影| 91精东传媒理伦片在线观看| 色嗨嗨av一区二区三区| 色老头在线视频| 欧美性猛交xxxx黑人| 人妻丰满熟妇av无码区| 欧美亚洲动漫制服丝袜| 中文字幕一二区| 欧美精品一二三| 96日本xxxxxⅹxxx17| 色综合视频一区二区三区高清| 无尽裸体动漫2d在线观看| 秋霞国产精品| 成人激情春色网| 136福利精品导航| 精品在线观看一区二区| 国产精品嫩草影院在线看| 亚洲日本japanese丝袜| 欧美一区精品| 人人干视频在线| 久久精品麻豆| 青青草精品在线| 91亚洲大成网污www| 少妇愉情理伦三级| 一级日本不卡的影视| 国产精品一区二区三区四| 欧美性生活久久| www男人的天堂| 亚洲男人天堂网站| h片在线观看网站| 国内揄拍国内精品| 秋霞国产精品| 不卡视频一区| 欧美精品一区二区三区精品| 加勒比海盗1在线观看免费国语版| 亚洲精品成人| av在线com| 亚洲一区国产| 92看片淫黄大片一级| 久久99精品国产麻豆婷婷| 精产国品一区二区三区| 久久久久久综合| 69av视频在线| 日本道色综合久久| 国产精品无码在线播放| 精品免费视频一区二区| 丁香六月天婷婷| 日韩av最新在线观看| 高h震动喷水双性1v1| 欧美va亚洲va在线观看蝴蝶网| 高清国产福利在线观看| 97精品国产97久久久久久| 美女100%一区| 国产免费一区| 欧美在线亚洲综合一区| 97国产精东麻豆人妻电影| 国产一区二区三区免费看| 欧美另类z0zx974| 亚洲一区在线观看免费观看电影高清| 亚洲毛片一区二区三区| 日韩一区二区三区在线视频| 国产女人在线视频| 97精品一区二区三区| 亚洲天堂中文字幕在线观看| 日本午夜精品一区二区三区| 欧美日本一区| 一区二区在线免费看| 91免费观看在线| 久久精品波多野结衣| 欧美综合久久久| 人妻妺妺窝人体色www聚色窝| 日韩视频永久免费观看| 日韩漫画puputoon| 久久草.com| 伊人久久婷婷| 免费观看一区二区三区| 中文字幕欧美三区| 亚洲 欧美 中文字幕| 欧美激情一区二区三区不卡| 日韩经典在线视频| 校园激情久久| 一级黄色片国产| 国产精品每日更新| 欧美人一级淫片a免费播放| 亚洲国产精品字幕| h片在线观看| 国产精品欧美日韩一区二区| 亚洲警察之高压线| www成人免费| 蜜臀av亚洲一区中文字幕| 日本japanese极品少妇| 亚洲国产日产av| av免费在线不卡| 亚洲女人初尝黑人巨大| 阿v视频在线| 国产在线观看一区| 国产欧美91| 久久久久国产精品区片区无码| 狠狠色噜噜狠狠狠狠97| 日本亚洲一区| 欧美一区二三区| 国产剧情在线观看一区| 黄色三级视频在线| 国产欧美综合在线观看第十页| 国产免费一级视频| 一区二区三区亚洲| 欧美一级二级视频| 伊人久久婷婷色综合98网| 狠狠色丁香久久婷婷综| 国产精品视频一区二区在线观看| 8v天堂国产在线一区二区| www.久久ai| 国产日韩欧美一二三区| **女人18毛片一区二区| 深夜视频在线观看| 欧美日韩国产在线看| 国产色a在线| 国产精品香蕉av| 亚洲草久电影| 制服下的诱惑暮生| 亚洲午夜视频在线观看| 亚洲av无码片一区二区三区| 久久久久五月天| 高清日韩欧美| 色综合av综合无码综合网站| 91丝袜呻吟高潮美腿白嫩在线观看| 黄色片免费在线观看视频| 99热在线成人| 天天久久综合网| 亚洲一二三区视频在线观看| 亚洲风情第一页| 88xx成人精品| 亚洲成人最新网站| 亚洲第九十七页| 日韩欧美aaa| 在线免费黄色| 国产高清精品一区二区三区| 天堂av在线一区| 欧美做爰啪啪xxxⅹ性| 精品国产一区二区三区忘忧草| 国产日韩另类视频一区| 中文一区一区三区免费| 国产在线视频不卡二|