精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最強(qiáng)的GPT-4V都考不過(guò)?基于大學(xué)考試的測(cè)試基準(zhǔn)MMMU誕生了

人工智能 新聞
隨著大型語(yǔ)言模型(LLM)快速發(fā)展,人們對(duì) AGI 這一頗具爭(zhēng)議的概念進(jìn)行了廣泛討論。簡(jiǎn)單來(lái)說(shuō),AGI 是指在大多數(shù)任務(wù)上都與人類相當(dāng)或超越人類的人工智能系統(tǒng)。由于缺乏公認(rèn)的可操作定義,人們一直都很難就 AGI 開(kāi)展更加坦誠(chéng)和建設(shè)性的討論。

目前最好的大型多模態(tài)模型 GPT-4V 與大學(xué)生誰(shuí)更強(qiáng)?我們還不知道,但近日一個(gè)新的基準(zhǔn)數(shù)據(jù)集 MMMU 以及基于其的基準(zhǔn)測(cè)試或許能給我們提供一點(diǎn)線索,如下排行榜所示。

圖片

看起來(lái),GPT-4V 在一些科目上已經(jīng)強(qiáng)過(guò)掛科的大學(xué)生了。當(dāng)然這個(gè)數(shù)據(jù)集的創(chuàng)造目的并不為了擊敗大學(xué)生,而是為了提供一個(gè)兼具深度與廣度的多模態(tài) AI 測(cè)試基準(zhǔn),助力人工智能系統(tǒng)的開(kāi)發(fā),尤其是通用人工智能(Artificial General Intelligence,AGI)。

隨著大型語(yǔ)言模型(LLM)快速發(fā)展,人們對(duì) AGI 這一頗具爭(zhēng)議的概念進(jìn)行了廣泛討論。簡(jiǎn)單來(lái)說(shuō),AGI 是指在大多數(shù)任務(wù)上都與人類相當(dāng)或超越人類的人工智能系統(tǒng)。由于缺乏公認(rèn)的可操作定義,人們一直都很難就 AGI 開(kāi)展更加坦誠(chéng)和建設(shè)性的討論。

為了解決這個(gè)問(wèn)題,Morris 等人的論文《Levels of AGI: Operationalizing Progress on the Path to AGI》提出了一種兼顧通用性(廣度)和性能(深度)的 AGI 分級(jí)分類法。

在這種分類法中,第 3 級(jí)是專家 AGI,這是一個(gè)重要的里程碑。它表示 AI 系統(tǒng)在廣泛的任務(wù)上達(dá)到了「掌握專業(yè)知識(shí)的成年人類的 90%」,并由此可以在許多行業(yè)中達(dá)到「機(jī)器智能接替人類勞動(dòng)力的替代門檻」,從而造成重大的失業(yè)風(fēng)險(xiǎn)和經(jīng)濟(jì)混亂。因此,密切關(guān)注專家 AGI 的發(fā)展情況具有重要的學(xué)術(shù)和社會(huì)意義。

那么,該如何創(chuàng)造用于度量專家 AGI 的基準(zhǔn)呢?

由于專家 AGI 的定義是基于與專業(yè)人士的比較,因此不同學(xué)科的大學(xué)水平考試就是一個(gè)很好的起點(diǎn),因?yàn)檫@些考試本身的目的就是評(píng)估人類在相應(yīng)學(xué)科的專業(yè)能力。MMLU 和 AGIEval 等基準(zhǔn)已經(jīng)成功采用了這一策略,但它們只考慮了基于文本的問(wèn)題,而人類專家有能力解決多模態(tài)問(wèn)題。

與此同時(shí),能夠理解文本和圖像的大型多模態(tài)模型(LMM)已經(jīng)朝著更通用的人工智能邁出了一大步。這些 LMM 能在現(xiàn)有的多模態(tài)基準(zhǔn)測(cè)試上獲得穩(wěn)定一致的優(yōu)良表現(xiàn)。比如 CogVLM 在 VQA-v2 基準(zhǔn)上的成績(jī)?yōu)?85%,在 ScienceQA-IMG 上為 92%,在 RefCOCO 上為 93%。

然而,大多數(shù)現(xiàn)有的多模態(tài)基準(zhǔn)側(cè)重于常識(shí) / 日常知識(shí),而不是專家級(jí)的領(lǐng)域知識(shí)和高級(jí)推理。與這個(gè)目標(biāo)最接近的基準(zhǔn)是 ScienceQA。盡管 ScienceQA 覆蓋了多個(gè)學(xué)科(廣度),但其大部分問(wèn)題都限于小學(xué)到初中水平,因此缺乏深度,不足以作為專家 AGI 的基準(zhǔn)。

為此,IN.AI Research 等多所機(jī)構(gòu)的一個(gè)研究團(tuán)隊(duì)構(gòu)建了一個(gè)新基準(zhǔn) MMMU,可用于評(píng)估 AI 在大學(xué)水平的多學(xué)科問(wèn)題上的多模態(tài)理解和推理能力。

圖片

  • 論文地址:https://arxiv.org/abs/2311.16502
  • 項(xiàng)目網(wǎng)站:https://mmmu-benchmark.github.io/
  • 數(shù)據(jù)集:https://huggingface.co/datasets/MMMU/MMMU
  • 代碼:https://github.com/MMMU-Benchmark/MMMU

其中包含的問(wèn)題來(lái)自大學(xué)考試、測(cè)驗(yàn)和教科書,涉及六個(gè)常見(jiàn)學(xué)科:藝術(shù)與設(shè)計(jì)、商科、科學(xué)、健康與醫(yī)學(xué)、人文與社會(huì)科學(xué)、技術(shù)與工程。MMMU 包含 1.15 萬(wàn)個(gè)精心選取的多模態(tài)問(wèn)題,涵蓋 30 個(gè)不同的科目和 183 個(gè)子領(lǐng)域,因此滿足廣度目標(biāo)。此外,MMMU 中許多問(wèn)題都需要專家級(jí)的推理能力,比如使用傅立葉變換或均衡理論來(lái)推導(dǎo)問(wèn)題的解,因此也滿足深度目標(biāo)。

圖片

MMMU 還具備了兩個(gè)特有挑戰(zhàn)(圖 1):一是其涵蓋多種圖像格式,從照片和繪畫等視覺(jué)場(chǎng)景到圖表和表格,可用于測(cè)試 LMM 的感知能力;二是 MMMU 具有文本和圖像混合交織的輸入。對(duì)于這個(gè)基準(zhǔn),AI 模型需要把圖像和文本放在一起理解,這往往需要回憶深度的學(xué)科知識(shí)并根據(jù)理解和知識(shí)來(lái)執(zhí)行復(fù)雜推理。

該團(tuán)隊(duì)不僅提出了基準(zhǔn),也基于新基準(zhǔn)評(píng)估了一些模型,其中包括 14 個(gè)開(kāi)源 LMM 和 GPT-4V。他們從中得到了一些有趣的結(jié)論。

此外,他們還分析了 GPT-4V 的 150 個(gè)錯(cuò)誤案例,結(jié)果發(fā)現(xiàn) 35% 的錯(cuò)誤與感知有關(guān),29% 的錯(cuò)誤源自缺乏知識(shí)、26% 則是由于推理過(guò)程的缺陷。這些發(fā)現(xiàn)表明 MMMU 是有難度的,可用于助力進(jìn)一步的研究發(fā)展。

MMMU 基準(zhǔn)

MMMU 概況

MMMU 是 Massive Multi-discipline Multimodal Understanding and Reasoning 的縮寫,即大規(guī)模多學(xué)科多模態(tài)理解和推理。其構(gòu)建目標(biāo)是評(píng)估基礎(chǔ)模型在廣泛多樣的任務(wù)上的專家級(jí)多模態(tài)理解能力。MMMU 涉及 6 個(gè)學(xué)科的 30 個(gè)科目。圖 2 給出了每個(gè)學(xué)科的一個(gè) MMMU 樣本。

圖片

圖 3 詳細(xì)給出了所覆蓋的科目及相關(guān)統(tǒng)計(jì)數(shù)據(jù)。

圖片

該基準(zhǔn)中的問(wèn)題是人工收集的,收集者是來(lái)自不同學(xué)科的 50 位大學(xué)生,數(shù)據(jù)來(lái)源包括網(wǎng)絡(luò)資源、教科書和課程材料。

如表 1 所示,MMMU 中共有 1.15 萬(wàn)個(gè)問(wèn)題,并分成了三個(gè)子集:少樣本開(kāi)發(fā)集、驗(yàn)證集和測(cè)試集。

少樣本開(kāi)發(fā)集中每個(gè)科目包含 5 個(gè)問(wèn)題;驗(yàn)證集則包含大約 900 個(gè)問(wèn)題,可用于超參數(shù)選擇;測(cè)試集則有 1.05 萬(wàn)個(gè)問(wèn)題。MMMU 的設(shè)計(jì)目標(biāo)是衡量 LMM 的三項(xiàng)基本技能:感知、知識(shí)和推理。

數(shù)據(jù)的收集和整理過(guò)程

數(shù)據(jù)收集。第一步,他們?yōu)g覽了常見(jiàn)的大學(xué)專業(yè),然后確定要將哪些學(xué)科包含進(jìn)該基準(zhǔn)中。他們選擇的原則是該學(xué)科需要經(jīng)常采用視覺(jué)輸入來(lái)提供有價(jià)值的信息。基于這個(gè)原則,他們?nèi)サ袅朔▽W(xué)和語(yǔ)言學(xué)等一些學(xué)科,因?yàn)檫@些學(xué)科中很難找到足夠多的相關(guān)多模態(tài)問(wèn)題。最后,他們從 6 個(gè)不同學(xué)科中選擇了 30 個(gè)科目。

第二步,他們招募了 50 位這些專業(yè)的大學(xué)生,讓他們作為標(biāo)注者來(lái)幫助收集問(wèn)題。他們會(huì)從專業(yè)教科書和網(wǎng)絡(luò)資源收集多模態(tài)問(wèn)題,并在有必要時(shí)根據(jù)自己的專業(yè)知識(shí)創(chuàng)建新問(wèn)題。考慮到基礎(chǔ)模型的數(shù)據(jù)污染問(wèn)題,標(biāo)注者會(huì)選擇沒(méi)有立即可用答案的問(wèn)題,例如那些答案在不同的文檔中或教科書末尾的問(wèn)題。這個(gè)過(guò)程中,他們得到了 1.3 萬(wàn)個(gè)問(wèn)題。

 為了進(jìn)一步控制數(shù)據(jù)質(zhì)量,他們又執(zhí)行了兩個(gè)數(shù)據(jù)清理步驟。第一步,他們使用了詞匯重疊和來(lái)源網(wǎng)址相似度來(lái)識(shí)別潛在的重復(fù)問(wèn)題。然后他們對(duì)這些重復(fù)項(xiàng)進(jìn)行了審查,并清除了所有重復(fù)項(xiàng)。第二步則是把這些問(wèn)題分配給該論文的參與作者,讓他們幫助進(jìn)行格式和拼寫檢查。最后,該團(tuán)隊(duì)對(duì)這些問(wèn)題進(jìn)行了難度分級(jí):非常簡(jiǎn)單、簡(jiǎn)單、中等、困難。其中大約 10% 的問(wèn)題屬于非常簡(jiǎn)單;由于太過(guò)簡(jiǎn)單,不符合該基準(zhǔn)的設(shè)計(jì)原則,因此被排除在外。

圖 4 給出了 MMMU 與已有基準(zhǔn)的差異。

實(shí)驗(yàn) 

該團(tuán)隊(duì)基于 MMMU 對(duì)多種 LLM 和 LMM 進(jìn)行了評(píng)估。每一種類型都兼顧了閉源和開(kāi)源模型。評(píng)估采用了零樣本設(shè)置,以評(píng)估模型在沒(méi)有微調(diào)或少樣本演示的情況下生成準(zhǔn)確答案的能力。所有實(shí)驗(yàn)均基于 NVIDIA A100 GPU。

主要結(jié)果 

表 2 給出了在 MMMU 基準(zhǔn)上不同 LLM 和 LMM 的結(jié)果比較。

他們得到了一些重要發(fā)現(xiàn):

  • MMMU 難度很大,就連 GPT-4V 的準(zhǔn)確度也只有 55.7%,這說(shuō)明 AI 技術(shù)還有很大的改進(jìn)空間。
  • 開(kāi)源 LMM 和 GPT-4V 的性能差距很大。BLIP2-FLAN-T5-XXL 和 LLaVA-1.5 等表現(xiàn)最好的開(kāi)源模型也只有 34% 左右的準(zhǔn)確度。
  • 具備光學(xué)字符識(shí)別(OCR)或生成字幕的 LLM 沒(méi)有看到顯著的提升,這說(shuō)明 MMMU 需要模型更深度地將圖像和文本放在一起理解。 
  • 在藝術(shù)與設(shè)計(jì)以及人文與社會(huì)科學(xué)等視覺(jué)數(shù)據(jù)不太復(fù)雜的學(xué)科中,模型表現(xiàn)出的性能更高。相比之下,商科、科學(xué)、健康與醫(yī)學(xué)以及技術(shù)與工程等領(lǐng)域具有更復(fù)雜的視覺(jué)數(shù)據(jù)并需要復(fù)雜的推理,因此 AI 模型的性能也相對(duì)較低。

但該團(tuán)隊(duì)也指出,MMMU 并不足以對(duì)專家 AGI 進(jìn)行充分的測(cè)試,這是受定義限制的,因?yàn)槟P偷?MMMU 性能與「掌握專業(yè)知識(shí)的成年人類的 90%」之間不存在直接的映射關(guān)系,而且大學(xué)考試也并非 AGI 理應(yīng)解決的唯一任務(wù)。但他們也認(rèn)為專家 AGI 有必要在 MMMU 基準(zhǔn)上取得好成績(jī),這樣才能體現(xiàn)其掌握知識(shí)的廣度和深度以及專家級(jí)的理解和推理能力。

對(duì)圖像類型和難度的分析

不同的圖像類型。圖 5 比較了在常用的圖像類型上,不同模型的性能。可以看到,在所有類型上,GPT-4V 始終大幅優(yōu)于其它模型。在照片和繪畫等訓(xùn)練中更常見(jiàn)的類型上,開(kāi)源模型的表現(xiàn)相對(duì)較好。但是,對(duì)于幾何形狀、樂(lè)譜和化學(xué)結(jié)構(gòu)等更不常見(jiàn)的圖像類別,所有模型的分?jǐn)?shù)都非常低(有些接近于隨機(jī)亂猜)。這表明現(xiàn)有模型在這些圖像類型上的泛化性能不佳。

不同難度。表 3 比較了所選模型在三個(gè)難度層級(jí)上的性能。在「容易」類別中,GPT-4V 的表現(xiàn)顯著優(yōu)于開(kāi)源模型,成功率達(dá)到了 76.1%。對(duì)于「中等」難度類別,差距縮小了,但 GPT-4V 依然領(lǐng)先,為 55.6%。到了「困難」級(jí)別,模型的差距進(jìn)一步變小,這表明隨著任務(wù)復(fù)雜性的提升,GPT-4V 等更先進(jìn)模型的優(yōu)勢(shì)會(huì)逐漸消失。這可能表明當(dāng)前模型在處理專家級(jí)高難度查詢方面存在局限,即便最先進(jìn)模型也是如此。

錯(cuò)誤分析與未來(lái)研究

該團(tuán)隊(duì)還深度分析了 GPT-4V 的錯(cuò)誤,這有助于理解其運(yùn)作能力和局限。該分析不僅能識(shí)別模型當(dāng)前的缺點(diǎn),還可以幫助改進(jìn)未來(lái)的設(shè)計(jì)和訓(xùn)練。他們從 GPT-4V 的預(yù)測(cè)中隨機(jī)采樣的 150 個(gè)錯(cuò)誤實(shí)例,然后請(qǐng)專家級(jí)標(biāo)注者分析了這些實(shí)例,這些專家根據(jù)自己的知識(shí)找到了這些錯(cuò)誤預(yù)測(cè)的根本原因。圖 6 給出了這些錯(cuò)誤的分布情況。

感知錯(cuò)誤(35%):GPT-4V 的錯(cuò)誤中很大一部分是感知錯(cuò)誤,這又可以進(jìn)一步分為兩種類型:基本感知錯(cuò)誤和特定領(lǐng)域的感知錯(cuò)誤。如圖 7 所示,當(dāng)模型能準(zhǔn)確處理和理解給定信息,但無(wú)法解讀基本的視覺(jué)信息時(shí),就會(huì)出現(xiàn)基本感知錯(cuò)誤。而特定領(lǐng)域的感知錯(cuò)誤則是由缺乏知識(shí)所致。當(dāng)分析根本原因時(shí),研究者將此類錯(cuò)誤歸類為缺乏知識(shí)。此外,GPT-4V 經(jīng)常表現(xiàn)出對(duì)文本的偏好,也就是以文本信息優(yōu)先,視覺(jué)輸入在后。

缺乏知識(shí)(29%):如前所述,對(duì)于 GPT-4V 模型,特定領(lǐng)域的感知錯(cuò)誤的一個(gè)基本根本原因就是缺乏專業(yè)知識(shí)。類似地,缺乏專業(yè)知識(shí)還可能導(dǎo)致推理出現(xiàn)問(wèn)題。

推理錯(cuò)誤(26%):在一些實(shí)例中,模型正確解讀了文本和圖像,也找到了相關(guān)知識(shí),但卻未能成功應(yīng)用邏輯和數(shù)學(xué)推理技能來(lái)進(jìn)行準(zhǔn)確的推導(dǎo)。

其它錯(cuò)誤:其它錯(cuò)誤還包括文本理解錯(cuò)誤(6%)、拒絕問(wèn)答(3%)、注釋錯(cuò)誤(2%)、答案提取錯(cuò)誤(1%)。這些錯(cuò)誤的原因也多種多樣,比如復(fù)雜文本的解讀難度大、響應(yīng)生成的限制、數(shù)據(jù)注釋不準(zhǔn)確以及從較長(zhǎng)輸出中提取精確答案存在問(wèn)題。

更多詳細(xì)內(nèi)容,請(qǐng)閱讀原文。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-02-06 09:00:00

GPT-4VLLaVA大型語(yǔ)言

2023-11-13 18:19:35

AI訓(xùn)練

2024-08-13 13:50:00

數(shù)據(jù)模型

2023-10-19 09:32:45

自動(dòng)駕駛技術(shù)

2024-01-30 21:18:57

語(yǔ)言模型圖像序列機(jī)器人

2023-12-18 09:39:20

模型AI

2024-09-06 13:00:29

2023-11-06 10:40:47

GPT-4V大模型

2023-10-31 12:23:17

GPT-4版本VLM

2023-12-29 09:55:03

視覺(jué)模型

2023-11-20 13:53:00

數(shù)據(jù)訓(xùn)練

2023-11-13 07:48:08

AI檢測(cè)

2024-06-11 08:16:00

2023-10-23 12:28:18

AI訓(xùn)練

2023-10-16 09:23:24

自動(dòng)駕駛技術(shù)

2023-11-04 12:23:39

GPT-4AI

2024-07-23 09:48:59

2023-12-12 12:43:19

AI訓(xùn)練

2023-06-08 11:27:10

模型AI

2024-04-14 19:53:44

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲欧美精品一区| 亚洲欧洲中文日韩久久av乱码| 68精品国产免费久久久久久婷婷| 一级性生活毛片| 成人亚洲网站| 一区二区免费看| 欧美精品一区在线| 国产免费叼嘿网站免费| av成人黄色| 色老头一区二区三区在线观看| 欧美专区第二页| 亚洲女同av| 亚洲欧美另类在线| 欧洲亚洲一区二区| 亚洲女同志亚洲女同女播放| 久久久xxx| 久久久av免费| av网站免费在线播放| 福利一区三区| 欧洲精品一区二区| 日本午夜激情视频| 操你啦在线视频| 久久久www免费人成精品| 99一区二区三区| 在线免费观看视频网站| 免费国产自线拍一欧美视频| 欧美国产视频一区二区| 大地资源高清在线视频观看| 久久综合五月婷婷| 欧美午夜不卡视频| 久久久久狠狠高潮亚洲精品| 金瓶狂野欧美性猛交xxxx| 国产精品国产三级国产三级人妇 | 亚洲一区二区成人在线观看| 亚洲综合视频一区| 精品亚洲综合| 91美女在线观看| 国产伦理久久久| 午夜精品久久久久久久91蜜桃| 免费观看一级特黄欧美大片| 国产成人高潮免费观看精品| 国产精品第9页| 在线视频观看日韩| 欧美激情第一页xxx| 国产三级国产精品国产国在线观看| 欧美理论在线播放| 亚洲国产精品va在线看黑人动漫 | 视频一区日韩精品| 91精品欧美一区二区三区综合在 | 黄色一级视频片| 美洲精品一卡2卡三卡4卡四卡| 亚洲免费在线电影| 无码人妻aⅴ一区二区三区日本| 蜜桃视频在线观看www社区 | 韩国黄色一级大片| 久操视频在线播放| 亚洲免费伊人电影| 成人av在线不卡| 四虎影视国产在线视频| 亚洲黄色小视频| 国产高清www| 91在线三级| 第一福利永久视频精品| 国产欧美在线一区| 亚洲a∨精品一区二区三区导航| 色域天天综合网| 成年人视频网站免费观看| 国产精品av一区二区三区 | 欧美日韩亚洲一二三| 经典三级一区二区| 欧美日韩国产成人在线91| 亚洲a级黄色片| 亚洲乱码一区| 日韩激情视频在线| 精品无码在线观看| 天天操夜夜操国产精品| 欧美国产视频日韩| 久久一区二区三区视频| 日本成人超碰在线观看| 亚洲bt欧美bt日本bt| 蜜臀av在线观看| 国产午夜精品福利| 无码毛片aaa在线| av免费不卡| 欧美午夜片在线观看| 99视频在线观看视频| 成人香蕉社区| 亚洲一区第一页| www.99re7| 国产欧美二区| 成人国内精品久久久久一区| 日日夜夜精品免费| 国产亲近乱来精品视频| 日韩在线视频在线| 国产精品久久久久av电视剧| 91精品国产全国免费观看| 黄色激情在线观看| 欧美一区电影| 欧美激情中文网| 中文资源在线播放| 成人免费视频视频| 亚洲一区3d动漫同人无遮挡| 国产天堂在线播放视频| 欧美丝袜丝交足nylons图片| 国产xxx在线观看| blacked蜜桃精品一区| 欧美日韩国产va另类| 久久精品久久久久久久| 成人亚洲一区二区一| 日韩亚洲欧美精品| 黄视频网站在线观看| 欧美日韩国产在线观看| 黄色国产在线观看| 欧美日韩三级电影在线| 热久久这里只有| 亚洲精品国产精| 18涩涩午夜精品.www| 免费黄色福利视频| gogo久久日韩裸体艺术| www.亚洲天堂| 色婷婷久久综合中文久久蜜桃av| 成人av网在线| 色哟哟免费网站| 韩国精品视频在线观看| 亚洲女人被黑人巨大进入al| 久操免费在线视频| 韩国视频一区二区| 曰韩不卡视频| 国产69精品久久久久按摩| 日韩精品视频免费| 日韩av电影网址| 懂色av一区二区三区免费看| 一区二区日本| 97欧美成人| 亚洲男人的天堂在线| 日本特黄一级片| 国产99精品国产| 欧美日韩午夜爽爽| 久久免费精品| 久久国产色av| 国产视频一二三四区| 国产精品人妖ts系列视频| 美女网站免费观看视频| 天堂日韩电影| 欧美亚洲视频在线看网址| 四虎永久在线观看| 婷婷国产在线综合| 国产麻豆xxxvideo实拍| 日韩午夜在线电影| 九九九久久久| 亚洲成人人体| 亚洲新声在线观看| 精品国产www| 国产精品日韩成人| 婷婷中文字幕在线观看| 亚洲欧美网站在线观看| 92看片淫黄大片欧美看国产片| caoporm免费视频在线| 日韩欧美国产高清| 久久久精品国产sm调教| 国产成人午夜99999| 欧美大黑帍在线播放| 精品视频高潮| 欧洲中文字幕国产精品| 成人一区二区不卡免费| 欧美精品色一区二区三区| 黄色一级视频免费观看| 成人性生交大片免费看中文| 午夜免费福利小电影| 一本色道久久综合亚洲精品酒店| 国产精品久久久久久久久久东京| 日本视频在线免费观看| 欧美一级二级在线观看| 国产污视频在线观看| 2019国产精品| 亚洲激情在线看| 激情久久久久久| 欧美亚洲精品日韩| 亚洲欧美在线综合| 久久久久久久久久婷婷| 国产高清自拍视频在线观看| 91精品国产综合久久久久久久| 欧美精品色哟哟| 99re视频精品| 久久久久久久久久一区二区| 欧美日本不卡| 欧美中日韩免费视频| 国产剧情一区二区在线观看| 午夜免费日韩视频| 99re在线视频| 亚洲精品suv精品一区二区| 国产无遮挡又黄又爽又色视频| 亚洲日本丝袜连裤袜办公室| 在线观看国产三级| 久久99这里只有精品| 日本午夜激情视频| 亚洲精品成人影院| 欧美日韩亚洲在线| 欧一区二区三区| 国产成人精品在线| 牛牛精品视频在线| 中文字幕日韩欧美在线| 男人天堂av网| 欧美福利视频导航| 91午夜精品亚洲一区二区三区| 亚洲乱码日产精品bd| 中文字幕一二三四区| 国产精品亚洲一区二区三区妖精| 91传媒久久久| 黄色精品免费| 国产又大又长又粗又黄| 欧美激情在线免费| 国产激情美女久久久久久吹潮| 日本精品裸体写真集在线观看| 韩国三级日本三级少妇99| 国产在线高清视频| 在线精品高清中文字幕| 色婷婷激情五月| 日韩一卡二卡三卡四卡| 中文字幕在线网址| 欧美香蕉大胸在线视频观看| 男女免费视频网站| 亚洲人妖av一区二区| 午夜在线观看一区| 91在线观看一区二区| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 91av在线免费视频| 亚洲综合偷拍欧美一区色| 日本视频在线免费| 日本一区二区三区久久久久久久久不 | 色播一区二区| 亚洲一区国产精品| 日本在线一区二区| 国产精品自拍偷拍| 91综合国产| 国产精品久久二区| 最新日韩三级| 国产成人在线一区二区| 日韩新的三级电影| 91国内精品久久| 第一福利在线视频| 91精品成人久久| 波多野结依一区| 韩国日本不卡在线| 神马久久午夜| 欧美孕妇与黑人孕交| 中文在线免费视频| 欧美在线免费看| 少妇视频一区| 国产精品91久久久久久| 日本精品在线中文字幕| 国产精品久久久久久久午夜 | 99热在线精品观看| 国产69精品久久久久999小说| 极品少妇一区二区三区| 一二三四视频社区在线| 一区二区三区国产在线| 国产1区2区在线| 麻豆一区二区三区| 91免费视频污| 国产激情精品久久久第一区二区| 国产精品久久久久野外| 成人午夜又粗又硬又大| www.17c.com喷水少妇| aa级大片欧美| 久久成人激情视频| 中文字幕一区二区三区四区不卡 | 免费在线毛片网站| 精品少妇一区二区30p| 免费在线观看av电影| 国内精品久久久久影院优| 日本蜜桃在线观看视频| 国产成人午夜视频网址| 四虎影视成人精品国库在线观看| 5g影院天天爽成人免费下载| av综合网址| 日韩国产精品一区二区| 久久久人成影片免费观看| 精品无码一区二区三区爱欲| 麻豆精品网站| а 天堂 在线| 91视频免费看| 欧日韩不卡视频| 亚洲国产精品自拍| 国产亚洲欧美日韩高清| 欧美日本韩国一区| 亚洲人成色777777精品音频| 中日韩美女免费视频网站在线观看 | 亚洲视频一区在线播放| 日韩欧美国产一区二区三区| 美女做暖暖视频免费在线观看全部网址91 | 玖玖爱在线观看| 亚洲女同一区二区| 国产成人亚洲精品自产在线| 欧美日韩国产免费一区二区| 蜜桃视频久久一区免费观看入口| 国产午夜精品全部视频在线播放| gogo在线高清视频| 国产精品成av人在线视午夜片| 久久中文字幕一区二区| 欧美日韩在线观看一区二区三区| 欧美高清一区| 国产wwwxx| 99久久夜色精品国产网站| 在线观看黄网址| 日韩欧美亚洲国产一区| jlzzjlzz亚洲女人18| 亚洲人高潮女人毛茸茸| 蜜桃成人365av| 91在线视频免费| 欧美日韩性在线观看| 国产精品12345| 国产精品1区2区3区| 国产精品无码无卡无需播放器| 香蕉加勒比综合久久| 国产露脸国语对白在线| 国产亚洲免费的视频看| av资源中文在线| 91在线免费观看网站| 日韩电影在线视频| 乱子伦视频在线看| k8久久久一区二区三区| 国产大学生自拍| 欧美精品乱人伦久久久久久| 免费av在线电影| 91精品国产91久久久久| 国产成人一二| 国产一区二区三区乱码| 国产麻豆精品95视频| 99成人在线观看| 欧美亚洲一区二区在线观看| 欧美xxx.com| 91精品成人久久| 欧洲亚洲成人| 免费 成 人 黄 色| 9色porny自拍视频一区二区| 黄色一级视频免费观看| 日韩精品一区二区三区视频播放| 老司机精品影院| 成人在线中文字幕| 外国成人免费视频| 亚洲精品免费一区亚洲精品免费精品一区| 国产三级精品三级| 伊人久久久久久久久久久久 | 中文字幕资源站| 欧美午夜精品一区| 日本在线免费网| 亚洲一区二区久久久久久久| 久久精品青草| 黄色a级三级三级三级| 亚洲卡通欧美制服中文| 国产强被迫伦姧在线观看无码| 超碰精品一区二区三区乱码| 九九九九九九精品任你躁| 国产亚洲精品久久久久久久| 国产成人精品亚洲777人妖| 精品无码免费视频| 欧美精品一区二| 国产精品专区免费| 亚洲一区二区在| 黄色精品一二区| 欧洲猛交xxxx乱大交3| 精品国产三级电影在线观看| 51精品视频| 欧洲视频一区二区三区| 久久国产精品区| 久久这里只有精品国产| 日韩精品中文字| 91另类视频| 日本大胆人体视频| 97久久超碰精品国产| 黄色大全在线观看| 久久视频在线观看免费| 高潮按摩久久久久久av免费| 18岁视频在线观看| 亚洲免费伊人电影| 五月婷婷激情在线| 国产欧美精品xxxx另类| 欧美影院一区| 懂色av粉嫩av蜜乳av| 欧美色综合网站| 蜜乳av一区| 亚洲午夜精品一区二区三区| 国产成人在线网站| 亚洲毛片一区二区三区| 久久精视频免费在线久久完整在线看| 成人看片爽爽爽| 99视频在线视频| 亚洲成av人片| 免费观看在线黄色网| 久久99精品久久久久久久久久| 美女网站色91| 日本视频免费在线| 久久久av电影| 精品国产乱码久久久久久果冻传媒 | 国产欧美日韩另类| 久久精品99久久久香蕉| 欧美在线导航| 日韩av加勒比| 91福利视频在线|