精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

奧林匹克競賽里選最聰明的AI:Claude-3.5-Sonnet vs. GPT-4o?

人工智能 新聞
近日,同樣是研究團隊,首次提出使用"奧林匹克競賽獎牌榜"的方法,根據各AI模型在奧林匹克競技場(各學科)的綜合表現進行排名,選出迄今為止智力最高的AI。

上海交通大學生成式人工智能實驗室 (GAIR Lab) 的研究團隊,主要研究方向是:大模型訓練、對齊與評估。

團隊主頁:https://plms.ai/

AI技術日新月異,近來Anthropic公司最新發布的Claude-3.5-Sonnet因在知識型推理、數學推理、編程任務及視覺推理等任務上設立新行業基準而引發廣泛討論:Claude-3.5-Sonnet 已經取代OpenAI的GPT4o成為世界上”最聰明的AI“(Most Intelligent AI)了嗎?回答這個問題的挑戰在于我們首先需要一個足夠挑戰的智力測試基準,使得我們可以區分目前最高水平的AI。

上海交通大學生成式人工智能實驗室(GAIR Lab)推出的OlympicArena[1] (奧林匹克競技場)滿足了這個需求。

奧林匹克學科競賽不僅是對人類(碳基智能)思維敏捷性、知識掌握和邏輯推理的極限挑戰,更是AI(“硅基智能”)鍛煉的絕佳練兵場,是衡量AI與“超級智能”距離的重要標尺。OlympicArena——一個真正意義上的AI奧運競技場。在這里,AI不僅要展示其在傳統學科知識上的深度(數學、物理、生物、化學、地理等頂級競賽),還要在模型間的認知推理能力上展開較量。

近日,同樣是研究團隊,首次提出使用"奧林匹克競賽獎牌榜"的方法,根據各AI模型在奧林匹克競技場(各學科)的綜合表現進行排名,選出迄今為止智力最高的AI。在此次競技場中,研究團隊重點分析并比較了最近發布的兩個先進模型——Claude-3.5-SonnetGemini-1.5-Pro,以及OpenAI的GPT-4系列(e.g., GPT4o)。通過這種方式,研究團隊希望能夠更有效地評估和推動AI技術的發展。

圖片

圖: 奧林匹克學科競賽獎牌榜

注:研究團隊首先依據金牌數量對模型進行排序,如果金牌數量相同,則按照整體性能分數來排序。

實驗結果表明:

  • Claude-3.5-Sonnet在整體表現上與GPT-4o相比極具競爭力,甚至在一些科目上超過了GPT-4o(比如在物理、化學和生物學上)。
  • Gemini-1.5-Pro和GPT-4V排名緊隨GPT-4o和Claude-3.5-Sonnet之后,但它們之間存在明顯的表現差距。
  • 來自開源社區的AI模型性能明顯落后于這些專有模型。
  • 這些模型在此基準測試上的表現不盡人意,表明我們在實現超級智能之路上還有很長的路要走。

圖片

  • 項目主頁:https://gair-nlp.github.io/OlympicArena/

實驗設置

研究團隊采取OlympicArena的測試集進行評估。該測試集的答案并未公開,有助于防止數據泄露,從而反映模型的真實性能。研究團隊測試了多模態大模型(LMMs)和純文本大模型(LLMs)。對于LLMs的測試,輸入時不提供任何與圖像相關的信息給模型,僅提供文本。所有評估均采用零樣本(zero-shot)思維鏈(Chain of Thought)提示詞。

評估對象

研究團隊評估了一系列開源和閉源的多模態大模型(LMMs)和純文本大模型(LLMs)。對于LMMs,選擇了GPT-4o、GPT-4V、Claude-3-Sonnet、Gemini Pro Vision、Qwen-VL-Max等閉源模型,此外還評估了LLaVA-NeXT-34B、InternVL-Chat-V1.5、Yi-VL-34B和Qwen-VL-Chat等開源模型。對于LLMs,主要評估了Qwen-7B-Chat、Qwen1.5-32B-Chat、Yi-34B-Chat和InternLM2-Chat-20B等開源模型。

此外,研究團隊特別包括了新發布的Claude-3.5-Sonnet以及Gemini-1.5-Pro,并將它們與強大的GPT-4o和GPT-4V進行比較。以反映最新的模型性能表現。

評估方法

衡量標準 鑒于所有問題都可以通過基于規則的匹配進行評估,研究團隊對非編程任務使用準確率,并對編程任務使用公正的pass@k指標,定義如下:

圖片

本次評估中設定k = 1且n = 5,c表示通過所有測試用例的正確樣本數量。

奧林匹克競技場獎牌榜:

與奧運會使用的獎牌系統類似,是一個專門設計用來評估AI模型在各個學術領域性能的先驅性排名機制。該表為在任一給定學科中取得前三名成績的模型頒發獎牌,從而為比較不同模型提供了一個明確且具有競爭性的框架。研究團隊首先依據金牌數量對模型進行排序,如果金牌數量相同,則按照整體性能分數來排序。它提供了一種直觀簡潔的方式來識別不同學術領域中的領先模型,使研究人員和開發者更容易理解不同模型的優勢和劣勢。

細粒度評估:

研究團隊還基于不同學科、不同模態、不同語言以及不同類型的邏輯和視覺推理能力進行基于準確性的細粒度評估。

結果與分析

分析內容主要關注Claude-3.5-Sonnet和GPT-4o,同時也對Gemini-1.5-Pro的性能表現進行了部分討論。

總體情況

圖片

表:模型在不同學科上的表現

根據表格的總體結果,可以觀察到:

  • 新發布的Claude-3.5-Sonnet性能強大,達到了幾乎與GPT-4o相當的水平。兩者的整體準確率差異僅約1%。
  • 新發布的Gemini-1.5-Pro也展現出了相當的實力,在大多數學科中的表現超過了GPT-4V(OpenAI當前第二強大的模型)。
  • 值得注意的是,在撰寫本報告時,這三個模型中最早的發布時間僅為一個月前,反映了這一領域的快速發展。

針對學科的細粒度分析

GPT-4o vs. Claude-3.5-Sonnet:

盡管GPT-4o和Claude-3.5-Sonnet在整體上表現相似,但兩個模型都展現了不同的學科優勢。GPT-4o在傳統的演繹和歸納推理任務上展現出更優秀的能力,特別是在數學和計算機科學方面。Claude-3.5-Sonnet在物理、化學和生物等學科表現出色,特別是在生物學上,它超過GPT-4o 3%。

GPT-4V vs. Gemini-1.5-Pro:

在Gemini-1.5-Pro與GPT-4V的比較中,可以觀察到類似的現象。Gemini-1.5-Pro在物理、化學和生物學方面的表現顯著優于GPT-4V。然而,在數學和計算機科學方面,Gemini-1.5-Pro優勢不明顯甚至不如GPT-4V。

從這兩組比較中,可以看出:

  • OpenAI的GPT系列在傳統的數學推理和編程能力上表現突出。這表明GPT系列模型已經經過了嚴格訓練以處理需要大量演繹推理和算法思維的任務。
  • 相反,當涉及到需要將知識與推理結合的學科,如物理、化學和生物學時,其他模型如Claude-3.5-Sonnet和Gemini-1.5-Pro展現出了具有競爭性的表現。這體現了不同模型的專業領域以及潛在的訓練重點,表明在推理密集型任務以及知識整合型任務可能存在的權衡。

針對推理類型的細粒度分析

圖片

Caption: 各模型在邏輯推理能力上的表現。邏輯推理能力包括:演繹推理(DED)、歸納推理(IND)、溯因推理(ABD)、類比推理(ANA)、因果推理(CAE)、批判性思維(CT)、分解推理(DEC)和定量推理(QUA)。

GPT-4o 與 Claude-3.5-Sonnet 在邏輯推理能力上的比較:

從表格的實驗結果可以看出,GPT-4o在大多數的邏輯推理能力上優于Claude-3.5-Sonnet,例如演繹推理、歸納推理、溯因推理、類比推理和批判性思維方面。然而,Claude-3.5-Sonnet在因果推理、分解推理和定量推理上的表現超過了GPT-4o。整體而言,兩個模型的表現相當,雖然GPT-4o在大多數類別上略有優勢。

圖片

表: 各模型在視覺推理能力上的表現。視覺推理能力包括:模式識別(PR)、空間推理(SPA)、圖表推理(DIA)、符號解釋(SYB)和視覺比較(COM)。

GPT-4o vs. Claude-3.5-Sonnet 在視覺推理能力上的表現:

從表格的實驗結果可以看出,Claude-3.5-Sonnet在模式識別和圖表推理方面能力領先,展現了其在模式識別和解讀圖表方面的競爭力。兩個模型在符號解釋方面表現相當,表明它們在理解和處理符號信息方面具有相當的能力。然而,GPT-4o在空間推理和視覺比較方面優于Claude-3.5-Sonnet,展示了其在需要理解空間關系和比較視覺數據的任務上的優越性。

綜合學科與推理類型的分析,研究團隊發現:

  • 數學和計算機編程強調復雜演繹推理技巧和基于規則導出普適性結論,傾向于較少依賴預先存在的知識。相比之下,像化學和生物學這樣的學科往往需要大量的知識庫來基于已知的因果關系和現象信息進行推理。這表明,盡管數學和編程能力仍然是衡量模型推理能力的有效指標,其他學科更好地測試了模型在基于其內部知識進行推理和問題分析方面的能力。
  • 不同學科的特點表明了定制化訓練數據集的重要性。例如,要提高模型在知識密集型學科(如化學和生物學)中的表現,訓練期間模型需要廣泛接觸特定領域的數據。相反,對于需要強大邏輯和演繹推理的學科,如數學和計算機科學,模型則能從專注于純邏輯推理的訓練中受益。
  • 此外,推理能力和知識應用之間的區別表明了模型跨學科應用的潛力。例如,具有強大演繹推理能力的模型可以協助需要系統化思維解決問題的領域,如科學研究。而擁有豐富知識的模型在重度依賴現有信息的學科中非常寶貴,如醫學和環境科學。理解這些細微差別有助于開發更專業和多功能的模型。

針對語言類型的細粒度分析

Caption: 各模型在不同語言問題的能力表現。

以上表格展示了模型在不同語言上的性能表現。研究團隊發現大多數模型在英語上的準確度比中文要高,這種差距在排名靠前的模型中尤為顯著。推測可能有以下幾個原因:

  • 盡管這些模型包含了大量中文訓練數據并且具有跨語言泛化能力,但它們的訓練數據主要以英語為主。
  • 中文問題的難度比英文問題更具挑戰性,尤其是在物理和化學等科目中,中國奧林匹克競賽的問題更難。
  • 這些模型在識別多模態圖像中的字符方面能力不足,中文環境下這一問題更為嚴重。

然而,研究團隊也發現一些中國廠商開發或基于支持中文的基模型進行微調的模型,在中文場景下的表現優于英文場景,例如Qwen1.5-32B-Chat、Qwen-VL-Max、Yi-34B-Chat和Qwen-7B-Chat等。其他模型如InternLM2-Chat-20B和Yi-VL-34B,雖然仍然在英語上表現更好,但與排名靠前的閉源模型相比,它們在英語和中文場景間的準確度差異要小得多。這表明,為中文數據乃至全球更多語言優化模型,仍然需要顯著的關注。

針對模態的細粒度分析

圖片

Caption: 各模型在不同模態問題的能力表現。

以上表格展示了模型在不同模態上的性能表現。GPT-4o在純文本和多模態任務中均優于Claude-3.5-Sonnet,并在純文本上表現更突出。另一方面,Gemini-1.5-Pro在純文本和多模態任務上表現均優于GPT-4V。這些觀察表明,即使是目前可用的最強模型,在純文本任務上也比多模態任務有更高的準確率。這說明模型在利用多模態信息解決復雜推理問題方面仍有相當大的改進空間。

結語

研究團隊在本次評測中主要關注最新的模型:Claude-3.5-Sonnet 和 Gemini-1.5-Pro,并將它們與 OpenAI 的 GPT-4o 和 GPT-4V 進行比較。此外,研究團隊還設計了一種用于大模型的新穎排名系統——OlympicArena Medal Table,用來清晰的比較不同的模型的能力。研究團隊發現,GPT-4o 在數學和計算機科學等科目上表現突出,具有較強的復雜演繹推理能力和基于規則得出普遍結論的能力。另一方面,Claude-3.5-Sonnet 更擅長根據已有的因果關系和現象進行推理。另外,研究團隊還觀察到這些模型在英語語言問題上表現更好,并且在多模態能力方面有顯著的改進空間。理解模型這些細微差別有助于開發更專業化的模型,以更好地滿足不同學術和專業領域的多樣化需求。

隨著四年一度的奧運盛事日益臨近,我們不禁想象,如果人工智能也能參與其中,那將是一場怎樣的智慧與技術的巔峰對決?不再僅僅是肢體的較量,AI的加入無疑將開啟對智力極限的新探索, 也期待更多AI選手加入這場智力的奧運會。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-21 09:58:38

2024-06-21 09:51:17

2024-10-06 09:00:00

AI訓練數據

2025-01-22 16:57:32

字節跳動豆包大模型

2025-01-06 13:15:02

2024-06-28 18:13:05

2025-04-08 02:26:00

2018-09-20 10:26:41

阿里云奧林匹克

2024-05-21 12:23:17

2024-07-16 13:24:38

2024-07-11 16:38:15

2024-06-21 09:57:00

2024-10-21 14:30:00

AI游戲

2024-12-19 17:50:28

2025-08-11 14:12:35

GPT-4oAIGrok 4

2024-06-05 08:29:35

2024-07-04 15:28:11

2024-10-17 13:30:00

點贊
收藏

51CTO技術棧公眾號

小说区图片区亚洲| 国产日本在线视频| 日韩午夜在线| 亚洲视频精品在线| 手机在线成人免费视频| 国产日产一区二区| 99久久精品国产导航| 国产成人一区二区三区| 5566中文字幕| 另类春色校园亚洲| 欧美性感一区二区三区| 久久久天堂国产精品| 精品三级久久久久久久电影聊斋| 久久精品久久综合| 97精品在线观看| 亚洲最大成人综合网| 91蜜桃臀久久一区二区| 欧美视频自拍偷拍| 欧美视频在线观看视频| av色图一区| 不卡视频免费播放| 成人黄色在线观看| av图片在线观看| 亚洲国产精品日韩专区av有中文| 亚洲国产欧美一区| 亚洲欧美日韩一二三区| 国产私拍福利精品视频二区| 亚洲一区二区精品久久av| 日韩精品第一页| 人妻无码中文字幕| 国产一区二区在线观看免费| 日本精品性网站在线观看| 精品99在线观看| 日韩欧美视频专区| 亚洲欧美日韩成人| xfplay5566色资源网站| 91精品亚洲一区在线观看| 色综合久久久久| 欧美激情视频免费看| 成人日批视频| 国产精品久久777777| 欧美精品人人做人人爱视频| 亚洲国产精品无码久久| 国产在线精品不卡| 国产日本欧美一区| 欧美高清69hd| 首页亚洲欧美制服丝腿| 欧美与黑人午夜性猛交久久久| 精品欧美一区二区久久久久| 久久久9色精品国产一区二区三区| 国产亚洲精品久久久久久| 亚洲 欧美 日韩在线| 91成人午夜| 日韩午夜小视频| а 天堂 在线| 国产精品久久久久久久久久辛辛 | 久久久999国产精品| 日韩一区二区a片免费观看| 国产精品xxxav免费视频| 日韩欧美高清dvd碟片| 制服下的诱惑暮生| 美国十次综合久久| 欧美成va人片在线观看| 日韩黄色一区二区| 国产精品高潮呻吟久久久久| 亚洲成人国产精品| 在线免费观看污视频| 午夜a一级毛片亚洲欧洲| 精品偷拍一区二区三区在线看| 国产精品无码在线| 思热99re视热频这里只精品| 亚洲欧美国产精品| 91麻豆制片厂| 五月婷婷六月综合| 欧美疯狂性受xxxxx另类| 九九热精品免费视频| 亚洲国产精品一区制服丝袜| 97av在线影院| 久操视频在线免费观看| 久久av老司机精品网站导航| 99久久伊人精品影院| 蜜桃av中文字幕| 91视频免费播放| 日本视频一区二区不卡| 韩国av网站在线| 亚洲国产你懂的| 日本三级免费观看| 国产一区影院| 精品日韩一区二区| 一卡二卡三卡四卡| 国产高清欧美| 国精产品一区一区三区有限在线| 亚洲熟女综合色一区二区三区| 蜜桃av一区二区在线观看| 91精品网站| 五月婷婷在线播放| 国产精品电影一区二区三区| 欧妇女乱妇女乱视频| 自拍偷自拍亚洲精品被多人伦好爽 | 亚洲精品二三区| www亚洲色图| 亚洲国产精品一区| 国产日产欧美精品| 日本高清视频免费看| 中文字幕免费不卡| 91免费黄视频| 日韩黄色三级| 精品伊人久久97| 日韩成人短视频| 免费在线观看成人av| 亚洲一区二区三区视频播放| 日本五码在线| 一区二区日韩av| 污污的网站18| 美女一区2区| 美女性感视频久久久| 无码人妻精品一区二区三区9厂| 国产一区二区在线电影| 天堂资源在线亚洲资源| free性护士videos欧美| 91精品国产高清一区二区三区| 黄瓜视频污在线观看| 欧美日韩第一区| 国产美女91呻吟求| 欧美zzoo| 亚洲第一在线综合网站| 亚洲第一天堂久久| 免费看av成人| 17婷婷久久www| 99在线精品视频免费观看20| 国产精品美女一区二区在线观看| 黄色免费视频大全| 给我免费播放日韩视频| 欧美成人亚洲成人日韩成人| 亚洲在线观看av| 国产色爱av资源综合区| 能在线观看的av| 成人在线视频你懂的| 久久影视免费观看| 国产精品传媒在线观看| 久久欧美一区二区| 免费无遮挡无码永久视频| 成人av影音| 欧美日韩国产二区| 亚洲av无码乱码国产精品| 亚洲天堂中文字幕| 999在线观看| 久久综合国产| 国产美女久久精品香蕉69| 国产露出视频在线观看| 欧洲中文字幕精品| 337人体粉嫩噜噜噜| 日本中文字幕一区二区视频| 日本精品二区| 日本综合视频| 中文字幕日韩有码| 91tv国产成人福利| 亚洲婷婷国产精品电影人久久| а 天堂 在线| 欧美日本国产| 国产视频在线观看一区| 伦理av在线| 亚洲精品久久久久| 综合网在线观看| 国产欧美一区二区三区在线老狼| 亚洲综合欧美激情| 久久久久国产| 国产精品xxx在线观看www| 国产ktv在线视频| 日韩精品视频在线观看网址| 久久久久久久久黄色| 欧美激情一区三区| 91pony九色| 午夜国产精品视频免费体验区| 成人免费在线看片| caoporn-草棚在线视频最| 精品调教chinesegay| 波多野结衣爱爱| 亚洲品质自拍视频| 波多野结衣视频播放| 日韩精品五月天| 26uuu成人| 国产精品久av福利在线观看| 国产经典一区二区| 爆操欧美美女| 亚洲热线99精品视频| 亚洲天堂手机版| 一二三区精品视频| 草草影院第一页| 精品无人码麻豆乱码1区2区| 国产 日韩 亚洲 欧美| 精品在线91| 91亚洲国产成人久久精品网站| wwwwxxxx在线观看| 亚洲天堂影视av| h狠狠躁死你h高h| 日本久久精品电影| 在线观看亚洲网站| 91丨porny丨最新| 福利片一区二区三区| 99精品热6080yy久久| 亚洲午夜在线观看| 欧美电影完整版在线观看| 国产精选久久久久久| 女人让男人操自己视频在线观看| 色噜噜国产精品视频一区二区 | ijzzijzzij亚洲大全| 日韩激情毛片| 91免费的视频在线播放| 成人性生活视频| 欧美激情极品视频| 最新97超碰在线| 日韩精品在线播放| 国产极品久久久| 欧美揉bbbbb揉bbbbb| 六月丁香在线视频| 亚洲乱码日产精品bd| 亚洲精品成人无码| 91原创在线视频| 中文字幕无人区二| 久久精品国产成人一区二区三区 | 欧美激情网站| 久久国产精品首页| 午夜不卡视频| 亚洲片在线观看| 亚洲三区在线播放| 精品国产成人在线影院| 国产av精国产传媒| 欧美男生操女生| 黄色片视频免费| 福利一区福利二区微拍刺激| 精品无码人妻一区二区三区| 亚洲老妇xxxxxx| 国产又色又爽又高潮免费| 亚洲国产精品二十页| 成人无码av片在线观看| 久久久久国产一区二区三区四区 | 欧美sss在线视频| 成人免费观看网站| 久久久久亚洲精品中文字幕| 91美女福利视频高清| www.91精品| 91久久国产精品91久久性色| 亚洲欧洲专区| 91热精品视频| 狂野欧美xxxx韩国少妇| 91在线色戒在线| 韩国一区二区三区视频| 91久久久久久久一区二区| 麻豆久久久久| 91精品久久久久久久久青青| 欧美videos粗暴| 91精品国产综合久久男男 | 北条麻妃高清一区| 麻豆国产精品| 国产伦精品一区二区三| 国产精品丝袜在线播放| 九9re精品视频在线观看re6| 欧美三级午夜理伦三级在线观看| 精品国产一区二区三区免费| 精品久久对白| 麻豆成人av| 欧美日韩高清| 老司机av福利| 国产精品av久久久久久麻豆网| 韩日视频在线观看| 一本色道久久综合亚洲精品不卡| 播放灌醉水嫩大学生国内精品| 美女日韩在线中文字幕| av丝袜天堂网| 国产一区欧美日韩| 97人妻精品一区二区三区免费| 99久久精品情趣| 欧美日韩生活片| 亚洲天堂久久久久久久| 日韩经典在线观看| 91国在线观看| 99久久国产热无码精品免费| 亚洲白拍色综合图区| 九色在线观看| 另类专区欧美制服同性| sm性调教片在线观看| 国产成人精品日本亚洲专区61| 欧美a一级片| 精品国产91亚洲一区二区三区www| 国内精品视频在线观看| 麻豆md0077饥渴少妇| 中文高清一区| 狠狠干狠狠操视频| www.日韩av| a级黄色免费视频| 亚洲国产日韩在线一区模特| 狠狠狠狠狠狠狠| 欧美tk—视频vk| 福利小视频在线观看| 欧美极品少妇xxxxⅹ裸体艺术| 综合另类专区| 7777精品久久久大香线蕉小说| 欧美三级电影在线| 青青草免费在线视频观看| 西西人体一区二区| 国产福利精品一区二区三区| www..com久久爱| 精品国产精品国产精品| 一本大道久久精品懂色aⅴ| 性网爆门事件集合av| 一区二区亚洲欧洲国产日韩| 91福利在线尤物| 成人有码视频在线播放| 欧美女王vk| 毛片av在线播放| 麻豆精品国产传媒mv男同| 玖草视频在线观看| 亚洲精品成人悠悠色影视| 亚洲精品一区二区二区| 日韩av一区在线| 欧美videosex性欧美黑吊| 国产美女精品免费电影| 你微笑时很美电视剧整集高清不卡| 99热这里只有精品免费| 久久狠狠亚洲综合| 成人免费网站黄| 五月天丁香久久| 成人高潮片免费视频| 日韩中文有码在线视频| 久久夜夜操妹子| 精品久久久久久一区| 欧美人与禽猛交乱配视频| 在线免费看污网站| 国产欧美日韩精品一区| 成人毛片18女人毛片| 亚洲国产欧美一区二区三区久久| 污污网站在线观看| 成人字幕网zmw| 91日韩免费| 污网站免费在线| 国产欧美一区二区精品性色 | 性感少妇一区| 三级男人添奶爽爽爽视频| 亚洲第一激情av| 黑人乱码一区二区三区av| 欧美国产视频一区二区| 免费观看性欧美大片无片| 欧美性受xxxx黑人猛交88| 久草热8精品视频在线观看| 欧美一区二区三区观看| 欧美裸体一区二区三区| 欧美激情黑人| 91久久久久久久| 欧美另类视频| 国产精品一区二区在线免费观看| 亚洲自拍偷拍九九九| 亚洲第一精品网站| 久久人人爽人人爽人人片av高请| 都市激情亚洲欧美| 福利视频免费在线观看| www.亚洲在线| 日韩在线播放中文字幕| 亚洲天堂av在线免费观看| 成人日韩精品| 亚洲精品国产精品国自产观看| 久久精品国产精品青草| 欧美三级日本三级| 亚洲缚视频在线观看| 欧美三级网站| 日韩在线三区| 捆绑紧缚一区二区三区视频| 在线免费日韩av| 亚洲电影在线看| 色8久久影院午夜场| 亚洲综合五月天| 国产综合色精品一区二区三区| 免费在线观看亚洲| 日韩精品在线影院| 福利一区和二区| 蜜桃视频一区二区在线观看| 97久久久精品综合88久久| 亚洲天堂五月天| 久热精品视频在线免费观看| 国产美女撒尿一区二区| 精品久久久久久无码国产| 中文字幕视频一区| 日本xxxxwww| 国产成人中文字幕| 亚洲免费二区| 六十路息与子猛烈交尾| 欧美日韩精品一区二区三区四区 | 日本一区二区三区四区视频| 日韩在线观看电影完整版高清免费悬疑悬疑| www.五月天色| 欧美日韩国产中文精品字幕自在自线| 国产高清免费av在线| 91视频99| 免费人成精品欧美精品| 日本熟妇乱子伦xxxx| 伊是香蕉大人久久| 国产伦乱精品| 在线观看免费不卡av| 欧美性感美女h网站在线观看免费 欧美性xxxx在线播放 | 另类人妖一区二区av|