精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟論文意外「走光」,OpenAI參數全泄密!GPT-4o僅200B,o1 300B

人工智能 新聞
穿越重重迷霧,OpenAI模型參數終被揭開!一份來自微軟華盛頓大學醫療論文,意外曝光了GPT-4、GPT-4o、o1系列模型參數。讓所有人震驚不已的是,GPT-4o mini僅8B。

誰能想到,微軟在一篇醫學領域的論文里,竟然把OpenAI模型的參數全「曝光」了!

  • GPT-4參數約1.76萬億
  • GPT-4o參數約2000億
  • GPT-4o mini參數約80億
  • o1-preview參數約3000億
  • o1-mini參數約1000億
  • Claude 3.5 Sonnet參數約1750億

圖片

研究人員:參數均為估算值

讓所有人難以置信的是,GPT-4o系列的參數如此少,mini版甚至只有8B。

圖片

有網友猜測,4o mini是一個大約有40B參數的MoE模型,其中激活參數為8B。

因為,他發現4o mini明顯比8B模型學到了更多的知識,同時間運行速度很快。

此外,由于GPT-4o是MoE架構,所以OpenAI可能在mini版本上使用了相同的架構。

圖片

另有網友驚訝地表示,Claude 3.5 Sonnet參數竟等同于GPT-3 davinci。

圖片

這篇來自微軟、華盛頓大學團隊的論文中,發布了一個具有里程碑意義的評估基準——MEDEC1,專為臨床筆記醫療錯誤檢測和糾正而設計。

圖片

論文地址:https://arxiv.org/abs/2412.19260

這項基準涵蓋了五種類型的錯誤,包括診斷、管理、治療、藥物治療和致病因子。

MEDEC的數據來源,收集了來自3家美國醫院系統的488篇臨床筆記,總計3,848篇臨床文本。

值得一提的是,這些數據此前從未被任何LLM接觸過,能夠確保評估真實性可靠性。目前,該數據集已被用于MEDIQA-CORR共享任務,以評估17個參與系統的表現。

圖片

得到數據集MEDEC后,研究團隊對當前最先進的模型,包括o1-preview、GPT-4、Claude 3.5 Sonnet、Gemini 2.0 Flash等,在醫療錯誤檢測和糾正任務中進行了全面測試。

同時,他們也邀請了兩位專業醫生進行相同的錯誤檢測任務,最終將AI與人類醫生結果進行PK。

結果發現,最新LLM在醫療錯誤檢測和糾正方面表現不俗,但與人類醫生相比,AI還是有著明顯的差距。

這也從側面印證了,MEDEC是一個具有充分挑戰性的評估基準。

論文講了什么?

來自美國醫療機構的一項調查研究顯示,每5位閱讀臨床筆記的患者中,就有一位報告發現了錯誤。

其中40%的患者認為這些錯誤是嚴重的,最常見的錯誤類別與當前或過去的診斷相關。

圖片

與此同時,如今越來越多的醫學文檔任務(比如,臨床筆記生成)均是由LLM去完成。

然而,將LLM用于醫學文檔任務的主要挑戰之一,容易產生「幻覺」,輸出一些虛構內容或錯誤信息,直接影響了臨床決策。

畢竟,醫療無小事,一字之差可能關乎生死。

為了降低這些風險,并確保LLM在醫學內容生成中的安全性,嚴格的驗證方法至關重要。這種驗證需要相關的基準來評估是否可以通過驗證模型實現完全自動化。

在驗證過程中,一個關鍵任務是,檢測和糾正臨床文本中的醫學錯誤。

站在人類醫生的角度來考慮,識別和糾正這些錯誤不僅需要醫學專業知識和領域背景,有時還需要具備豐富的經驗。

而此前,大多數關于(常識性)錯誤檢測的研究都集中在通用領域。

為此,微軟華盛頓大學團隊引入了全新數據集——MEDEC,并對不同的領先的LLM(比如,Claude 3.5 Sonnet、o1-preview和Gemini 2.0 Flash)進行了實驗。

作者稱,「據我們所知,這是首個公開可用的臨床筆記中自動錯誤檢測和糾正的基準和研究」。

MEDEC數據集

MEDEC數據集一共包含了3,848篇來自不同醫學專業領域的臨床文本的新數據集,標注任務由8位醫學標注員完成。

如前所述,該數據集涵蓋了五種類型的錯誤,具體包括:

  • 診斷(Diagnosis):提供的診斷不準確
  • 管理(Management):提供的管理下一步措施不準確
  • 藥物治療(Pharmacotherapy):推薦的藥物治療不準確
  • 治療(Treatment):推薦的治療方案不準確
  • 致病因子(Causal Organism):指出的致病生物或致病病原體不準確

(注:這些錯誤類型是在分析醫學委員會考試中最常見的問題類型后選定的。)

上圖1展示了,MEDEC數據集中的示例。每篇臨床文本要么是正確的,要么包含一個通過以下兩種方法之一創建的錯誤:方法#1(MS)和方法#2(UW)。

數據創建方法#1(MS)

在此方法中,作者利用了MedQA集合中的醫學委員會考試題目。

4位具有醫學背景的標注員參考這些考試中的醫學敘述和多項選擇題,在核對原始問題和答案后,將錯誤答案注入場景文本中,并排除包含錯誤或信息模糊的問答對。

醫學標注員遵循以下準則:

  • 使用醫學敘述多項選擇題,將錯誤答案注入場景文本中,并創建兩個版本,分別將錯誤注入文本的中間或末尾。
  • 使用醫學敘述多項選擇題,將正確答案注入場景文本中,以生成正確版本,如圖2所示(包含正確答案的生成文本)。
  • 手動檢查自動生成的文本是否忠實于原始場景及其包含的答案。

最終,研究人員從兩個不同的場景(錯誤注入文本中間或末尾)中,隨機為每篇筆記選擇一個正確版本和一個錯誤版本,構建了最終數據集。

圖片

數據創建方法#2(UW)

這里,作者使用了華盛頓大學(UW)三家醫院系統(Harborview Medical Center、UW Medical Center 和 Seattle Cancer Care Alliance)從2009年-2021年間的真實臨床筆記數據庫。

研究人員從中17,453條診斷支持記錄中,隨機選取了488條,這些記錄總結了患者的病情并提供了治療依據。

4名醫學生組成的團隊手動向其中244條記錄中引入了錯誤。

在初始階段,每條記錄都標注了若干候選實體,這些實體由QuickUMLS 4識別為統一醫學語言系統(UMLS)的概念。

標注員可以從這些候選實體中選擇一個簡潔的醫學實體,或者創建一個新的文本片段(span)。隨后,該片段被標記為五種錯誤類型之一。

接著,標注員用類似但不同的概念替換該片段,錯誤版本由標注員自行設計或通過基于SNOMED和LLM的方法生成。這種方法向標注員建議替代概念,但不依賴輸入文本。醫學標注員手動確定最終注入文本中的概念或錯誤。

在此過程中,每個錯誤片段必須與臨床筆記中的至少兩個其他部分相矛盾,同時標注員需為每個引入的錯誤提供合理的解釋。

作者使用了Philter5工具對注入錯誤后的臨床筆記進行自動去標識化處理。

隨后,每條筆記由2名標注員獨立審查以確保去標識化的準確性。對于任何分歧,由第3名標注員進行裁定。

下表1展示了訓練集、驗證集和測試集的劃分情況。其中,MS訓練集包含2,189篇臨床文本,MS驗證集包含574篇臨床文本,UW驗證集包含160篇臨床文本。

MEDEC測試集由MS集合的597篇臨床文本和UW數據集的328篇臨床文本組成。測試集中,51.3%的筆記包含錯誤,而48.7%的筆記是正確的。

圖片

下圖3展示了數據集中錯誤類型的分布情況(診斷、管理、治療、藥物治療和致病因子)。

圖片

醫療錯誤檢測與糾正方法

為了評估模型在醫療錯誤檢測與糾正任務中的表現,作者將該過程劃分為三個子任務:

  • 子任務 A:預測錯誤標志(0:如果文本沒有錯誤;1:如果文本包含錯誤)
  • 子任務 B:提取包含錯誤的句子,用于已標記錯誤的文本(-1:如果文本沒有錯誤;句子ID:如果文本包含錯誤)
  • 子任務 C:為包含錯誤的標記文本生成修正后的句子(NA:如果文本沒有錯誤;生成的句子/修正內容:如果文本有錯誤)

為了進行比較,他們基于LLM構建了解決方案,使用了兩種不同的提示詞來生成所需的輸出,以評估模型在這三個子任務中的表現:

  • 提示詞#1:

以下是關于一名患者的醫療敘述。你是一名熟練的醫生,正在審閱這些臨床文本。文本要么是正確的,要么包含一個錯誤。文本中每行是一句話。每行以句子ID開頭,后跟一個豎線符號,然后是需要檢查的句子。檢查文本中的每一句話。如果文本正確,則返回以下輸出:CORRECT。如果文本中存在與治療、管理、病因或診斷相關的醫療錯誤,則返回包含錯誤的句子ID,后跟一個空格,然后是修正后的句子。發現并糾正錯誤需要用到醫學知識與推理能力。

  • 提示詞#2:與第一個提示詞類似,但包含一個從訓練集中隨機選取的輸入和輸出示例:

以下是一個示例。

0 一名35歲的女性向她的醫生訴說手部疼痛和僵硬。1 她說,疼痛始于6周前,在她克服了一次輕微的上呼吸道感染幾天后開始。(……) 9 雙手的雙側X線顯示左手第五掌指關節周圍輕微的關節周圍骨質減少。10 給予甲氨蝶呤。

在這個示例中,錯誤出現在句子編號10:「給予甲氨蝶呤」。修正為:「給予潑尼松」。輸出為:10 1 Prednisone is given。示例結束。

實驗與結果

語言模型

研究人員對幾種近期的語言模型進行了實驗:

  1. Phi-3-7B:具有70億參數的小語言模型(SLM)。
  2. Claude 3.5 Sonnet(2024-10-22):Claude 3.5系列的最新模型(≈1750億參數),在多個編碼、視覺和推理任務中展現出了SOTA的性能。
  3. Gemini 2.0 Flash:最新/最先進的Gemini模型。其他谷歌模型(如專為醫療設計的Med-PaLM,5400億參數)尚未公開。
  4. ChatGPT(≈1750億參數)和GPT-4(≈1.76萬億參數),是「高智能」模型。
  5. GPT-4o(≈2000億參數),提供「GPT-4級別的智能但速度更快」,以及專注于特定任務的小模型GPT-4o-mini(gpt-4o-2024-05-13)(≈80億參數)。
  6. 最新的o1-mini(o1-mini-2024-09-12)(≈1000億參數)和o1-preview(o1-preview-2024-09-12)(≈3000億參數),具備「全新AI能力」,可處理復雜推理任務。

值得注意的是,大多數模型的參數量為估算值,主要用來幫助理解模型性能。少數模型(如Phi-3和Claude)需要進行少量自動后處理來修正格式問題。

結果

下表2展示了,由醫療醫生手動標注的結果以及使用上述兩個提示詞的多個最新LLM的結果。

在錯誤標志(error flag)檢測方面,Claude 3.5 Sonnet以70.16%的準確率優于其他方法,在錯誤句子檢測中更是達到了65.62%的準確率。

o1-mini在錯誤標志檢測中,拿下了第二高的準確率69.08%。

在錯誤糾正方面,o1-preview以0.698的綜合評分(Aggregate Score)獲得了最佳表現,遠超第二名GPT-4 [P#2] 的0.639。

圖片

下表3展示了,在每個數據集(MEDEC-MS和MEDEC-UW)上的錯誤檢測準確率和錯誤糾正評分。其中,MS子集對Claude 3.5 Sonnet和醫生#2來說更具挑戰性,而UW子集對o1-preview和醫生#1來說更具挑戰性。

結果表明,與醫生的評分相比,最新的LLM在錯誤檢測和糾正方面表現良好,但在這些任務中仍然不及人類醫生。

這可能是因為,此類錯誤檢測和糾正任務在網絡和醫學教科書中相對罕見,也就是,LLM在預訓練中遇到相關數據的可能性較低。

這一點可以從o1-preview的結果中看出,該模型在基于公開臨床文本構建的MS子集上的錯誤和句子檢測中分別取得了73%和69%的準確率,而在私有的UW集合上僅取得了58%和48%的準確率。

另一個因素是,任務需要分析和糾正現有的非LLM生成的文本,這可能比從0開始起草新答案的難度更高。

圖片

下表4展示的則是,每種錯誤類型(診斷、管理、治療、藥物治療和病因微生物)的錯誤檢測召回率和錯誤糾正評分。

可以看到,o1-preview在錯誤標志和句子檢測中,召回率顯著高于Claude 3.5 Sonnet和兩位醫生。但在結合準確率結果(見表2)之后發現,醫生在準確率上表現更佳。

這些結果表明,模型在精確度方面存在顯著問題,并且與醫生相比,AI在在許多情況下都過度預測了錯誤的存在(即產生了幻覺)。

圖片

另外,結果還顯示,分類性能與錯誤糾正生成性能之間存在排名差異。

例如,在所有模型中,Claude 3.5 Sonnet在錯誤標志和句子檢測的準確率上排名第一,但在糾正生成評分中排名最后(見表 2)。

此外,o1-preview在所有LLM中的錯誤檢測準確率排名第四,但在糾正生成中排名第一且遙遙領先。同樣的模式也可以在兩位醫療醫生之間觀察到。

上述現象,可以通過糾正生成任務的難度來解釋,同時也可能反映了當前SOTA的文本生成評估指標在捕捉醫學文本中的同義詞和相似性方面的局限性。

表5展示了參考文本、醫生標注以及由Claude 3.5 Sonnet和GPT模型自動生成的糾正示例。

例如,第二個示例的參考糾正表明患者被診斷為Bruton無丙種球蛋白血癥,而LLM提供的正確答案提到了X-連鎖無丙種球蛋白血癥(該罕見遺傳疾病的同義詞)。

此外,一些LLM(如Claude)提供了更長的答案/糾正,并附上了更多解釋。類似的現象也出現在醫生的標注中,其中醫生#1提供的修正比醫生#2更長,而兩位醫生在某些示例/案例中存在不同意見,這反映了由不同醫生/專家撰寫的臨床筆記在風格和內容上的差異。

圖片

關于醫療錯誤檢測和糾正的相關研究下一步,還需要在提示詞中引入更多示例并進行示例優化。

作者介紹

Wen-wai Yim

圖片

Wen-wai Yim是微軟的高級應用科學家。

她在UCSD獲得生物工程學士學位,并在華盛頓大學獲得生物醫學與健康信息博士學位,研究方向包括從臨床和放射學筆記中提取臨床事件以及進行癌癥分期預測。

此外,還曾在斯坦福大學擔任博士后研究員,開發用于從自由格式臨床筆記中提取信息的方法,并將這些信息與電子病歷中的元數據相結合。

她的研究興趣包括從臨床筆記和醫學對話中進行臨床自然語言理解,以及從結構化和非結構化數據生成臨床筆記語言。

Yujuan Fu

圖片

Yujuan Fu是華盛頓大學醫學信息專業的博士生。

此前,她在上海交通大學獲得電子與計算機工程學士學位,在密歇根大學獲得數據科學學士學位。

研究領域是面向健康領域的自然語言處理:通過指令微調大語言模型,包括信息抽取、摘要、常識推理、機器翻譯以及事實一致性評估。

Zhaoyi Sun

圖片

Zhaoyi Sun是華盛頓大學生物醫學與健康信息學專業的博士生,隸屬于UW-BioNLP團隊,由Meliha Yetisgen博士指導。

此前,他在南京大學獲得化學學士學位,并在康奈爾大學獲得健康信息學碩士學位。

他的研究重點是將LLM應用于醫療問答和臨床筆記中的錯誤檢測,興趣是結合生物醫學圖像與文本的多模態深度學習研究,目標是提升自然語言處理技術在臨床領域中的應用效率和效果。

Fei Xia

圖片

Fei Xia是華盛頓大學語言學系的教授,也是華盛頓大學/微軟研討會的聯合組織者。此前,曾在IBM T. J. Watson研究中心擔任研究員。

她在北京大學計算機科學系獲得學士學位,并在賓夕法尼亞大學計算與信息科學系獲得碩士和博士學位。

在賓大期間,她是中文樹庫項目的團隊負責人,也是XTAG項目的團隊成員。博士論文導師是Martha Palmer博士和Aravind Joshi博士。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-01-02 11:00:34

2024-10-17 13:30:00

2024-09-29 13:07:16

2025-05-27 15:19:52

GPUMetaGPT-4o

2025-04-11 09:10:00

模型開源AI

2024-10-17 14:05:34

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2025-01-21 10:10:56

2025-08-07 14:05:40

OpenAI大模型開源

2025-04-16 09:15:00

AI模型數據

2024-09-24 11:01:03

2024-06-05 08:29:35

2025-03-31 08:50:00

AI生成模型

2024-08-14 14:30:00

AI訓練

2024-05-14 11:29:15

2024-11-07 15:40:00

2024-05-15 17:34:15

2024-08-08 14:27:29

2025-01-16 16:39:44

2024-05-21 12:23:17

點贊
收藏

51CTO技術棧公眾號

精品久久久无码中文字幕| 91精品人妻一区二区| 国产丝袜视频在线播放| av色综合久久天堂av综合| 日本三级韩国三级久久| 你懂的在线播放| 九九九伊在线综合永久| 国产精品久久久99| 国产精品久久久对白| 99热精品一区二区| 亚洲人免费视频| 天堂av8在线| 国产伦久视频在线观看| 国产精品无圣光一区二区| 亚洲永久在线观看| 久久久久在线视频| 中国精品18videos性欧美| 日韩电影大全免费观看2023年上| 亚洲一区二区福利视频| 伊人成综合网站| 亚洲黄色小视频| 欧美一级爽aaaaa大片| 成人1区2区3区| 裸体一区二区三区| 欧美做爰性生交视频| 免费在线视频观看| 欧美电影三区| 亚洲欧洲一区二区三区在线观看| 稀缺呦国内精品呦| 精品一区二区三区免费看| 色94色欧美sute亚洲线路一久| 99久久久精品视频| 国产在线激情视频| 国产精品美日韩| 日本在线视频不卡| 你懂的视频在线播放| 成人国产亚洲欧美成人综合网| 91精品视频免费| 亚洲天堂自拍偷拍| 人人精品人人爱| 啪一啪鲁一鲁2019在线视频| 久久网中文字幕| 51精产品一区一区三区| 日韩在线免费av| 女人黄色一级片| heyzo久久| 中文字幕av一区中文字幕天堂| 魔女鞋交玉足榨精调教| 日韩丝袜视频| 成人高清电影网站| 欧美在线观看一二区| 不卡影院一区二区| 欧美舌奴丨vk视频| 欧美中文字幕一区二区三区亚洲 | 精品人妻一区二区三区浪潮在线 | 国产精品一区二区在线免费观看| 欧美不卡在线观看| 欧美sm美女调教| 国产精品果冻传媒| 日韩高清影视在线观看| 亚洲欧美日韩高清| 91久久精品视频| 免费看黄色av| 日韩系列欧美系列| 久久久精品视频成人| 亚洲国产精品免费在线观看| 中文字幕日韩一区二区不卡| 欧美国产第二页| 女人十八岁毛片| 丝袜亚洲精品中文字幕一区| 国产精品揄拍一区二区| 国产精品久久无码一三区| 国产精品一区三区| 精品一区二区三区日本| 风间由美一区| 亚洲啪啪综合av一区二区三区| 高清无码视频直接看| 免费v片在线观看| 欧美中文字幕一二三区视频| 日韩av一卡二卡三卡| 伊人久久大香线蕉av超碰| 亚洲激情国产精品| 国产精品久久久视频| 一区二区电影在线观看| 国内精品久久久久久影视8| 午夜精品三级久久久有码| 蜜臀av性久久久久蜜臀aⅴ四虎 | 国产三级自拍视频| 丁香激情综合五月| 日韩视频一区二区三区| 国产日韩成人内射视频| 91精品福利观看| 亚洲第一福利视频| 黄色裸体一级片| 亚洲乱码久久| 91久久中文字幕| 日韩精品一二| 一区二区三区欧美| 日韩肉感妇bbwbbwbbw| 亚洲一区二区电影| 亚洲最新av网址| 国产精品第一页在线观看| 日韩一区精品视频| 国产精品99久久久久久久| 国产女人在线观看| 亚洲国产精品久久久久婷婷884 | 亚洲精品自在久久| 亚洲国产精品免费在线观看| 久久综合狠狠| 国产精品一区在线观看| 免费av在线| 一本大道久久精品懂色aⅴ| 色哟哟网站在线观看| 国内精品久久久久久久久电影网 | 69精品无码成人久久久久久| 亚洲人成网亚洲欧洲无码| 插插插亚洲综合网| 影音先锋国产在线| 91免费在线视频观看| 黄色成人在线免费观看| 色8久久久久| 亚洲欧美中文日韩v在线观看| 九九视频在线观看| 国模大尺度一区二区三区| 日韩hmxxxx| 一区二区三区短视频| 精品处破学生在线二十三| 老熟妇高潮一区二区三区| 日韩福利电影在线| 明星裸体视频一区二区| 91九色porn在线资源| 精品国产一区二区国模嫣然| 国产一区二区精彩视频| 蓝色福利精品导航| 亚洲欧洲免费无码| 国产高清免费在线观看| 91免费精品| 国产精品第一视频| 国产区在线视频| 在线观看一区不卡| 精品人妻无码一区二区三区换脸| 亚洲作爱视频| 久久久99爱| 欧美私密网站| 亚洲精品福利在线| 日本视频免费在线| 91香蕉国产在线观看软件| 成年人午夜免费视频| 欧美日韩一区二区三区四区不卡| 午夜精品一区二区三区av| 神宫寺奈绪一区二区三区| 午夜精品久久久久久久久久久| 国产成人精品一区二区三区在线观看 | 99久久国产宗和精品1上映| 亚洲小说图片视频| 日韩av成人在线| 国产香蕉视频在线看| 欧美中文字幕一区| 国产小视频你懂的| 国产乱子轮精品视频| 久久久久久久久久伊人| theporn国产在线精品| 久久免费少妇高潮久久精品99| 欧美一区二区三区激情| 富二代精品短视频| 一级二级黄色片| 国产麻豆成人传媒免费观看| 国产内射老熟女aaaa| 精品按摩偷拍| 欧洲成人在线视频| 日本中文字幕在线观看| 日韩欧美一区二区久久婷婷| 国产乡下妇女做爰| 久久久99精品免费观看不卡| 三上悠亚在线一区| 国产精品xvideos88| 精品视频高清无人区区二区三区| 婷婷综合六月| 午夜精品福利久久久| 国产精品美女xx| 国产激情在线视频| 亚洲第一中文字幕在线观看| 国产精品久久久久久人| 日韩一区中文字幕| 你懂的在线观看网站| 日本视频一区二区三区| 亚洲国产一二三精品无码| 日本国产精品| 国产中文日韩欧美| av资源在线播放| 最近2019年手机中文字幕| 精品久久久无码中文字幕| 欧美特黄级在线| 国产激情无码一区二区三区| av在线免费不卡| 中文字幕66页| 免费永久网站黄欧美| 中文字幕第50页| 你懂的视频欧美| 91九色蝌蚪成人| 春暖花开亚洲一区二区三区| 久久69精品久久久久久国产越南| 99热这里只有精品2| 成人免费91| 欧美亚洲另类制服自拍| 国产鲁鲁视频在线观看特色| 亚洲免费精彩视频| 动漫av一区二区三区| 欧美视频一区二区| 天堂在线免费观看视频| 亚洲精品五月天| 久久一级免费视频| 久久精品一区二区三区av| 日本一区二区在线观看视频| 精品一区二区三区香蕉蜜桃 | 69久久夜色精品国产69| 天堂网在线观看视频| 7777精品伊人久久久大香线蕉经典版下载 | 蜜桃a∨噜噜一区二区三区| 99re在线国产| 99久久99九九99九九九| 国产精品久久9| 欧美黄色网页| 欧美伊久线香蕉线新在线| 美足av综合网| 成人午夜电影久久影院| 每日在线观看av| 欧美激情91| 日本丰满少妇黄大片在线观看| 国产一区二区三区不卡视频网站 | aa日韩免费精品视频一| 四虎成人精品一区二区免费网站| 日韩美女主播视频| 亚洲人体影院| 5278欧美一区二区三区| 国产美女精品写真福利视频| 欧美大片第1页| av软件在线观看| 欧美大肥婆大肥bbbbb| 免费a级人成a大片在线观看| 色小说视频一区| 欧美被日视频| 久久久国产在线视频| 免费大片在线观看www| 日韩中文在线观看| 男人的天堂官网| 99久久这里只有精品| 欧美精品亚洲精品| 久久99国产精品视频| 久久日韩精品| 国产欧美日韩视频在线| 奇米精品在线| 国产一区二区三区91| 亚洲视频在线二区| 99久久久久国产精品| 九一免费在线观看| 韩国av一区| 北条麻妃69av| 日本欧美一区二区| 国产aⅴ爽av久久久久| 国产一区二区不卡在线| 一区二区三区四区影院| 99热这里都是精品| 一区二区三区伦理片| 欧美经典一区二区| 国产三级国产精品国产国在线观看| 亚洲精品成人悠悠色影视| 国产黄色片视频| 色综合久久88色综合天天| 中文字幕av无码一区二区三区| 6080yy午夜一二三区久久| 亚洲精品一区二区三区蜜桃| 亚洲精品一区二区三区不| 国产区av在线| 欧美大荫蒂xxx| 极品美女一区| 91久久精品一区| 日本在线中文字幕一区| 亚洲精品高清视频| 亚洲天堂999| 欧美丝袜美女中出在线| 一级黄色a毛片| 欧美精品一区二区三区蜜桃视频 | 国产三级欧美三级| 日韩在线一卡二卡| 午夜精品影院在线观看| 中文字幕第99页| 欧美精品一区二区三区在线播放| 欧美日韩国产综合在线| 伊人久久大香线蕉av不卡| 亚洲一区二区三区精品在线观看 | 久久69精品久久久久久久电影好| 免费一二一二在线视频| 国产日韩欧美在线| 免费观看成人www动漫视频| 一区二区精品免费视频| 91久久夜色精品国产九色| 亚洲欧美久久久久| www.在线欧美| 男人在线观看视频| 日韩欧美在线视频观看| 国产成人三级在线播放| 亚洲视频日韩精品| 国产深夜视频在线观看| 成人a级免费视频| 蜜桃成人av| 色欲色香天天天综合网www| 麻豆91精品91久久久的内涵| 熟妇高潮精品一区二区三区| 亚洲男人电影天堂| 这里只有精品免费视频| 亚洲精品久久久久中文字幕二区| 高清全集视频免费在线| 国产精品三级久久久久久电影| 麻豆一区二区麻豆免费观看| 日韩中文字幕亚洲精品欧美| 日本在线不卡视频| 亚洲精品理论片| 亚瑟在线精品视频| 性生活免费网站| www.国产一区| 久久三级毛片| 特级西西444www大精品视频| 亚洲欧美卡通另类91av| 亚洲啪av永久无码精品放毛片 | 26uuu国产电影一区二区| 久久久久亚洲av无码专区| 6080国产精品一区二区| 色影院视频在线| 国产精品福利无圣光在线一区| 午夜精品福利影院| 欧美日韩在线一| av中文字幕亚洲| 欧美性做爰毛片| 欧美va视频| 日本高清不卡三区| 香蕉av777xxx色综合一区| 亚洲欧美在线不卡| 婷婷丁香激情综合| 色欲久久久天天天综合网| 久久久久久免费精品| 国产精品白丝一区二区三区| 精品一区二区三区无码视频| 国产.精品.日韩.另类.中文.在线.播放 | 无人区乱码一区二区三区| 女女同性女同一区二区三区按摩| 久久99精品久久久久久久久久久久 | 国产又黄又粗又猛又爽| 久久久久北条麻妃免费看| aa亚洲一区一区三区| 中文字幕欧美日韩一区二区| 精品一区二区日韩| 午夜免费激情视频| 日韩精品一区在线| www成人免费观看| 免费中文日韩| 美女视频网站久久| 欧美手机在线观看| 日韩一区二区免费视频| 欧美精品videosex| 精品一区二区国产| 日日摸夜夜添夜夜添亚洲女人| 国产视频三区四区| 欧美一区二区三区啪啪| 超免费在线视频| 蜜桃成人在线| 老司机一区二区| 精品少妇久久久| 亚洲精品自拍视频| 精品视频在线一区二区在线| 一区二区三区三区在线| 国产成人日日夜夜| 99精品人妻国产毛片| 日韩视频一区在线| swag国产精品一区二区| 成人3d动漫一区二区三区| 亚洲丝袜精品丝袜在线| 天天操天天爱天天干| 国产精品日韩欧美| 国产专区一区| 免费视频91蜜桃| 日韩欧美一级二级三级久久久| 久草在线中文最新视频| 亚洲图色在线| 99在线精品免费| 亚洲自拍偷拍另类| 国内精品久久久久久久久| 久久国产成人午夜av影院宅| 国产免费a级片| 在线观看www91| 欧美6一10sex性hd| 亚洲国产精品www| 成人在线一区二区三区| www.av88| 91av福利视频| 一区二区三区国产精华| 成人乱码一区二区三区av| 欧美一区二区三区白人| 美女网站视频一区| 人妻av中文系列|