精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT上下文碾壓64K開源模型!UC伯克利:開源模型能力嚴重「虛標」|最新硬核評測曝光

人工智能
最近,來自LMSYS Org的研究人員不僅一次發了兩個支持16k token上下文長度的開源大模型LongChat-7B和LongChat-13B。而且,他們還測試了號稱支持長上下文能力的幾個大模型的實際表現,發現開源模型虛標嚴重。

早先發布Vicuna模型和大語言模型排位賽的LMSYS Org(UC伯克利主導)的研究人員又開始搞事情了。

這次,他們開發出了一個支持長上下文的開源大模型家族LongChat-7B和LongChat-13B,支持高達16K token的上下文長度。

但是吧,其實市面上早已出現支持65K(MPT-7B-storyteller)和32K(CHatGLM2-6B)token的選手了。

圖片圖片

抱著一邊向他們虛心學習一邊質疑的研究者心態,他們設計一個專門評估大語言模型處理長上下文任務的性能的工具,測了測一眾號稱支持長上下文的模型們性能到底怎么樣。

不測不知道,一測發現之前宣稱能支持長上下的開源模型幾乎水平都不怎么樣,而自家的LongChat在一眾「開源李鬼」里才是真的李逵。

而商業閉源大模型的長上下文能力,是真的不錯,各個都很能打。

圖片圖片

在長距離主題檢索任務上比較LongChat和其他模型

長上下文「打假」

根據研究人員測試的結果,閉源的商業長上下文模型確實能兌現它們的承諾:gpt-3.5-16k和Anthropic Claude在基準測試中幾乎都達到了完美的性能。

然而,現有的開源模型在長上下文長度方面的表現卻比自己「聲稱」的要差很多。

圖片圖片

大語言模型支持長上下文能力的等級

全新LongChat開源模型,支持16k上下文

LongChat模型不僅可以處理高達16k token的上下文長度,而且還能準確地遵循對話中的人類指令,并在人類偏好基準MT-Bench中展示出強大的性能。

預覽版本可在HuggingFace上獲得:

  • lmsys/longchat-13b-16k
  • lmsys/longchat-7b-16k

感興趣的同學可以在命令行界面或Web界面中使用FastChat來跑一下試試:

Python
python3 -m fastchat.serve.cli --model-path lmsys/longchat-7b-16k

在研究團隊的LongChat存儲庫中可以找到用于重現研究結果結果的數據和代碼,研究人員還貼心地提供了可視化效果展示。

那么我們來看看LongChat是怎么一步一步從LLaMA的2048個token的上下文長度訓練到16K的。

第一步:壓縮旋轉嵌入( Rotary embedding)

旋轉位置嵌入是一種將位置信息注入Transformer的位置嵌入方法。

在Hugging Face的Transformer庫中,它的實現方式如下:

Python
query_states, key_states = apply_rotary_pos_emb(query_states, key_states, cos, sin, position_ids)

其中position_ids是索引,如1、2、3等,用于表示句子中token的位置。

例如,在句子「today is a good day」中,token「today」的position_ids為1。apply_rotary_pos_emb()函數根據提供的position_ids應用變換。

LLaMA模型使用旋轉嵌入在序列長度2048上進行預訓練的。

這就意味著在預訓練階段就觀察不到position_ids > 2048的情況。

研究團隊沒有強制LLaMA模型適應position_ids > 2048,而是將position_ids > 2048的部分壓縮到0到2048之間。

直觀地說,研究人員假設這種壓縮可以最大程度地重用在預訓練階段學到的模型權重。

他們通過將目標新上下文長度y除以2048來定義壓縮比率。

然后將每個position_ids除以這個比率,并將其輸入apply_rotary_pos_emb()函數。

Python
query_states, key_states = apply_rotary_pos_emb(query_states, key_states, cos, sin, position_ids / ratio)

在此版本中,研究人員將模型微調到上下文長度為16384,壓縮率設為8。

例如,把position_ids = 10000的token變為position_ids = 10000 / 8 = 1250,而相鄰的token10001變為10001 / 8 = 1250.125。

這個技術最先由開源社區的一個叫Kaiokendev的開源愛好者發現(https://kaiokendev.github.io/context)并傳播和討論。LMSys Org的研究人員發現這個技術確實很好使,而且這一步只需要改一行代碼,不需要進行訓練。

第二步:微調精選的對話數據庫

在壓縮嵌入之后,研究人員使用他們精心挑選的對話數據集執行微調過程。

研究團隊重新使用了先前用來訓練Vicuna的用戶分享對話數據。

使用FastChat數據處理流程清理數據,截斷了這些對話,使其長度不超過16K。

然后再使用標準下一個token預測損失對模型進行微調。

最后他們分別使用80,000個和18,000個對話對7B和13B模型進行微調。

假設在云上使用A100花費每小時3美元,7B模型的成本約為300美元,而13B模型的成本約為700美元。

上下文能力驗證工具:LongEval

為了驗證商業閉源和開源模型宣傳支持的長上下文能力(從8K、32K到100K)到底有多強,研究團隊開發了一套驗證工具包。

不同的模型作者可能對所謂的「長上下文能力」對有著不同的理解。

舉個例子,MPT-7B-StoryWriter所宣稱的65K上下文長度是否與OpenAI的ChatGPT在16K上下文長度下具有相同的性能?

在LongChat開發過程中,同樣的問題也困擾著研究團隊。

如何迅速有效地確認一個新訓練的模型是否能夠真地有效處理預期的上下文長度?

為了解決這個問題,研究團隊可以基于需要LLM處理長上下文的任務進行評估。

例如文本生成、檢索、摘要和長文本序列中的信息關聯。

受最近的研究啟發,研究人員們設計了一個名為LongEval的長上下文測試套件。

這個套件包括兩個難度不同的任務,提供了一種簡單快捷的方式來衡量和比較長上下文的性能。

任務一:粗粒度主題檢索

在現實世界的長對話中,用戶通常與聊天機器人的討論會在多個主題間跳轉。

研究團隊使用主題檢索任務來模擬這種場景。

這個任務會要求聊天機器人檢索由多個主題組成的長對話中的第一個主題,來模擬這種情景。

示例任務如下:

Python
… (instruction of the task)
USER: I would like to discuss <TOPIC-1>
ASSISTANT: Sure! What about xxx of <TOPIC-1>?
… (a multi-turn conversation of <TOPIC-1>)
USER: I would like to discuss  <TOPIC-2>
…
USER: I would like to discuss <TOPIC-k>
…
USER: What is the first topic we discussed?
ASSISTANT:

這個任務測試模型是否能夠定位長下文中的一段文本并將其與正確的主題名稱相關聯。

研究人員設計了很多個由400到600個token組成的對話,并隨機組合它們達到到想要測試的長度,將組合出來的長文本作為 Prompt.

所以,這是一個粗粒度的對話,因為當模型能夠定位到距離正確位置不太遠(<500個token距離)的位置時,它可能會給出正確的預測。

任務二:細粒度檢索

為了進一步測試模型在長對話中定位和關聯文本的能力,研究人員引入了更精細的行檢索測試(Line Retrieval test)。

在這個測試中,聊天機器人需要精確地從長文檔中檢索一個數字,而不是從長對話中檢索一個主題。

以下是一個示例:

Python
line torpid-kid: REGISTER_CONTENT is <24169>
line moaning-conversation: REGISTER_CONTENT is <10310>
…
line tacit-colonial: REGISTER_CONTENT is <14564>
What is the <REGISTER_CONTENT> in line moaning-conversation?

這個任務最初是在「Little Retrieval Test」中被設計出來的。

原始的測試中,是使用數字來表示一行,但研究人員發現較小的LLM通常無法很好地理解數字。

為了解開這些因素并使其更適合測試不同大小的開源聊天機器人,他們通過使用隨機的自然語言(例如「torpid-kid」)進行改進。

研究人員發現這兩個任務都具有這幾預期的特點:

1. 任務可以有效捕捉到文本生成、檢索和長上下文信息關聯的能力,最終反映在檢索準確性上。

2. 可以輕松將測試擴展到任意長度,以測試模型在不同上下文長度下的能力。

3. 研究人員已經對這兩個任務進行了檢查,并觀察到了預期的結果。

例如,對于使用2K上下文進行預訓練的原始LLaMA模型,在測試輸入長度小于2K時可以實現完美的準確性。

但對于超過2K的測試輸入,準確性幾乎為零。

研究人員通過這個原理,就能檢測不同模型對于不同上下文長度時,執行信息檢索和關聯相關信息的能力。

測評結果

圖片圖片

根據粗粒度的主題檢索測試結果,團隊觀察到開源的長上下文模型的性能似乎沒有自己宣稱得那么好。

例如,Mpt-7b-storywriter聲稱具有84K的上下文長度,但即使在它聲稱的上下文長度的四分之一(16K)處,準確率也僅達到50%。

Chatglm2-6B在長度為6K(46%準確率)時無法可靠地檢索第一個主題。

當在大于10K的上下文長度上進行測試時,其準確率幾乎為0%。

另一方面,研究人員觀察到LongChat-13B-16K模型可靠地檢索到第一個主題,并且準確率與gpt-3.5-turbo相當。

圖片圖片

在更細粒度的行檢索測試中,Mpt-7b-storywriter的表現甚至比粗粒度情況下更差,準確率從約50%下降到約30%。

Chatglm2-6B也出現了下降,在研究人員測試的最短長度(5K上下文長度)上表現也不太好。

相比之下,LongChat-13B-16K表現可靠,在12K的上下文長度內接近gpt-3.5/Anthropic-claude的能力。

解開LongEval中與LLM能力無關的因素

在主題和行檢索測試中,研究人員觀察到一些錯誤是由與長上下文能力無關的因素引起的,比如指令跟隨能力。

例如,在行檢索測試中,模型可能會簡單地回答「當然,我會告訴你這個數字」,而不是按照要求回答實際的數字。

為了進行公平比較,研究人員采取了兩個措施來避免與長上下文能力無關的因素:

1)設計適當的提示詞

2)僅在模型按照研究人員的指令執行的情況下計算準確率。

人類偏好基準(MT-bench)

在前面的部分中,研究人員觀察到LongChat模型在長距離檢索任務上表現良好,但這是否會導致人類偏好顯著下降呢?

為了測試它是否仍然符合人類的偏好,研究人員使用了GPT-4評分的MT-bench,這是一組具有挑戰性的多輪對話問題。

研究人員發現,LongChat-13B-16K與其最接近的替代模型Vicuna-13B相比,確實在MT-Bench分數上略有下降,但在可接受的范圍內,這表明這種長距離能力并沒有顯著犧牲其短距離能力。

同時,LongChat-13B-16K與其他相同規模的模型相比也具有競爭力。

圖片圖片

討論分析

研究人員發現,當上下文長度接近16K時,LongChat-13B-16K在細粒度的行檢索任務上出現了準確率下降的情況。

在他們的初步嘗試中,研究人員猜測這是因為接近最大的微調長度。

例如,使用更大的長度(例如32K)進行訓練可以緩解這個問題。

研究人員正在積極努力解決這個問題,并計劃在不久的將來發布中解決。

研究人員用表格形式定性地說明了性能水平,并且希望提出他們的最終思考:能夠在一個上下文范圍內生成文本,和真正的具備在宣稱的上下文長度上能進行reasoning和檢索,這兩種能力是有很大差距的。

模型提供者通暢需要對模型進行良好的訓練(例如使用高質量的長序列數據,或者像研究人員探索過的進行壓縮),以實現良好的長上下文文本生成、檢索和推理能力。

雖然閉源模型基本在研究人員設計出的檢索測試上都能達到要求,但開源模型提供者在自己宣傳支持的長下文長度上,水分很大。

研究人員呼吁社區為長上下文聊天機器人貢獻更多的評估基準,并進一步理解和填補這一差距。

團隊介紹

共同一作Dacheng Li

Dacheng Li目前是加州大學伯克利分校的博士生。本科畢業于加州大學圣地亞哥分校,碩士畢業于卡耐基梅隆大學機器學習專業。他的主要研究方向是機器學習和分布式系統的交叉領域。

共同一作Rulin Shao

Rulin Shao 目前就職于亞馬遜AWS人工智能研究和教育中心,被錄取為華盛頓大學博士。她本科畢業于西安交通大學,碩士畢業于CMU機器學習專業。

Anze Xie

Anze Xie目前就讀于加州大學圣地亞哥分校計算機專業,本科畢業于維斯康星大學麥迪遜分校。

Xuezhe Ma

Xuezhe Ma目前是南加州大學計算機系的助理教授,本科和研究生畢業于上海交通大學,博士畢業于卡耐基梅隆大學。他的研究方向是提高表征學習的效率,有效性等。

團隊的其他幾位成員就是LMSYS Org發起人和老熟人了:盛穎,鄭憐憫,Ion Stoica和張昊等。

參考資料:

https://lmsys.org/blog/2023-06-29-longchat/

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-04-07 00:45:00

開源模型

2024-02-19 13:46:04

多模態信息LWMtoken

2025-04-30 09:09:00

2025-02-14 09:20:00

模型數據訓練

2023-04-07 13:54:37

模型AI

2023-04-04 13:17:00

GPUCMU開源

2023-07-18 15:02:50

論文AI

2024-12-02 08:20:00

2023-08-14 08:04:13

2023-06-21 13:20:14

系統模型

2023-04-07 09:28:31

模型訓練

2025-10-13 09:03:00

2025-04-18 08:42:52

模型推理AI

2023-04-11 14:16:53

模型AI

2025-08-21 10:14:18

2023-05-04 14:55:02

模型AI

2023-08-05 13:45:46

模型AI

2025-10-11 18:05:23

AI智能體模型

2024-06-03 14:24:00

2023-05-16 13:32:23

模型排行
點贊
收藏

51CTO技術棧公眾號

青草青在线视频| 成人黄色片在线观看| 日韩三级精品| 一区二区三区av电影| 69174成人网| 国产精品变态另类虐交| 精品综合久久88少妇激情| 亚洲黄色片在线观看| 成人91免费视频| 黄网在线观看视频| 国际精品欧美精品| 欧美精品18+| 成人小视频在线观看免费| 色天堂在线视频| 狠狠色丁香久久婷婷综| 亚洲91av视频| 26uuu成人网| 亚洲人成伊人成综合图片| 欧美日韩国产区一| 国产男女无遮挡| 国产激情视频在线| 国产欧美日韩另类一区| 国产成人精品免费视频大全最热| 手机看片久久久| 欧美日韩亚洲一区在线观看| 国产一区二区三区中文| 一级黄色大片免费看| 另类专区亚洲| 亚洲成av人在线观看| 亚洲欧美久久234| 亚洲av成人精品毛片| 国产麻豆视频精品| 国产精品日韩在线观看| 中文字幕亚洲精品一区| 亚洲乱码在线| 永久免费精品影视网站| 欧美在线一级片| 日韩一区二区三区精品| 欧美日韩在线播放| 日韩有码免费视频| 嗯~啊~轻一点视频日本在线观看| 成人免费一区二区三区在线观看| 日本高清久久一区二区三区| 懂色av成人一区二区三区| 韩国三级中文字幕hd久久精品| 日韩免费在线播放| 在线天堂中文字幕| 亚洲久久一区二区| 欧美大片在线免费观看| 精品人妻伦九区久久aaa片| 欧美日韩国产高清电影| 亚洲欧洲日本专区| 日韩av在线看免费观看| 青青草原在线亚洲| 亚洲精品美女久久久久| 看全色黄大色黄女片18| 成人午夜网址| 亚洲国产精品久久久久久| 中文字幕亚洲日本| 日韩影片在线观看| 日韩精品一区二区三区蜜臀 | 精灵使的剑舞无删减版在线观看| 国产精品久久久久桃色tv| 亚洲精品日韩精品| h视频网站在线观看| 久久久久国产精品人| 欧美精品成人一区二区在线观看| 日本成人一区| 中文字幕精品综合| 中文字幕免费在线不卡| 成人免费网站在线观看视频| 一区二区三区日韩精品视频| 国产日韩亚洲欧美在线| 美女的胸无遮挡在线观看 | 中文字幕91爱爱| 麻豆成人久久精品二区三区红 | 51社区在线成人免费视频| 欧美成人一区二区三区在线观看| 国产性猛交96| 色爱综合av| 中文字幕免费国产精品| 强乱中文字幕av一区乱码| 在线日本成人| 日韩av电影在线播放| 在线免费观看日韩视频| 国产美女娇喘av呻吟久久| 51成人做爰www免费看网站| 色一情一乱一区二区三区| 97se亚洲国产综合自在线不卡| 久久久7777| 91.xxx.高清在线| 亚洲另类在线视频| 116极品美女午夜一级| 国产香蕉久久| 精品av久久707| 国产成人av一区二区三区不卡| 99精品视频在线观看免费播放| 欧美放荡办公室videos4k| 中文字幕视频网| 国产专区欧美精品| 久久久久se| 黄色免费网站在线| 欧美日韩精品二区| 加勒比av中文字幕| 香蕉久久精品| 九色精品美女在线| 性色av一区二区三区四区| 夫妻av一区二区| 亚洲 日韩 国产第一区| 精精国产xxxx视频在线中文版 | 日本欧美爱爱爱| 精品久久久久中文慕人妻| 91色视频在线| 在线观看av的网址| 巨胸喷奶水www久久久免费动漫| 精品欧美乱码久久久久久| 国产亚洲精品精品精品| 一区二区三区导航| www.成人av| 1pondo在线播放免费| 欧美性猛交xxxx免费看| 在线观看一区二区三区视频| 精品国产美女| 91爱视频在线| www.成人免费视频| 国产精品网曝门| 啊啊啊一区二区| 一区二区三区高清在线观看| 中文字幕国产精品| 久久国产视频一区| av男人天堂一区| 国产精品啪啪啪视频| 欧洲亚洲精品久久久久| 亚洲欧美国产制服动漫| 日韩成人av毛片| 国产成人av自拍| 手机看片日韩国产| 日日夜夜亚洲| 中文字幕自拍vr一区二区三区| 欧美日韩一二三四区| 91亚洲精品久久久蜜桃网站| 日韩欧美一级在线| 精品国产18久久久久久二百| 色哟哟入口国产精品| 最新国产中文字幕| 久久精品无码一区二区三区| 久久久999视频| 亚洲成aⅴ人片久久青草影院| 久久久噜噜噜久久中文字免| 亚洲av永久无码国产精品久久 | 91丨精品丨国产| 精品国产一区二区三区四区在线观看| 少妇无套内谢久久久久| 日本一区二区三区免费乱视频| 黄在线观看网站| 蜜臀av免费一区二区三区| 欧美一级在线亚洲天堂| 亚洲人成色777777精品音频| 欧美视频一区二区三区…| 精品无码在线视频| 天堂午夜影视日韩欧美一区二区| 蜜桃狠狠色伊人亚洲综合网站| 中文字幕在线免费观看视频| 亚洲精品视频二区| 自拍偷拍校园春色| 国产精品免费久久| 日韩久久久久久久久久久| 欧美激情偷拍| 黄色99视频| 成人欧美大片| 中文字幕免费国产精品| 97人妻精品一区二区三区视频 | 亚洲欧美国产精品va在线观看| 无码人妻精品一区二区50| 国产精品理伦片| 激情小说欧美色图| 在线观看国产精品入口| 91视频国产一区| 136福利第一导航国产在线| 亚洲激情视频在线播放| 午夜精品免费观看| 综合色天天鬼久久鬼色| wwwxx日本| 老司机精品视频网站| 亚洲午夜精品一区二区| 香蕉成人app| 欧美一区二区色| 中文字幕在线免费| 精品国内二区三区| 久久久久久久久久一级| 亚洲精品免费在线观看| 亚洲成人av免费在线观看| 三级亚洲高清视频| 国产成人亚洲综合无码| 亚洲婷婷丁香| 97超级碰碰| 国产精品专区免费| 欧美大胆a视频| 你懂的好爽在线观看| 欧美一区二区免费观在线| 国产精品免费精品一区| 亚洲乱码中文字幕| 欧美日韩国产黄色| 99久久精品国产观看| 污污网站在线观看视频| 亚洲一区自拍| 国产91porn| 久久国产综合| 久久综合九色综合网站| 成人亚洲精品| 国产成人亚洲综合91| 国内在线视频| 久久精品电影一区二区| 欧美zozo| 亚洲韩国欧洲国产日产av| 国产乱色精品成人免费视频| 色噜噜偷拍精品综合在线| 久久精品这里有| 亚洲日本丝袜连裤袜办公室| 永久免费成人代码| www.日韩精品| 免费在线观看日韩av| 美女看a上一区| 日本精品久久久久中文字幕| 精品91在线| 久久久久久久久影视| 99久久综合狠狠综合久久aⅴ| 免费看成人片| 网曝91综合精品门事件在线| 国产精品国模大尺度私拍| 精品视频在线观看免费观看| 国产精品香蕉国产| 日本一道高清亚洲日美韩| 7777免费精品视频| 91禁在线看| 欧美激情综合色综合啪啪五月| 国产原创在线观看| 日韩在线观看免费av| wwwxxx在线观看| 亚洲一区二区国产| 国产在线高清| 亚洲人成在线免费观看| 欧美一区二区三区少妇| 日韩av最新在线观看| 天堂网av2014| 日韩精品极品在线观看| 偷拍自拍在线视频| 日韩精品视频观看| 免费在线超碰| 一区二区三区国产在线观看| 国产日产精品久久久久久婷婷| 国产香蕉精品视频一区二区三区| 国内精品一区视频| 在线视频亚洲欧美| 男人和女人做事情在线视频网站免费观看 | 99thz桃花论族在线播放| 欧美国产乱视频| 免费电影视频在线看| 久久免费视频在线观看| 女人让男人操自己视频在线观看 | 欧美一级高潮片| 亚洲va国产va欧美va观看| 亚洲国产成人精品激情在线| 欧美日韩色婷婷| 久久这里只有精品9| 欧美日韩在线播放一区| 国产jzjzjz丝袜老师水多| 精品久久久久av影院 | 在线观看视频亚洲| 伊人在线视频| 欧美日韩成人在线观看| 国产美女精品写真福利视频| 日本久久久久久久| 91丨精品丨国产| 九九九热999| 欧美精选视频在线观看| 国产高潮呻吟久久久| 亚洲第一黄网| 日本男人操女人| 寂寞少妇一区二区三区| 看全色黄大色黄女片18| 国产色产综合色产在线视频| frxxee中国xxx麻豆hd| 亚洲午夜久久久久中文字幕久| 亚洲另类欧美日韩| 欧美日韩国产123区| 丰满人妻一区二区三区四区53| 精品视频在线观看日韩| 麻豆电影在线播放| 欧美亚洲视频在线观看| 四虎影视精品永久在线观看| 国产精品一区二区三区精品| 波多野结衣在线观看一区二区三区| 一区二区精品在线| 亚洲免费大片| 波多野结衣国产精品| 91视频免费观看| 男人操女人的视频网站| 色婷婷综合久久久久中文 | 日韩色图在线观看| 91精品国产综合久久精品麻豆 | xxx成人少妇69| 欧美少妇网站| 91在线中文字幕| 中文字幕中文字幕精品| 国产 欧美 日韩 一区| 日本欧美一区二区| 亚洲中文字幕无码一区| 一色屋精品亚洲香蕉网站| 日韩欧美成人一区二区三区 | 毛片网站在线| 久久久久久亚洲精品| 免费一级欧美在线观看视频| 狠狠久久综合婷婷不卡| 亚洲第一偷拍| 99热手机在线| 久久香蕉国产线看观看99| 青青青在线视频| 欧美乱熟臀69xxxxxx| 久香视频在线观看| 97精品国产97久久久久久免费| 91国产一区| 神马影院我不卡午夜| 国产精品日本欧美一区二区三区| 九九九久久久久久久| 国产精品女上位| 国产天堂第一区| 亚洲人高潮女人毛茸茸| 黄频免费在线观看| 国产精品一区二区在线观看 | 欧美日韩国产成人在线| japansex久久高清精品| 伊人情人网综合| 久草精品在线观看| 林心如三级全黄裸体| 在线亚洲精品福利网址导航| 欧洲伦理片一区 二区 三区| 国内精品久久久久久| 国产一区丝袜| www.日本在线播放| 成人黄色777网| 国产在线精品观看| 亚洲高清久久网| 国产福利电影在线播放| 国产一区二区不卡视频| 亚洲欧洲另类| 中国极品少妇videossexhd | 国产中文字幕二区| 成人网在线播放| 久久久久久久99| 日韩av网址在线| 亚洲色图官网| 日韩精品av一区二区三区| 日韩精品免费视频人成| 东京热无码av男人的天堂| 欧美伦理视频网站| 手机av免费在线| 国产三区二区一区久久| 国产精品资源| 女女互磨互喷水高潮les呻吟| 欧美吻胸吃奶大尺度电影| 在线免费av网站| 91精品视频在线看| 亚洲视频碰碰| 国产福利短视频| 欧美色区777第一页| 黄色免费网站在线观看| 国产精品国产三级欧美二区| 亚洲欧美日本日韩| avhd101老司机| 日韩欧美在线123| 亚洲一级少妇| 在线成人av电影| 成人在线视频一区二区| 日韩欧美成人一区二区三区| 伊人伊成久久人综合网小说| 二区三区精品| 日本在线xxx| 国产精品乱码一区二三区小蝌蚪| 国产欧美久久久| 国产91精品视频在线观看| 日韩成人综合| 国产精品果冻传媒| 欧美性一二三区| 神马午夜伦理不卡| 秋霞毛片久久久久久久久| 国产一区中文字幕| 国产又大又黄视频| 久久久国产精品x99av| 日本一道高清一区二区三区| 麻豆三级在线观看| 亚洲.国产.中文慕字在线| 国产福利免费在线观看| **亚洲第一综合导航网站| 亚洲欧美大片| 18岁成人毛片| 亚洲四色影视在线观看| youjizz欧美| 国产又黄又猛的视频| 欧美性极品xxxx娇小|