精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICML 2025 | 大模型能在信息不完備的情況下問(wèn)出正確的問(wèn)題嗎?

人工智能 新聞
我們將簡(jiǎn)要介紹 TMLR 課題組和斯坦福大學(xué)合作的 AR-Bench,并展示我們從廣泛地測(cè)試實(shí)驗(yàn)中提取出來(lái)的重要發(fā)現(xiàn),相關(guān)論文已發(fā)表于 ICML 2025 會(huì)議。

大語(yǔ)言模型(Large Language Model, LLM)在復(fù)雜推理任務(wù)中表現(xiàn)卓越。借助鏈?zhǔn)剿季S(Chain-of-Thought, CoT),LLM 能夠?qū)?fù)雜問(wèn)題分解為簡(jiǎn)單步驟,充分探索解題思路并得出正確答案。LLM 已在多個(gè)基準(zhǔn)上展現(xiàn)出優(yōu)異的推理能力,尤其是數(shù)學(xué)推理和代碼生成。

然而,當(dāng)前針對(duì) LLM 推理能力的研究主要集中于被動(dòng)推理(Passive Reasoning, PR),即在提供完整信息的前提下讓模型進(jìn)行推理。相比之下,對(duì)信息不完備場(chǎng)景下模型推理能力的研究明顯不足。

這類場(chǎng)景在實(shí)際應(yīng)用中十分常見(jiàn),例如偵探需要通過(guò)詢問(wèn)和走訪獲取破案線索,醫(yī)生需要通過(guò)問(wèn)診收集診斷依據(jù)。我們將這類需要主動(dòng)獲取信息的推理稱為主動(dòng)推理(Active Reasoning, AR)。

目前關(guān)于 AR 的方法和基準(zhǔn)研究較少,探索不足,制約了 LLM 在復(fù)雜現(xiàn)實(shí)場(chǎng)景中的應(yīng)用。如圖 1 所示,被動(dòng)推理是直接從給定的充分信息中求解,而主動(dòng)推理則需要從不完整的信息出發(fā),通過(guò)多輪交互來(lái)獲取關(guān)鍵線索,最終得出結(jié)論。可以說(shuō),被動(dòng)推理的核心是找到答案,而主動(dòng)推理的核心是提出正確的問(wèn)題。

圖片

圖 1 被動(dòng)推理(左)與主動(dòng)推理(右)的示意圖。

盡管主動(dòng)推理對(duì)實(shí)現(xiàn)通用人工智能至關(guān)重要,但目前學(xué)術(shù)界對(duì)此關(guān)注甚少,LLM 在這方面的能力也亟待一個(gè)系統(tǒng)性的評(píng)估。為此,我們提出了 AR-Bench,一個(gè)旨在全面評(píng)估大模型主動(dòng)推理能力的基準(zhǔn),并進(jìn)行了一系列深入的實(shí)驗(yàn)分析。

我們的主要貢獻(xiàn)有如下三點(diǎn):

  1. 新問(wèn)題:我們提出了主動(dòng)推理這一亟待研究的新問(wèn)題,并系統(tǒng)定義了其相對(duì)于被動(dòng)推理的核心挑戰(zhàn)。
  2. 新基準(zhǔn):我們提出了專門(mén)用于評(píng)估主動(dòng)推理能力的基準(zhǔn) AR-Bench ,系統(tǒng)的測(cè)試模型在復(fù)雜場(chǎng)景中的主動(dòng)推理能力。
  3. 新發(fā)現(xiàn):我們通過(guò)在 AR-Bench 上的全面評(píng)測(cè),揭示了當(dāng)前頂尖 LLM 在主動(dòng)推理方面的普遍且嚴(yán)重的短板,并指出了未來(lái)的研究方向。

接下來(lái),我們將簡(jiǎn)要介紹 TMLR 課題組和斯坦福大學(xué)合作的 AR-Bench,并展示我們從廣泛地測(cè)試實(shí)驗(yàn)中提取出來(lái)的重要發(fā)現(xiàn),相關(guān)論文已發(fā)表于 ICML 2025 會(huì)議。

圖片

  • 論文標(biāo)題:From Passive to Active Reasoning: Can Large Language Models Ask the Right Questions under Incomplete Information?
  • 論文鏈接:https://arxiv.org/abs/2506.08295 
  • 代碼鏈接:https://github.com/tmlr-group/AR-Bench

新問(wèn)題:主動(dòng)推理

傳統(tǒng)的 LLM 推理研究,如 CoT,大多遵循被動(dòng)推理的范式。在這種范式下,模型接收一個(gè)包含所有必要信息的問(wèn)題,然后逐步地推導(dǎo)出最終答案。然而,現(xiàn)實(shí)中許多場(chǎng)景都存在著信息不完整的情況。以醫(yī)療診斷為例,醫(yī)生需要通過(guò)與患者互動(dòng)主動(dòng)獲取癥狀、病史等關(guān)鍵信息,而非被動(dòng)接收完整數(shù)據(jù)。這類信息不完整的場(chǎng)景要求 LLM 通過(guò)提問(wèn)、信息探索和動(dòng)態(tài)交互來(lái)補(bǔ)充缺失信息,最終完成推理任務(wù)。

我們將這種推理范式定義為主動(dòng)推理。在 AR 范式下,模型僅獲得部分信息,并且必須通過(guò)與外部環(huán)境(如數(shù)據(jù)庫(kù)、API 或人類用戶)的交互來(lái)主動(dòng)提問(wèn),以獲取缺失的關(guān)鍵信息來(lái)解決問(wèn)題。AR 綜合了提問(wèn)、檢索和迭代推理,是一個(gè)更全面、更動(dòng)態(tài)、更具挑戰(zhàn)性的問(wèn)題解決框架。

對(duì)主動(dòng)推理問(wèn)題的探索,有助于我們更好地理解和提升 LLM 在真實(shí)、復(fù)雜場(chǎng)景下的智能水平,推動(dòng)其從一個(gè)被動(dòng)的文本處理器,轉(zhuǎn)變?yōu)橐粋€(gè)能夠主動(dòng)解決問(wèn)題的人工智能體。

圖片

圖 2 PR 要求模型通過(guò)一步步推理從給定的問(wèn)題得到正確答案,而 AR 要求模型分析當(dāng)前任務(wù),提出一系列關(guān)鍵的問(wèn)題來(lái)獲取重要信息,并利用這些信息得到正確的答案。本質(zhì)上,PR 的核心要求是根據(jù)問(wèn)題得到正確答案,而 AR 的核心要求是提出正確的問(wèn)題來(lái)獲取關(guān)鍵的信息。

新基準(zhǔn):AR-Bench

為了系統(tǒng)地評(píng)估和衡量 LLM 的主動(dòng)推理能力,我們構(gòu)建了 AR-Bench (Active Reasoning Benchmark)。AR-Bench 旨在模擬真實(shí)世界中的信息獲取場(chǎng)景,它包含三個(gè)不同類型的任務(wù),分別對(duì)應(yīng)三種核心的推理能力:

偵探案件 (Detective Cases, DC): 模擬刑事案件調(diào)查,模型需要通過(guò)提問(wèn)來(lái)搜集線索、分析案情,考驗(yàn)其常識(shí)推理能力。

情景謎題 (Situation Puzzles, SP): 也被稱為 「海龜湯」,模型需要通過(guò) 「是 / 否」 問(wèn)題來(lái)揭開(kāi)一個(gè)看似矛盾或離奇情景背后的真相,考驗(yàn)其邏輯推理和發(fā)散思維能力。

數(shù)字猜謎 (Guessing Numbers, GN): 經(jīng)典的主動(dòng)推理游戲,模型需要根據(jù)反饋猜測(cè)一個(gè)由不重復(fù)數(shù)字組成的四位數(shù),考驗(yàn)其符號(hào)推理能力。

圖片

圖 3 AR-Bench 中三種任務(wù)的示例。

我們的評(píng)估框架采用多輪交互范式,其中提問(wèn)方 LLM 與扮演信息源的 「回答者」 智能體進(jìn)行動(dòng)態(tài)對(duì)話。該評(píng)估體系包含兩個(gè)維度:

1) 結(jié)果評(píng)估:在 DC 和 GN 任務(wù)中判斷模型結(jié)論與標(biāo)準(zhǔn)答案的匹配度,對(duì)于開(kāi)放式問(wèn)題 SP 則采用 F1-Score 衡量回答相似度;

2) 過(guò)程評(píng)估:基于預(yù)設(shè)關(guān)鍵問(wèn)題(Key Questions),通過(guò) LLM-as-a-judge 方法以交互輪次為粒度評(píng)估對(duì)話是否有效解決關(guān)鍵問(wèn)題(適用于 DC 和 SP ),而在 GN 任務(wù)中則直接計(jì)算反饋信息的數(shù)字準(zhǔn)確率作為過(guò)程評(píng)分指標(biāo)。這一綜合評(píng)估方案不僅關(guān)注最終答案的正確性,更重視模型在交互過(guò)程中提出問(wèn)題的質(zhì)量和信息獲取的有效性,從而全面刻畫(huà)模型的主動(dòng)推理能力。

新發(fā)現(xiàn):

大模型主動(dòng)推理能力嚴(yán)重不足

我們?cè)?AR-Bench 上對(duì)包括 GPT-4o 在內(nèi)的多個(gè)先進(jìn) LLM,以及基于 prompting 和基于訓(xùn)練的推理方法進(jìn)行了廣泛測(cè)試。

實(shí)驗(yàn)結(jié)果(圖 4,5)表明:目前的語(yǔ)言模型和推理方法都無(wú)法有效解決 AR-Bench 提出的問(wèn)題,我們發(fā)現(xiàn):

1. 即使是最先進(jìn)的 GPT-4o 模型也只能在 GN 任務(wù)上達(dá)到 35% 的準(zhǔn)確率。

2. 細(xì)粒度的指導(dǎo)和基于搜索的方法 (ToT)只能提供非常有限的性能提升。

3. 基于訓(xùn)練的方法(SFT, DPO)甚至在一些任務(wù)上使模型性能變差。

圖片

圖 4 不同模型在 AR-Bench 上的性能對(duì)比。

圖片

圖 5 Llama-3.1-8B 和 Llama-3.1-70B 使用不同方法在 AR-Bench 上的性能對(duì)比。

我們還測(cè)試了兩個(gè)先進(jìn)的主動(dòng)推理方法(Proactive CoT 和 Uncertanty of Thoughts)以及人類在 AR-Bench 上的表現(xiàn)(見(jiàn)圖 6)。我們發(fā)現(xiàn):

1. 即使是目前提出的先進(jìn)的主動(dòng)推理方法也無(wú)法提升模型在 AR-Bench 上的性能。

2. 人類在 AR-Bench 上的推理表現(xiàn)顯著優(yōu)于目前先進(jìn)的語(yǔ)言模型。

圖片

圖 6(左)先進(jìn)的主動(dòng)推理方法在 AR-Bench 上的性能表現(xiàn),(右)人類在 AR-Bench 上的表現(xiàn)和 GPT-4o 對(duì)比。

為了更細(xì)致的研究語(yǔ)言模型在主動(dòng)推理上的表現(xiàn),理解目前模型和方法的不足,我們測(cè)量了模型在主動(dòng)推理交互過(guò)程中模型對(duì)該任務(wù)的解決程度(見(jiàn)圖 7,8),我們發(fā)現(xiàn):

1. 在交互過(guò)程中,模型的收益呈現(xiàn)遞減趨勢(shì),在后期問(wèn)題質(zhì)量低下

2. 較弱的模型問(wèn)出的問(wèn)題質(zhì)量偏低,并且無(wú)法對(duì)交互機(jī)會(huì)進(jìn)行有效利用

3. 較強(qiáng)的模型能夠利用多輪交互機(jī)會(huì),持續(xù)獲得有用的信息

4. 基于搜索的方法在 AR-Bench 中依賴于每一輪評(píng)估問(wèn)題質(zhì)量的驗(yàn)證器的可靠性,表現(xiàn)在對(duì) GN 任務(wù)有顯著提升 (驗(yàn)證器基于數(shù)值反饋構(gòu)建,簡(jiǎn)單可靠),而在 SP 任務(wù)下無(wú)法提升推理表現(xiàn) (驗(yàn)證器基于自然語(yǔ)言反饋構(gòu)建,復(fù)雜且相對(duì)不可靠)。

圖片

圖 7  Llama-3.1-8B 和 Llama-3.1-70B 使用不同方法在 AR-Bench 推理中過(guò)程分的變化趨勢(shì)。

圖片

圖 8  不同模型在 AR-Bench 各任務(wù)上推理中過(guò)程分的變化趨勢(shì)。

我們還進(jìn)行在 AR-Bench 進(jìn)行了三方面的消融實(shí)驗(yàn)(見(jiàn)圖 9,10,11):

1. 固定交互信息,探究不同模型的推理能力的表現(xiàn)。

2. 延長(zhǎng)交互的輪數(shù),給予模型更多的機(jī)會(huì)進(jìn)行信息獲取,探究模型的表現(xiàn)變化。

3. 探究在實(shí)驗(yàn)中扮演回答者的模型的可靠性。

我們發(fā)現(xiàn):

1. 更大的模型能夠在固定的記錄中提取出更多的有效信息。

2. 簡(jiǎn)單延長(zhǎng)交互輪數(shù)無(wú)法完全解決主動(dòng)推理任務(wù)。

3. 面對(duì)主模型提出的問(wèn)題,回答者能夠給出可靠的回復(fù)。

圖片

圖 9  使用 Llama-3.1-70B 和 Llama-3.1-405B 在交互過(guò)程中獲得的交互記錄測(cè)試不同模型在給定信息的情況下給出正確結(jié)論的能力。

圖片

圖 10  延長(zhǎng)交互輪數(shù)后,比較模型的推理表現(xiàn)變化。

圖片

圖 11  回答者模型的可靠性驗(yàn)證。

為更直觀評(píng)估模型在主動(dòng)推理中的表現(xiàn),我們系統(tǒng)分析了不同任務(wù)中的典型錯(cuò)誤模式(見(jiàn)圖 12),并通過(guò)具體案例深入剖析了模型的失誤原因(見(jiàn)圖 13)。

我們發(fā)現(xiàn):

1. 模型會(huì)問(wèn)出寬泛,不具體的問(wèn)題。

2. 模型會(huì)問(wèn)出沒(méi)有幫助的問(wèn)題。

3. 模型在主動(dòng)推理中會(huì)頻繁出現(xiàn)時(shí)間線誤解,忽視證據(jù),強(qiáng)行提出未經(jīng)驗(yàn)證的假設(shè),以及沒(méi)有完全利用符號(hào)反饋等典型問(wèn)題。

圖片

圖 12  GPT-4o 模型在不同任務(wù)下的推理正確和推理錯(cuò)誤的案例分析。

圖片

圖 13  Llama-3.1-8B 和 GPT-4o 在不同任務(wù)下的出現(xiàn)的典型錯(cuò)誤統(tǒng)計(jì)。

總結(jié)

我們的工作系統(tǒng)地定義了主動(dòng)推理這一重要問(wèn)題,并構(gòu)建了 AR-Bench 作為社群的評(píng)估工具。我們的實(shí)驗(yàn)結(jié)果清晰地表明,當(dāng)前的大語(yǔ)言模型雖然在被動(dòng)推理上能力強(qiáng)大,但在更貼近現(xiàn)實(shí)的主動(dòng)推理場(chǎng)景下卻舉步維艱。

展望未來(lái)工作,我們認(rèn)為 AR-Bench 存在以下拓展方向:

提升模型的主動(dòng)推理能力:

1. 采集小規(guī)模但是高質(zhì)量的微調(diào)數(shù)據(jù)集

2. 將強(qiáng)化學(xué)習(xí)推理方法(PPO, GRPO, DAPO)和推理模型適配到主動(dòng)推理

3. 為搜索方法開(kāi)發(fā)更先進(jìn)可靠的驗(yàn)證器,以提升搜索方法在主動(dòng)推理上的表現(xiàn)

將 AR-Bench 拓展到更多的任務(wù)和領(lǐng)域:

1. 醫(yī)療場(chǎng)景和定制化代理

2. 多輪檢索增強(qiáng)生成和工具調(diào)用

3. 模擬真實(shí)環(huán)境和多模態(tài)場(chǎng)景,例如機(jī)器人和游戲

更多的實(shí)驗(yàn)分析和技術(shù)細(xì)節(jié),請(qǐng)參閱我們的論文及源碼,我們也將持續(xù)更新本工作的內(nèi)容。

我們希望 AR-Bench 能夠激發(fā)更多關(guān)于主動(dòng)推理的研究,推動(dòng)開(kāi)發(fā)出能夠主動(dòng)提問(wèn)、高效探索、真正解決現(xiàn)實(shí)世界問(wèn)題的人工智能。非常感謝大家關(guān)注我們的工作!

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-05-16 08:44:01

2025-07-17 09:28:09

2025-06-30 08:36:00

AI模型強(qiáng)化學(xué)習(xí)

2019-07-22 10:13:54

2025-05-28 11:42:14

模型框架AI

2025-06-10 11:25:06

主流大模型安全

2024-09-09 09:00:00

2024-08-19 09:42:00

模型MIT

2025-07-04 08:53:00

2025-05-07 09:12:00

模型研究LLM

2025-07-23 10:07:31

2025-05-21 08:47:00

2010-04-30 12:47:22

2023-03-02 08:19:43

不加鎖程序實(shí)時(shí)性

2023-07-18 12:58:06

2024-01-26 11:11:11

攜程模型

2025-06-26 08:42:00

模型安全AI

2025-05-14 13:23:19

數(shù)據(jù)模型AI

2025-05-07 13:49:19

模型AI架構(gòu)

2025-10-11 04:11:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

狠狠狠综合7777久夜色撩人| 国产一级特黄a大片免费| 在线免费看av片| 日韩国产欧美| 欧美日韩精品一区二区| 在线观看成人av电影| 91福利免费视频| 亚洲精品tv久久久久久久久久| 91精品一区二区三区久久久久久| 麻豆一区二区三区在线观看| 亚洲va天堂va欧美ⅴa在线| 极品尤物久久久av免费看| 这里只有精品视频在线观看| 成人午夜视频免费观看| 欧洲成人免费aa| 97精品一区| 国产午夜小视频| 91麻豆国产精品| 国产日韩欧美激情| 在线视频超级| 性生交大片免费看l| 波多野结衣不卡视频| 1769国产精品视频| 亚洲va韩国va欧美va精品| 久久人人97超碰人人澡爱香蕉| 免费无码国产精品| 亚洲国产一成人久久精品| 精品人在线二区三区| 久久久久久久久久久久久国产精品| av中文资源在线| 成人免费毛片高清视频| 国产精品国产三级国产专播精品人| 欧美黑人精品一区二区不卡| 亚洲资源网你懂的| 日韩美一区二区三区| 男人天堂网视频| 成码无人av片在线观看网站| 久久精品这里都是精品| 97碰碰视频| 欧美男人天堂网| 亚洲欧洲日本mm| 亚洲新声在线观看| 无码人妻久久一区二区三区蜜桃| 精品123区| 亚洲成av人片www| 自拍视频一区二区三区| 男女视频在线观看免费| 福利视频网站一区二区三区| 国产日韩中文字幕在线| 九九热在线视频播放| 亚洲欧美综合国产精品一区| 一区二区三区亚洲| 蜜臀av粉嫩av懂色av| 91嫩草国产线观看亚洲一区二区| 色菇凉天天综合网| 国产九九九九九| 3d玉蒲团在线观看| 中文字幕人成不卡一区| 日韩精品不卡| 狠狠v欧美ⅴ日韩v亚洲v大胸| 国产91精品一区二区| 成人午夜一级二级三级| 成人毛片在线播放| 亚洲精品专区| 欧美黑人性视频| 一级黄色录像视频| 一区二区电影在线观看| 色一区av在线| 少妇视频在线播放| 蜜桃成人av| 亚洲激情视频网| 欧洲中文字幕国产精品| 日本天堂在线播放| 国产一精品一av一免费爽爽| 欧美精品一级二级三级| 日日躁夜夜躁aaaabbbb| 日本在线播放一二三区| 亚洲香肠在线观看| 妞干网视频在线观看| 日本中文字幕中出在线| 一区二区久久久久久| 黄色网络在线观看| 四虎亚洲精品| 亚洲精选视频免费看| 穿情趣内衣被c到高潮视频| 免费日本一区二区三区视频| 国产精品久久久久影视| 亚洲欧美日韩另类精品一区二区三区| 在线毛片网站| 亚洲欧美另类久久久精品2019| 中文字幕在线亚洲三区| 日本无删减在线| 亚洲成人一二三| 国产精品成人久久电影| 国产真人无码作爱视频免费| 最新国产精品拍自在线播放 | 欧美视频第三页| 91精品国产综合久久香蕉| 亚洲精品一区在线观看| 成人午夜视频福利| 欧美日韩国产一二三| 欧美日韩大尺度| 国产成人a视频高清在线观看| 欧美午夜精品一区二区三区| 免费黄频在线观看| 97视频一区| 日韩精品中文字幕在线| 人妻熟人中文字幕一区二区| 希岛爱理一区二区三区| 欧美极品少妇xxxxⅹ免费视频| 欧美一级视频免费观看| 日韩av一区二| 99国产高清| 国产人成在线观看| 国产精品免费看片| 免费高清一区二区三区| se01亚洲视频| 欧美一二三区在线| 国产ts丝袜人妖系列视频| 欧美色图在线播放| 久久久久久久香蕉网| 日韩电影在线观看一区二区| 久久er99热精品一区二区| 高清av免费一区中文字幕| 免费看男男www网站入口在线| 中文字幕五月欧美| 欧美啪啪免费视频| 国产精品美女久久久久| 亚洲欧美制服另类日韩| 少妇久久久久久被弄高潮| 麻豆久久婷婷| 国产精品免费区二区三区观看| 成人av电影观看| 亚洲一区二区美女| 国产无遮挡猛进猛出免费软件| 欧美激情影院| 久久97久久97精品免视看| 日韩色图在线观看| 国产成人一区二区精品非洲| 日韩电影在线播放| 91在线超碰| 正在播放一区二区| 成人性生交大片免费看无遮挡aⅴ| 亚洲午夜激情在线| 91久久久久久久一区二区| 男人天堂资源在线| 亚洲成人高清在线| 精品国产乱码久久久久久1区二区| 成人香蕉社区| 欧美精品性视频| 亚洲天堂免费av| 国产午夜亚洲精品午夜鲁丝片| 青草青青在线视频| 日韩三级av高清片| 中文字幕久久亚洲| 中文字幕日本视频| 2021中文字幕一区亚洲| 国产原创中文在线观看| 亚洲一区二区三区免费| 日韩在线播放视频| 五月天中文字幕| 日本一区二区在线不卡| 免费日韩视频在线观看| 欧美黄色影院| 韩国日本不卡在线| 好吊视频一区二区三区| 亚洲精品高清视频在线观看| 亚洲xxx在线观看| 日韩系列欧美系列| 国产精品久久久久久五月尺| 国产一级网站视频在线| 一本久久a久久精品亚洲 | 久久一区视频| 日本不卡一区二区三区视频| 僵尸再翻生在线观看免费国语| 欧美va亚洲va香蕉在线| 国产亚洲精久久久久久无码77777| 国产在线视频精品一区| 异国色恋浪漫潭| 日韩精品三级| 久久久久久久成人| 天天干天天爱天天操| 狠狠久久亚洲欧美专区| 午夜在线观看一区| 美女视频网站久久| 亚洲精品永久www嫩草| 欧美视频免费看| 不卡av电影院| 日本免费一区视频| 日本韩国一区二区三区视频| 国产黄色大片免费看| 狠狠网亚洲精品| 欧美精品在欧美一区二区| 久久99精品国产自在现线| 欧美影院久久久| eeuss影院在线观看| 欧美丰满美乳xxx高潮www| 日韩在线观看视频一区二区| 国产91精品久久久久久久网曝门| 欧美精品久久久久久久免费| 久久久久97| 日本最新高清不卡中文字幕| 午夜不卡视频| 精品久久久久久综合日本欧美| 日韩特级黄色片| 国产精品每日更新| 欧美丰满熟妇bbb久久久| 国产一区91| 国产高清免费在线| 亚洲精品高潮| 国产ts人妖一区二区三区 | 国产999精品在线观看| 国产69精品久久久久9| 狠狠色伊人亚洲综合网站l| 91精品国产乱码| 国产又爽又黄的视频| 国产精品久久午夜夜伦鲁鲁| zjzjzjzjzj亚洲女人| 视频一区在线播放| 蜜臀在线免费观看| 亚洲最大在线| 91丝袜脚交足在线播放| 免费成人动漫| 欧美肥臀大乳一区二区免费视频| 亚洲av无码乱码国产麻豆| 欧美性一二三区| 青青草原国产视频| 欧美国产精品中文字幕| 老熟妇精品一区二区三区| 日韩国产欧美视频| 久草免费福利在线| 国产高清一区| 日本在线视频一区| 久久动漫网址| 97中文在线观看| 日韩午夜电影免费看| 欧美在线观看一区二区三区| 最新日本在线观看| 亚洲日韩第一页| 天天操天天爱天天干| 91精品国产色综合久久ai换脸| 国产精品suv一区| 亚洲午夜私人影院| 美国一级片在线观看| 久久久久国色av免费看影院| 中文字幕天堂网| 国产成人啪午夜精品网站男同| 一区二区传媒有限公司| 午夜精品国产| 乱子伦一区二区| 婷婷综合网站| 亚洲一区二区自拍偷拍| 精品久久不卡| 欧美在线视频一区二区三区| 久久黄色影视| 国产精品乱码一区二区三区| av亚洲一区| 国产精品久久久久aaaa九色| 2022成人影院| 日本成人激情视频| 蜜桃av.网站在线观看| 久久久女女女女999久久| 欧美xxxx少妇| 久久久爽爽爽美女图片| 色呦呦网站在线观看| xxxx性欧美| 黄色网在线播放| 超碰97人人做人人爱少妇| 麻豆网站在线看| 伊人伊成久久人综合网小说| 国产在线中文字幕| 国产午夜精品一区二区三区 | 国产在线一区二区综合免费视频| 天天综合网久久| 激情综合色播激情啊| 亚洲一级免费观看| 狠狠色丁香婷婷综合| 毛片毛片毛片毛片毛| 粉嫩aⅴ一区二区三区四区五区| 色91精品久久久久久久久| 蜜臀精品久久久久久蜜臀| 三上悠亚在线一区二区| 另类av一区二区| 日本www.色| 国精产品一区一区三区mba桃花| 91热视频在线观看| av午夜精品一区二区三区| av网站免费在线看| 亚洲精品五月天| 永久免费无码av网站在线观看| 911精品产国品一二三产区 | 亚洲无限av看| 特级毛片在线| 国产精品7m视频| 2020最新国产精品| 日韩区国产区| 激情欧美一区二区三区| 天天爽天天爽夜夜爽| 国产不卡在线视频| 五月婷六月丁香| 亚洲成人av电影在线| 亚洲午夜精品久久久| 亚洲精品久久久久久久久久久| av一本在线| 77777少妇光屁股久久一区| 欧洲午夜精品| 免费久久久一本精品久久区| 欧美淫片网站| 高清一区在线观看| a级精品国产片在线观看| 91大神福利视频| 色综合久久66| 天天操天天操天天| 欧美日韩xxxxx| 亚洲视频自拍| 色噜噜狠狠色综合网| 亚洲人成免费| 久久综合在线观看| 国产精品水嫩水嫩| 91视频免费网址| 精品国产乱码91久久久久久网站| 中文日本在线观看| 国产www精品| 一本色道久久综合亚洲精品酒店| 日本一级黄视频| 国产美女精品一区二区三区| 国产精成人品免费观看| 欧美日韩午夜激情| 四虎精品一区二区三区| 欧美激情精品久久久久久变态| 久久天天久久| 亚洲国产精品综合| 视频一区二区三区中文字幕| 亚洲欧美视频在线播放| 亚洲1区2区3区4区| а√天堂资源在线| 九九热精品视频国产| 狂野欧美xxxx韩国少妇| 影音先锋成人资源网站| 狠狠色狠狠色合久久伊人| 亚洲色偷偷综合亚洲av伊人| 欧美性色aⅴ视频一区日韩精品| 黄色美女网站在线观看| 国产suv精品一区二区| 怕怕欧美视频免费大全| 茄子视频成人免费观看| 久久夜色精品国产噜噜av| 美日韩一二三区| 亚洲美女精品成人在线视频| 卡通欧美亚洲| 性刺激综合网| 久久国产剧场电影| 日韩在线一卡二卡| 欧美一区二区三区四区久久 | 亚洲国产精品嫩草影院| 你懂的网站在线| 91精品国产高清自在线看超| 国产精品视屏| www.中文字幕在线| 久久久久久免费网| 国产成人精品亚洲| 色偷偷偷综合中文字幕;dd| 在线免费成人| 精品视频在线观看一区二区| 成人18视频在线播放| 亚洲精品1区2区3区| 亚洲午夜未满十八勿入免费观看全集| 日韩制服一区| 法国空姐在线观看免费| 成人免费视频app| 台湾佬中文在线| 久久精品中文字幕一区| 亚洲视频精选| 超碰97人人射妻| 日韩美女视频一区| 亚洲精品久久久久久久久久久久久久| 97国产精品视频人人做人人爱| 亚洲精品**不卡在线播he| 天天干天天爽天天射| 一区二区三区中文字幕| 色就是色亚洲色图| 国产欧美 在线欧美| 亚洲视屏一区| 亚洲精品国产91| 日韩欧美国产三级| 国产精品专区免费| 91香蕉视频网址| 99久久免费国产| 亚洲一区二区三区网站| 欧美激情奇米色| 精品国产一级毛片| 国产调教打屁股xxxx网站| 色8久久精品久久久久久蜜| а√天堂8资源在线官网| 精选一区二区三区四区五区| 麻豆一区二区99久久久久| 五月天婷婷网站| 日韩一区二区欧美| 欧美一区 二区| 中文字幕在线播放一区二区|