精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

劍橋揭開(kāi)大模型翻車黑箱!別再怪它不懂推理,是行動(dòng)出錯(cuò)了

人工智能 新聞
為什么大模型,在執(zhí)行長(zhǎng)時(shí)任務(wù)時(shí)容易翻車?這讓一些專家,開(kāi)始質(zhì)疑大模型的推理能力,認(rèn)為它們是否只是提供了「思考的幻覺(jué)」。近日,劍橋大學(xué)等機(jī)構(gòu)的一項(xiàng)研究證明:?jiǎn)栴}不是出現(xiàn)在推理上,而是出在大模型的執(zhí)行能力上。

大模型也有「EMO」時(shí)刻。

比如,Gemini在Cursor里調(diào)試編譯錯(cuò)誤后,打開(kāi)了自責(zé)「循環(huán)模式」,把「I am a disgrace(我很丟臉)」重復(fù)了86次。

盡管大模型在復(fù)雜推理能力上已有了巨大進(jìn)步,但上述現(xiàn)象仍使一部分專家認(rèn)為:

思考模型,只提供了「思考的幻覺(jué)」,因?yàn)楫?dāng)任務(wù)被拉長(zhǎng)時(shí)它們最終會(huì)失敗。

近日,劍橋大學(xué)等機(jī)構(gòu)的一項(xiàng)研究對(duì)這些「翻車」現(xiàn)象作出解釋,研究者認(rèn)為:

問(wèn)題不在于大模型的推理能力,而在于其執(zhí)行計(jì)劃的能力。

邊際收益遞減的錯(cuò)覺(jué):衡量大語(yǔ)言模型的長(zhǎng)時(shí)程任務(wù)執(zhí)行能力https://arxiv.org/pdf/2509.09677 

也就是說(shuō),大模型出現(xiàn)問(wèn)題未必是源于「思考的幻覺(jué)」,而更可能是執(zhí)行階段「打滑」了。

研究人員發(fā)現(xiàn),單步準(zhǔn)確率的小幅提升,會(huì)復(fù)利式地放大你能完成的總步驟數(shù),使任務(wù)「里程」指數(shù)級(jí)變長(zhǎng)。

隨著步驟數(shù)量增加,模型的每步準(zhǔn)確率會(huì)下降——不僅僅是「上下文太長(zhǎng)」,還有一個(gè)更「詭異」的現(xiàn)象:自條件化效應(yīng)(self-conditioning)。

所謂「自條件化」,當(dāng)上下文里包含模型先前犯過(guò)的錯(cuò),將導(dǎo)致它在后續(xù)過(guò)程中會(huì)更容易再犯錯(cuò)。

任務(wù)變長(zhǎng)就失敗

只因模型不會(huì)推理?

業(yè)界正競(jìng)相打造能夠處理整個(gè)項(xiàng)目而非孤立問(wèn)題的智能體,隨之而來(lái)的一個(gè)根本問(wèn)題是:

如何度量大模型能可靠執(zhí)行的步驟數(shù)量?

任務(wù)一變長(zhǎng),就失敗。是因?yàn)榇竽P汀覆粫?huì)推理」嗎?

研究人員認(rèn)為,大模型在早期多步中能正確遵循指令,說(shuō)明其具備按計(jì)劃執(zhí)行的能力。

這也證明,大模型不是失敗在了推理上,而是在執(zhí)行上:

隨著任務(wù)變長(zhǎng),模型在執(zhí)行計(jì)劃時(shí)更可能出錯(cuò)。

目前,大量研究聚焦于大模型的推理能力,而對(duì)執(zhí)行穩(wěn)定性關(guān)注不足。

這一點(diǎn),隨著大模型被用于長(zhǎng)推理與智能體任務(wù),重要性也正日益上升。

單步穩(wěn)一點(diǎn),長(zhǎng)跑多一截

長(zhǎng)視界任務(wù)需要大量步驟,其中任務(wù)長(zhǎng)度,即為完成任務(wù)所需的步驟數(shù)。

研究人員通過(guò)下面幾個(gè)指標(biāo)來(lái)評(píng)估性能:

  • 步驟準(zhǔn)確率(Step Accuracy):度量在第i-1步到第i步的狀態(tài)更新是否正確的樣本占比,而不考慮模型在第i-1步的狀態(tài)是否正確;
  • 輪次準(zhǔn)確率(Turn Accuracy):一輪是與模型的一次交互,可能需要執(zhí)行多個(gè)步驟。輪次準(zhǔn)確率度量在第t-1輪到第t輪的狀態(tài)更新是否正確的樣本占比,而不考慮模型在第t-1輪的狀態(tài)是否正確;
  • 輪次復(fù)雜度(K)(Turn Complexity):定義為模型每輪必須執(zhí)行的步驟數(shù);
  • 任務(wù)準(zhǔn)確率(Task Accuracy):度量模型在執(zhí)行i個(gè)步驟的過(guò)程中不犯任何錯(cuò)誤、從而完成任務(wù)的樣本占比;
  • 視界長(zhǎng)度(Hs)(Horizon Length):給定成功率閾值0 ≤ s ≤ 1。將模型的視界長(zhǎng)度定義為模型在第i個(gè)步驟處的平均任務(wù)準(zhǔn)確率降到低于概率s的位置。

如圖2所示,模型在超過(guò)50%準(zhǔn)確率下可執(zhí)行的任務(wù)長(zhǎng)度,在單步準(zhǔn)確率超過(guò)70%后,隨單步準(zhǔn)確率增加,而呈現(xiàn)快于指數(shù)的增長(zhǎng)。

圖3顯示了如何把「長(zhǎng)視界任務(wù)」,抽象為一串可控的小步驟,以及如何只測(cè)「執(zhí)行力」,而不摻雜「規(guī)劃力」。

左圖中,該框架將長(zhǎng)視界任務(wù)建模為一系列「先檢索、再合成」的步驟。

右圖中,研究人員設(shè)計(jì)了一個(gè)簡(jiǎn)單任務(wù),用以將規(guī)劃與執(zhí)行解耦:

每一輪以鍵(key)給出計(jì)劃,要求模型檢索對(duì)應(yīng)值(value),并計(jì)算累計(jì)和。

該推導(dǎo)表明,即便在問(wèn)答類任務(wù)上準(zhǔn)確率的提升似乎在放緩,仍然可以在更長(zhǎng)的任務(wù)上預(yù)期得到巨大的收益。

例如,在軟件工程任務(wù)上,前沿模型在s=0.5時(shí)的視界長(zhǎng)度呈指數(shù)增長(zhǎng),每7個(gè)月翻一番。

研究人員認(rèn)為,單輪或短任務(wù)基準(zhǔn),在評(píng)估進(jìn)一步投資LLM算力收益時(shí),可能制造出「進(jìn)展放緩」的錯(cuò)覺(jué),而模型可完成的任務(wù)長(zhǎng)度,是更能指示經(jīng)濟(jì)價(jià)值的指標(biāo),它們卻可能在快速增長(zhǎng)。

只考「執(zhí)行力」

把規(guī)劃和知識(shí)先拿掉

研究人員把「要做什么」(規(guī)劃)和「知道什么」(知識(shí))都喂給模型,只考它能不能穩(wěn)定地把步驟一口氣做完。

這樣就能純粹度量LLM的長(zhǎng)視界執(zhí)行能力。

以訂機(jī)票為例。

現(xiàn)實(shí)中,訂機(jī)票不是一句「幫我訂」就完了,它是一串流程:

  • 打開(kāi)某個(gè)航班詳情;
  • 核對(duì)起降時(shí)間、行李額度、轉(zhuǎn)機(jī)時(shí)長(zhǎng)、準(zhǔn)點(diǎn)率、口碑;
  • 套用里程、會(huì)員、優(yōu)惠券;
  • 在「價(jià)格×?xí)r長(zhǎng)×偏好」的權(quán)衡里做選擇。

其中的每一步,都要先「檢索」信息/調(diào)用工具,再把新信息與當(dāng)前判斷融合。

評(píng)完一個(gè)航班是一次執(zhí)行;評(píng)完多條備選航班直到下單,是一段長(zhǎng)視界執(zhí)行。

經(jīng)常會(huì)有人將執(zhí)行失敗歸因到「不會(huì)推理/不會(huì)規(guī)劃」。

研究人員則認(rèn)為,就算推理、規(guī)劃和世界知識(shí)都完美,LLM在長(zhǎng)鏈條上仍可能因?yàn)椤笀?zhí)行不穩(wěn)」而失誤。

因此,他們將執(zhí)行單獨(dú)拎出來(lái)測(cè)——把計(jì)劃和知識(shí)都顯式提供,只讓模型照做。

研究人員首先驗(yàn)證這樣的假設(shè):

即便在不需要世界知識(shí)與規(guī)劃的任務(wù)上,長(zhǎng)視界執(zhí)行也會(huì)很難。隨后,再研究擴(kuò)大模型規(guī)模對(duì)長(zhǎng)視界執(zhí)行的益處。

研究人員評(píng)估了Qwen3、Gemma3模型家族。

在實(shí)驗(yàn)中,研究人員將輪次復(fù)雜度設(shè)置為最簡(jiǎn)單形式(K=1),每輪僅提供一個(gè)鍵,并改變輪次數(shù)量。

結(jié)果1:長(zhǎng)視界執(zhí)行仍然很具挑戰(zhàn)性。

如圖4所示,除了Gemma3-4B與Qwen3-4B外,所有模型在第一步的準(zhǔn)確率均達(dá)到了100%,表明它們具備完成我們?nèi)蝿?wù)單步所需的知識(shí)與推理能力。

然而,任務(wù)準(zhǔn)確率在后續(xù)輪次迅速下滑。

即便是表現(xiàn)最好的Qwen3-32B,其準(zhǔn)確率也會(huì)在15輪內(nèi)跌到50%以下。

這證實(shí)了研究人員的假設(shè):

即便移除了規(guī)劃和知識(shí)需求,長(zhǎng)視界執(zhí)行依然很難。

如圖4,研究人員改變模型規(guī)模,并研究隨著輪次數(shù)增加的完整任務(wù)準(zhǔn)確率(a)與逐輪準(zhǔn)確率(b)。

粗體線是5輪的滑動(dòng)平均。

虛線(b)中的逐輪準(zhǔn)確率顯示除了最小的模型外,任務(wù)的單步準(zhǔn)確率都是100%。

然而,隨著輪次數(shù)增加,小模型與大模型的性能差距拉大(a),后者擁有顯著更長(zhǎng)的視界長(zhǎng)度(c)。

結(jié)果2:擴(kuò)大模型規(guī)模的收益并不遞減。

如圖4(a)所示,更大的模型能在更多輪次上保持更高的任務(wù)準(zhǔn)確率,從而帶來(lái)清晰的視界長(zhǎng)度縮放趨勢(shì)(圖4(c))。

這驗(yàn)證了兩點(diǎn)重要結(jié)論:

長(zhǎng)視界執(zhí)行是困難的;

擴(kuò)大模型規(guī)模,能顯著增加模型可正確執(zhí)行的輪次數(shù)。

自條件化效應(yīng)

為什么輪次準(zhǔn)確率會(huì)退化?

人們可能會(huì)期望,模型會(huì)在逐輪中保持恒定。

然而,圖4(b)顯示,隨著輪次數(shù)增加,各輪的準(zhǔn)確率穩(wěn)步下降。

研究人員考察兩個(gè)相互競(jìng)爭(zhēng)的假設(shè):

無(wú)論上下文內(nèi)容如何,模型的性能僅僅由于上下文變長(zhǎng)而退化。

模型會(huì)基于其過(guò)去的錯(cuò)誤自條件化:看到前幾輪的錯(cuò)誤之后,它更可能在后續(xù)輪中犯錯(cuò)。

為解開(kāi)這兩個(gè)因素,研究人員通過(guò)操控模型的聊天歷史,進(jìn)行反事實(shí)實(shí)驗(yàn)。

他們用所選錯(cuò)誤率注入人工輸出歷史,來(lái)控制錯(cuò)誤率,格式保持一致。

如果完全「治愈」歷史(誘導(dǎo)錯(cuò)誤率為0%),那么模型在第1輪,與較后某一輪之間的準(zhǔn)確率退化,就可歸因于長(zhǎng)上下文問(wèn)題。

如果在保持「較后某一輪」固定的情況下,隨著先前輪次錯(cuò)誤率的上升,模型的準(zhǔn)確率持續(xù)變差,這將表明模型會(huì)基于自己的過(guò)往錯(cuò)誤進(jìn)行條件化,從而提高未來(lái)錯(cuò)誤的可能性。

結(jié)果3:自條件化,會(huì)在長(zhǎng)上下文之外進(jìn)一步導(dǎo)致逐輪準(zhǔn)確率退化。

圖5(a)中的結(jié)果顯示,長(zhǎng)上下文與自條件化都會(huì)導(dǎo)致退化。

研究人員發(fā)現(xiàn),當(dāng)基于無(wú)錯(cuò)歷史進(jìn)行條件化(誘導(dǎo)錯(cuò)誤率=0.00)時(shí),第100輪的逐輪準(zhǔn)確率低于初始值,與先前關(guān)于長(zhǎng)上下文退化的觀察一致。

更有意思的是,當(dāng)研究人員提高注入到上下文中的錯(cuò)誤率時(shí),第100輪的準(zhǔn)確率會(huì)持續(xù)下降。

這表明了自條件化效應(yīng):當(dāng)模型犯錯(cuò)時(shí),它更可能繼續(xù)犯錯(cuò),導(dǎo)致如圖5(b)所示的逐輪準(zhǔn)確率在輸出軌跡中持續(xù)退化。

結(jié)果4:與長(zhǎng)上下文不同,擴(kuò)大模型規(guī)模不能緩解自條件化。

注意在誘導(dǎo)錯(cuò)誤率為0的情況下,第100輪的準(zhǔn)確率會(huì)隨著模型變大而穩(wěn)定提升。

如圖5(c)所示,把規(guī)模擴(kuò)展到前沿(200B+參數(shù))的模型,如Kimi-K2、DeepSeek-V3以及Qwen3-235B-Instruct-2507,基本解決了在100輪以內(nèi)的長(zhǎng)上下文退化問(wèn)題,在「治愈」歷史下實(shí)現(xiàn)了近乎完美的準(zhǔn)確率。

然而,即便這樣,這些大模型仍然容易受到自條件化的影響,當(dāng)其歷史中的誘導(dǎo)錯(cuò)誤率上升時(shí),性能仍會(huì)持續(xù)退化。

這或許與近期結(jié)果相似:

更大的模型在多輪對(duì)話中會(huì)出現(xiàn)人格漂移。在該項(xiàng)研究中,漂移的方向是「更容易犯錯(cuò)」的人格。

此外,模型會(huì)基于其過(guò)去的錯(cuò)誤進(jìn)行自條件化,導(dǎo)致每步準(zhǔn)確率的退化。僅擴(kuò)大模型規(guī)模不足以緩解這一點(diǎn)。

結(jié)果5:思考修復(fù)了自條件化。

圖6中,研究人員清楚看到Qwen3的思考模型不會(huì)自條件化。

無(wú)論上下文中的錯(cuò)誤率如何,模型在第100輪的準(zhǔn)確率都保持穩(wěn)定。

研究人員將之歸結(jié)為兩個(gè)原因:

其一,RL訓(xùn)練可能降低了語(yǔ)言模型「續(xù)寫最可能下一個(gè)Token」的行為,使其更面向任務(wù)成功而非延續(xù)上下文。

其二,去除先前輪的思考軌跡,可能降低先前輪對(duì)模型輸出的影響,因?yàn)槟P蜁?huì)獨(dú)立地思考新的這一輪。

啟用思考的Qwen3模型不再發(fā)生自條件化,即便整個(gè)先前歷史都是錯(cuò)誤答案;這與非思考設(shè)置的結(jié)果形成對(duì)比。

研究人員以單輪可執(zhí)行的任務(wù)長(zhǎng)度為指標(biāo),對(duì)近期的「思考/Thinking」類模型,進(jìn)行了基準(zhǔn)評(píng)測(cè),發(fā)現(xiàn)它們「抗翻車能力」更強(qiáng):

它們不太會(huì)被先前錯(cuò)誤帶偏(自條件化被顯著修復(fù));

在單輪里就能把更長(zhǎng)的任務(wù)跑完。

這證實(shí)了「先推理,后行動(dòng)」的重要性,比如:

DeepSeek-V3不加思維鏈跑2步都難,但其思考版R1卻能跑到200步;  

GPT-5 Thinking單輪可執(zhí)行1000+步,Claude-4-Sonnet約432步。

作者簡(jiǎn)介

Akshit Sinha,劍橋大學(xué)機(jī)器學(xué)習(xí)與機(jī)器智能MPhil(MLMI)研究生。研究方向?yàn)榇竽P湍芰υu(píng)估與提升、圖神經(jīng)網(wǎng)絡(luò)(GNN)解釋性與「遺忘/反學(xué)習(xí)」、多智能體等。

在此之前,Akshit Sinha在IIIT Hyderabad計(jì)算機(jī)科學(xué)與工程學(xué)院獲得榮譽(yù)學(xué)士學(xué)位。他在Ponnurangam Kumaraguru的指導(dǎo)下,在Precog實(shí)驗(yàn)室從事基于圖的機(jī)器學(xué)習(xí)研究。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2019-03-04 10:32:41

2022-05-27 21:56:55

索引存儲(chǔ)MySQL 存儲(chǔ)引擎

2025-06-03 08:44:00

2024-11-20 15:43:27

2012-05-18 13:23:02

iPhone 4S

2025-05-28 11:44:24

AI模型研究

2014-07-03 14:04:55

Bug報(bào)告Bug

2025-10-28 09:16:38

2022-08-31 10:40:40

MySQL數(shù)據(jù)庫(kù)

2024-04-22 14:19:08

大型語(yǔ)言模型人工智能

2025-05-21 13:56:37

模型圖像AI

2024-05-29 13:00:19

2022-02-14 17:15:00

情人節(jié)禮物程序員

2024-02-19 14:07:00

數(shù)據(jù)模型

2020-06-18 10:48:44

Linux 系統(tǒng) 數(shù)據(jù)

2024-07-15 08:45:00

2018-08-15 08:24:08

2024-01-04 08:12:12

IDE代碼出錯(cuò)ChatGPT

2015-12-07 14:11:01

2020-08-26 11:50:25

谷歌開(kāi)源工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产亚洲视频一区| 麻豆中文字幕在线观看| 久久久蜜桃一区二区| 日韩电影免费网址| 日韩限制级电影在线观看| 大胆欧美熟妇xx| 国产乱视频在线观看| 国模少妇一区二区三区 | 波多野结依一区| 久久嫩草精品久久久精品一| 成人精品一区二区三区电影黑人| 日韩经典在线观看| 欧美成人激情| 亚洲美女在线看| 日韩精品视频网址| 在线成人视屏| 婷婷丁香久久五月婷婷| 亚洲欧美日韩精品综合在线观看| 国产91免费在线观看| 美女视频一区在线观看| 97视频色精品| 黄页网站免费观看| 色综合色综合| 亚洲欧美中文字幕| 免费成人深夜夜行p站| 国产精品一区免费在线| 在线免费不卡视频| 毛片在线播放视频| 欧美黑人猛交的在线视频| 一色屋精品亚洲香蕉网站| 欧美12av| 免费国产精品视频| 国产精品综合二区| 国产日韩av高清| 久久精品视频2| 国产一区二区三区的电影 | 亚洲tv在线| 色久综合一二码| 每日在线更新av| 草草在线观看| 亚洲大片免费看| 欧美中文字幕在线观看视频 | 97在线观看免费| 妺妺窝人体色www婷婷| 亚洲精品极品少妇16p| 日韩一区二区av| 久久精品三级视频| 精品一区二区三区的国产在线观看| 日韩大陆欧美高清视频区| 精品国产乱码久久久久夜深人妻| 经典三级久久| 欧美成人精精品一区二区频| www.色.com| 欧美日韩黄网站| 日韩三级av在线播放| 青娱乐精品在线| 色悠久久久久综合先锋影音下载 | 欧美孕妇孕交| 91免费观看在线| 日韩精品电影网站| av电影在线网| 中文字幕一区二区日韩精品绯色| 中文字幕一区二区三区有限公司 | 色偷偷久久一区二区三区| 大陆极品少妇内射aaaaa| 中文一区一区三区高中清不卡免费| 午夜婷婷国产麻豆精品| 久久精品免费一区二区| 欧美成人ⅴideosxxxxx| 在线观看免费视频综合| xxww在线观看| 日本在线一区二区三区| 欧美变态tickling挠脚心| 精品无码人妻少妇久久久久久| 女一区二区三区| 国产一区二区三区在线观看视频 | 伊人在我在线看导航| 亚洲午夜激情网页| 国产乱子夫妻xx黑人xyx真爽| 亚洲成a人片| 91精品午夜视频| 制服丝袜在线第一页| 国产成人1区| 久久亚洲国产精品成人av秋霞| 劲爆欧美第一页| 国产乱码精品| 国产自产女人91一区在线观看| www天堂在线| 国产亚洲一二三区| 欧美性受xxxx黑人猛交88| 成人福利影视| 欧美日韩国产综合久久| jjzzjjzz欧美69巨大| 久久99国产精品视频| 久久九九热免费视频| 日韩伦理在线视频| 免费观看成人av| 春色成人在线视频| eeuss影院www在线观看| 一卡二卡欧美日韩| 怡红院亚洲色图| 亚洲ab电影| 九九精品视频在线观看| 精品国产乱子伦| 懂色av中文字幕一区二区三区| 欧美日韩精品一区| 久久大胆人体| 欧美在线看片a免费观看| 性活交片大全免费看| 日本久久综合| 欧美一级电影久久| 丰满人妻熟女aⅴ一区| 亚洲国产精品传媒在线观看| 97在线国产视频| 日韩成人一区| 亚洲人成网站777色婷婷| 麻豆changesxxx国产| 免费观看久久久4p| 欧美一区二区影视| 成av人片在线观看www| 欧美三级三级三级| 黄瓜视频污在线观看| 国产精品激情| 亚洲字幕在线观看| 免费在线看黄色| 在线视频一区二区三区| 欧美 变态 另类 人妖| 国内激情久久| 亚洲综合最新在线| 免费在线午夜视频| 欧美日韩一区在线观看| 亚洲自拍偷拍图| 午夜在线视频观看日韩17c| 91网站在线免费观看| 午夜国产福利在线| 欧美丝袜第三区| 精品无码人妻一区二区免费蜜桃 | 99久久99久久精品国产片果冰| 日本久久中文字幕| 四虎精品在永久在线观看 | av网站在线免费看| 中文字幕综合网| 五月天婷婷影视| 欧美h版在线| 91久久精品久久国产性色也91| 日本在线免费看| 欧美巨大另类极品videosbest| www..com.cn蕾丝视频在线观看免费版| 可以看av的网站久久看| 欧美久久久久久一卡四| 精品国产第一福利网站| 亚洲天堂网站在线观看视频| 中文字幕在线播| 久久久91精品国产一区二区精品| 人妻熟女一二三区夜夜爱| 天堂综合网久久| 日韩av男人的天堂| 99精品老司机免费视频| 欧美人牲a欧美精品| www欧美com| 东方aⅴ免费观看久久av| www.夜夜爱| 欧美激情99| 日本国产一区二区三区| 第一视频专区在线| 在线不卡一区二区| 久草视频手机在线观看| 99久久精品国产一区二区三区| 97超碰青青草| 欧美裸体在线版观看完整版| 国产日韩精品在线| 色综合999| 亚洲男人的天堂在线播放| 波多野结衣高清视频| 亚洲视频一区二区在线观看| 国产乱国产乱老熟300部视频| 日韩一级不卡| 亚洲成人一区二区三区| 免费看日产一区二区三区| 欧美极品xxxx| 国产日本在线| 欧美一激情一区二区三区| 青青草成人av| 一区视频在线播放| 国产 中文 字幕 日韩 在线| 日韩av电影天堂| 国产成人一区二区三区别| 午夜欧洲一区| 2022国产精品| 日韩一区二区三区免费| 欧美高清在线观看| 国产最新视频在线观看| 日韩欧美的一区| 日本a级c片免费看三区| 亚洲精品视频在线看| 久久久精品人妻无码专区| 精品无码三级在线观看视频| 黄色av网址在线播放| 色天天综合网| 欧美一区二区三区四区五区六区| 亚洲高清在线一区| 国产精品一区二区三| 草草视频在线| 欧美乱大交xxxxx| 黄色毛片在线观看| 精品sm在线观看| 一区二区日韩在线观看| 欧美日韩亚洲视频| 久久久精品国产sm调教| 中文字幕不卡在线播放| 午夜一区二区三区免费| 懂色av一区二区三区免费观看 | 先锋影音一区二区| 国产成人一区二区三区| 国模私拍视频在线播放| 久久精品国亚洲| 国产在线视频网| 亚洲精品99久久久久中文字幕| 国产免费无遮挡| 欧美性大战xxxxx久久久| 免费在线不卡视频| 亚洲国产日韩一级| 少妇久久久久久被弄高潮| 国产精品无人区| 乐播av一区二区三区| 99r国产精品| 亚洲美女在线播放| 丁香婷婷综合激情五月色| 中文字幕亚洲影院| 美女脱光内衣内裤视频久久影院| 欧洲熟妇精品视频| 欧美一级网站| 男人的天堂99| 天堂资源在线中文精品| 两根大肉大捧一进一出好爽视频| 国产在线不卡| 日本a在线天堂| 欧美精品入口| 91传媒免费视频| 欧美精选在线| 人人妻人人做人人爽| 国产精品magnet| 国产欧美日韩网站| 日韩视频二区| 丝袜老师办公室里做好紧好爽| 亚洲另类黄色| 精品中文字幕av| 久久久夜精品| 无限资源日本好片| 蜜臂av日日欢夜夜爽一区| 日本人69视频| 国产精品小仙女| 中文字幕在线观看91| 成人在线视频一区二区| 国产一级二级视频| 91看片淫黄大片一级在线观看| 无码熟妇人妻av| 欧美激情一区二区三区四区| 91ts人妖另类精品系列| 亚洲欧美日韩系列| 国产精品.www| 欧美日韩中文字幕日韩欧美| 日本免费在线观看视频| 欧美日韩一区不卡| 国产伦子伦对白视频| 欧美大片免费久久精品三p | 中文字幕99页| 国产精品系列在线播放| 99精品一区二区三区无码吞精 | 免费在线观看黄色小视频| 日韩美女啊v在线免费观看| 欧美黄片一区二区三区| 欧美日韩国产精品一区二区三区四区 | 亚洲欧洲自拍| 国产又爽又黄的激情精品视频| 国产精品日本一区二区三区在线| 国产精品久久久久久久久久久久午夜片 | 欧美日韩在线精品一区二区三区| 欧美日韩伦理| 六月婷婷激情综合| 在线免费观看日本欧美爱情大片| 久久久久久免费看| 美女任你摸久久| 久草视频福利在线| 亚洲国产精品激情在线观看| 久久久久亚洲av片无码下载蜜桃| 色狠狠桃花综合| www.精品视频| 在线午夜精品自拍| 黑人精品视频| 国产成人激情小视频| 久久久久久亚洲精品美女| 欧美成人免费在线| 欧美另类综合| 天美星空大象mv在线观看视频| 国产精品18久久久久| 亚洲色成人网站www永久四虎| 亚洲男人在线| 久久免费国产视频| 日韩福利影视| 免费99视频| 亚洲午夜激情在线| 污片在线免费看| 97久久超碰精品国产| 老熟妇高潮一区二区三区| 色综合天天综合色综合av| 亚洲成熟女性毛茸茸| 一区二区中文字幕| 国产v日韩v欧美v| 91久久久国产精品| 视频国产一区| 人妻av中文系列| 国产精品888| 国产免费一区二区三区四区| 色综合久久久久网| 秋霞视频一区二区| 欧美日韩成人网| 四虎地址8848精品| 亚洲成人一区二区三区| 久久精品导航| 成人在线视频免费播放| 亚洲精品国产高清久久伦理二区| 91麻豆国产在线| 中文字幕日韩av综合精品| 国产精品av一区二区三区 | 精品国产乱码一区二区三| 中文字幕日韩视频| 欧美大片高清| 欧美日韩一区在线播放| 国产深夜精品| 欧美熟妇精品黑人巨大一二三区| 亚洲午夜激情网页| 囯产精品久久久久久| 久久免费精品视频| 成人搞黄视频| 99在线免费视频观看| 国产91在线观看| xxxxxx国产| 亚洲第一av在线| sis001亚洲原创区| 久久精品日韩精品| 亚洲一区二区三区高清不卡| 国产精品1000部啪视频| 欧美日韩一区二区免费在线观看 | 狠狠一区二区三区| 成人黄色av片| 99视频热这里只有精品免费| 好吊操这里只有精品| 亚洲激情在线视频| 中文字幕在线中文字幕在线中三区| 国外成人在线视频网站| 一区二区三区导航| 加勒比一区二区| 欧美亚一区二区| av一本在线| 91久久久久久| 亚洲欧洲一区二区天堂久久| www.超碰97| 欧美亚州韩日在线看免费版国语版| 一级毛片视频在线观看| 91久久在线播放| 亚洲视频日本| av网站免费在线播放| 在线观看日韩高清av| 里番在线观看网站| 99视频免费观看| 国产3级在线观看| 日韩欧美视频一区二区三区| 黄色影院在线播放| 成人免费网站在线看| 欧美日韩亚洲一区三区| 亚洲国产无码精品| 欧美日韩精品一区二区天天拍小说| av免费在线观看网站| 久草精品电影| 麻豆成人免费电影| 久久久无码一区二区三区| 精品无人国产偷自产在线| 国产一区一一区高清不卡| 热久久最新地址| 2020国产精品| 国产999久久久| 91精品国产亚洲| 天天操夜夜操国产精品| 超碰caoprom| 欧美日韩国产片| 麻豆蜜桃在线观看| 中文字幕一区二区三区最新 | 日韩激情视频网站| 欧美国产日韩在线观看成人| 日韩第一页在线| 中文字幕综合| 欧美一区二区三区爽大粗免费 | 99久在线精品99re8热| 中文字幕亚洲一区二区三区五十路| 日韩成人视屏| 天天色综合天天色| 婷婷国产v国产偷v亚洲高清| 国产鲁鲁视频在线观看特色| 欧美少妇一区|