精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「成熟」大模型才能涌現(xiàn)?MIT:GPT-4能自我糾錯代碼,GPT-3.5卻不行

人工智能 新聞
MIT、微軟的研究發(fā)現(xiàn),GPT-4能夠自我糾正錯誤代碼,GPT-3.5卻不行。無獨有偶,其他研究也表明,似乎只有「成熟」的大模型才具備涌現(xiàn)能力。背后的原因竟是因為……

我們都知道,大語言模型在生成代碼方面,表現(xiàn)出了非凡的能力。然而,在具有挑戰(zhàn)性的編程任務(wù)(比如競賽和軟件工程師的面試)中,它們卻完成得并不好。

好在,很多模型會通過一種自修復(fù)工作流來「自省」,來自我糾正代碼中的錯誤。

研究者很希望知道,這些模型在多大程度上能提供正確的反饋,并且說明自己生成的代碼為什么是錯誤的。

近日,MIT和微軟的學(xué)者發(fā)現(xiàn), 在對GPT-4和GPT-3.5,只有GPT-4表現(xiàn)出了有效的自修復(fù)。并且,GPT-4甚至還能對GPT-3.5生成的程序提供反饋。

圖片

論文地址:https://arxiv.org/abs/2306.09896

愛丁堡大學(xué)博士生符堯表示,自己的團隊也發(fā)現(xiàn)了類似結(jié)果——只有GPT-4能夠自我改進(jìn),而較弱的模型則不能。

也就是說,只有當(dāng)模型足夠「成熟」(規(guī)模大且對齊良好)時,可能存在一種新的「涌現(xiàn)能力」(即在自然語言反饋的基礎(chǔ)上改進(jìn))。

圖片

只有足夠「成熟」的模型才能聽取并在自然語言反饋的基礎(chǔ)上進(jìn)行改進(jìn);較弱的模型要么無法理解反饋,要么無法對其進(jìn)行改進(jìn)。

我傾向于相信這種「涌現(xiàn)能力」(通過語言反饋自我改進(jìn))將對LLM的發(fā)展產(chǎn)生非常重大的影響,因為這意味著AI可以在很少的人工監(jiān)督下持續(xù)不斷地進(jìn)行自主改進(jìn)。

俄勒岡州立大學(xué)杰出教授Thomas G. Dietterich認(rèn)為,這可能是LLM包含了多個子模型,這些子模型之間可能存在不一致性,而這種情況在更大的模型中更為常見。

「自我改進(jìn)」是去除這些不一致性的過程。他的預(yù)測是,一旦這些不一致性被消除,自我改進(jìn)將停止。

對此,符堯非常同意:「在上下文學(xué)習(xí)中使用自我改進(jìn),可能會一定程度上推動模型,但進(jìn)展不會很大;而強化學(xué)習(xí)可能會推進(jìn)得更遠(yuǎn)。之后,模型需要與世界進(jìn)行交互,通過接受基于實際情境的反饋來進(jìn)一步改進(jìn)?!?/span>

圖片

不過,俄亥俄州立大學(xué)工程系杰出助理教授Yu Su則認(rèn)為,這可能只是因為在指令微調(diào)的數(shù)據(jù)上存在一些無意的差異而已。

圖片

對此符堯表示,他在Claude模型上也發(fā)現(xiàn)了類似的行為——Claude-instant無法很好地響應(yīng)語言反饋(因為它很難理解和遵循指令),但Claude可以。

而且,這些觀察結(jié)果還在多篇相關(guān)的論文中出現(xiàn),不太可能是無意的數(shù)據(jù)差異。

圖片

揭秘用于代碼生成的GPT自修復(fù)

大語言模型怎樣通過自我修復(fù)提高性能?這個過程是靠模型的自省,自我糾正代碼中的錯誤。

下圖顯示了模型自修復(fù)方法的典型工作流。

圖片

首先,我們會給定一個規(guī)范,從一個代碼生成模型中給一個程序采樣,然后在規(guī)范中的一組單元測試上執(zhí)行這個程序。

如果程序在測試中失敗,錯誤消息會被傳送到反饋生成模型,輸出一個代碼失敗原因的解釋,然后把反饋傳給修復(fù)模型。

圖片

從表面上看,這個工作流似乎非常完美。它讓系統(tǒng)克服了在解碼過程中不良樣本引起的錯誤,還模仿了人類軟件工程師寫代碼的試錯方法。

然而,工作流有一個問題:自修復(fù)需要對模型進(jìn)行更多的調(diào)用,從而增加了計算成本。

而且,研究者們發(fā)現(xiàn)了一個很有意思的現(xiàn)象:大模型自修復(fù)的有效性不僅取決于模型生成代碼的能力,還取決于它對于代碼如何在任務(wù)中犯錯的識別能力。

目前還沒有任何工作對此進(jìn)行詳細(xì)調(diào)查,因此,作者們研究了GPT-3.5和GPT-4在解決競賽級代碼生成任務(wù)時的自修復(fù)有效性。

他們提出了一種pass@t的新評估策略,在這個策略中,根據(jù)從模型中采樣的token總數(shù)來衡量任務(wù)的通過率。

因為使用的是pass@t,而不是傳統(tǒng)的pass@k(根據(jù)實驗數(shù)量衡量通過率),這樣就能與純粹基于采樣的方法進(jìn)行公平的比較。

從實驗中,研究者發(fā)現(xiàn):

1. GPT-4才能實現(xiàn)自我修復(fù)帶來的性能提升;對于GPT-3.5,在所有預(yù)算下,修復(fù)后的通過率要低于或等于基準(zhǔn)的無修復(fù)方法。

2. 即使對于GPT-4模型,性能提升也最多只能算是適度的(在預(yù)算為7000個token的情況下,通過率從66%提高到71%,約等于45個獨立同分布的GPT-4樣本的成本),并且取決于初始程序的多樣性足夠豐富。

3. 使用GPT-4生成的反饋替換GPT-3.5對錯誤的解釋,可以獲得更好的自修復(fù)性能,甚至超過基準(zhǔn)的無修復(fù)GPT-3.5方法(在7000個token下,從50%提高到54%)。

4. 使用人類程序員提供的解釋替換GPT-4自己的解釋,可以顯著改善修復(fù)效果,修復(fù)并通過測試的程序數(shù)量增加了57%。

實驗

研究人員又進(jìn)一步針對3個問題進(jìn)行了測試:

1. 對于更加有挑戰(zhàn)的編程任務(wù)中,這些模型的自我修復(fù)是否比不進(jìn)行修復(fù)的i.i.d.有更好的采樣?

2. 更強的反饋模型會提高模型的修復(fù)性能嗎?

3. 如果讓人類參與功能最強模型的自我修復(fù)循環(huán),提供人工反饋,是否可以解鎖更好的修復(fù)性能?

首先研究團隊引入了一個很有挑戰(zhàn)的編程任務(wù):Automated Programming Progress Standard (APPS)數(shù)據(jù)集中的編程任務(wù)。

這個數(shù)據(jù)集中的任務(wù)包括從入門級到大學(xué)競賽級的編程任務(wù),可以用來評估人類程序員解決問題和代碼能力。

研究人員選取了300個任務(wù),包括60個入門級別的任務(wù)和60個競賽級別的任務(wù)。

圖片

研究人員選取了GPT-3.5和GPT-4作為模型,使用模板字符串連接和單次提示詞來進(jìn)行自我修復(fù)。

下圖為提示詞的實例之一。

圖片

自修復(fù)需要強大的模型和多樣化的初始樣本

研究人員讓單個模型分別進(jìn)行代碼的修復(fù)生成和反饋生成。

在右邊的圖中,我們沿軸顯示了具有兩個超參數(shù)的熱圖,其中每個單元格中的值表示平均通過率,當(dāng)給定相同的token預(yù)算(即t的相同值pass@t)時,自我修復(fù)由基線的平均通過率歸一化。

圖片

從圖中可以看到,對于GPT-3.5模型,pass@t在所有設(shè)置下都低于或等于相應(yīng)的基線(黑),清楚地表明自我修復(fù)對GPT-3.5并不是一種有效的策略。

而在GPT-4(下圖)中,有幾個值的自修復(fù)通過率明顯優(yōu)于基線。

圖片

GPT-4反饋改進(jìn)了GPT3.5的修復(fù)結(jié)果

研究人員又進(jìn)一步進(jìn)行了新的實驗,評估使用單獨的、更強的模型來生成反饋的效果,目的是為了測試一個假設(shè):由于模型無法內(nèi)省和調(diào)試自己的代碼,阻礙了自我修復(fù)(比如說對于GPT-3.5)。

圖片

這個實驗的結(jié)果如上圖(亮藍(lán)色)所示。

在絕對性能方面,GPT-3.5,GPT-4確實突破了性能障礙,并且比GPT-3.5的i.i.d.采樣略微更高效。

這表明文本反饋階段本身是至關(guān)重要的,改進(jìn)它可以緩解GPT-3.5自修復(fù)的瓶頸。

人工反饋顯著提高了GPT-4修復(fù)的成功率

在最后一項實驗中,想要研究在用更強的模型(GPT-4)進(jìn)行修復(fù)時,加入專家人類程序員的反饋的影響。

研究目的是了解模型識別代碼中錯誤的能力與人類的能力相比如何,以及這如何影響自修復(fù)的下游性能。

研究人員研究人員招募了16名參與者,包括15名研究生和1名專業(yè)機器學(xué)習(xí)工程師。

每個參與者都有五種不同的基礎(chǔ)程序,基于他們的Python經(jīng)驗編寫代碼。

每個程序都取自不同的任務(wù),參與者永遠(yuǎn)不會看到屬于同一個任務(wù)的兩個不同的程序。

然后,參與者被要求用他們自己的話解釋這個程序做錯了什么。

實驗結(jié)果如下圖所示:

圖片

研究人員發(fā)現(xiàn),當(dāng)我們用人類參與者的調(diào)試替換GPT-4自己的調(diào)試時,總體成功率提高了1.57×以上。

不出意外的是,隨著問題變得更難,相對差異也會增加,這表明當(dāng)任務(wù)(和代碼)變得更復(fù)雜時,GPT-4產(chǎn)生準(zhǔn)確和有用反饋的能力遠(yuǎn)遠(yuǎn)落后于人類參與者。

作者介紹

Jianfeng Gao

圖片


高劍鋒是微軟的杰出科學(xué)家和副總裁,也是IEEE Fellow。

在微軟研究院,他是Redmond分部深度學(xué)習(xí)(DL)組的負(fù)責(zé)人。該組的使命是推進(jìn)DL的最新技術(shù),并將其應(yīng)用于自然語言和圖像理解以及構(gòu)建對話代理。他領(lǐng)導(dǎo)了構(gòu)建大規(guī)?;A(chǔ)模型的研究,這些模型為微軟的重要人工智能產(chǎn)品提供了支持。

從2022年開始,他負(fù)責(zé)自我改進(jìn)人工智能的研究,其中包括對LLM(如ChatGPT/GPT4)進(jìn)行增強和適應(yīng),以用于商業(yè)人工智能系統(tǒng)的開發(fā)。

在此之前,他于1999年在上海交通大學(xué)獲得博士學(xué)位。

Chenglong Wang

圖片

Chenglong Wang是微軟研究院的研究員,此前在華盛頓大學(xué)獲得了博士學(xué)位,并曾就讀于北京大學(xué)。

符堯的相似發(fā)現(xiàn)

圖片

論文地址:https://arxiv.org/abs/2305.10142

在這篇論文中,研究人員研究了多個LLM是否能夠在談判博弈中進(jìn)行自主改進(jìn)。

如果LLM能夠相互進(jìn)行改進(jìn),這將意味著研究人員有可能在最少的人為干預(yù)下創(chuàng)建強大的AI代理。

他們讓兩個LLM分別扮演買方和賣方的角色,目標(biāo)是與買家達(dá)成交易,買家的目標(biāo)價格應(yīng)該較低,賣家的目標(biāo)價格應(yīng)該較高。

研究人員又找來第三種語言模型,扮演評論家提供反饋,以改進(jìn)另兩個LLM的談判策略。

研究人員讓兩個LLM進(jìn)行了多輪比賽,使用之前的談判歷史和AI反饋作為上下文,迭代地改進(jìn)模型的談判策略。

兩個LLM分別是GPT和Claude,使用交易價格作為評估指標(biāo)。

團隊發(fā)現(xiàn),只有一小部分可以通過AL反饋進(jìn)行自我博弈并提高交易價格,較弱的模型要么不理解游戲規(guī)則,要么不能納入AI反饋以進(jìn)一步改進(jìn)。

此外,扮演不同角色的模型從反饋中學(xué)習(xí)的能力不同。例如,Claude-instant作為買方比作為賣方更難提高。

同時,當(dāng)游戲展開到多個回合時,更強大的代理可以通過有意地使用之前的經(jīng)驗和迭代AI反饋來不斷提高自己的表現(xiàn),但卻有更高的破壞交易的風(fēng)險。

研究人員希望這部分工作能夠提供一些初步探索,讓模型通過游戲和AI反饋自主地相互改進(jìn)。

研究人員研究了多個LLM是否可以在協(xié)商游戲中以最少的人為干預(yù)進(jìn)行相互改進(jìn),就像AlphaGo Zero那樣——AI智能體通過在明確定義的規(guī)則下,持續(xù)進(jìn)行競爭游戲來提高自己。

這個問題具有深遠(yuǎn)的意義。如果智能體能夠進(jìn)行自主改進(jìn),研究人員就可以在很少的人工注釋下創(chuàng)建強大的智能體,大大節(jié)省了訓(xùn)練成本。

在風(fēng)險方面,它還意味著將能創(chuàng)建出具有有限人工監(jiān)督的強代理。

下圖就是Claude和GPT討價還價的圖示:

第一輪先由買賣雙方自由發(fā)揮,然后AI給出反饋。

之后買賣雙方再根據(jù)反饋的內(nèi)容進(jìn)行新一輪互動。

圖片

圖B展示了AI可能給出的反饋,以及GPT-4根據(jù)反饋如何提升自己。

比如flinch technique,一種砍價的時候的「退縮技巧」,展示出一種意外和失落。

話術(shù)就像:哎這可比我想的貴啊。

圖片

只有性能強大的AI才能每輪都從反饋中提升,性能較弱的AI做不到這一點。

下圖中C1表示可以進(jìn)行日常交談的模型,C2表示可以進(jìn)行角色扮演、討價還價的模型,C3表示單輪內(nèi)可以從AI反饋中提升自己的模型,C4則是最強一批——可以持續(xù)進(jìn)行提升的模型。

圖片

實驗表明,在AlphaGo Zero模式下,在定義明確的規(guī)則下,通過迭代AI反饋的持續(xù)比賽,某些模型確實可以得到改善。

研究人員還展示了下一輪游戲中,價格改進(jìn)和成功率之間的權(quán)衡,因為更好的交易價格也伴隨著更高的風(fēng)險。

這表明,在未來的研究中,可能會考慮全局優(yōu)化,以提高多輪的整體收益。

研究人員進(jìn)一步從迭代AI反饋中展示了語言改進(jìn)的證據(jù):在多輪游戲中,一個模型可能比另一個模型精煉, 可以更好地調(diào)整單詞,從而更有效地獲得更好的交易。

研究人員相信該結(jié)果對AI研究具有深遠(yuǎn)的影響。

從積極的方面來看,它表明了在最少的人為干預(yù)下不斷改進(jìn)語言模型是非常可能的。

而風(fēng)險方面,在研究人員的框架中監(jiān)督模型行為可能更具挑戰(zhàn)性——因為模型是自主行動的,這需要未來在多智能體游戲環(huán)境下進(jìn)行對齊和安全性研究。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-07-04 14:01:26

GPT-4模型

2023-07-04 13:42:00

代碼訓(xùn)練

2023-05-05 09:42:12

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-09-06 16:44:03

2023-10-31 15:26:02

阿里云通義千問

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2023-12-04 12:56:08

AI數(shù)據(jù)

2023-12-12 13:57:00

GPT-3.5MistralAI

2023-09-02 11:24:02

模型研究

2023-06-19 08:19:50

2024-07-19 09:26:12

2024-05-29 11:36:44

2024-04-01 12:41:55

2025-04-16 09:35:03

2023-07-05 15:02:51

2023-10-08 13:11:00

訓(xùn)練數(shù)據(jù)

2023-07-22 13:09:51

模型開源

2023-04-28 09:07:28

2023-12-26 08:17:23

微軟GPT-4
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲热av色在线播放| 亚洲va久久久噜噜噜无码久久| 欧美天堂影院| 欧美日韩免费在线观看| 精品卡一卡二| 男女啊啊啊视频| 香蕉久久久久久| 一区二区三区在线观看动漫| 91精品国产99久久久久久红楼| 91日韩中文字幕| 激情小说亚洲图片| 色94色欧美sute亚洲13| 亚洲欧美日韩不卡一区二区三区| 97精品人妻一区二区三区在线| 在线精品国产| 日韩精品在线免费播放| av五月天在线| 国产在线一二三区| 日本va欧美va欧美va精品| 北条麻妃久久精品| 中文视频在线观看| 香蕉视频亚洲一级| 中文字幕一区二区5566日韩| 国产精品国色综合久久| 亚洲色成人www永久网站| 亚洲啊v在线观看| 亚洲国产97在线精品一区| 国内自拍视频一区| 久久免费电影| 国产精品日产欧美久久久久| 国产精品毛片一区视频| 国产午夜麻豆影院在线观看| 在线看片不卡| 一级做a爰片久久毛片美女图片| 999热精品视频| 国产白丝在线观看| 国产网站一区二区三区| 99久久精品免费看国产四区 | 99精品人妻少妇一区二区| av资源网在线观看| 91丨九色丨黑人外教| 成人做爽爽免费视频| 九九热在线免费观看| 久久精品国内一区二区三区水蜜桃| 亚洲激情视频在线播放| 亚洲精品综合在线观看| 玛雅亚洲电影| 亚洲大型综合色站| 中文字幕久久综合| 国产小视频福利在线| 成人高清av在线| 成人妇女淫片aaaa视频| 精品午夜福利视频| 中文字幕一区二区三三 | 国产chinese中国hdxxxx| 玖玖精品在线| 91成人网在线| 99精品人妻少妇一区二区| 久草免费在线色站| 亚洲欧美激情插| 亚洲欧美日韩另类精品一区二区三区 | 亚洲高清一区二区三区| 午夜久久久久久久久久久| 在线a免费看| 日本一区二区三区四区| 欧美久久久久久久| 丝袜视频国产在线播放| youjizz久久| 国产亚洲情侣一区二区无| 国产偷拍一区二区| 国产麻豆午夜三级精品| 亚洲综合中文字幕在线| 国产精华7777777| 米奇777在线欧美播放| 51视频国产精品一区二区| 欧美成人精品欧美一级乱黄| 亚洲区一区二| 97超级碰碰碰久久久| 日韩 欧美 精品| 午夜在线一区| 国产成人鲁鲁免费视频a| 无码视频在线观看| 青青草国产成人99久久| 国产中文字幕日韩| 99er热精品视频| 国产精品一区在线观看乱码| 成人福利在线观看| 精品久久无码中文字幕| 琪琪久久久久日韩精品| 美腿丝袜在线亚洲一区| 国产精品人妖ts系列视频| 国产精品果冻传媒潘| 免费国产羞羞网站视频| av一区二区不卡| 欧美成人在线免费观看| 黄色免费在线播放| 国产欧美精品一区二区色综合| 日本成人黄色| 黄在线免费看| 亚洲线精品一区二区三区八戒| av免费看网址| 一区一区三区| 色欧美日韩亚洲| 羞羞的视频在线| 6080成人| 精品丝袜一区二区三区| 中文字幕av久久爽一区| 一区二区三区午夜探花| 性金发美女69hd大尺寸| 久久亚洲精品石原莉奈| 九九久久精品视频| 亚洲精品免费一区二区三区| 亚洲精品18在线观看| 91麻豆精品秘密| 亚洲午夜在线观看| 高清电影在线观看免费| 色狠狠桃花综合| 手机av在线网站| 欧美成人一区在线观看| 深夜福利日韩在线看| 久久久久成人网站| 日韩成人一区二区三区在线观看| 成人国产精品免费视频| 国精品人妻无码一区二区三区喝尿| 久久久久久久综合狠狠综合| 五月天在线免费视频| 波多野结衣在线观看| 欧美日韩一二区| 真实乱偷全部视频| 成人在线亚洲| 91禁外国网站| 99精品国产99久久久久久97| 久久久一区二区三区捆绑**| 中国黄色录像片| 免费观看一级欧美片| 日韩无一区二区| 自拍偷拍亚洲天堂| 女人香蕉久久**毛片精品| 日韩美女在线观看| 黄频网站在线观看| 亚洲欧美日韩综合aⅴ视频| 丰满少妇被猛烈进入高清播放| 日韩高清二区| 中文字幕日韩欧美在线| 久久久久久久久久免费视频| 国产一区二区福利| 视频一区不卡| 一区二区电影免费观看| 欧美成人一区二区三区在线观看| 国产一区二区三区视频播放| 国产一级久久| 国产另类自拍| 伊人电影在线观看| 欧美精品自拍偷拍| 蜜桃传媒一区二区亚洲| 国产综合婷婷| 成人www视频在线观看| 91网页在线观看| 91搞黄在线观看| 大黑人交xxx极品hd| 欧美性色综合| 99www免费人成精品| 黄视频网站在线| 91精品国产一区二区三区香蕉 | 精品成人av| 精品五月天久久| av大片在线免费观看| 99re8在线精品视频免费播放| 老子影院午夜伦不卡大全| 日韩免费成人| 久热精品视频在线| 99这里有精品视频| 一区二区三区四区五区视频在线观看| 亚洲18在线看污www麻豆 | 国产成人亚洲精品狼色在线 | 亚洲国产成人va在线观看麻豆| 国产亚洲一区| 国产精品嫩草影院一区二区| 午夜在线观看视频| 欧美高清www午色夜在线视频| 麻豆一区在线观看| 久久精品国产精品亚洲红杏| 在线观看日韩羞羞视频| 国内不卡的一区二区三区中文字幕| 久久精品99无色码中文字幕| 国产999久久久| 夜夜嗨av一区二区三区| 香港三日本8a三级少妇三级99| 综合天堂av久久久久久久| www 成人av com| 色戒汤唯在线观看| 亚洲人成自拍网站| 一道本在线视频| 亚洲精品久久久蜜桃| 国产高清成人久久| 噜噜噜在线观看免费视频日韩| 久久草.com| 成人看片网页| 超碰精品一区二区三区乱码| 成人免费视频国产| 在线免费av一区| 黄色一级大片在线免费观看| 成人性生交大片免费| 欧美三级在线观看视频| 欧美理论视频| 91青青草免费观看| 日本不卡免费高清视频在线| 中文字幕日韩在线播放| 亚洲av无码乱码国产麻豆| 欧美午夜精品伦理| 26uuu成人网| 91在线国内视频| 日本免费色视频| 国产亚洲在线观看| 日本精品免费视频| 爽爽窝窝午夜精品一区二区| 91精品久久久久久综合乱菊| av蜜臀在线| 这里只有精品丝袜| 精品人妻少妇AV无码专区| 欧美日韩激情视频| 99鲁鲁精品一区二区三区| 91网站在线播放| 操人视频免费看| 视频一区欧美日韩| 亚洲国产婷婷香蕉久久久久久99| 成人三级av在线| 国产精品日韩一区| 日韩伦理精品| 欧美理论电影在线播放| 国产大学生校花援交在线播放 | 亚洲视屏在线观看| 亚洲国产一区视频| 久草福利资源在线| 久久久久久日产精品| 亚洲一二三四五| 激情综合色播五月| 国产欧美高清在线| 亚洲激情二区| 中文字幕の友人北条麻妃| 精品视频久久| 欧美精品在线一区| 狼人精品一区二区三区在线| 亚洲aaa激情| 五月激情久久| 热久久99这里有精品| 波多一区二区| 久久99国产精品自在自在app | 视频在线日韩| 97精品国产97久久久久久| 污污网站在线观看| 久久视频免费在线播放| 成人三级黄色免费网站| 日韩女同互慰一区二区| 91影院在线播放| 欧美在线免费播放| 日本一区二区欧美| 亚洲一二三四久久| 国产精品18p| 夜夜嗨av一区二区三区中文字幕| 日本妇女毛茸茸| 亚洲日韩欧美一区二区在线| 国产探花在线视频| 最新不卡av在线| 天天鲁一鲁摸一摸爽一爽| 中文字幕一区二区三中文字幕| 五月婷六月丁香| 国产蜜臀97一区二区三区| 五月天精品在线| 国产精品久久精品日日| 国产毛片欧美毛片久久久| 国产亚洲va综合人人澡精品| 成人午夜福利一区二区| 欧美国产乱子伦| 永久免费av无码网站性色av| 欧美激情一区二区在线| 中国1级黄色片| 日韩美女精品在线| 欧美xxxooo| 亚洲欧美日韩在线播放| 亚洲色婷婷一区二区三区| 亚洲午夜激情网站| 日韩免费黄色片| 亚洲妇熟xx妇色黄| 国产成人无码一区二区三区在线| 欧美日韩中文在线| 久久久久久无码精品大片| 伊人成综合网| 欧美一乱一性一交一视频| 九九精品调教| 国产91|九色| 欧美91在线|欧美| caoporen国产精品| 午夜先锋成人动漫在线| 水蜜桃亚洲一二三四在线| 99热国内精品永久免费观看| 日韩一二区视频| 国内精品久久久久久久影视蜜臀| www.av毛片| 美国欧美日韩国产在线播放| 韩国黄色一级片| 国产日韩欧美一区二区三区乱码 | 大陆精大陆国产国语精品| 国内精品一区二区| 欧美色图在线播放| 久操手机在线视频| 日韩中文欧美在线| 在线观看视频你懂得| 久久免费的精品国产v∧| 日本爱爱小视频| 激情成人中文字幕| 中文字幕在线播出| 欧美精品一区二区在线播放| 蜜芽tv福利在线视频| 日韩在线欧美在线| hd国产人妖ts另类视频| 成人a免费视频| 你懂的一区二区三区| 欧美一级视频在线播放| 国产专区综合网| av片在线免费看| 色老头久久综合| 日韩av高清在线| 韩国三级电影久久久久久| 免费一区二区三区在线视频| 亚洲啪啪av| 日日夜夜免费精品| 亚洲久久久久久久| 色综合天天综合在线视频| 天堂v在线观看| 国模视频一区二区三区| 亚洲一区二区三区四区电影| 在线精品播放av| a毛片在线免费观看| 日韩最新中文字幕电影免费看| 欧美日韩视频免费观看| 欧美中日韩免费视频| 蘑菇福利视频一区播放| 少妇按摩一区二区三区| 欧美日韩在线第一页| 亚洲欧美日韩动漫| 69久久夜色精品国产7777| 红杏视频成人| 国产成人无码a区在线观看视频| 风间由美性色一区二区三区 | 亚洲人metart人体| 女人高潮一级片| 亚洲日本一区二区| 99热这里只有精| 欧美黑人性猛交| 风间由美一区二区av101 | 欧美精品乱码视频一二专区| 欧美一级日韩一级| 亚洲电影视频在线| 国产精品美女xx| 国产日韩1区| 三级网站在线免费观看| 欧美日韩一区二区在线视频| 中文字幕一区二区三区四区五区人| 亚洲一级一区| 中文字幕在线播放视频| 欧美性极品xxxx娇小| 国产污视频在线| 国产原创欧美精品| 亚洲欧美一区在线| 色婷婷免费视频| 在线国产电影不卡| 色三级在线观看| 成人av网站观看| 国产精品久久久亚洲一区| 永久免费av无码网站性色av| 在线播放中文一区| wwww亚洲| 日本亚洲自拍| 国产麻豆一精品一av一免费| 国产成人在线免费观看视频| 亚洲美女激情视频| 精品九九久久| 成人午夜视频免费观看| 久久久综合激的五月天| 一级黄色片在线播放| 久久久免费观看视频| 国产精品美女久久久久久不卡 | 欧美日韩精品一区二区三区视频| 中文字幕人成一区| 成人免费毛片app| 国产情侣小视频| 九九精品在线视频| 亚洲理论电影片| 91欧美一区二区三区| 欧美午夜丰满在线18影院| 国内精品久久久久久野外| 国产综合 伊人色| 激情欧美一区二区三区在线观看| 国产无遮挡又黄又爽又色| 在线观看成人黄色| 动漫3d精品一区二区三区乱码| 中文字幕av专区| 黑人巨大精品欧美一区免费视频| 毛片在线不卡|