精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只有GPT-4可以自我改進(jìn),GPT-3.5都不行,MIT&微軟代碼生成實(shí)驗(yàn)新發(fā)現(xiàn)

人工智能 新聞
作為最領(lǐng)先的大模型,GPT-4 有自我糾正生成代碼的能力,結(jié)合人類反饋,自我糾正能力還能進(jìn)一步的提高。

大型語言模型(LLM)已被證明能夠從自然語言中生成代碼片段,但在應(yīng)對復(fù)雜的編碼挑戰(zhàn),如專業(yè)競賽和軟件工程專業(yè)面試時(shí),仍面臨巨大的挑戰(zhàn)。最近的研究試圖通過利用自修復(fù)來提高模型編碼性能。自修復(fù)是指讓模型反思并糾正自己代碼中的錯(cuò)誤。

下圖 1 顯示了基于自修復(fù)方法的典型工作流程。首先,給定一個(gè)規(guī)范,從代碼生成模型中對程序進(jìn)行采樣;然后在作為一部分規(guī)范提供的一套單元測試上執(zhí)行程序;如果程序在任一單元測試中失敗,則將錯(cuò)誤消息和錯(cuò)誤程序提供給一個(gè)反饋生成模型,該模型輸出代碼失敗原因的簡短解釋;最后,反饋被傳遞給修復(fù)模型,該模型生成程序的最終固化版本。

從表面上看,這是一個(gè)非常有吸引力的想法。這種設(shè)計(jì)能讓系統(tǒng)克服在解碼過程中由離群樣本引起的錯(cuò)誤;在修復(fù)階段,可以輕松地整合來自編譯器、靜態(tài)分析工具和執(zhí)行引擎等符號系統(tǒng)的反饋,并模仿人類軟件工程師編寫代碼的試錯(cuò)方式。

圖片圖片

然而,自修復(fù)需要更多的模型調(diào)用,計(jì)算成本較高。特別要注意的是,自修復(fù)能否奏效,最終歸結(jié)為在同等計(jì)算性能預(yù)算下,是否能從模型中抽取更多代碼樣本,并將其與作為一部分任務(wù)提供的單元測試套件進(jìn)行比較。

至關(guān)重要的是,自修復(fù)的有效性不僅取決于模型生成代碼的能力(文獻(xiàn)中對此進(jìn)行了廣泛研究),還取決于它識別代碼(由模型本身生成)在任務(wù)規(guī)范方面是如何出錯(cuò)的能力。此前沒有任何工作試圖詳細(xì)研究這些能力的影響。

本文中,來自 MIT、微軟研究院的研究者在解決競賽級別的代碼生成任務(wù)時(shí),使用 GPT-3.5 和 GPT-4 研究自修復(fù)的有效性。研究者首先提出一種新的評估策略,稱為 pass@t,其中獲得正確程序的可能性(相對于給定的單元測試)相對于從模型中采樣的 token 總數(shù)進(jìn)行加權(quán)。

使用新的評估策略代替?zhèn)鹘y(tǒng)的 pass@k 度量(根據(jù)試驗(yàn)次數(shù)衡量通過率),研究者能夠準(zhǔn)確地將通過自修復(fù)獲得的性能與模型在生成反饋和進(jìn)行修復(fù)時(shí)所做的任何額外工作進(jìn)行比較。研究者仔細(xì)探究了在一系列超參數(shù)下的動(dòng)態(tài)自修復(fù)過程。

最后,鑒于研究的主要目標(biāo)是深入了解最先進(jìn)的代碼生成模型反思和調(diào)試自己代碼的能力,本文進(jìn)行了一組實(shí)驗(yàn),單獨(dú)研究了改進(jìn)反饋階段的影響。通過分析使用比代碼生成模型更強(qiáng)的反饋生成模型(使用 GPT-4 為 GPT-3.5 代碼模型生成反饋)的影響,研究者進(jìn)行了一項(xiàng)研究:讓人類對不正確的程序提供反饋,以便將模型生成的自反饋與人類提供的自反饋進(jìn)行比較。

論文地址:https://arxiv.org/pdf/2306.09896.pdf

從本文的實(shí)驗(yàn)中,研究者有了以下發(fā)現(xiàn):

1. 當(dāng)考慮進(jìn)行檢查和修復(fù)的成本時(shí),自修復(fù)的性能收益只能用 GPT-4 來衡量;對于 GPT-3.5,在所有配置下,修復(fù)的通過率低于或等于基線模型 / 無修復(fù)方法的通過率。

2. 即使對于 GPT-4,性能提升也是適度的(66%→ 71% 的通過率,預(yù)算為 7000 個(gè) token,約 45 個(gè)獨(dú)立同分布(i.i.d.)的 GPT-4 樣本),并同時(shí)取決于初始程序是否具有足夠的多樣性。

3. 用 GPT-4 產(chǎn)生的反饋代替 GPT-3.5 對錯(cuò)誤的解釋,可以獲得更好的自修復(fù)性能,甚至超過了基線的無修復(fù) GPT-3.5 方法(50%→ 7000token 時(shí)為 54%)。

4. 用人類的解釋取代 GPT-4 自己的解釋可以顯著改善修復(fù)結(jié)果,從而使通過測試的修復(fù)程序數(shù)量增加 57%。

愛丁堡大學(xué)博士生符堯表示:「只有 GPT-4 可以自我改進(jìn),而較弱的模型不能,這一發(fā)現(xiàn)非常有趣,表明(大模型存在)一種新型的涌現(xiàn)能力(即改進(jìn)自然語言反饋),可能只有在模型足夠成熟(大而整齊)時(shí)才存在。大模型的這種能力在論文《Improving Language Model Negotiation with Self-Play and In-Context Learning from AI Feedback》中也存在過。

只有足夠成熟的模型才能清楚(listen to)并改進(jìn)自然語言反饋,較弱的模型要么無法理解反饋,要么無法對其進(jìn)行改進(jìn)。

我傾向于相信這種涌現(xiàn)能力(通過語言反饋進(jìn)行自我改進(jìn))會對 LLM 研究產(chǎn)生非常重要的影響,因?yàn)檫@意味著 AI 可以在很少的人類監(jiān)督下不斷自主改進(jìn)。」

圖片圖片

方法

自修復(fù)概述

如上圖 1 所示,自修復(fù)方法包括 4 個(gè)階段:代碼生成、代碼執(zhí)行、反饋生成和代碼修復(fù)。接下來正式定義這四個(gè)階段。

代碼生成

給定一個(gè)規(guī)范 ψ,程序模型 M_P 首先生成 n_p 個(gè)獨(dú)立同分布樣本,研究者將其表示為

圖片圖片

代碼執(zhí)行

然后在測試臺上執(zhí)行這 n_p 個(gè)代碼樣本。研究者假設(shè)可以訪問可執(zhí)行形式的全套測試,因此如果任何樣本通過了所有測試,系統(tǒng)就會停止,因?yàn)檫@時(shí)已經(jīng)找到了一個(gè)令人滿意的程序。否則,系統(tǒng)將收集執(zhí)行環(huán)境返回的錯(cuò)誤消息圖片。這些錯(cuò)誤消息要么包含編譯 / 運(yùn)行時(shí)錯(cuò)誤信息,要么包含程序輸出與預(yù)期輸出不同的示例輸入。示例如圖 1(組件 3)所示。

反饋生成

由于來自執(zhí)行環(huán)境的錯(cuò)誤消息通常非常高級,因此它們提供的修復(fù)信號很少。作為中間步驟,研究者使用反饋模型來更詳細(xì)地解釋出了什么問題;示例如圖 1(組件 4)所示。形式上,在這個(gè)階段,他們?yōu)槊總€(gè)錯(cuò)誤的程序 p_i 生成 n_f 個(gè)反饋?zhàn)址?/span>圖片,具體如下所示:

圖片

有了明確的反饋生成步驟,就可以消融這個(gè)組件,獨(dú)立地研究它的意義。

代碼修復(fù)

在最后一步中,對于每個(gè)初始程序 p_i 和反饋 f_ij,可以從圖片采樣 n_r 個(gè)候選修復(fù)程序:

圖片

修復(fù)樹。研究者將該過程生成的包含文本和程序的樹稱為植根于規(guī)范中的 ψ,然后分支到初始程序 p_i,每個(gè)初始程序分支到反饋 f_ij,然后對修復(fù)樹 r_ijk 進(jìn)行修復(fù),如下圖所示。

圖片

注意:聯(lián)合采樣反饋和修復(fù)。上述通用框架不要求編程模型和反饋模型相同,因此兩個(gè)模型可以使用各自的專有模型。然而,當(dāng) M_P=M_F 時(shí),研究者在單個(gè) API 調(diào)用中聯(lián)合生成反饋和修復(fù)的程序,因?yàn)?GPT-3.5 和 GPT-4 都有在響應(yīng)中交織文本和代碼的自然傾向。形式上,研究者將其表示為

圖片圖片

pass@t:通過率與 token 數(shù)量的關(guān)系

由于自修復(fù)需要幾個(gè)非均勻成本的依賴模型調(diào)用,因此 pass@k 這種在 k 個(gè)獨(dú)立同分布樣本中獲得正確程序的可能性指標(biāo),不是用于比較和評估自修復(fù)的各種超參數(shù)選擇的合適度量。相反,研究者將通過率作為從模型中采樣的 token 總數(shù)的函數(shù),稱之為 pass@t。

形式上,假設(shè)一個(gè)數(shù)據(jù)集 D={ψ_d}_d 和超參數(shù)(M_P,M_F,n_p,n_f,n_r)的一組選定值。令圖片表示上文所述對任務(wù) ψ_d 進(jìn)行采樣的修復(fù)樹;令 size(T^i_d)表示修復(fù)樹中的程序和反饋 token 的總數(shù);并在當(dāng)且僅當(dāng) T^i_d 至少有一個(gè)葉子節(jié)點(diǎn)程序滿足規(guī)范中的單元測試 ψ_d 時(shí),令 T^i_d |=ψ_d 為真。然后 pass@t 這種超參數(shù)選擇的度量被定義為希望通過這種超參數(shù)選擇生成的 token 數(shù)量時(shí)預(yù)期通過率:

圖片

實(shí)驗(yàn)繪制了這兩個(gè)量的 bootstrapped estimates(一種統(tǒng)計(jì)估計(jì)方法,通常用于評估參數(shù)估計(jì)的不確定性)。為了獲得這些數(shù)值,本文首先為每個(gè)任務(wù)規(guī)范生成一個(gè)非常大的修復(fù)樹,其中:有 N_p≥n_p 個(gè)初始程序樣本;每個(gè)錯(cuò)誤程序有 N_f≥n_f 個(gè)反饋?zhàn)址徊⑶颐總€(gè)反饋串有 N_r≥n_r 個(gè)修復(fù)候選。給定(n_p,n_f,n_r)的設(shè)置,然后從這個(gè)凍結(jié)的數(shù)據(jù)集中對 N_t 個(gè)不同的修復(fù)樹進(jìn)行子采樣(帶替換)。最后,本文計(jì)算了這 N_t 棵樹上通過率和樹大小的樣本均值和標(biāo)準(zhǔn)差。如此估計(jì) pass@t 大大降低了實(shí)驗(yàn)的計(jì)算成本,因?yàn)榭梢灾赜孟嗤某跏紨?shù)據(jù)集來計(jì)算 n_p、n_f 和 n_r 的所有不同選擇的估計(jì)。

本文所有實(shí)驗(yàn)中,N_p=50,自修復(fù)方法中 n_p≤25,基線無修復(fù)方法中 n_p≤50。類似地,對于反饋,本文令 N_f=25 和 N_f≤10。對于候選修復(fù),由于本文在大多數(shù)實(shí)驗(yàn)中對反饋和修復(fù)進(jìn)行聯(lián)合采樣,因此本文設(shè)置 N_r=n_r=1。最后,本文對所有設(shè)置使用 N_t=1000。

實(shí)驗(yàn)

研究者針對以下問題進(jìn)行了相關(guān)實(shí)驗(yàn):

(a)在具有挑戰(zhàn)性的編程難題的背景下,對于本文提出的模型,自修復(fù)是否比不修復(fù)的獨(dú)立同分布采樣更好?如果是,在什么超參數(shù)下自修復(fù)最有效?

(b) 更強(qiáng)的反饋模型會提高模型的修復(fù)性能嗎?

(c) 即使是最強(qiáng)的模型,讓人參與提供反饋會帶來更好的修復(fù)性能嗎?

本文使用 APPS 數(shù)據(jù)集評估了這些關(guān)于 Python 編程挑戰(zhàn)的疑惑。

自修復(fù)需要強(qiáng)大的模型和多樣化的初始樣本

令 M_P=M_F∈{GPT-3.5,GPT-4},用于代碼 / 修復(fù)生成和反饋生成的是同一個(gè)模型。GPT-3.5 的結(jié)果見圖 3,GPT-4 的結(jié)果見圖 4。

圖片

圖片

從圖中可以看出,對于 GPT-3.5 模型,pass@t 在所有的 n_p、n_fr 選值中,都低于或等于相應(yīng)基線(黑線),這清楚地表明自修復(fù)不是 GPT-3.5 的有效策略。另一方面,對于 GPT-4,有幾個(gè) n_p、n_fr 值,其自修復(fù)的通過率明顯優(yōu)于基線的通過率。例如,當(dāng) n_p=10,n_fr=3 時(shí),通過率從 65% 增加到 70%,當(dāng) n_p=25,n_fr=1 時(shí),通過率從 65% 增加至 71%。

GPT-4 的反饋改進(jìn)了 GPT-3.5 自修復(fù)能力

接下來,本文進(jìn)行了一個(gè)實(shí)驗(yàn),在這個(gè)實(shí)驗(yàn)中,研究者評估了使用一個(gè)單獨(dú)的、更強(qiáng)的模型來生成反饋的影響。這是為了檢驗(yàn)一種假設(shè):即模型無法內(nèi)省和調(diào)試自己本身的代碼,從而阻礙了自修復(fù)(尤其是 GPT-3.5)。

該實(shí)驗(yàn)的結(jié)果如圖 5 所示(亮藍(lán)線)。研究者觀察到,就絕對性能而言,M_P=GPT-3.5,M_F=GPT-4 確實(shí)突破了性能障礙,變得比 GPT-3.5 的獨(dú)立同分布采樣效率略高。這表明反饋階段至關(guān)重要,改進(jìn)它可以緩解 GPT-3.5 自修復(fù)的瓶頸。

圖片

人類反饋顯著提高了 GPT-4 自修復(fù)的成功率

在本文的最后一個(gè)實(shí)驗(yàn)中,研究者考慮了在使用 GPT-4 等更強(qiáng)的模型進(jìn)行修復(fù)時(shí)使用專業(yè)人類程序員的反饋的效果。這項(xiàng)研究的目的不是直接比較人在循環(huán)中的方法與自修復(fù)方法,因?yàn)槿嗽谘h(huán)方法會帶來更多的認(rèn)知負(fù)擔(dān),而本文沒有對此進(jìn)行研究。相反,本文的目標(biāo)是了解模型識別代碼中錯(cuò)誤的能力與人類相比如何,以及這如何影響自修復(fù)的下游性能。因此,該研究對人類反饋對自修復(fù)的影響進(jìn)行了定性和定量分析。

結(jié)果總結(jié)在表 1 中。我們首先注意到,當(dāng)我們用人類參與者的調(diào)試取代 GPT-4 自己的調(diào)試時(shí),總體成功率提高了 1.57 倍以上。也許不足為奇的是,隨著問題變得越來越困難,相對差異也會增加,這表明當(dāng)任務(wù)(和代碼)變得更加復(fù)雜時(shí),GPT-4 產(chǎn)生準(zhǔn)確和有用反饋的能力遠(yuǎn)遠(yuǎn)落后于我們的人類參與者。

圖片

此外,該研究還定性地分析了人類參與者提供的反饋與 GPT-4 提供的反饋之間的差異。

  • 只有 2/80 個(gè)人貢獻(xiàn)的反饋?zhàn)址▊未a或顯式 Python;也就是說,獲得的幾乎所有人類反饋都是自然語言,偶爾穿插著單語句數(shù)學(xué) / 代碼表達(dá)式。
  • GPT-4 的反饋更可能明顯不準(zhǔn)確(32/80 與人類反饋的 7/80)。
  • GPT-4 更可能明確地建議小的變化(54/80 對 42/80;28/48 對 38/73,當(dāng)看起來正確時(shí)),而我們的人類參與者顯示出更大的趨勢來建議高水平的變化(23/80 對 18/80,GPT-4;21/73 對 13/48,當(dāng)看起來正確時(shí))。
  • 人類參與者有時(shí)會表達(dá)不確定性(7/80);GPT-4 沒有(0/80)。

進(jìn)一步的分析表明,表 1 中的結(jié)果不是由于人為因素造成的,例如參與者提供了模型簡單復(fù)制的顯式代碼塊。相反,性能的差異似乎是由更準(zhǔn)確的反饋、在需要時(shí)建議對代碼進(jìn)行高級別、大規(guī)模更改的更大能力,以及參與者表達(dá)其不確定性的能力(而不是自信地給出潛在的不準(zhǔn)確反饋)共同造成的。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-06-21 13:37:41

模型研究

2023-09-06 16:44:03

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-05-05 09:42:12

2023-10-31 15:26:02

阿里云通義千問

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2023-07-04 13:42:00

代碼訓(xùn)練

2023-12-04 12:56:08

AI數(shù)據(jù)

2023-08-15 10:33:06

微軟必應(yīng)人工智能

2023-06-19 08:19:50

2024-05-29 11:36:44

2023-12-12 13:57:00

GPT-3.5MistralAI

2025-04-16 09:35:03

2023-12-26 08:17:23

微軟GPT-4

2023-04-28 09:07:28

2025-05-30 07:40:56

2023-05-30 13:29:25

2024-06-28 13:40:03

2023-04-12 16:23:00

GPT-4代碼

2024-07-15 09:00:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲免费播放| 国产suv精品一区二区四区视频| 99riav久久精品riav| 97热在线精品视频在线观看| 中文文字幕文字幕高清| 美女av在线免费看| 国产欧美综合色| 国产精品美腿一区在线看| 国精产品视频一二二区| 日本在线成人| 精品欧美一区二区三区| 精品国产免费久久久久久尖叫| 800av免费在线观看| 成人aaaa| 91精品黄色片免费大全| 免费毛片网站在线观看| 成人77777| 国产精品正在播放| 国内精品久久影院| 日本一二三不卡视频| 538任你躁精品视频网免费| 欧美性极品xxxx娇小| 午夜在线视频免费观看| 亚洲 小说区 图片区 都市| 理论片日本一区| 性欧美xxxx| 亚洲一区电影在线观看| 日韩美女国产精品| 欧美一级爆毛片| 日韩免费高清在线| 高清毛片在线观看| 亚洲日本乱码在线观看| 久久综合狠狠综合久久综青草| 亚洲手机在线观看| 久久av一区| 色综合久久88色综合天天看泰| 妺妺窝人体色WWW精品| 999久久精品| 欧美日韩精品专区| 欧美 日韩精品| 欧美v亚洲v| 中文字幕在线视频一区| 欧美日韩成人一区二区三区| 成人免费一级视频| 国产一区二区三区四区五区入口 | 香蕉大人久久国产成人av| 色婷婷国产精品| 日韩网站在线免费观看| a黄色片在线观看| 国产日韩一级二级三级| 久久精品国产精品国产精品污| av综合在线观看| 久久精品国产精品亚洲红杏| 国产97免费视| 天天干在线播放| 一区二区毛片| 97视频免费观看| 精品无码久久久久| 韩国在线视频一区| 欧美夫妻性生活视频| 91人妻一区二区三区蜜臀| 日韩久久精品网| 中文字幕精品一区久久久久| 亚洲区免费视频| 网红女主播少妇精品视频| 亚洲国产精品久久久久秋霞蜜臀| www.黄色网| av综合网址| 亚洲第五色综合网| 久久久久成人精品无码中文字幕| 国产精品17p| 亚洲国产欧美精品| 人妻丰满熟妇av无码久久洗澡| 久久精品亚洲成在人线av网址| 亚洲加勒比久久88色综合| 欧美做受高潮中文字幕| 欧美调教在线| 亚洲欧洲一区二区三区在线观看 | 国产不卡一区视频| 国产九区一区在线| 日本免费一区视频| 久久先锋影音av鲁色资源| 欧美日韩三区四区| 91se在线| 亚洲另类在线制服丝袜| 欧美国产日韩激情| 美女福利一区二区三区| 欧美日韩精品三区| 制服.丝袜.亚洲.中文.综合懂| 给我免费播放日韩视频| 亚洲性猛交xxxxwww| 可以免费看av的网址| 欧美日本一区| 青青久久av北条麻妃黑人| 中文字幕乱码中文字幕| 国产精品一区一区三区| 国产一区二区高清视频| 国产午夜视频在线观看| 中文字幕一区二区三区视频| 国产精品视频网站在线观看 | 亚洲人成精品久久久 | 国产精品私房写真福利视频| 可以免费看的黄色网址| 阿v视频在线| 欧洲亚洲国产日韩| 在线观看你懂的视频| 自拍欧美一区| 欧美成人中文字幕在线| 青青草免费观看视频| 加勒比av一区二区| 欧美黑人3p| 香蕉成人app免费看片| 色综合色狠狠综合色| 国产xxxxhd| 亚洲资源网站| 欧美裸体男粗大视频在线观看 | 欧美视频一区二区三区在线观看| 天天av天天操| 精品影片在线观看的网站| 不卡av电影院| 日本熟妇一区二区三区| 成人午夜视频网站| 日本特级黄色大片| 日韩欧美看国产| 精品少妇一区二区三区在线播放| 精品一区二区三区蜜桃在线| 一区在线免费| 成人免费福利在线| 国产高清美女一级毛片久久| 亚洲国产精品视频| 999热精品视频| 精品一区二区三区在线| 91av在线影院| 亚洲男人第一天堂| 亚洲欧美激情一区二区| 中文字幕国内自拍| 神马影视一区二区| 9.1国产丝袜在线观看| 亚洲国产精品成人久久蜜臀| 国产精品电影一区二区| 欧美日韩大尺度| 日韩在线你懂的| 高清欧美性猛交xxxx| 国产成人精品a视频| 亚洲欧美在线另类| 亚洲久久中文字幕| 成人免费在线播放| 国产精品高潮呻吟视频| 极品美乳网红视频免费在线观看| 五月婷婷激情综合| 国产精品果冻传媒| 国产综合婷婷| 91精品国自产在线观看 | 久久99国产综合精品女同| 91精品国自产| 国产精品美女久久久久av爽李琼| 成人在线观看黄| 国产精品片aa在线观看| 日韩美女在线观看一区| 日本a一级在线免费播放| 欧美日韩亚洲国产一区| 欧美bbbbb性bbbbb视频| 国产农村妇女精品一二区| 国产综合精品一区二区三区| av老司机在线观看| 日韩精品久久久久| 亚洲欧美另类在线视频| 久久精品一区二区三区不卡牛牛| 国产极品美女高潮无套久久久| 亚洲ab电影| 日韩美女在线播放| 求av网址在线观看| 欧美一区二区视频在线观看2020| 五月天丁香激情| 懂色av一区二区三区免费观看| 男人天堂手机在线视频| 西野翔中文久久精品国产| 国产成人免费91av在线| 三区四区电影在线观看| 日韩一区二区精品在线观看| 精品无码免费视频| 久久人人爽人人爽| 亚洲欧洲日本精品| 午夜精品偷拍| 久久99精品久久久久久久久久| 国产精品迅雷| 综合av色偷偷网| 精品人妻一区二区三区麻豆91 | 久久黄色网页| 视频一区在线免费观看| 老司机亚洲精品一区二区| 国外成人在线视频| 国产二区在线播放| 日韩一区二区三区四区| 欧美日韩综合在线观看| 中文字幕欧美三区| 中文字幕无人区二| 久久国产欧美| 日本美女爱爱视频| 蜜桃一区二区| 91视频国产高清| 欧美裸体视频| 久久久黄色av| 欧美成人片在线| 欧美一区二区免费| 极品国产91在线网站| 亚洲美女一区二区三区| 中文字幕av网址| 国产精品小仙女| 久久综合久久色| 国产精品mm| 亚洲国产精品一区二区第四页av| av综合网址| 成人欧美在线观看| 午夜精品久久久久久久久久蜜桃| 欧美裸体男粗大视频在线观看| 国产精品麻豆一区二区三区| 欧美成人精品二区三区99精品| 少妇又紧又色又爽又刺激视频| 亚洲国产精品天堂| www深夜成人a√在线| 久久久精品国产99久久精品芒果 | 亚洲第一中文字幕在线观看| 亚洲视频一区二区三区四区| 欧美日韩国产在线看| 欧美黑人性猛交xxx| 欧美激情一区在线| 国产精品一区二区入口九绯色| 国产精品99久| 日本超碰在线观看| 三级一区在线视频先锋| 欧美黑人经典片免费观看| 欧美成人一品| 天堂v在线视频| 奇米影视亚洲| 日本一区二区三区www| 日韩欧美中文字幕电影| 国产高清精品一区| 日韩一二三区在线观看| 成人激情视频在线播放| 精品欧美日韩精品| 国产精品麻豆va在线播放| 范冰冰一级做a爰片久久毛片| 97超视频免费观看| xxxx成人| 欧美精品久久久久久久久| av文字幕在线观看| 久久精品99久久香蕉国产色戒| 高清av在线| 亚洲天天在线日亚洲洲精| 欧美成人免费| 亚洲性xxxx| wwwww在线观看免费视频| 亚洲图中文字幕| 男人久久精品| 亚洲欧美中文日韩在线| 黄色视屏网站在线免费观看| 亚洲欧洲第一视频| av片在线看| 综合激情国产一区| 免费大片在线观看www| 久久精品国产亚洲精品| caopen在线视频| 欧美精品免费在线观看| 羞羞视频在线免费国产| 久久人人爽人人| 天堂网在线最新版www中文网| 欧美一区亚洲一区| 国产另类xxxxhd高清| 国产精品欧美激情在线播放| 亚洲精品毛片| 亚洲综合色激情五月| 51精品国产| 久久日韩精品| 精品国产乱码久久久久久果冻传媒 | www国产在线观看| 日韩视频欧美视频| 国产福利视频在线观看| 久久久久久久久久久网站| 第一福利在线视频| 国产精品2018| 亚洲ww精品| 成人免费观看网站| 天堂网av成人| 亚洲综合首页| 欧美视频不卡| 99热成人精品热久久66| 久久99国产精品久久| 不许穿内裤随时挨c调教h苏绵| 99re成人精品视频| 老司机精品免费视频| 夜夜夜精品看看| 国产精品久久久久久久久久精爆| 欧美日韩在线播放三区| 成人久久久精品国产乱码一区二区| 日韩成人在线电影网| 最新97超碰在线| 久久久久国产精品www| 三级成人在线| 91在线播放视频| 妖精一区二区三区精品视频 | 男插女视频网站| 91丝袜呻吟高潮美腿白嫩在线观看| 国产免费嫩草影院| 五月天欧美精品| 国产麻豆91视频| 亚洲欧美日本精品| 污视频在线免费观看网站| 日韩美女中文字幕| 国产精品久久久久久久久久白浆| 日本黑人久久| 国内视频精品| 亚洲娇小娇小娇小| 91亚洲国产成人精品一区二区三 | 九九热在线精品视频| 韩国三级一区| 国产精品区一区二区三在线播放| 日韩一区电影| 欧美亚洲另类色图| 东方aⅴ免费观看久久av| 国产黄色录像视频| 欧美日韩在线观看视频| www.xxxx国产| 日韩在线免费观看视频| 亚洲午夜天堂| 国产精品制服诱惑| 国产综合精品| xxx中文字幕| 国产精品色哟哟| av一级在线观看| 日韩成人在线网站| 丁香花视频在线观看| 91在线免费观看网站| 色乱码一区二区三区网站| 国产成人在线免费看| 成人91在线观看| 久久精品99国产精| 欧美一级免费观看| 伦xxxx在线| 国产欧美日韩中文字幕在线| 国产一区二区三区不卡视频网站| 免费毛片网站在线观看| 成人精品gif动图一区| 91成人福利视频| 日韩一区二区麻豆国产| 亚洲丝袜一区| 5566av亚洲| 欧美一区精品| 女人扒开腿免费视频app| 综合久久国产九一剧情麻豆| 亚洲永久精品视频| 日韩中文字幕在线观看| 欧美成人xxxx| 一区二区视频在线免费| 久久99久久99小草精品免视看| 精品人妻中文无码av在线| 欧美性欧美巨大黑白大战| 国产福利在线视频| 国产在线播放91| 影音先锋日韩在线| 日本女人性视频| 亚洲午夜视频在线观看| 欧美熟妇交换久久久久久分类| 国模精品视频一区二区三区| 农村少妇一区二区三区四区五区| 91免费黄视频| 91麻豆免费观看| 自拍偷拍校园春色| 日韩在线视频一区| 日本一区二区三区播放| www.国产在线播放| 91网址在线看| 亚洲精品无码久久久久| 北条麻妃久久精品| 日韩一区二区三区精品| www.av片| 国产性色一区二区| 91麻豆成人精品国产| 欧美麻豆久久久久久中文| 欧美三级午夜理伦三级小说| 午夜视频在线瓜伦| 亚洲欧美日韩在线| 五月色婷婷综合| 国产精品激情av电影在线观看 | 日本h片久久| 一区二区三区不卡在线| 国产成人免费视| 国产超碰人人爽人人做人人爱| 亚洲欧美一区二区三区在线| 巨大黑人极品videos精品| 成人国产在线看| 91免费观看国产| 国产一区二区麻豆| 韩日精品中文字幕| 日韩大片在线观看| 97精品人人妻人人| 欧美三级在线播放| gogo久久| 亚洲丰满在线| av在线不卡网|