精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

對OpenAI模型進行基準測試以實現自動解決錯誤

譯文 精選
人工智能
本文評估了軟件開發中的LLM,重點關注它們在解決錯誤方面的有效性。這是軟件開發人員工作流程中的一個關鍵任務。

譯者 | 李睿

審校 | 重樓

大型語言模型(LLM)正在日益塑造軟件開發的未來,為代碼生成、調試和解決錯誤提供了新的可能性。這些人工智能驅動工具的最新進展促使人們更仔細地研究它們的實際應用和對開發人員工作流程的潛在影響。

本文探討了LLM在軟件開發中的有效性,特別關注解決錯誤。根據軟件開發人員在Raygun公司的人工智能解決錯誤工作中獲得的行業觀察和見解,將分析LLM當前的能力及其對未來開發實踐的影響,并討論將權衡這些技術融入人們的日常工作所帶來的具有前景的進步和挑戰。

一、用于軟件開發的OpenAI模型

OpenAI公司已經成功發布了更新、更快、更智能的模型。雖然基準測試網站證實了這些結果,但越來越多的非官方證據表明,人們感覺這些模型更加笨拙。大多數現有的基準測試完全側重于關注這些模型的邏輯推理方面,例如完成SAT問題,而不是關注定性響應,特別是在軟件工程領域。而這里的目標是使用錯誤解析作為基準,定量和定性地評估這些模型,因為解決錯誤在開發人員的工作流程中很常見。

這個綜合評估將涵蓋幾種模型,其中包括GPT-3.5 Turbo、GPT-4、GPT-4 Turbo、GPT- 40和GPT-40 mini。本文將使用現實生活中的堆棧跟蹤和發送的相關信息來評估這些模型如何解決錯誤,還將徹底檢查響應速度、答案質量和開發人員偏好等因素。這種分析將導致從這些模型中提取最佳響應的建議,例如提供更多場景(例如源圖和源代碼)對其有效性的影響。

二、實驗方法

如上所述,將評估以下模型: GPT-3.5 Turbo、GPT-4、GPT-4 Turbo、GPT- 40和GPT-40 mini。使用的特定變體是截至2024年7月30日由OpenAI API提供的默認模型。

為了進行評估,從各種編程語言中選擇了七個現實世界中的錯誤,包括Python、TypeScript和.NET,每種語言都結合了不同的框架。通過在賬戶和個人項目中抽樣現有的錯誤來選擇這些具有代表性的樣本。沒有選擇瞬態或未指向直接原因的錯誤。

名稱

語言

解決方案

難度

Android missing file

.NET Core

試圖讀取的.dll文件不存在

簡單

Division by zero

Python

空數組導致的除零錯誤-無錯誤檢查

簡單

Invalid stop id

TypeScript

從Alexa請求信封中提取的停止ID無效- Alexa模糊測試發送了無效的xyzxyz值

困難

IRaygunUserProvider not registered

.NET Core

IRaygunUserProvider沒有在DI容器中注冊,導致在MAUI中創建主頁失敗

中等

JSON Serialization Error

.NET Core

強類型對象映射與提供的JSON對象不匹配,是由Raygun客戶端發送的不兼容的錯誤有效負載引起的

困難

Main page not registered ILogger

.NET Core

添加了ILogger,但是MainPage沒有作為一個單例添加到DI容器中,導致ILogger<MainPage>在創建MainPage時出錯

中等

Postgres missing table

.NET Core/Postgres

當被C# 程序調用時,Postgres丟失表,導致堆棧跟蹤混亂

簡單-中等

然后使用來自Raygun公司的AI Error Resolution的模板系統提示,其中包含了發送崩潰報告中的信息。通過OpenAI的API直接在所有模型上進行了測試。這個過程產生了35個LLM錯誤響應對。然后這些配對被隨機分配給工程師,他們根據準確性、清晰度和實用性對它們進行1到5的評分。此次評估的工程師有11人,其中包括軟件工程師和數據工程師,他們的經驗水平各不相同,既有只有幾年經驗的工程師,也有多達幾十年經驗的工程師。

除了偏好評級,還將對模型的性能進行解析分析。這項分析將集中在兩個關鍵方面,即響應時間和響應長度,然后將使用這兩個方面來推導這些模型有效性的多種衡量標準。

三、開發者偏好:定性結果

總體看法

根據工程師的評分制作了下面的圖表。由此,有一些明顯的結果既支持也反駁了非官方證據。雖然這項分析側重于解決錯誤,但將這些發現與引言中討論的其他動機因素進行比較是必要的。例如,模型在解決錯誤方面的有效性可能與它們在代碼生成或調試等任務中的性能不同,這可能會影響總體看法。這個更廣闊的視角幫助人們理解大型語言模型對開發人員工作流程的不同方面的不同影響。

意外發現

人們認為GPT-4是最好的LLM模型,但Raygun公司的軟件工程師認為它是最差的??梢允褂脕碜攒浖こ處煹姆答伜鸵恍┓治鰯祿檫@個結果提供可能的理由,將在下一節中展示這些數據。這些假設來自于關注這項研究的工程師進行的討論。GPT-4 Turbo及以后的模型在建議更改時包括代碼片段,工程師們表示,這使他們更好地理解解決方案。GPT-4沒有生成片段,并且其解決方案比GPT-3.5 Turbo更長,這表明工程師不喜歡不包含補充資源的更長響應。

錯誤模式

工程師們還觀察到,JSON驗證錯誤在所有模型變體中的排名一直很低,因為僅靠堆棧跟蹤并不能很好地解決這個錯誤;這使工程師在向LLM尋求幫助時,能夠及時了解提示工程以及哪些信息是有幫助的。

場景影響

(1).NET錯誤

.NET錯誤包括所有這些測試用例,除了除零錯誤和無效的停止ID,如上面的表中所述。結果是只有LLM和工程師知道的場景是堆棧跟蹤、標簽、面包屑和自定義數據。Raygun公司的工程師看到這些錯誤的報告評分更高,可能是因為他們主要使用.NET。然而,在測試不同語言的情況下,仍然觀察到良好的結果。

(2)其他語言

根據工程師的評論,這樣做的原因是在采用Python和TypeScript的情況下,堆棧跟蹤與周圍的代碼場景一起出現。在Python中,周圍的代碼場景是作為堆棧跟蹤的一部分提供的,在TypeScript錯誤中,它來自包含源代碼的源映射。有了這些額外的信息,LLM可以生成直接解決錯誤的代碼片段,這也有助于對GPT-4變體的后續系列進行評級。

性能洞察

(1)GPT-4 Turbo的后續版本性能下降

從GPT-4 Turbo及后續版本的評分來看,看到評分有所下降,尤其是評估到GPT-4o時,盡管這些結果仍然優于GPT-4,而且大多數都優于GPT-3.5 Turbo。如果將JSON序列化錯誤作為異常值刪除,可以觀察到GPT-4 Turbo之后版本的性能有所下降。這一結果清楚地表明,GPT-4系列的性能在GPT-4 Turbo達到峰值后有所下降。

(2)場景對非描述性堆棧跟蹤的重要性

JSON序列化錯誤導致的性能不佳可能是由于需要有關潛在問題的支持信息。僅僅查看堆棧跟蹤就很難確定錯誤,因為存在多個故障點。同樣,這也涉及到包含更多場景(例如源代碼和變量值)的主題,以提示問題可能在哪里。這里的增強可能是源代碼上的RAG查找實現,因此可以將堆棧跟蹤與相應的代碼相關聯。

(3)響應長度對性能的影響

在后續的模型中,造成性能惡化的一個原因是響應長度的增加。這些模型可能在較重的基于邏輯的問題中表現得更好,但這些較長的回答在日常對話中是不可取的。工程師在詢問有關Python庫的問題時遇到過這種情況,希望得到直接的答案。它每次都會重復一整個關于建立庫的介紹部分和有關問題的無用信息。

如果是這樣的話,希望在GPT-5和其他競爭對手等新模型問世時看到對這一問題的一些修正,但就目前而言,這些模型的冗長現象將繼續存在。

四、解析分析:定量結果

響應時間和內容生成

雖然對LLM響應的定性評估至關重要,但響應時間/生成速度和生成的內容量也會顯著影響這些工具的有用性。下圖顯示了為錯誤響應對創建聊天完成的平均響應時間。

有趣的是,就生成聊天完成的平均響應時間而言,GPT-4 Turbo是響應最慢的模型。這是一個令人驚訝的結果,因為一般的理解表明,GPT-4 Turbo應該比GPT-4更快。

令牌生成和模型性能

下圖通過測量每個模型生成的令牌的平均數量來解釋這個令人驚訝的結果。這表明GPT-4 Turbo平均生成的令牌比GPT-4多得多。有趣的是,之前的圖表顯示GPT-4o生成的令牌最多,但仍然比GPT-4 Turbo快得多。

工程師們還看到,在OpenAI的最新模型GPT-4o mini中,這種更多令牌的趨勢不會持續下去。與GPT-4 Turbo相比,令牌的平均數量有所減少,但仍遠高于GPT-4。生成最少令牌數量的模型是GPT-3.5 Turbo,它與定性分析結果一致,工程師更喜歡較短的響應,而不是沒有補充解釋的較長響應。

每個令牌響應時間

在按模型檢查響應時間和平均令牌計數之后,可以確定每個模型在響應時間和令牌生成方面的速度。

下圖顯示了按模型劃分的每個令牌響應時間。在這里看到GPT-4比GPT-4 Turbo更快,但這是由于數據中的異常值??紤]到它傾向于產生更長的輸出,其總體響應時間仍然比GPT-4長。這可能意味著GPT-4 Turbo在生成太多內容時是一個不太理想的模型。

注意:GPT-3.5、GPT 4和GPT-4o模型使用不同的令牌。

GPT-4o與GPT-4o-Mini的比較

有趣的是,與其他來源的研究結果相比,數據顯示GPT-4o和GPT-4o-mini具有相似的反應速度。這種差異表明,可能需要更大的樣本量來揭示他們表現中更明顯的差異。另一種解釋是,考慮到是通過總響應時間來測量每秒的令牌數,由于首次令牌響應時間(TTFT)和其他網絡的相關瓶頸,其數值稍微偏低。

擴展模式

繪制響應時間與令牌計數的關系,并按模型分組,揭示了這些模型擴展中的不同模式。對于GPT-3.5、GPT-4o和GPT-4o-Mini擴展主要是線性的,令牌數量的增加會導致響應時間的相應增加。

然而,這種模式并不適用于較大和較舊的GPT-4系列模型,其中這兩個變量沒有一致的關系。這種不一致可能是由于樣本量較小或專用于這些請求的資源較少,從而導致響應時間不同。鑒于在其他模型中觀察到的線性關系,后一種解釋更有可能。

GPT-4場景限制

最后一項分析來自生成這些錯誤-響應對。雖然GPT-4模型是勝任的,但對于需要長輸入的任務(例如堆棧跟蹤),其場景長度明顯受到限制。由于這個原因,不能生成一個錯誤響應對,因為組合的輸入和輸出將超過模型的8192個令牌場景窗口。

聯合分析

在評估了定性數據后,很明顯GPT-4 Turbo是完成這項任務的最佳模型。然而,將其與定量數據進行比較會引入響應時間和成本考慮。新的GPT-4o模型比所有其他模型快得多,也便宜得多,這是一種權衡。如果需要更好的性能,GPT-4 Turbo是首選。然而,如果成本和速度是優先事項,GPT-4o和GPT-4o-mini是更好的選擇。

結論

這項研究提供了關于后期模型性能的混合證據。雖然一些較新的模型,例如GPT-4 Turbo和GPT-4o,由于能夠包含簡潔的代碼片段而有所改進,但其他模型(例如GPT-4)由于冗長和不太實用的響應而表現不佳。

關鍵要點

  • 代碼片段很重要:提供代碼片段和解釋的模型更有效,更受開發人員的青睞。
  • 場景至關重要:添加周圍代碼或源代碼映射可以顯著提高響應的質量。
  • 平衡回復長度:簡短的回復通常比冗長的回復更有幫助。
  • 定期評估:持續評估模型性能,以確保使用最有效的工具來滿足需求。
  • 注意場景限制:注意場景長度的限制,并相應地制定計劃。

通過關注這些因素,開發人員可以更好地利用LLM來解決錯誤,最終提高他們的生產力和解決方案的準確性。

正如引言中提到的,未來補充這項研究的實驗可能包括對代碼生成的更深入分析。一個可能的實驗可能涉及從解決錯誤中獲取建議,并為LLM提供額外的場景。在理想情況下,如果這項研究要重新進行,那么需要納入更廣泛的錯誤,包括更具挑戰性的錯誤,并從更多樣化的工程師那里獲得評分。

原文標題:Benchmarking OpenAI Models for Automated Error Resolution,作者:Reilly Oldham

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2024-08-23 13:40:57

2024-09-02 11:53:15

2024-10-11 12:56:20

2024-03-22 12:07:43

2025-04-03 10:21:32

2025-04-21 08:22:25

2011-05-16 15:36:00

軟件測試

2024-04-08 13:29:52

2018-01-02 15:38:52

WinSAT系統評估

2013-05-07 09:47:30

測試MySQLMySQL測試

2023-01-30 17:14:40

人工智能語音識別

2025-04-14 00:10:00

人工智能AIAI 模型

2010-08-14 21:59:35

2011-08-02 09:38:20

PerfMonWindows基準測試

2011-03-04 09:09:07

BlueJ

2020-07-28 08:41:21

Kubernetes自動化測試軟件開發

2023-12-08 08:10:34

谷歌GeminiOpenAI

2010-04-12 10:46:02

Oracle性能測試

2012-07-31 09:02:49

Apworks

2010-02-23 13:33:49

Python測試套件
點贊
收藏

51CTO技術棧公眾號

日本在线成人一区二区| 欧美成人激情视频| 久久久国产欧美| 色综合久久久久综合一本到桃花网| 久久草av在线| 久久久久久伊人| 久久久久无码精品国产sm果冻| 成人永久在线| 欧美日韩一区二区免费在线观看| 亚洲一区二区免费视频软件合集| 亚洲精品久久久久avwww潮水| 翔田千里一区二区| 欧美日韩国产123| 亚洲国产天堂av| 6080亚洲理论片在线观看| 色综合色综合色综合| 中国老女人av| 国产精品四虎| 不卡视频一二三四| 成人午夜高潮视频| 欧美日韩一级黄色片| 欧美日韩三区| www.亚洲天堂| 波多野结衣a v在线| 亚洲国产一区二区三区网站| 欧美色精品天天在线观看视频| www.夜夜爱| 男人在线资源站| 久久久久国产一区二区三区四区 | 欧美日韩在线观看首页| 中文字幕中文字幕一区二区 | 人妻一区二区三区四区| 精品在线亚洲视频| 国产成人综合一区二区三区| 日本特黄一级片| 欧美在线高清| 久久精品国产一区| 国精产品久拍自产在线网站| 国产精品一区2区3区| 亚洲国产成人久久综合| 亚洲综合在线一区二区| 亚洲最大的免费视频网站| 日本高清视频一区二区| 欧美精品色婷婷五月综合| 日本高清成人vr专区| 1024国产精品| 中文一区一区三区免费| 日本中文在线| 国产精品青草综合久久久久99| 欧美久久在线| 麻豆导航在线观看| www.爱久久.com| 国产精品日本一区二区| 午夜久久久久久噜噜噜噜| 国产高清不卡一区| 99re视频在线观看| a天堂视频在线| 国产美女主播视频一区| 国产主播精品在线| 一级黄色免费看| 久久国产生活片100| 国产美女久久久| 亚洲天堂狠狠干| 六月丁香婷婷久久| 成人高h视频在线| 97人妻精品一区二区三区| 久久国产夜色精品鲁鲁99| 91精品国产自产在线老师啪| 91黄色在线视频| 国产在线观看一区二区| 99国产超薄丝袜足j在线观看| www日本高清视频| 粉嫩在线一区二区三区视频| 国外成人在线视频网站| 天堂av中文在线资源库| 国产亚洲视频系列| 亚洲国产成人不卡| 国产福利视频在线| 亚洲一区二区四区蜜桃| 鲁一鲁一鲁一鲁一色| 国产免费不卡| 欧美三级日韩在线| 波多野结衣电影免费观看| 亚洲国产欧美国产第一区| 亚洲成年人影院在线| 日本黄色特级片| 欧洲激情综合| 久久久999成人| 福利一区二区三区四区| 老司机精品视频网站| 国产精品国语对白| aa视频在线免费观看| fc2成人免费人成在线观看播放 | 91影院成人| 欧美伦理91i| 免费在线不卡视频| 久久国产成人午夜av影院| 动漫美女被爆操久久久| 国产一级在线| 亚洲已满18点击进入久久| 国产97在线 | 亚洲| 欧美啪啪网站| 亚洲高清av在线| 久久久久99精品成人| 欧美日韩四区| 国产精品v片在线观看不卡| 99国产精品欲| 久久奇米777| 亚洲激情免费视频| 性欧美gay| 日韩精品一区二区三区老鸭窝| 欧美丰满少妇人妻精品| 亚洲色图网站| 奇门遁甲1982国语版免费观看高清 | 青青草在线免费观看| 亚洲视频免费在线| 蜜臀久久99精品久久久酒店新书 | 一区二区三区福利| 成人黄色av网| 欧美大片aaa| 亚洲国产日韩一区二区| 最新天堂中文在线| 亚洲精品合集| 欧美激情久久久久| 国产精品视频久久久久久| 91免费看片在线观看| 亚洲色婷婷久久精品av蜜桃| 久久精品嫩草影院| 亚洲日本欧美日韩高观看| 久久久久亚洲AV| 激情五月播播久久久精品| 欧美人xxxxx| 1区2区3区在线| 日韩一区二区免费在线电影 | av一区二区高清| 91精品国产色综合| 少妇无码一区二区三区| 夜夜嗨av一区二区三区网页| 人人爽人人爽av| 日韩成人精品一区二区| 国产极品精品在线观看| 青青草视频免费在线观看| 亚洲成av人综合在线观看| 制服下的诱惑暮生| 婷婷激情图片久久| 国产精品一香蕉国产线看观看| 内衣办公室在线| 欧美午夜xxx| 午夜视频在线观看国产| 伊人精品在线| 国产亚洲情侣一区二区无| 欧美极品少妇videossex| 91精品国产一区二区人妖| 欧美xxxooo| 久久99久久久欧美国产| 波多野结衣三级在线| 成人51免费| 插插插亚洲综合网| 精品国产18久久久久久| 亚洲靠逼com| xxxx国产视频| 亚洲精品国产偷自在线观看| 91精品在线影院| 成人日日夜夜| 欧美成人伊人久久综合网| 久久久久性色av无码一区二区| 国产成人av福利| 国产美女主播在线播放 | 久久99国产精品免费| 伊人久久99| 久久99精品久久久野外观看| 欧美裸身视频免费观看| 亚洲 欧美 精品| 91福利在线播放| 永久免费看片直接| 成人动漫中文字幕| 欧美亚洲一二三区| av在线不卡顿| 成人两性免费视频| 暖暖在线中文免费日本| 日韩精品在线视频| 在线观看视频二区| 一区二区三区精品视频| 蜜臀av一区二区三区有限公司| 99成人免费视频| 日韩精品久久一区二区三区| 中文成人在线| 亚州国产精品久久久| 国产福利在线| 欧美va亚洲va在线观看蝴蝶网| 久久夜靖品2区| 国产目拍亚洲精品99久久精品| 中文字幕第一页在线视频| 黄色成人在线网站| 欧美一区二区视频在线| 国产精品**亚洲精品| 97在线视频免费播放| www.在线视频.com| 欧美va亚洲va| 中文字幕av网站| 亚洲高清不卡在线| 欧美性猛交xxxx乱大交少妇| 国产69精品久久777的优势| 免费观看成人网| 一区在线视频| 国产精品99久久久久久有的能看| 四虎永久在线精品免费一区二区| 精品国产亚洲一区二区在线观看| 欧美一二三视频| 成人日韩欧美| 亚洲精品一区在线观看香蕉| 99久久99久久久精品棕色圆| 色综合久久久久网| 久久午夜鲁丝片午夜精品| 国产日韩欧美麻豆| 麻豆精品国产传媒av| 麻豆传媒一区二区三区| www国产精品内射老熟女| 午夜激情久久| 欧美亚洲另类在线一区二区三区| 日韩精品一区二区三区中文| 国产国语刺激对白av不卡| gogo高清在线播放免费| 一区二区亚洲欧洲国产日韩| 人妻一区二区三区| 日韩西西人体444www| 国产无遮挡又黄又爽又色视频| 亚洲成av人综合在线观看| 欧产日产国产v| 国产精品久久久久久久久久免费看 | 春色成人在线视频| 国产精品一区二区美女视频免费看| 欧美有码在线观看| 美女91在线看| 久久免费高清视频| 超碰免费在线播放| 久久精品国产清自在天天线| 成人在线视频成人| 亚洲免费av电影| 欧美熟妇另类久久久久久不卡| 91麻豆精品国产91久久久久久 | 国内精品一区二区| 白嫩白嫩国产精品| 成人av网站观看| 国产区一区二| 国产在线不卡精品| 99久久99九九99九九九| 国产精品久久久亚洲| 性欧美18一19sex性欧美| 日韩免费不卡av| 亚洲精品一区| 国产成人精品久久| 精品免费av在线| 国产精品高潮在线| 影音成人av| 国产精品视频yy9099| 成人高清一区| 国产在线观看精品| 国产亚洲高清在线观看| 91精品国产一区二区三区动漫 | 亚洲成人毛片| 热久久免费国产视频| 色在线免费观看| 欧美有码在线视频| 日日夜夜天天综合| 国产精品国模在线| 欧美视频在线视频精品| 成人两性免费视频| 亚洲视频国产精品| 国产精品有限公司| 亚洲图区在线| 日本高清不卡一区二区三| 国产亚洲精品美女久久久久久久久久| 日韩电影免费观看高清完整| 成人免费电影网址| 一道精品一区二区三区| 亚洲精品va| 国产精品国产对白熟妇| 亚洲综合欧美| 国产九九在线观看| 国产乱理伦片在线观看夜一区| 日本人妻一区二区三区| 91在线高清观看| 中文字幕伦理片| 亚洲欧美日韩国产成人精品影院 | 黄网动漫久久久| 99精品人妻国产毛片| 欧美日韩免费高清一区色橹橹| av高清一区二区| 日韩hd视频在线观看| 电影av在线| 欧美区在线播放| 最新日韩精品| 亚洲va久久久噜噜噜| 久久香蕉精品香蕉| 杨幂一区欧美专区| 韩日精品视频| 国产免费又粗又猛又爽| 国产精品99久久久久久似苏梦涵| 五级黄高潮片90分钟视频| 国产精品嫩草99a| 日本少妇性生活| 欧美三级电影在线看| 成人乱码一区二区三区| 国产亚洲成av人片在线观看桃| 成人ww免费完整版在线观看| 欧美伊久线香蕉线新在线| 日韩精品视频在线看| 日本精品视频一区| 黄色综合网站| 午夜剧场在线免费观看| 不卡在线观看av| 久久久久人妻一区精品色| 亚洲777理论| 国产精品女同一区二区| 亚洲毛片在线看| 成年网站在线视频网站| 国产热re99久久6国产精品| 天天躁日日躁狠狠躁欧美| 日本一二三区视频在线| 日韩电影在线免费看| 制服丝袜第一页在线观看| 亚洲欧美色图小说| 小泽玛利亚一区二区三区视频| 精品sm捆绑视频| 久久日韩视频| 国产精品美女久久| 亚洲大片精品免费| 国产毛片久久久久久国产毛片| 蜜臀av性久久久久蜜臀aⅴ流畅 | 国产精品中文字幕制服诱惑| 一区二区精品在线| 日韩国产欧美在线视频| 久久久久国产精品区片区无码| 一区二区三区影院| 国产免费无遮挡| 久久精品久久精品亚洲人| 精品免费av在线| 日韩av一区二区三区在线| 久久久噜噜噜| 疯狂揉花蒂控制高潮h| 亚洲一区二区精品视频| 精品人妻一区二区三区日产乱码| 最近2019年好看中文字幕视频| 欧美艳星kaydenkross| 老司机精品福利在线观看| 在线一区欧美| yy1111111| 亚洲成av人片在线| 日韩性xxxx| 高清欧美性猛交xxxx| 都市激情久久| 亚洲色成人www永久在线观看| 国产成人在线视频播放| 久久精品www| 欧美成人vps| heyzo在线播放| 国产一区自拍视频| 一区二区三区四区五区精品视频 | 日本韩国欧美在线观看| 成人黄色av网站在线| 五月天综合激情| 精品视频久久久久久| 欧美美女日韩| 亚洲欧美日产图| 国产在线精品不卡| 久久久久久久久97| 亚洲国产精品电影| 一级毛片久久久| 色播五月综合| 韩国精品免费视频| 久久黄色免费网站| 亚洲国产精品字幕| 欧美片第1页| 在线观看一区二区三区三州| 国产在线精品免费av| 国产极品美女高潮无套嗷嗷叫酒店| 亚洲福利视频在线| 色老太综合网| 手机成人av在线| www.日韩在线| 日韩乱码一区二区三区| 久久激情视频久久| 国产精品调教视频| 国产成人无码av在线播放dvd| 国产精品狼人久久影院观看方式| 国产三级自拍视频| 97视频com| 大色综合视频网站在线播放| 欧美激情第四页| 欧美日韩国内自拍| 国产精品一二三区视频| 91久久国产综合久久蜜月精品| 伊人久久大香线蕉av超碰演员| 99久久精品免费视频| 日韩欧美你懂的| 校园春色亚洲色图| 男人天堂网站在线| 久久亚洲一区二区三区明星换脸| 亚洲天堂男人网|