精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM能力評測與基準構建:金融LLM認知診斷框架;LLM未來事件預測評估基準;LLM MCP的評估基準

發布于 2025-8-25 01:40
瀏覽
0收藏

From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models

2025-08-19|WHU, WHU, NAU, SWJTU, BUFT, AU, UoM|??53??http://arxiv.org/abs/2508.13491v1https://huggingface.co/papers/2508.13491https://github.com/WHUNextGen/FinCDM??

研究背景與意義

  1. 問題定義與現狀概述金融領域中大型語言模型(LLMs)展現出廣泛應用潛力,但現有評測方法多依賴單一分數,難以揭示模型對金融知識的具體掌握情況。傳統金融LLM評測基準覆蓋面狹窄,忽視了稅務、監管等關鍵領域,且無法反映模型在不同金融技能上的差異。
  2. 挑戰與目標闡明當前評測面臨“分數扁平化”問題,導致模型能力被過度簡化。為解決這一瓶頸,論文旨在構建一個認知診斷框架FinCDM,能夠從知識與技能層面細致評估金融LLMs,揭示其優勢與不足,推動更可信和針對性的模型開發。

研究方法與創新

LLM能力評測與基準構建:金融LLM認知診斷框架;LLM未來事件預測評估基準;LLM MCP的評估基準-AI.x社區

  1. 技術框架設計FinCDM借鑒教育心理學中的認知診斷模型(CDM),通過非負矩陣協同分解方法,將模型對題目的回答矩陣分解為題目潛在技能需求、模型潛在技能掌握度和技能與金融知識點的映射矩陣,形成多維度、可解釋的能力畫像。
  2. 數據集創新構建CPA-QKA數據集,基于權威的注冊會計師考試大綱,涵蓋70個核心金融概念,由三位領域專家嚴格編寫和標注問題,保證高質量與廣泛覆蓋。另對現有FinEval數據集進行細粒度知識點標注,驗證數據集的結構合理性。
  3. 優勢與理論基礎
  • 細粒度診斷能力:不同于傳統單一準確率,FinCDM能精確定位模型在具體金融知識點上的掌握情況。
  • 覆蓋全面、注重實用:涵蓋財務、審計、稅務、經濟法等多個子領域,反映真實金融業務需求。
  • 理論支撐:采用概率生成模型結合矩陣分解技術,提升了模型推斷的魯棒性和解性,相較傳統DINA、神經網絡或圖模型,表現出更優的預測準確度和泛化能力。
  1. 對比現有方法通過與神經網絡CDM和圖神經網絡CDM對比,FinCDM在準確率、AUC及RMSE指標上均顯著優越,證明了其在金融領域認知診斷任務中的有效性。

實驗設計與結果分析

LLM能力評測與基準構建:金融LLM認知診斷框架;LLM未來事件預測評估基準;LLM MCP的評估基準-AI.x社區

  1. 實驗設計評測覆蓋30余款中文能力強的LLMs,包括閉源通用模型(如GPT-4、Claude系列)、開源通用模型(如Baichuan、Falcon)及金融領域專用模型(如Finma、CFGPT)。使用統一的提示模板和生成配置,保證評測公平性和結果穩定性。
  2. 結果分析
  • 知識掌握差異顯著:FinCDM揭示了模型在不同金融知識點的掌握差異。如Gemini-2.5-Pro擅長國際會計準則相關內容,而Doubao-1.5-Pro則在財務成本管理領域表現突出。
  • 語言資源影響明顯:缺乏中文預訓練的模型(如Falcon-7B)表現較差,顯示語言資源對金融知識習得至關重要。
  • 數據集結構影響:FinEval-KQA數據集因知識點分布不均,導致模型表現偏向高頻概念,CPA-KQA則提供更均衡的評估視角。
  • 診斷準確性驗證:通過對Claude 3.5模型在特定金融概念(如F3、F5)上的錯誤回答進行專家復核,確認FinCDM診斷結果的可靠性。
  1. 模型行為模式揭示通過潛在技能掌握矩陣分析,發現模型群體存在明顯的行為聚類,反映不同模型在金融知識領域的專長和弱點,為后續模型定向優化提供依據。

結論與展望

  1. 研究貢獻總結
  • 首次提出面向金融LLMs的認知診斷評估框架FinCDM,突破傳統單一分數限制,實現知識技能層面的細粒度評測。
  • 構建高質量、覆蓋全面的CPA-QKA數據集,結合嚴謹的專家標注流程,提升了評測的權威性和實用價值。
  • 通過大規模多模型實驗,揭示了金融LLMs在知識掌握上的多樣化表現,促進了模型理解和可信度提升。
  1. 局限性分析
  • 當前數據集主要基于中文金融知識,跨語言和跨文化的泛化能力尚需驗證。
  • 矩陣分解模型假設線性關系,可能限制對復雜非線性知識結構的捕捉。
  • 部分金融知識點因數據稀缺仍難以充分評估,未來需擴展數據覆蓋。
  1. 未來展望
  • 拓展多語言、多文化金融數據集,增強模型跨域適應能力。
  • 融合更先進的非線性診斷模型,如圖神經網絡與深度學習方法,提升診斷精度和解釋力。
  • 將認知診斷結果反饋至模型訓練環節,實現動態知識補全和定向能力提升,推動金融LLMs向更高可信度和專業度發展。

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

2025-08-16|ByteDance Seed, Fudan U, Stanford U, Princeton|??46

??http://arxiv.org/abs/2508.11987v2https://huggingface.co/papers/2508.11987??

研究背景與意義

  1. 研究背景未來預測是大型語言模型(LLM)代理面臨的復雜任務,要求具備高度的分析思維、信息收集、上下文理解和不確定性下的決策能力。當前雖然存在多種LLM評測基準,但多集中于靜態知識或模擬環境,缺乏對動態、實時未來事件預測的系統性評估。未來預測任務不僅涉及實時數據整合,還要求模型在信息不斷變化的環境中進行推理和預測,類似于政治、經濟和金融領域的專業人類分析師。
  2. 研究意義該領域缺乏大規模、動態、無數據污染的評測基準,限制了LLM代理未來預測能力的準確評估和提升。FutureX填補了這一空白,提供了一個涵蓋廣泛領域、支持實時更新的未來預測動態評測平臺,推動LLM代理向專業人類分析師水平邁進,促進智能體在復雜真實環境中的應用和發展。

研究方法與創新

  1. 技術描述FutureX構建了一個自動化、動態的未來事件評測流水線,涵蓋事件庫構建、每日事件篩選、代理預測執行和答案獲取四大環節。通過從2000余個網站篩選出195個高質量、多領域數據源,結合模板化事件生成和隨機變量替換,保證了事件的多樣性和實時性。系統每日自動運行,收集代理預測并在事件結果公布后自動抓取真實答案,實現全流程閉環自動評測。
  2. 創新點
  • 數據污染根除設計:通過預測未來尚未發生事件,杜絕歷史數據導致的邏輯泄漏和檢索污染,確保評測公正性和可信度。
  • 真實世界動態環境:非模擬環境,直接面對真實、復雜、多變的信息流,考驗代理的綜合分析、推理和決策能力。
  • 規模與多樣性領先:涵蓋11大領域、近500個每周事件,涵蓋單選、多選、開放排名及數值預測等多種題型,遠超現有未來預測基準的規模和豐富度。
  • 多層次代理評測:評估基礎LLM、具備搜索推理能力的LLM、開源和閉源深度研究代理,全面反映不同技術路線的性能表現。
  • 高度自動化評測流程:實現每日自動事件更新、模型預測執行和結果采集,支持25個模型的連續在線評測,技術復雜度和實施難度均領先同行。
  1. 優勢解析該方法突破了傳統靜態基準的限制,真實模擬了未來預測的核心挑戰,推動了代理從知識記憶向動態推理和信息整合的轉型。通過多領域、多事件類型的覆蓋,FutureX有效避免了模型過擬合和評測偏頗,確保了評測結果的廣泛適用性和前瞻性。

實驗設計與結果分析

  1. 實驗設計
  • 事件構建:每日從195個精選網站自動爬取未來事件,經過模板化處理和隨機化,生成約500個多樣化事件。
  • 事件篩選:剔除主觀、易預測(如二選一)及有害事件,確保事件質量和挑戰性。
  • 模型評測:涵蓋8個基礎LLM、7個具備搜索推理的LLM、8個開源深度研究代理和2個閉源深度研究代理,共25個模型。所有模型每日自動執行預測,限時30分鐘。
  • 答案采集:事件結果公布后,系統多時段爬取并通過LLM輔助抽取準確答案,自動完成評分。
  1. 結果分析
  • 整體表現:FutureX提供了動態、無污染且跨領域的評測環境,模型表現顯著區分了基礎LLM與具備搜索推理能力的代理,深度研究代理表現尤為優異。
  • 難度與領域影響:模型在不同難度等級和領域上的表現存在顯著差異,復雜開放式高波動事件對模型推理和搜索能力提出更高要求。
  • 時間敏感性:模型在事件發生前預測準確性明顯優于事件發生后嘗試預測,驗證了未來預測任務的真實性和挑戰性。
  • 功能模塊貢獻:規劃與搜索能力顯著提升模型性能,體現了復合智能體設計的重要性。
  • 安全與效率:深度研究代理對虛假信息存在一定脆弱性,部分模型在信息檢索效率上仍有提升空間。

結論與展望

  1. 總結貢獻FutureX作為首個大規模、動態、無污染的未來預測評測基準,系統性地推動了LLM代理在復雜動態環境下的推理、搜索和決策能力的評估與提升。通過多領域、多模型、多事件類型的綜合測試,FutureX為智能體研究提供了堅實的實驗平臺和豐富的數據資源。
  2. 局限分析當前FutureX依賴于高質量網站的數據可訪問性和時效性,部分事件答案抽取仍需人工輔助優化,且深度研究代理對虛假信息的防御能力尚需加強。模型預測時間限制和事件多樣性仍存在進一步拓展空間。
  3. 未來展望
  • 增強抗干擾能力:提升模型對虛假信息和惡意事件的識別與防御能力。
  • 豐富事件類型與領域:引入更多實時數據源和復雜事件類型,提升評測的全面性和挑戰性。
  • 優化自動化流程:進一步提升答案抽取準確率和系統穩定性,實現完全無人值守的長期運行。
  • 促進模型協同:探索多智能體協作機制,提升復雜未來預測的整體性能。
  • 推動行業應用:基于FutureX評測結果,推動LLM代理在金融、政策分析等高風險領域的實際部署和應用。

FutureX的設計理念和實施成效為未來智能體的研究和應用奠定了堅實基礎,代表了AI發展“第二階段”中智能體能力評估和提升的重要里程碑。

MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

2025-08-20|Salesforce AI Research|??17??http://arxiv.org/abs/2508.14704v1https://huggingface.co/papers/2508.14704https://mcp-universe.github.io??

研究背景與意義

本文聚焦于Model Context Protocol(MCP)這一新興的開放標準,它實現了大型語言模型(LLMs)與外部數據源及工具的無縫連接,填補了傳統語言模型在實際應用中因信息孤島導致的整合瓶頸。然而,現有的評測體系多為簡化版本,難以反映現實環境中如長時序推理、大規模未知工具使用等復雜挑戰。針對這一缺口,作者提出了MCP-Universe——首個涵蓋真實MCP服務器、多領域、多任務的綜合性評測基準,旨在系統評估LLM在現實復雜場景中的工具調用能力和推理水平。該工作不僅豐富了MCP生態的評測手段,也為推動LLM實用化提供了關鍵支撐。

研究方法與創新

MCP-Universe的核心創新在于其全方位、多維度的設計理念。首先,基于真實世界的11個MCP服務器,覆蓋地理導航、代碼庫管理、金融分析、3D設計、瀏覽器自動化和網絡搜索六大核心領域,任務設計貼合真實應用場景,具備豐富的操作復雜度和動態變化特征。其次,評測框架采用執行驅動的自動化評估機制,集成格式校驗、靜態內容匹配和動態實時數據驗證三種評估手段,克服了以往LLM自評估帶來的主觀偏差和時效性不足??蚣苓€支持多模型、多代理架構的靈活配置,確保評測的公正性和可擴展性。此外,作者提出了針對長上下文處理和未知工具適應的挑戰分析,并嘗試引入上下文摘要機制以緩解信息爆炸問題,展現了方法的前瞻性和實踐價值。

實驗設計與結果分析

實驗涵蓋包括OpenAI GPT-5、Anthropic Claude-4.0-Sonnet、xAI Grok-4等多款頂尖專有及開源模型,均采用ReAct代理框架進行任務執行。結果顯示,最高成功率為GPT-5的43.72%,其余模型表現普遍低于35%,尤其在地理導航和代碼庫管理領域表現尤為薄弱,反映出現實MCP環境對現有LLM能力的嚴峻考驗。評估細分為格式合規性、靜態內容準確性及動態實時響應三類,發現模型在格式遵循上表現較好(多數超過80%),而內容正確性尤其是動態任務中明顯不足,暴露出內容生成的核心瓶頸。長上下文的快速增長導致模型性能下降,摘要機制雖有一定效果,但仍未根本解決問題。整體實驗揭示了LLM在實際MCP應用中的多重限制,強調了跨領域適應性和工具熟悉度的迫切需求。

結論與展望

本文通過MCP-Universe基準系統地揭示了當前大型語言模型在真實MCP環境下的性能瓶頸和挑戰,包括長上下文處理能力不足、對新工具的適應性差異以及跨領域表現不均等關鍵問題。該基準不僅提供了一個真實、多樣且動態的評測平臺,也為未來LLM代理設計指明了方向。展望未來,研究可聚焦于提升模型的長期記憶與摘要能力、增強對未知工具接口的自適應學習、以及開發更高效的多模態交互策略。此外,開放的評測框架和UI支持將促進社區協作,加速MCP生態系統的創新與成熟,推動LLM從實驗室走向廣泛的實際應用。

本文轉載自???AI研究前瞻???,作者:胡耀淇

收藏
回復
舉報
回復
相關推薦
天堂av在线免费观看| 一区二区三区中文字幕在线观看| 亚洲一区二区综合| 欧洲亚洲在线视频| 亚洲理论中文字幕| 国产一级片久久| 国产麻豆剧传媒精品国产| 成人午夜淫片100集| 伊人久久大香伊蕉在人线观看热v| 欧美a级在线| 在线视频你懂得一区| 亚洲国产精品一区二区尤物区| 亚洲欧美日韩高清| 视色,视色影院,视色影库,视色网| 男人日女人网站| 日韩精品欧美| 在线一区二区视频| 在线观看成人免费| 国产精品九九九九| 欧美色婷婷久久99精品红桃| 欧美日韩国产精品一区二区三区四区 | 国产色99精品9i| 久久久精品影视| 久久久久久久激情视频| 色黄视频免费看| 日本中文在线| 蜜桃视频一区二区| 日韩在线免费视频观看| 六月丁香婷婷激情| 深爱五月激情五月| 在线看片一区| 亚洲成人教育av| 菠萝蜜视频在线观看入口| 国产草草影院ccyycom| 天天做天天爱天天爽综合网| 欧美夫妻性生活| 一区二区三区电影| 99热这里只有精| 三级精品在线观看| 中文字幕亚洲国产| 欧美性受xxxxxx黑人xyx性爽| 日本欧美在线视频免费观看| 91免费版在线看| 欧洲中文字幕国产精品| 久草国产在线观看| 91免费精品国偷自产在线在线| 亚洲激情成人在线| 中文字幕久久一区| 亚洲精品一区二区口爆| 亚洲精品色图| 亚洲热线99精品视频| 999精彩视频| 黄色免费网站在线观看| 成人一道本在线| 欧日韩在线观看| 国产无码精品一区二区| 欧美喷水视频| 日韩精品视频免费专区在线播放| 91久久精品午夜一区二区| 一区二区三区毛片| 痴汉一区二区三区| 国产精品一区二区6| 国产欧美日韩在线观看视频| 欧美日韩国产一二三| 国产一区 在线播放| 天堂资源中文在线| 99久久婷婷国产综合精品电影| 热99精品只有里视频精品| 日韩精品久久久久久久酒店| 亚洲国产精品第一区二区| 久久人人爽人人爽人人片av高清| 国产精品1000部啪视频| 亚洲一区导航| 欧美一区二区成人6969| 欧美极品欧美精品欧美| av在线资源网| av在线不卡电影| 精品国产综合区久久久久久| 中文字幕一区二区三区四区免费看 | 在线免费看污网站| 日本综合精品一区| 欧美色另类天堂2015| 一区二区免费电影| 丝袜综合欧美| 国产精品网站在线播放| 91在线看网站| 成人毛片一区二区三区| 国产精品啊v在线| 搡老女人一区二区三区视频tv| 貂蝉被到爽流白浆在线观看| 国产在线播放精品| 欧美性猛交xxxxxx富婆| 9久久9毛片又大又硬又粗| 在线免费观看的av网站| 91网上在线视频| 日韩一区不卡| 午夜小视频在线播放| 国产精品一区在线| 国产精品偷伦一区二区| 日韩 欧美 综合| 日韩国产在线观看| 96成人在线视频| 手机福利在线| 亚洲视频在线观看一区| 五月婷婷一区| 邻家有女韩剧在线观看国语| thepron国产精品| 神马影院午夜我不卡| 欧美精品videosex| 亚洲欧洲性图库| 日韩欧美国产二区| 日韩激情av| 欧美性猛交xxxx黑人交| 俄罗斯黄色录像| 亚洲天堂av资源在线观看| 91精品国产全国免费观看| 欧美精品欧美极品欧美激情| jizz性欧美23| 中文字幕日韩av综合精品| 欧美日韩中文视频| 韩国一区二区视频| 国产欧美精品在线播放| 亚洲精选一区二区三区| 中文字幕乱码久久午夜不卡| 玩弄中年熟妇正在播放| av成人在线网站| 亚洲视频777| 你懂的国产视频| 丁香婷婷综合网| 在线观看福利一区| 欧美性理论片在线观看片免费| 精品国产999| 国产女女做受ⅹxx高潮| 裤袜国产欧美精品一区| 91国偷自产一区二区三区成为亚洲经典 | 成人在线激情视频| 91久久精品无码一区二区| 久久99久国产精品黄毛片色诱| 国产乱肥老妇国产一区二| 头脑特工队2在线播放| 亚洲一区二区四区蜜桃| 一起草最新网址| 91精品国偷自产在线电影| 色在人av网站天堂精品| 午夜偷拍福利视频| 国产a视频精品免费观看| 国产一区二区三区奇米久涩 | 日韩高清a**址| xxxx 国产| 成人不卡免费av| 久久综合中文色婷婷| 天天干天天色天天| 亚洲自拍偷拍av| 91porn在线| 黄色成人av网站| 国产66精品久久久久999小说| 超碰在线无需免费| 欧美日韩国产专区| 中文字幕在线播放视频| 99在线观看免费视频精品观看| 日韩美女视频免费在线观看| 97人妻精品一区二区三区软件| 中文子幕无线码一区tr| 色婷婷.com| 国产人妖ts一区二区| 久久久久久久久久久久av| 蜜臀av免费在线观看| 国产婷婷色一区二区三区| 波多野结衣 作品| 91精品导航| 97视频在线观看免费| 在线播放亚洲精品| www.av亚洲| 三级4级全黄60分钟| 国产一区一区| 久久久久日韩精品久久久男男 | 自拍视频在线看| 91精品国产91综合久久蜜臀| 亚洲色婷婷一区二区三区| 天堂va蜜桃一区二区三区 | 国产午夜精品一区二区 | 青青草手机在线观看| 国产福利一区在线| 日本一区视频在线| 懂色aⅴ精品一区二区三区| 欧美精品一区二| 小嫩苞一区二区三区| 99riav1国产精品视频| 狠狠色噜噜狠狠色综合久| 日韩国产网站| 欧美乱人伦中文字幕在线| 亚洲人视频在线观看| 欧美性色黄大片| 麻豆亚洲av熟女国产一区二| 久久先锋资源网| 免费超爽大片黄| 日韩高清一区| 欧美专区日韩视频| 看黄网站在线观看| 亚洲国产日韩欧美综合久久| 在线免费看av网站| 另类综合日韩欧美亚洲| 日韩精品不卡| 午夜精品在线| 国产精品久久久久免费a∨| 精品视频二区| 日本道色综合久久| 欧美精品xxxxx| 国产日韩欧美一区二区三区乱码| 日本高清免费观看| 亚洲在线成人| 精品乱码一区二区三区| 另类一区二区三区| 在线观看久久久久久| 97人妻一区二区精品视频| 国产婷婷色一区二区三区 | 亚洲精品毛片| 久久精品2019中文字幕| 亚洲在线免费观看视频| 亚洲成人动漫精品| 特一级黄色录像| 国产婷婷一区二区| 91玉足脚交白嫩脚丫| 国产精品一区二区久久不卡| 天天操天天摸天天爽| 成人高清av| 久久av免费观看| 超级碰碰不卡在线视频| 亚洲国产精品大全| 国产女人18毛片水真多| 一区二区三区欧美在线观看| 伊人影院综合网| 蜜桃久久久久久久| 久久美女福利视频| 亚洲久久视频| 久久99久久99精品| 欧美高清视频看片在线观看| 国内精品小视频| 国产在线高清视频| 亚洲午夜未删减在线观看| 中文字幕在线播放日韩| 色综合一区二区| 精品欧美一区二区久久久| 日韩精品欧美精品| 久久国产亚洲精品无码| aⅴ色国产欧美| 五十路熟女丰满大屁股| 在线观看一区| 免费不卡av在线| 伊人成人在线| 国产精品无码人妻一区二区在线| 亚洲无吗在线| 亚洲人成无码网站久久99热国产| 黄色成人91| 免费国产a级片| 香蕉视频成人在线观看| av动漫在线观看| 石原莉奈在线亚洲三区| 欧美日韩国产精品激情在线播放| 国产精品亚洲产品| 国产日韩视频在线播放| 久久大胆人体视频| 国产精品丝袜一区二区三区| 日韩不卡在线| 久久久久久久网站| 国产污视频在线播放| 中文字幕亚洲欧美一区二区三区| 国产大片在线免费观看| 日韩欧美黄色影院| 无码人妻精品一区二区蜜桃色欲| 日韩欧美国产视频| 国产乱码77777777| 欧美日韩mp4| 99re只有精品| 亚洲成人激情图| 猫咪在线永久网站| 久久视频免费观看| 男生女生差差差的视频在线观看| 亚洲社区在线观看| 国产剧情在线| 国内精品久久久久久久| 成人国产二区| 成人激情视频网| 国产精品1luya在线播放| 久久久www免费人成黑人精品| 精品亚洲成人| 精品综合在线| 青青草国产成人a∨下载安卓| 99精品视频网站| 亚洲韩日在线| www.夜夜爽| 久久久久中文| 99色精品视频| 国内精品免费在线观看| 国产精品嫩草av| 亚洲国产精品激情在线观看 | 亚洲综合激情小说| 亚洲 日本 欧美 中文幕| 欧美一区二区美女| 黄色国产在线| 久久久久久国产精品三级玉女聊斋| 一级毛片久久久| 亚洲一区中文字幕| 免费日韩成人| 国产一区二区三区无遮挡| 欧洲杯半决赛直播| 亚洲精品无码国产| 老司机一区二区| 欧美 变态 另类 人妖| 成人国产精品免费网站| 亚洲毛片亚洲毛片亚洲毛片| 亚洲午夜久久久久久久久电影网| 五月激情丁香网| 日韩欧美中文字幕在线播放| 国产一区二区在线不卡| 亚洲老司机av| 国产精品国精产品一二| 国产欧美在线播放| 少妇高潮一区二区三区99| 狠狠干一区二区| 欧美日韩一区自拍| 天堂av8在线| 国产欧美中文在线| xxx在线播放| 亚洲国产精品高清| www.伊人久久| 精品国产一区a| 国产超级va在线视频| 国产精品免费视频xxxx| 亚洲综合福利| 翔田千里亚洲一二三区| 国产精品入口| 国产精品偷伦视频免费观看了 | 欧美在线日韩精品| 精品久久久久中文字幕小说| 国产 日韩 亚洲 欧美| 国产麻豆成人精品| 婷婷伊人五月天| 欧美日韩国产精品成人| av在线免费观看网站| 日产精品久久久一区二区福利| 久草精品视频| 岛国大片在线播放| 成人白浆超碰人人人人| 国产精品二区一区二区aⅴ| 日韩视频免费观看高清完整版在线观看 | 欧美日韩精品欧美日韩精品一综合| 亚洲av成人无码久久精品老人| 欧美激情在线观看视频| 欧美视频二区欧美影视| 久久精品日产第一区二区三区| 欧美日韩国产探花| 欧美成人精品一区二区综合免费| 一区二区三区在线免费视频| av中文字幕免费在线观看| 久久成人人人人精品欧| 亚洲成人五区| 2019日韩中文字幕mv| av中文字幕在线不卡| 在线能看的av| 亚洲网站在线播放| 国产麻豆一区| 成人在线观看www| 国产宾馆实践打屁股91| 日韩精品久久久久久久| 欧美另类z0zxhd电影| 黄色免费在线观看| 国产精品国产三级国产专区53 | 亚洲欧美中文另类| 欧美gay视频| 91精品免费| 国产主播精品| 日本黄色特级片| 欧美日韩视频在线第一区| 亚洲人成色777777精品音频| 国产91成人video| 亚洲三级av| 大肉大捧一进一出好爽视频| 国产亚洲精品久| 97免费观看视频| 性欧美xxxx视频在线观看| 九九免费精品视频在线观看| 国产一区二区四区| 久久一夜天堂av一区二区三区| 免费看av在线| 久久777国产线看观看精品| 精品国产18久久久久久洗澡| 男人透女人免费视频| 亚洲人成精品久久久久久| 偷拍精品一区二区三区| 国产激情综合五月久久| 琪琪久久久久日韩精品| 国产一级特黄a大片免费| 一区二区三区欧美| 久久电影视频| 96久久精品| 蜜臀av一级做a爰片久久| 国产主播在线观看| 在线色欧美三级视频| 国产乱论精品|