精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓Qwen2.5 7B超越o1,微軟干的!MSRA推出小模型數學推理自我進化新方法

人工智能 新聞
通過代碼增強CoT、蒙特卡洛樹搜索(MCTS)等,rStar-Math能讓小·大模型在不依賴蒸餾教師模型的情況下,通過多輪自我進化的深度思維,掌握數學推理。

7B參數的Qwen2.5數學推理表現超過o1-preview,這是怎么做到的?!

靠的就是MSRA最新的創新算法,rStar-Math

通過代碼增強CoT、蒙特卡洛樹搜索(MCTS)等,rStar-Math能讓小·大模型在不依賴蒸餾教師模型的情況下,通過多輪自我進化的深度思維,掌握數學推理。

圖片

并且戰功赫赫:

在美國數學競賽AIME 2024測試中,rStar-Math平均解決了53.3%的難題(OpenAI o1-preview為44.6%)打敗所有其它開源大模型,一舉成為最聰明的高中生數學top20%。

在MATH基準測試中,rStar-Math將阿里開源大模型Qwen2.5-Math-7B的準確率,從58.8%拉升到90.0%;Qwen2.5-Math-1.5B的準確率從51.2%拉升到87.8%;Phi3-mini-3.8B的準確率從41.4%提高到86.4%

——這些成績全部全部超過了OpenAI o1-preview。

就說牛不牛吧!

小聲說,微軟最近有一股在小·大模型圈子里重拳出擊的態勢:昨天剛開源了目前最強的小·大模型,14B的phi-4;今天又推出了rStar-Math,論文中直指其面向小語言模型(SLM)

這個趨勢剛有點苗頭,立刻引得全網討論連連。

有網友不禁開始猜測:

咱就是說,有沒有一種可能,在固定計算預算的情況下,小·大模型其實在某些推理問題上,它就是搶過大模型呢?

圖片

rStar - Math怎么做到的?

Let’s 提問:

讓小語言模型能和o1的數學推理能力相媲美甚至超越,且無需從高級教師模型中蒸餾,它怎么做到的?

MSRA在論文中表示,這是通過蒙特卡洛樹搜索(MCTS)進行深度思考來實現的,并且,其中一個數學策略小模型在基于小模型的過程獎勵模型的指導下執行測試時搜索。

圖片

目前,業界普遍依賴自然語言生成的推理步驟來提升數學推理模型的能力。

這種方法很直給,但其關鍵在于訓練一個強大的策略模型來生成解決方案步驟,還需要訓練一個可靠的獎勵模型來進行準確評估。

然而上述兩個模型都依賴于高質量的訓練數據

眾所周知的壞消息是,高質量的數學推理數據在現在是非常非常稀缺的,同時高質量的合成數據也存在一定bug。

而且實驗過程表明,它容易造成許多不相關、不必要的步驟,或產生錯誤。

當這種浪費和失誤出現在復雜的數學問題中時,一般很難被察覺

現有的辦法,比如基于蒸餾的數據合成方法來訓練策略模型(如擴大GPT-4蒸餾的CoT數據),已經明顯的出現回報遞減,且最終展現的能力無法超過其他教師模型。

與此同時,截至今天,訓練可靠的PRM(Process Reward Model,過程獎勵模型)進行數學推理仍然是一個懸而未決的問題。

MSRA此次推出的rStar-Math,就引入了三項創新方法,來應對訓練兩個小模型的挑戰:

  • 代碼增強CoT數據合成方法
  • 過程獎勵模型訓練方法
  • 四輪自我思維深度進化

咱展開來說說~

代碼增強CoT數據合成方法

rStar-Math選擇使用代碼增強CoT來解決上述難題。

該方法執行廣泛的MCTS部署,從而生成具有自我注釋的MCTS Q值的逐步驗證推理軌跡。

具體來說,一個數學問題的求解,會在MCTS內被分解為多步生成

模型在生成每一步推理時,作為策略模型的哪個SLM會對候選節點進行采樣,不僅生成這一步的CoT思維臉解釋,還生成相對應的Python代碼。

為了驗證生成質量,只有成功執行Python代碼的節點才會被保留,從而減少中間步驟的錯誤,確保每一步推理的正確性。

圖片

在此基礎上,為了進一步確保推理步驟的質量,rStar-Math使用了MCTS來生成逐步推理軌跡(用來分解復雜的數學問題為多個單步生成任務)

大量的MCTS回滾會根據每個中間步驟對最終正確答案的貢獻,自動為其分配一個Q值。

有助于產生更多導致正確答案的軌跡的步驟將被賦予更高的Q值,并被認為具有更高的質量。

這確保了SLM生成的推理軌跡,是由正確、高質量的中間步驟組成的。

過程獎勵模型訓練方法

現階段,多數大模型在解決推理數學問題時,都面臨一個問題:

無法無法提供細粒度的步驟級反饋,以幫助其在推理過程中做出更優的選擇。

盡管使用了廣泛的MCTS部署,仍會出現Q值不夠精確的情況,這就導致無法對每個推理步驟進行評分。

為此,rStar-Math通過引入用于訓練充當過程偏好模型(PPM,Process Preference Model)的SLM,來可靠地為每個數學推理步驟預測獎勵標簽。

PPM的核心思想,是通過構建步驟級的正負偏好對來訓練模型,而不是直接依賴于精確的步驟級評分。

它根據Q值為每個步驟構建偏好對,并使用成對排名損失來優化PPM對每個推理步驟的分數預測,實現可靠的標記。

如上所述,Q值雖然不精準、含噪聲,但PPM可以利用它,可靠地區分正(正確)步驟和負(不相關 / 錯誤)步驟。

四輪自我思維深度進化

由于SLM能力較大模型更弱,團隊設計了四輪自我思維深度進化,以逐步生成更高質量的數據,并通過更具挑戰性的數學問題擴展訓練集。

值得注意的是,團隊首先選擇了一個包含747k個數學問題的開源數據集。

但在每一輪中,研究團隊沒有使用747k數學數據集中的原始解決方案,而是進行了廣泛的MCTS部署——

四輪中的每一輪,都使用MCTS生成逐步驗證的推理軌跡,然后將其用于訓練新策略SLM和PPM;然后又在下一輪中應用新模型,以生成更高質量的訓練數據。

圖片

四輪自我思維深度進化具體如下。

第一輪:

通過監督微調對基礎模型進行初步改進,為后續的自我進化奠定基礎。

改進后的模型表示為SLM-r1。

如表2所示,研究人員使用DeepSeek-Coder-V2-Instruct (236B)運行MCTS來收集SFT數據。

由于本輪沒有可用的獎勵模型,研究者對Q值使用終端引導的注釋,并將MCTS限制為8次推出,以提高效率。

為了獲得正確的解決方案,團隊選擇具有最高平均Q值的前2條軌跡作為SFT數據。

同時,團隊在這一輪中也訓練了PPM-r1。

這一輪的關鍵在于生成高質量的初始訓練數據,并利用這些數據對基礎模型進行微調。

第二輪:

訓練可靠的PPM-r2,通過PPM顯著提升模型推理能力。

在這一輪中,隨著策略模型更新到7B SLM-r1,團隊進行了廣泛的MCTS部署,以獲得更可靠的Q值注釋;除此之外,還訓練了第一個可靠的獎勵模型PPM-r2。

具體來說,研究團隊為每個問題執行16次MCTS部署。由此產生的逐步驗證推理軌跡表明,質量和Q值精度都有了顯著提高。

如表 4 所示,PPM-r2明顯比bootstrap輪次更有效。

圖片

此外,如表3所示,策略模型SLM-r2也如預期的那樣繼續改進,指導其在后續的推理中做出更好的選擇。

圖片

第三輪:

通過PPM增強的MCTS生成更高質量的數據,進一步提升模型的推理能力。

借助可靠的PPM-r2,研究人員在這一輪中執行PPM增強的MCTS以生成數據,從而獲得更高質量的軌跡。此處涵蓋訓練集中的更多數學和奧林匹克級別問題(詳細可見表2)

然后,研究者使用生成的推理軌跡和自我注釋的Q值,來訓練新策略SLM-r3和PPM-r3——這兩者都顯示出顯著的改進。

第四輪:

通過增加MCTS回滾次數,解決具有挑戰性的數學難題。

前第三輪后,雖然rStar - Math已經讓SLM在小學和MATH題目上提高成功率,但奧賽級別題目成績還是只有62.16%。

為此,團隊采用了一種簡單的策略,即對于在16次MCTS部署后未解決的問題,會額外執行64次部署。

如果需要,這個次數可以增加到128次。

此外,研究者們還使用不同的隨機種子進行多個MCTS擴展,最后將奧賽級別問題的成功率提高到80.58%。

圖片
△此處再貼一次表2,方便大家查閱

綜上,經過四輪自我進化,747k數學題的成績已經來到了90.25%。

剩下的未解決的問題中,很大一部分都是綜合問題。

研究者人工手動審查了20個問題的隨機樣本,發現其中19個問題被錯誤地標記為錯誤答案。

基于此,團隊得出結論:剩余的未解決的問題質量較低,因此自我進化的腳步終止在第4輪。

圖片

實驗評估與發現

下面的表5,顯示了rStar-Math與最先進的推理模型進行比較的結果。

圖片

有三個值得說道說道的觀察發現:

第一,rStar-Math 顯著提高了SLM的數學推理能力,以小得多的模型尺寸,實現了與OpenAI o1相當,甚至超過o1的性能。

例如,Qwen2.5-Math-7B最初在MATH上的準確率為58.8%,使用rStar-Math后,準確率顯著提高到90.0%,優于o1-preview和Claude 3.5 Sonnet,和o1-mini打了個平手。

在College Math基準測試中,rStar-Math后Qwen2.5-Math-7B的比o1-mini高出 2.7%。

在AIME 2024上,rStar-Math后的Qwen2.5-Math-7B得分為53.3%,不及o1-mini的56.7%。不過,7B模型在AIME I 和 II 中解決了8/15的問題,在最聰明的高中數學學生中排名前 20%。

而未解決的問題中,有8個是需要視覺里覺的幾何圖形題,這個功能目前rStar-Math還不支持。

圖片

第二,盡管使用較小的政策模型(1.5B-7B)和獎勵模型(7B),但rStar-Math的性能明顯優于最先進的System 2基線。

與使用相同的基本模型(Qwen2-Math-7B、Qwen2.5-Math-1.5B/7B)但獎勵模型 (Qwen2.5-Math-RM-72B) 大10倍以上的Qwen Best-of-N基線相比,rStar-Math始終將所有基本模型的推理準確性提高到最先進的水平。

即使與Qwen2.5-Math-72B-Instruct的策略模型大10倍以上的N-Best-of-N對比,使用相同數量的采樣解決方案,rStar-Math也在除GSM8K之外的所有基準測試中也超過了它。

第三,除了MATH、GSM8K和AIME等可能存在過度優化的知名基準測試之外,rStar-Math在其它具有挑戰性的數學基準測試中表現出很強的通用性。

包括但不限于奧賽基準、大學數學和中國高考數學考試 (Gaokao)

而且需要強調的是,rStar-Math訓練集主要來自公共數據集,并沒有針對這些基準測試進行特定的優化。

總的來說,實驗結果驗證了自進化、逐步驗證推理軌跡和PPM的有效性。

One More Thing

本研究的共同一作分別是MSRA的Xinyu Guan和Li Lyna Zhang。

Li Lyna Zhang是工作的項目leader,本博都畢業于中國科學技術大學,目前是MSRA系統與網絡組的高級研究員。

圖片

另一位共同一作,Xinyu Guan,在完成這項工作的時候是MSRA的實習生,這位同學當時還在北大讀書。

BTW,論文中另一位作者Youran Sun參與項目時也是MSRA實習生,這位同學則是清華er。

啊,年輕人的世界,又是實習生呢~

arXiv:https://arxiv.org/pdf/2501.04519

代碼和數據詳見GitHub:https://github.com/microsoft/rStar

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-01-10 12:58:37

2025-05-26 08:52:00

2025-07-21 09:11:00

2025-06-25 08:54:03

模型訓練AI

2025-02-27 08:00:00

DeepSeek大模型人工智能

2025-03-10 01:00:00

2025-01-10 09:25:00

模型數據微軟

2024-11-07 15:40:00

2024-09-24 11:01:03

2025-04-26 09:25:00

模型推理AI

2024-02-07 12:39:00

AI數據

2024-11-29 13:57:38

2025-11-04 08:42:27

2025-02-25 12:30:00

2024-12-13 13:04:13

模型Phi-4AI

2024-09-19 14:00:00

模型開源代碼

2025-04-16 15:28:31

模型AI數據

2024-11-07 22:59:36

2025-10-24 12:07:12

2025-04-29 08:05:44

點贊
收藏

51CTO技術棧公眾號

日韩一级性生活片| 91在线中文字幕| 欧美黑人欧美精品刺激| 麻豆精品蜜桃| 国产精品福利影院| 成人18视频| jizz国产在线观看| 欧美在线亚洲综合一区| 亚洲精选在线观看| 亚洲第一色av| a欧美人片人妖| 亚洲欧美一区二区三区孕妇| 久草热久草热线频97精品| 亚洲性生活大片| 夜夜爽av福利精品导航| 色琪琪综合男人的天堂aⅴ视频| 91精品国产高清91久久久久久| 原纱央莉成人av片| 一二三四社区欧美黄| 日本精品免费| 少妇无码一区二区三区| 精品在线免费观看| 日韩免费在线播放| 欧美精品一区二区成人| 日韩av久操| 日韩精品极品毛片系列视频| 男人操女人下面视频| 国产一区二区主播在线| 亚洲va韩国va欧美va精品| 色播亚洲婷婷| 亚洲色大成网站www| 国产精品911| 国产在线高清精品| 成人一二三四区| 一区二区高清| 欧美激情性做爰免费视频| 色欲人妻综合网| 99热国内精品| 久久国产一区二区三区| 亚洲成人黄色av| 香蕉精品久久| 日韩成人在线电影网| 高清中文字幕mv的电影| 麻豆一二三区精品蜜桃| 91麻豆精品国产自产在线| 一道本在线免费视频| 在线成人视屏 | 香蕉视频亚洲一级| 五月婷婷激情综合| 欧美精品久久久久久久自慰| 色呦呦视频在线观看| 亚洲精品国产无天堂网2021 | 黑丝一区二区三区| 欧美精品在线极品| 性色av无码久久一区二区三区| 色爱综合网欧美| 色偷偷av一区二区三区| 亚洲少妇xxx| 一区二区在线影院| 另类天堂视频在线观看| 澳门黄色一级片| 国内精品福利| 亚洲91精品在线观看| 国产精品第9页| 午夜在线a亚洲v天堂网2018| 人九九综合九九宗合| 五月婷婷激情视频| 免费看精品久久片| 92看片淫黄大片看国产片| 精品黑人一区二区三区在线观看| 国产成人精品三级| 国产一区二区免费电影| 香蕉人妻av久久久久天天| 久久丝袜美腿综合| 亚洲一区二区三区四区中文| 精品视频在线一区二区| 亚洲一本大道在线| 日韩精品一区二区三区久久| 456成人影院在线观看| 欧美区在线观看| 日本美女视频网站| 亚洲婷婷伊人| 久久精品视频va| 日韩免费av片| 日韩av在线播放中文字幕| 91精品久久久久久久久| 日本激情视频网站| 国产欧美精品区一区二区三区| 国产又大又长又粗又黄| 成人观看网址| 欧美日韩一本到| 污污免费在线观看| 色喇叭免费久久综合| 欧美高清视频在线观看| 一级片视频在线观看| 久久国内精品自在自线400部| 99re资源| 国产黄色片在线观看| 亚洲激情五月婷婷| 美女喷白浆视频| 天堂va欧美ⅴa亚洲va一国产| 日韩美女av在线| 国产极品视频在线观看| 在线欧美亚洲| 成人国产在线视频| 青青草视频免费在线观看| 亚洲欧美日韩国产手机在线| 国产成人无码精品久久久性色| 四虎永久精品在线| 国产网站欧美日韩免费精品在线观看| 免费三级在线观看| 人禽交欧美网站| 久久精品国产一区二区三区日韩| 老司机在线看片网av| 欧美日韩国产在线看| 亚洲视频在线不卡| 日韩精品中文字幕第1页| 68精品久久久久久欧美| av无码精品一区二区三区宅噜噜| 久久精品视频在线免费观看| 免费看毛片的网址| 国产成人免费视频网站视频社区 | 午夜在线视频一区二区区别| 成人免费网视频| 成人网视频在线观看| 精品国产91久久久久久| 亚洲黄色小说在线观看| 亚洲欧美在线专区| 91精品国产自产在线老师啪| av天在线观看| 日本道色综合久久| 一区二区三区免费在线观看视频| 国产精品videosex极品| 91网在线免费观看| 国产超级va在线视频| 欧美优质美女网站| 日韩影视一区二区三区| 美女日韩在线中文字幕| 久久综合久久久| 日本不卡网站| 亚洲另类欧美自拍| 日本在线播放视频| 91麻豆精品视频| 鲁一鲁一鲁一鲁一色| 欧美美女啪啪| 69视频在线播放| 日韩欧美在线观看一区二区| 岛国av一区二区三区| 亚洲一区二区三区四区五区六区| 亚洲人体偷拍| 久久亚洲精品欧美| 韩国成人在线| 日韩亚洲在线观看| 99热在线只有精品| 亚洲午夜久久久久久久久电影院 | 久草精品视频| 97在线看福利| 伦理片一区二区三区| 欧洲在线/亚洲| 污污视频网站在线免费观看| 麻豆91精品视频| 99精品视频网站| 精品福利一区| 日韩av大片免费看| a√资源在线| 91精品国产综合久久久久久久| 精品国产大片大片大片| 国产成人自拍网| 丁香花在线影院观看在线播放| 女同久久另类99精品国产| 欧美有码在线视频| 色影院视频在线| 日韩一级免费一区| 日韩欧美三级在线观看| 久久久另类综合| 一级黄色录像在线观看| 女同性一区二区三区人了人一| 波多野结衣久草一区| 乱馆动漫1~6集在线观看| 日韩精品在线影院| 在线免费观看一区二区| 一区二区三区日韩在线观看| 久久精品女同亚洲女同13| 日韩高清欧美激情| www.18av.com| 国产一区二区区别| 91视频网页| 日韩精品一区二区三区| 美女黄色丝袜一区| 色视频在线看| 欧美一区二区国产| 少妇高潮av久久久久久| 一区二区三区四区不卡在线 | 飘雪影院手机免费高清版在线观看 | 一区二区三区的久久的视频| 成人h动漫免费观看网站| 国产成人拍精品视频午夜网站| av中文字幕在线播放| 亚洲九九九在线观看| 精品区在线观看| 欧洲av一区二区嗯嗯嗯啊| 久久久久久久久精| 国产精品不卡在线| 右手影院亚洲欧美| 国产美女视频91| 91日韩视频在线观看| 国产一区视频在线观看免费| 亚洲第一综合| 亚洲资源网你懂的| 国产精品福利视频| 色诱色偷偷久久综合| 青草青草久热精品视频在线网站| 伊人影院在线视频| 在线日韩中文字幕| 青春有你2免费观看完整版在线播放高清| 日韩一区二区三| 中文字幕av资源| 日韩欧美国产免费播放| 国产午夜小视频| 亚洲美女免费视频| 美女视频久久久| 中文字幕欧美国产| 亚洲区自拍偷拍| 91原创在线视频| 91九色蝌蚪porny| 国产精品一级黄| 爽爽爽在线观看| 激情六月婷婷久久| 奇米影音第四色| 奇米影视在线99精品| 黄色国产精品视频| 国产一级久久| 日本wwww视频| 校园激情久久| 日韩久久一级片| 亚洲综合电影一区二区三区| a级黄色一级片| 影音先锋亚洲精品| 久草视频国产在线| 日韩午夜免费| 精品欧美一区免费观看α√| aa亚洲婷婷| 美女福利视频在线| 首页欧美精品中文字幕| 成人羞羞国产免费网站| 亚洲一区二区毛片| 国产精品少妇在线视频| 久久综合影视| 亚洲77777| 狠狠色丁香久久婷婷综合_中 | 日本国产一区| 成人亲热视频网站| 国内精品视频| 国产精品乱码| 色愁久久久久久| 欧美日韩大片一区二区三区| 国内精品视频在线观看 | 国产网站在线免费观看| 久久国产精品久久国产精品| 日本精品600av| 91精品国产777在线观看| 成人直播视频| 国产男人精品视频| 美女精品视频在线| 精品国产一区二区三区四区精华| 婷婷激情久久| 亚洲精品一区二区三区蜜桃久| 欧美韩国日本在线观看| 肉大捧一出免费观看网站在线播放 | 国产一区二区三区在线观看| 3atv一区二区三区| 手机看片一区二区| 中文字幕国产精品| 成人免费网站在线观看视频| 久久久在线免费观看| 波多野结衣久久精品| 国产日本欧美一区二区三区在线| 日本成人精品| 精品久久久久亚洲| 欧美大人香蕉在线| 精品久久一二三| 蜜臀久久99精品久久久画质超高清 | 欧美一区二区三区网站| 欧美高清www午色夜在线视频| 午夜久久久久久噜噜噜噜| 国产午夜精品理论片a级探花| 日本成a人片在线观看| 97视频免费看| 亚洲狼人综合| 久久国产精品 国产精品| 999视频精品| 黄色免费视频大全| 国产一区二区三区香蕉| 国产熟妇久久777777| 伊人一区二区三区| 岳乳丰满一区二区三区| 日韩av在线播放资源| 中文字幕在线免费| 97国产真实伦对白精彩视频8| 九九九精品视频| 久久久久久久有限公司| 天天做天天爱综合| 日韩av一二三四| 成人网在线免费视频| 亚洲av无一区二区三区| 精品福利在线视频| 亚洲精品一级片| 日韩在线播放一区| 色香欲www7777综合网| 国产一区二区三区av在线| 91精品国产91久久久久久黑人| 日韩一级在线免费观看| 99久久国产综合精品色伊| 18岁成人毛片| 精品污污网站免费看| 免费福利在线观看| 午夜精品福利电影| 亚洲综合色婷婷在线观看| 一区二区精品视频| 日韩高清欧美激情| 国产精品无码久久久久一区二区| 亚洲国产另类av| 国产美女免费视频| 久久久国产成人精品| 成人做爰免费视频免费看| 欧美另类网站| 午夜在线精品偷拍| 30一40一50老女人毛片| 五月婷婷欧美视频| 黄色www视频| 国产69精品久久久久9999| 久久中文字幕一区二区| 一级一片免费播放| 久草热8精品视频在线观看| 国产精品久久久视频| 91黄视频在线| 黄色片在线免费看| 国产91在线播放九色快色| 中日韩免视频上线全都免费| 久久久久久久中文| 91免费精品国自产拍在线不卡| 日本少妇毛茸茸高潮| 精品99久久久久久| 爱看av在线入口| 国产综合第一页| 午夜一级久久| 国产jjizz一区二区三区视频| 色婷婷综合中文久久一本| 国产对白叫床清晰在线播放| 国产mv久久久| 欧美韩日一区| 在线观看视频你懂得| 一区二区三区四区不卡在线| 免费看日韩av| 2019中文字幕在线观看| 欧美精品第一区| 可以免费在线看黄的网站| 欧美国产乱子伦| 亚洲最新av网站| 欧美激情免费观看| 欧美人与动xxxxz0oz| 黑森林福利视频导航| 国产欧美精品在线观看| 97精品人妻一区二区三区| 美女福利精品视频| 琪琪久久久久日韩精品| 久久久久免费精品| 中文字幕中文乱码欧美一区二区| 99久久精品国产一区色| 欧美激情精品久久久久久蜜臀| 精品中国亚洲| 日韩爱爱小视频| 一区二区三区久久久| 日本天堂在线| 成人av番号网| 亚洲东热激情| 国产福利在线导航| 精品国产1区二区| 亚洲精品一区三区三区在线观看| 日本特级黄色大片| 91在线云播放| 国产精品久久久久久久一区二区| 欧美激情亚洲国产| 日韩精品一区二区久久| 波多野结衣办公室双飞| 日本韩国欧美一区二区三区| www视频在线免费观看| 免费一区二区三区在在线视频| 久久精品国产网站| 日韩福利片在线观看| 色噜噜亚洲精品中文字幕| 国产精品45p| 亚洲一区在线不卡| 五月天网站亚洲| av网址在线看| 日韩尤物视频| www.66久久| av网站在线免费看| 国产裸体写真av一区二区| 亚洲乱码久久|