精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維

發(fā)布于 2025-4-23 07:02
瀏覽
0收藏

介紹

大型推理模型 (LRM) 在解決復(fù)雜問題方面表現(xiàn)出了令人印象深刻的能力,但它們常常難以處理人類憑直覺就能解決的簡單任務(wù)。這種悖論是名為 S1-Bench 的新基準(zhǔn)測試的核心,該基準(zhǔn)測試專門針對評估 LRM 中的“系統(tǒng) 1”思維能力。

與大多數(shù)側(cè)重于復(fù)雜推理任務(wù)的現(xiàn)有基準(zhǔn)測試不同,S1-Bench 考察了 LRM 如何有效地處理簡單、直觀的問題,這些問題應(yīng)該只需要最少的思考。該基準(zhǔn)測試表明,當(dāng)前的 LRM 傾向于“過度思考”簡單問題,從而導(dǎo)致效率低下,有時甚至降低準(zhǔn)確性。

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

S1-Bench 性能圖圖 1:各種 LRM 在 S1-Bench 上的性能比較,繪制了準(zhǔn)確率與平均響應(yīng) token 的關(guān)系。該圖表明,許多較大的模型會生成明顯更多的 token,但沒有相應(yīng)的準(zhǔn)確率提升,這表明它們在處理簡單任務(wù)時效率低下。

雙系統(tǒng)框架

該研究基于認(rèn)知心理學(xué)的雙系統(tǒng)框架,該框架將人類思維分為兩個系統(tǒng):

1.系統(tǒng) 1(直覺思維):快速、自動且毫不費力的處理,以最少的有意識思考來處理日常任務(wù)和模式識別。

2.系統(tǒng) 2(審慎思維):緩慢、費力且分析性的處理,解決需要仔細(xì)推理和逐步分析的復(fù)雜問題。

雖然人類會根據(jù)任務(wù)的復(fù)雜性自然地在這兩個系統(tǒng)之間切換,但 LRM 的主要設(shè)計和訓(xùn)練目標(biāo)是在系統(tǒng) 2 思維方面表現(xiàn)出色。當(dāng)它們遇到可以通過更直觀的方法受益的簡單任務(wù)時,這會產(chǎn)生效率低下。作者認(rèn)為,真正智能的系統(tǒng)應(yīng)該能夠根據(jù)任務(wù)要求動態(tài)選擇合適的認(rèn)知系統(tǒng)。

S1-Bench 設(shè)計與方法

S1-Bench 經(jīng)過精心設(shè)計,以確保其問題真正簡單直觀。該基準(zhǔn)測試包括 380 個問題,涵蓋四個主要類別和 28 個子類別,包括英語和中文。

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

S1-Bench 構(gòu)建過程圖 2:S1-Bench 的構(gòu)建工作流程,展示了生成、驗證和完善問題的迭代過程,以確保簡單性和準(zhǔn)確性。

基準(zhǔn)測試的構(gòu)建過程包括:

1.問題生成:創(chuàng)建跨多個類別的各種問題。

2.質(zhì)量控制:使用判別器過濾掉模棱兩可或復(fù)雜的問題。

3.簡單性驗證:驗證小型語言模型是否可以輕松回答問題,以確認(rèn)其簡單性。

4.迭代改進(jìn):修改過于復(fù)雜的問題,直到它們滿足簡單性標(biāo)準(zhǔn)。

S1-Bench 中的問題刻意簡短,大多數(shù)問題僅包含 6-17 個 token:

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

問題 Token 長度分布圖 3:S1-Bench 中問題 token 長度的分布,表明大多數(shù)問題簡潔明了。

S1-Bench 中的四個主要類別是:

1.推理問題:簡單的邏輯或數(shù)學(xué)問題(例如,“7減去7是多少?”)

2.知識問題:基本的事實查詢(例如,“化學(xué)家瑪麗·居里的性別是什么?”)

3.指令遵循:需要特定輸出格式或約束的任務(wù)

4.分析問題:簡單的分類或識別任務(wù)

評估指標(biāo)

該研究使用幾個關(guān)鍵指標(biāo)評估了 22 種不同的 LRM:

1.格式指標(biāo)

?L-Corr:衡量模型將思維過程與最終答案分離的程度

?S-Corr:評估對特定輸出格式要求的遵守情況

2.效率指標(biāo)

?ART(平均響應(yīng)Token數(shù)) :量化模型輸出的長度,較短的響應(yīng)表示更高的效率

3.準(zhǔn)確性指標(biāo)

?pass@1:衡量首次嘗試的答案是否正確

?acc@k:評估采樣 k 次并選擇最常見答案時的準(zhǔn)確性

這些指標(biāo)提供了對 LRM 在簡單任務(wù)上的效率和有效性的全面評估。

主要發(fā)現(xiàn)

該研究揭示了關(guān)于 LRM 處理簡單任務(wù)的幾個關(guān)鍵見解:

1.低效性:在解決相同的簡單問題時,LRM 生成的輸出比小型語言模型長 15.5 倍。這表明在處理直觀任務(wù)時存在顯著的低效率。

2.低準(zhǔn)確性:盡管采用了復(fù)雜的推理過程,但與小型模型相比,大型模型有時在簡單問題上獲得的準(zhǔn)確性較低。這表明過度思考實際上會阻礙在簡單任務(wù)上的表現(xiàn)。

3.與模型大小沒有明確的相關(guān)性:該研究發(fā)現(xiàn)模型大小與響應(yīng)長度之間沒有直接關(guān)系,表明低效率不僅僅是參數(shù)數(shù)量的函數(shù)。

4.任務(wù)特定的變化:LRM 在處理指令遵循問題時表現(xiàn)出最顯著的 token 低效率,這表明它們尤其難以將簡單的指令映射到簡潔的行動。

不同問題類別中 token 使用情況的綜合熱圖說明了這些低效率:

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

Token Usage Heatmap圖 4:熱圖顯示了每個模型在不同子類別中的 token 使用情況。較深的顏色表示使用的 token 更多,揭示了不同任務(wù)類型中的低效率模式。

過度思考分析

該研究提供了對 LRM 中“過度思考”現(xiàn)象的詳細(xì)分析。作者將模型響應(yīng)分解為兩個組成部分:

1.初始思考:用于啟動推理過程的 token

2.額外思考:在完成基本推理后生成的額外 token

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

Initial vs. Additional Thinking圖 5:比較了不同 LRM 之間的初始思考與額外思考,表明許多模型在不必要的額外思考上花費了不成比例的 token。

該研究發(fā)現(xiàn),大多數(shù) LRM 在處理簡單問題時會進(jìn)行多輪“解決方案”。這種迭代推理通常會引入冗余,因為模型會在不同的推理段中重復(fù)相似的信息。相似性分析表明,內(nèi)容相似性隨著每個額外的推理段而增加,表明信息價值正在降低:

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

Reasoning Redundancy Analysis圖 6:不同問題類型之間推理段的最大相似性得分,顯示隨著推理的進(jìn)行冗余度增加。

這種模式表明 LRM 缺乏一種有效的機制來識別它們何時達(dá)到了足夠的推理水平,并且應(yīng)該提供一個簡潔的答案。

錯誤模式

一個特別有趣的發(fā)現(xiàn)是,LRMs有時會在推理的早期階段得出正確的答案,但隨后會偏離并產(chǎn)生不正確的最終答案。錯誤分析揭示了幾種模式:

1.正確的思考,錯誤的結(jié)論:模型有時會在整個思考過程中進(jìn)行正確的推理,但卻莫名其妙地給出一個錯誤的最終答案。

2.不正確的中間結(jié)論:準(zhǔn)確率較低的模型通常在其推理鏈中包含不正確的步驟。

3.答案識別失敗:一些模型在推理過程中正確地提到了答案,但未能將其識別為最終答案。

S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

錯誤模式分析圖 7:錯誤模式分析,顯示了思考過程 (TP) 和最終答案 (FA) 之間的關(guān)系。該圖表揭示了模型在思考中提供正確信息但得出不正確最終答案的情況。

這些錯誤模式表明,LRMs 的擴展推理過程有時可能會引入混亂而不是清晰性,尤其是在應(yīng)該憑直覺回答的問題上。

簡單性預(yù)判

一個有趣的發(fā)現(xiàn)是,許多 LRMs 能夠識別出一個問題何時簡單,但它們?nèi)匀粫M(jìn)行冗長的推理過程。該研究分析了模型明確評論問題簡單性的案例:


S1-Bench:評估大型推理模型中的系統(tǒng) 1 思維-AI.x社區(qū)

簡單性預(yù)判分析圖 8:分析模型識別問題簡單性的能力以及對 Token 使用的影響。上面的圖表顯示了每個模型明確識別問題為簡單的頻率,而下面的圖表比較了有和沒有這種識別時的 Token 使用情況。

該分析揭示了模型識別簡單性的能力與其響應(yīng)簡單問題的行為之間存在脫節(jié)。即使模型明確承認(rèn)問題很簡單,它們通常仍然會產(chǎn)生冗長的響應(yīng)——這表明對簡單性的識別并不能有效地觸發(fā)更有效的響應(yīng)策略。

意義和未來方向

該研究指出了未來工作的一些重要意義和方向:

1.雙系統(tǒng) LRMs:研究結(jié)果強調(diào),需要能夠根據(jù)任務(wù)要求在系統(tǒng) 1 和系統(tǒng) 2 思考之間動態(tài)切換的 LRMs。這樣的模型將更有效率,并且在更廣泛的任務(wù)中可能更準(zhǔn)確。

2.利用預(yù)判:由于許多 LRMs 可以識別出一個問題何時簡單,未來的工作應(yīng)側(cè)重于開發(fā)允許模型利用這種識別來產(chǎn)生更簡潔響應(yīng)的機制。

3.訓(xùn)練數(shù)據(jù)考慮:作者認(rèn)為,這個問題可能源于訓(xùn)練數(shù)據(jù)強調(diào)對所有類型的問題進(jìn)行冗長的推理。未來的訓(xùn)練方法應(yīng)包括復(fù)雜問題的詳細(xì)推理示例和簡單問題的簡潔響應(yīng)示例。

4.更復(fù)雜的提示:研究表明,當(dāng)前的提示策略可能無法有效地指導(dǎo)模型根據(jù)任務(wù)復(fù)雜性調(diào)整其推理深度。開發(fā)更好的提示技術(shù)可能有助于解決過度思考問題。

5.認(rèn)知框架:作者建議開發(fā)更細(xì)致的認(rèn)知框架,使 LRMs 能夠更好地將其推理方法與任務(wù)要求相匹配。

結(jié)論

S1-Bench 代表了對 LRMs 的評估和理解的重要貢獻(xiàn),它強調(diào)了一個關(guān)鍵的局限性:過度思考簡單問題的趨勢。這種低效率不僅導(dǎo)致不必要的計算成本,而且還可能導(dǎo)致簡單任務(wù)的準(zhǔn)確性降低。

該基準(zhǔn)測試為評估當(dāng)前和未來大型語言模型的系統(tǒng) 1 思維能力提供了一個有價值的工具。通過量化大型語言模型與理想雙系統(tǒng)模型之間的性能差距,S1-Bench 激發(fā)了對更具認(rèn)知靈活性的 AI 系統(tǒng)的開發(fā),這些系統(tǒng)可以高效地處理簡單和復(fù)雜的任務(wù)。

研究結(jié)果表明,真正先進(jìn)的 AI 系統(tǒng)需要發(fā)展出根據(jù)任務(wù)復(fù)雜性動態(tài)調(diào)整其推理深度的能力——就像人類一樣。這代表著一個重大的挑戰(zhàn),同時也為人工智能的未來研究提供了一個令人興奮的方向。

本文轉(zhuǎn)載自??芝士AI吃魚??,作者:芝士AI吃魚

已于2025-4-23 10:03:14修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
国产一区二区三区精彩视频 | 欧美日韩一级二级| 日韩欧美国产二区| 国产女人18毛片18精品| 99精品福利视频| 亚洲最新视频在线| 久久久久久久久久久影视| 中文字幕乱码在线播放| 中文字幕一区日韩精品欧美| 成人av免费在线看| 91porny九色| 在线观看免费一区二区| 亚洲女人天堂色在线7777| 中文字幕 欧美日韩| 爱情岛论坛亚洲品质自拍视频网站| 久久美女艺术照精彩视频福利播放 | 亚洲自拍偷拍视频| 制服.丝袜.亚洲.中文.综合懂色| 91视频综合| 国产午夜精品久久久 | 国产成人精品影院| 国产精品成久久久久三级| 青娱乐在线视频免费观看| 奇米狠狠一区二区三区| 精品久久人人做人人爰| 五月婷婷丁香综合网| 成人黄色动漫| 亚洲免费av网站| 日韩av不卡在线播放| 嫩草影院一区二区| 九一九一国产精品| 国产精品大陆在线观看| 日韩av综合在线| 欧美在线黄色| 色香阁99久久精品久久久| 少妇精品一区二区三区| 波多野结衣欧美| 91麻豆精品国产91久久久久久| 久久久久久久少妇| 55av亚洲| 亚洲国产综合色| 午夜久久久久久久久久久| 日韩理伦片在线| 欧美激情中文不卡| 欧美亚洲免费在线| 特级丰满少妇一级aaaa爱毛片| 国产美女在线观看一区| 成人xxxxx| 中文字幕欧美人妻精品一区蜜臀| 久久一日本道色综合久久| 91av在线看| 日韩黄色一级大片| 亚洲久久在线| 欧美孕妇与黑人孕交| 日韩精品一区二区三| 一区视频在线看| 久久久久国产视频| 青青草在线观看视频| 午夜国产一区| 欧美极品美女电影一区| 久久久久久久中文字幕| 国产一区二区三区自拍| 久久的精品视频| 亚洲av鲁丝一区二区三区| 欧美一区二区三区另类| 欧美高清电影在线看| 国产在线精品观看| 亚洲永久视频| 国产精品h片在线播放| 丰满熟女人妻一区二区三| 免费高清成人在线| 91在线视频导航| 亚洲成人第一区| 成人av网在线| 日韩欧美一区二区三区久久婷婷| 99青草视频在线播放视| 亚洲男人电影天堂| 国产中文字幕乱人伦在线观看| 高清在线视频不卡| 欧美在线一区二区| 亚洲第一成肉网| 2023国产精华国产精品| 国产婷婷色综合av蜜臀av| 亚洲黄色免费视频| 女主播福利一区| 97在线视频国产| 91麻豆精品在线| 国产风韵犹存在线视精品| 国内精品久久久久久久果冻传媒| 青青草免费在线| 中文字幕视频一区二区三区久| 成人国产一区二区三区| 夜鲁夜鲁夜鲁视频在线播放| 欧美色欧美亚洲另类二区| 欧美视频亚洲图片| 性欧美lx╳lx╳| 久久精品国产亚洲一区二区| 久青草视频在线观看| 久久激情婷婷| 亚洲一区二区在线| 全色精品综合影院| 亚洲精品中文在线观看| 日本免费一级视频| 久久gogo国模啪啪裸体| 亚洲免费电影在线观看| 国产美女福利视频| 久久精品亚洲| 91视频99| 91在线观看| 香蕉加勒比综合久久| 香港日本韩国三级网站| 果冻天美麻豆一区二区国产| 最近的2019中文字幕免费一页 | 中文字幕无人区二| 国产精选一区| 久久免费视频在线观看| 一级黄色免费看| 91蜜桃在线观看| 欧洲精品视频在线| 欧美va在线观看| 亚洲国产精久久久久久| 欧美精品久久久久久久久46p| 男人天堂欧美日韩| 国产欧美亚洲日本| 新版中文在线官网| 欧美日韩国产一区二区三区地区| 久久人妻少妇嫩草av无码专区| 天天色天天射综合网| 国产不卡av在线| 天天射天天色天天干| 亚洲激情男女视频| 亚洲娇小娇小娇小| 日本三级在线播放完整版| 秋霞在线午夜| 色婷婷av一区二区三区软件| 中文字幕在线国产| 亚洲情侣在线| 国产一区二中文字幕在线看| 久久米奇亚洲| 欧美日韩国产页| 日本50路肥熟bbw| 国产一区二区中文| 444亚洲人体| 菠萝菠萝蜜在线视频免费观看| 欧美日精品一区视频| 日韩av在线看免费观看| 亚洲综合精品| 欧美人xxxxx| 在线中文字幕播放| 日韩激情在线视频| av中文在线播放| 99精品欧美一区二区三区综合在线| 日韩欧美视频免费在线观看| 国产一区二区| 久久国产精品久久久| 国产日韩欧美一区二区东京热 | 国产wwwwxxxx| 老司机午夜精品99久久| 亚洲精品一区二区三区蜜桃久| 九九热线视频只有这里最精品| 亚洲精品在线视频| 伊人中文字幕在线观看| 久久久久久一级片| 能看的毛片网站| 日韩电影免费网址| 亚洲一区二区三区四区视频| 麻豆传媒在线免费看| 91精品国产综合久久精品app| 亚洲欧美精品aaaaaa片| 国产精品996| 成人在线播放网址| 任你躁在线精品免费| 日本三级韩国三级久久| 69视频在线观看| 欧美一级高清大全免费观看| 国产污片在线观看| 91日韩在线专区| 九九九在线观看视频| 91成人国产| 国产精品18毛片一区二区| 男人久久天堂| 色噜噜国产精品视频一区二区| 国产av无码专区亚洲av| 亚洲成人av中文| 欧美 日韩 成人| 国产一区在线精品| 久久久久久久久久网| 精品中文一区| 91精品视频观看| 九色porny丨国产首页在线| 一区二区三区精品99久久 | 色是在线视频| 色香阁99久久精品久久久| 丁香六月色婷婷| 欧日韩精品视频| 久久影院一区二区| 欧美极品aⅴ影院| 一区二区三区四区影院| 日本va欧美va欧美va精品| 97久久国产亚洲精品超碰热| 视频一区中文| 国产传媒一区二区三区| 成人黄色免费短视频| 欧美乱大交xxxxx另类电影| 五月激情婷婷网| 777亚洲妇女| av大全在线观看| 亚洲丝袜精品丝袜在线| 全黄一级裸体片| 国产精品18久久久久| 麻豆传传媒久久久爱| 韩日在线一区| 一区二区在线不卡| 亚洲综合福利| 国产精品一区视频网站| 青青国产精品| 日韩免费不卡av| av资源网在线播放| 久久国产精彩视频| 日本不卡视频| 国产亚洲一区精品| 神马久久精品| 亚洲成年人影院在线| 国产成人精品a视频| 欧美丝袜自拍制服另类| 国产成人无码av| 亚洲成人av电影在线| 精品国产乱码久久久久久鸭王1| 欧美高清在线视频| 午夜在线观看一区| 26uuu亚洲综合色| 欧美双性人妖o0| 成人在线视频首页| 成人做爰69片免费| 国产精品夜夜爽| 亚洲一区二区三区四区精品| 久久精品99久久久| 爱情岛论坛vip永久入口| 亚洲一区二区三区四区五区午夜| www.夜夜爱| 欧美日韩一视频区二区| 粉嫩av一区二区三区天美传媒| 婷婷中文字幕一区| 影音欧美亚洲| 色喇叭免费久久综合网| 亚洲天堂电影网| 久久精品播放| 一区二区三区久久网| 97精品国产一区二区三区| 亚洲精品成人自拍| 日韩欧美三级| 中文字幕免费在线不卡| 久久精品影视| 糖心vlog在线免费观看| 欧美片第1页综合| 欧美乱做爰xxxⅹ久久久| 国产伊人精品| 人体内射精一区二区三区| 伊人狠狠色j香婷婷综合| 草草视频在线免费观看| 国产欧美日韩综合一区在线播放 | 狂野欧美性猛交| 国产精品热久久久久夜色精品三区 | 久久亚洲精品石原莉奈| 日本高清不卡在线观看| 在线观看毛片av| 欧美一区二视频| 黄色片网站免费在线观看| 亚洲国产97在线精品一区| 色久视频在线播放| 伊人青青综合网站| 快射视频在线观看| 欧美激情一级精品国产| 麻豆理论在线观看| 国产精品久久久av| 老司机亚洲精品一区二区| 国产精品免费一区二区三区| 欧美有码在线| 亚洲无玛一区| 欧美日韩影院| 三级4级全黄60分钟| 老司机免费视频一区二区| 中国男女全黄大片| 国产亚洲一区二区三区四区 | 国产精品欧美在线观看| 亚洲日本欧美在线| 亚洲午夜在线| 欧美一级片中文字幕| 国产一区二区网址| 五月开心播播网| 欧美激情一区二区三区不卡| 2021亚洲天堂| 一本大道久久a久久精品综合| 亚洲最大成人av| 亚洲成人a级网| 尤物在线视频| 韩国福利视频一区| 欧美亚洲福利| 久久久99爱| 婷婷精品进入| 男人揉女人奶房视频60分 | 一本到12不卡视频在线dvd| 成人午夜免费在线| 久久er99热精品一区二区| 91丝袜在线观看| 亚洲欧美偷拍三级| 久久久黄色大片| 欧美xfplay| av网站在线免费播放| 午夜精品视频在线| vam成人资源在线观看| 欧美日韩亚洲在线| 在线观看日韩av电影| 国产无遮挡猛进猛出免费软件| av成人动漫在线观看| 91高清免费看| 欧美三级视频在线| 色播色播色播色播色播在线| 欧美精品情趣视频| 亚洲国产一区二区久久| 欧美日韩国产精品一卡| 伊人久久成人| 丰满少妇一区二区三区专区| 国产精品女主播av| 国产精品免费无遮挡无码永久视频| 亚洲韩国欧洲国产日产av| 99自拍视频在线观看| 国产欧美在线视频| 精品久久视频| 可以在线看的黄色网址| 99久久精品国产精品久久| 久久久久久久九九九九| 欧美精品久久99久久在免费线| 成人影视在线播放| 国产成人亚洲综合91| 日韩美脚连裤袜丝袜在线| 久久久性生活视频| 成人黄色777网| 国产精品成人av久久| 日韩欧美成人激情| 在线欧美三级| 91视频免费网站| 香蕉国产精品| 国产又粗又长又爽又黄的视频| 国产精品久久毛片a| 亚洲综合视频在线播放| www亚洲精品| 祥仔av免费一区二区三区四区| 午夜精品亚洲一区二区三区嫩草| 久久永久免费| 一二三不卡视频| 色婷婷亚洲综合| 国产区视频在线播放| 国产精品视频免费观看www| 久久网站免费观看| 中文av字幕在线观看| 亚洲三级电影全部在线观看高清| 国产黄色片免费| 久久久久久久久久久网站| 国产精品久久久久久久久久白浆| 国产夫妻自拍一区| 91在线码无精品| 波多野结衣在线电影| 中文字幕av一区二区| 99精品女人在线观看免费视频| 色哟哟免费网站| www.av精品| 69国产精品视频免费观看| 国产香蕉97碰碰久久人人| 中文字幕成人| 免费在线看黄色片| 久久夜色精品一区| 亚洲一区二区三区高清视频| 九九热这里只有精品免费看| www.久久东京| 欧美日韩中文在线视频| 国产精品久久免费看| 黄色av免费观看| 日产精品久久久一区二区福利| 青青草国产成人a∨下载安卓| www.亚洲自拍| 激情懂色av一区av二区av| 国产区视频在线| 2020国产精品久久精品不卡| 亚洲茄子视频| 一二三四在线观看视频| 精品国免费一区二区三区| 伊人色综合一区二区三区影院视频| 天堂av一区二区| 国产成人福利片| 精品无码一区二区三区的天堂| 久久久国产精品亚洲一区| 女同久久另类99精品国产| 手机看片一级片| 亚洲国产视频在线| 国产高清视频在线观看| 超碰97在线资源| 美女视频一区在线观看| 亚洲精品77777| 久久精品在线播放|