精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

研究人員發(fā)現(xiàn)奇怪現(xiàn)象:思考時(shí)間越長(zhǎng),大模型越笨

譯文 精選
人工智能
研究人員在周二發(fā)表的論文中寫道,“我們構(gòu)建的一系列評(píng)估任務(wù)發(fā)現(xiàn),延長(zhǎng)大推理模型(LRM)的推理長(zhǎng)度會(huì)降低其性能,即計(jì)算量與準(zhǔn)確率間存在反比例關(guān)系。”

Michael Nu?ez@MichaelFNunez

譯者 | 核子可樂(lè)

審校 | 重樓

Anthropic一項(xiàng)最新研究表明,AI模型耗費(fèi)更長(zhǎng)時(shí)間“思考”后表現(xiàn)未必更好,在某些情況下性能甚至?xí)@著下降。這一發(fā)現(xiàn),挑戰(zhàn)了AI行業(yè)推理浪潮的理論根基。

這項(xiàng)由Anthropic公司AI安全研究員Aryo Pradipta Gema及其他幾位研究人員主導(dǎo)的項(xiàng)目,發(fā)現(xiàn)了所謂“測(cè)試時(shí)計(jì)算反比例”跡象,即延長(zhǎng)大語(yǔ)言模型的推理長(zhǎng)度實(shí)際上會(huì)降低其在多種任務(wù)中的表現(xiàn)。這一發(fā)現(xiàn)可能對(duì)當(dāng)前強(qiáng)調(diào)模型推理能力的技術(shù)浪潮產(chǎn)生巨大沖擊。

研究人員在周二發(fā)表的論文中寫道,“我們構(gòu)建的一系列評(píng)估任務(wù)發(fā)現(xiàn),延長(zhǎng)大推理模型(LRM)的推理長(zhǎng)度會(huì)降低其性能,即計(jì)算量與準(zhǔn)確率間存在反比例關(guān)系。”

研究人員發(fā)現(xiàn)奇怪現(xiàn)象:思考時(shí)間越長(zhǎng),大模型越笨-AI.x社區(qū)研究人員發(fā)現(xiàn)奇怪現(xiàn)象:思考時(shí)間越長(zhǎng),大模型越笨-AI.x社區(qū)

研究團(tuán)隊(duì)成員包括Anthropic的Ethan Perez、Yanda Chen、Joe Benton以及多位學(xué)界合作伙伴。他們?cè)谒念惾蝿?wù)中開(kāi)展測(cè)試:包含干擾項(xiàng)的簡(jiǎn)單計(jì)數(shù)問(wèn)題、包含誤導(dǎo)性特征的回歸任務(wù)、復(fù)雜推理難題以及涉及AI安全問(wèn)題的場(chǎng)景。

Claude與GPT模型在擴(kuò)展處理下明確表現(xiàn)出推理失敗

研究結(jié)果顯示,主流AI系統(tǒng)中存在明顯的失敗模式。Claude模型“隨推理時(shí)間延長(zhǎng),會(huì)越來(lái)越容易受到無(wú)關(guān)信息的干擾”,而OpenAI的o系列模型“雖能抵御干擾項(xiàng),但會(huì)過(guò)度擬合問(wèn)題框架”。在回歸任務(wù)中,“擴(kuò)展推理會(huì)導(dǎo)致模型從合理的先驗(yàn)概率轉(zhuǎn)向虛假相關(guān)性”,不過(guò)提供示例能夠在很大程度上糾正這種行為。

更令企業(yè)用戶擔(dān)憂的是,所有模型在復(fù)雜推理任務(wù)中均表現(xiàn)出“擴(kuò)展推理性能下降”,“表明在執(zhí)行復(fù)雜推理任務(wù)時(shí)大模型難以保持專注”。

這項(xiàng)研究還提示了對(duì)AI安全性的擔(dān)憂。在一項(xiàng)實(shí)驗(yàn)中,當(dāng)給予Claude Sonnet 4更長(zhǎng)封閉場(chǎng)景推理長(zhǎng)度時(shí),它會(huì)“更多表現(xiàn)出自我保護(hù)”。

研究人員指出,“擴(kuò)展推理可能會(huì)放大令人擔(dān)憂的行為,Claude Sonnet 4就表現(xiàn)出更多自我保護(hù)行為。”

為何更長(zhǎng)AI處理時(shí)間并不能保證更佳業(yè)務(wù)產(chǎn)出

這項(xiàng)研究結(jié)果挑戰(zhàn)了業(yè)界的普遍認(rèn)知,即投入更多算力進(jìn)行推理可以持續(xù)提升AI性能。各大AI廠商已經(jīng)在“測(cè)試時(shí)計(jì)算”方面投入巨資,即允許模型延長(zhǎng)推理時(shí)間以解決復(fù)雜問(wèn)題,并將此作為增強(qiáng)能力的關(guān)鍵策略。

研究表明,這種方法可能會(huì)產(chǎn)生意想不到的后果。作者總結(jié)道,“雖然測(cè)試時(shí)計(jì)算擴(kuò)展對(duì)于提升模型能力仍有前景,但也可能會(huì)無(wú)意間強(qiáng)化推理模式中存在的問(wèn)題。”

對(duì)于企業(yè)決策者來(lái)說(shuō),這一發(fā)現(xiàn)意義重大。部署AI系統(tǒng)執(zhí)行批判性推理任務(wù)時(shí),組織應(yīng)當(dāng)謹(jǐn)慎校準(zhǔn)所分配的處理時(shí)長(zhǎng),而不可想當(dāng)然地認(rèn)為越長(zhǎng)越好。

簡(jiǎn)單問(wèn)題+過(guò)長(zhǎng)思考時(shí)間=難倒高級(jí)AI

研究人員還提供了反比例跡象的具體示例。在簡(jiǎn)單的計(jì)數(shù)任務(wù)中,他們發(fā)現(xiàn)對(duì)于涉及“生日悖論”之類的問(wèn)題時(shí),模型往往會(huì)嘗試應(yīng)用復(fù)雜的數(shù)學(xué)解決方案,而非直接給出簡(jiǎn)單答案。

例如被問(wèn)到“你有一個(gè)蘋果和一個(gè)橙子……你一共有幾個(gè)水果?”時(shí),隨著推理時(shí)間增加,復(fù)雜的數(shù)學(xué)干擾項(xiàng)會(huì)影響Claude模型的思考,甚至最終無(wú)法給出正確答案。

在使用真實(shí)學(xué)生數(shù)據(jù)的回歸任務(wù)中,模型最初關(guān)注的是最具預(yù)測(cè)影響力的因素(學(xué)習(xí)時(shí)間),但被給予更長(zhǎng)推理時(shí)間時(shí),模型則轉(zhuǎn)向其他關(guān)聯(lián)性較低的因素。

企業(yè)AI部署須了解推理模型的局限性

這項(xiàng)研究的出爐,恰逢各大科技企業(yè)競(jìng)相在AI系統(tǒng)中開(kāi)發(fā)日益復(fù)雜的推理能力。OpenAI的o1模型家族及其他“以推理為重點(diǎn)”的模型,代表著業(yè)界正在測(cè)試時(shí)計(jì)算擴(kuò)展中投入重大資源。

然而,研究結(jié)果表明簡(jiǎn)單擴(kuò)展方法可能無(wú)法帶來(lái)預(yù)期收益,反而引發(fā)新的潛在風(fēng)險(xiǎn)。“我們的研究表明,必須認(rèn)真評(píng)估不同推理長(zhǎng)度對(duì)于識(shí)別和解決大推理模型中故障模式的影響。”

此前的研究已經(jīng)發(fā)現(xiàn),AI的能力擴(kuò)展并不一定具備可預(yù)測(cè)性。該團(tuán)隊(duì)引用了旨在挑戰(zhàn)先進(jìn)模型的基準(zhǔn)測(cè)試BIG-Bench Extra Hard,并指出在現(xiàn)有基準(zhǔn)測(cè)試中“最先進(jìn)的模型在許多任務(wù)中取得了近乎完美的成績(jī)”,因此必須找到更為可靠的評(píng)估方法。

對(duì)企業(yè)用戶而言,這項(xiàng)研究強(qiáng)調(diào)了在生產(chǎn)環(huán)境中部署AI系統(tǒng)前,應(yīng)當(dāng)在不同推理場(chǎng)景及時(shí)間限制下進(jìn)行認(rèn)真測(cè)試。組織可能需要開(kāi)發(fā)出更細(xì)致的方法來(lái)分配算力,而非簡(jiǎn)單拉長(zhǎng)處理時(shí)間。

從更廣泛的層面來(lái)看,隨著AI系統(tǒng)變得越來(lái)越復(fù)雜,算力投入與性能之間的關(guān)系可能比我們之前理解的要更為復(fù)雜。在這個(gè)投入數(shù)十億美元以提升推理能力的領(lǐng)域,Anthropic的研究不啻于敲響了警鐘,提醒我們AI最大的敵人也許不是算力不足、而是過(guò)度思考。

原文標(biāo)題Anthropic researchers discover the weird AI problem: Why thinking longer makes models dumber,作者:Michael Nu?ez

責(zé)任編輯:姜華 來(lái)源: 51CTO內(nèi)容精選
相關(guān)推薦

2012-03-23 09:28:14

2014-12-25 09:51:32

2023-12-07 12:05:39

2023-07-28 12:13:28

模型語(yǔ)言性能

2013-06-08 09:23:20

2021-02-16 10:02:36

惡意擴(kuò)展安全插件網(wǎng)絡(luò)攻擊

2013-03-28 10:34:29

2025-02-06 07:26:35

2019-05-22 08:11:51

Winnti惡意軟件Linux

2014-11-07 10:37:57

2022-10-09 11:03:46

漏洞宜家智能燈泡

2011-08-23 13:37:47

2021-02-24 15:20:43

Windows 10Python命令

2022-02-25 23:54:43

人工智能數(shù)據(jù)計(jì)算

2020-08-12 08:08:02

安全漏洞數(shù)據(jù)

2015-03-10 11:12:42

2011-10-28 09:03:39

2021-03-02 09:42:25

跟蹤器密碼管理器密碼

2013-08-09 11:33:58

2021-03-31 09:17:46

Android惡意軟件攻擊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

五月天婷婷网站| 亚洲av成人精品一区二区三区| 日韩av中文| 国产精品一区二区在线观看不卡| 欧美精品久久久久久久| 国产福利短视频| 欧美人与性动交xxⅹxx| 国产精品天干天干在线综合| 91久久偷偷做嫩草影院| 日本熟伦人妇xxxx| 久久理论电影| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 久久先锋影音| 久久精品国产精品| 国产女主播喷水高潮网红在线| 成人国产精品久久| 在线中文字幕一区二区| 成人午夜免费在线视频| www视频在线观看免费| 狠狠色综合播放一区二区| 5566日本婷婷色中文字幕97| 亚洲综合久久av一区二区三区| 黄色欧美网站| 日韩欧美视频一区| 色综合天天色综合| 国产精欧美一区二区三区蓝颜男同| 日韩美女久久久| 亚洲7777| 秋霞欧美在线观看| 国产精品综合av一区二区国产馆| 国产成人亚洲综合91精品| 麻豆成人在线视频| 亚洲精品小说| 日韩中文理论片| 亚洲精品女人久久久| 91精品尤物| 91精品国产综合久久久久久漫画 | 1024手机在线视频| 久久理论电影| 最新国产成人av网站网址麻豆| 中文字幕在线观看的网站| 大型av综合网站| 欧美sm美女调教| 91视频免费入口| 精品一区二区三区在线观看视频| 欧美亚洲愉拍一区二区| 无码无遮挡又大又爽又黄的视频| 欧美激情网站| 精品日韩中文字幕| 欧美极品欧美精品欧美| 蜜桃av在线| 福利视频第一区| 久久无码高潮喷水| 巨茎人妖videos另类| 色美美综合视频| 亚洲成人福利在线观看| 69堂精品视频在线播放| 欧美私模裸体表演在线观看| 五月婷婷激情久久| 日日夜夜综合| 欧美一级黄色大片| 国产伦理在线观看| 欧美aaaaa级| 亚洲精品日韩久久久| 88久久精品无码一区二区毛片| 亚洲欧美成人vr| 亚洲天堂av在线免费| 91在线无精精品白丝| 久久99高清| 综合激情国产一区| 欧产日产国产v| 国产一区二区三区四区三区四 | 在线无限看免费粉色视频| 米奇精品一区二区三区| 亚洲综合另类小说| 国内外成人免费激情在线视频| 久久久久久视频| 欧美一区亚洲| 国语自产精品视频在线看| 五月婷婷中文字幕| 七七婷婷婷婷精品国产| 亚洲a在线播放| 丰满少妇被猛烈进入| 99r精品视频| 四虎永久国产精品| 在线三级中文| 欧美性猛交xxxx免费看漫画 | 久视频在线观看| 国产精品日韩欧美一区| 国产精品亚洲аv天堂网| 国产不卡av在线播放| 97超碰欧美中文字幕| 亚洲国产一区二区精品视频| 在线午夜影院| 日本韩国欧美三级| xxxx国产视频| 天天久久夜夜| 美日韩在线视频| 久久国产黄色片| 狠狠色丁香婷综合久久| 久久久精品有限公司| 在线观看免费高清完整| 亚洲电影第三页| 五月天激情视频在线观看| 97久久综合精品久久久综合| 正在播放欧美视频| 久久久国产高清| 国产综合色视频| 欧美日韩精品综合| 男男gaygays亚洲| 欧美亚洲国产bt| 性欧美丰满熟妇xxxx性久久久| 日韩电影一区| 性欧美长视频免费观看不卡| 97精品久久人人爽人人爽| 91免费观看视频| 亚洲理论电影在线观看| 日韩专区视频| 在线亚洲男人天堂| 精品人妻一区二区三区潮喷在线 | 国产原创精品| 污污片在线免费视频| 91黄视频在线| 中文乱码人妻一区二区三区视频| 亚洲成人精选| 国产精品中文久久久久久久| 男人天堂亚洲二区| 婷婷国产v国产偷v亚洲高清| 亚洲精品乱码久久久久久9色| 日韩精品一卡| 国产精品久久久久免费a∨大胸| 手机看片福利在线| 亚洲一区二三区| 97超碰人人看| 综合激情一区| 亚洲一区二区三区视频播放| 3p视频在线观看| 欧美午夜电影一区| 欧美三级视频网站| 日韩成人免费电影| 日本高清久久一区二区三区| 综合日韩av| 亚洲精品中文字幕女同| 欧美福利视频一区二区| 成人av网站免费| www.av毛片| 盗摄系列偷拍视频精品tp| 欧美黄色性视频| 精品久久久久成人码免费动漫| 亚洲三级免费观看| 欧美大片久久久| 亚洲深深色噜噜狠狠爱网站| 亚洲free性xxxx护士hd| 亚洲男同gay网站| 精品国产电影一区二区| 日干夜干天天干| 91视频你懂的| 国产精品久久久久9999小说| 欧美精品一二| 国产精品永久免费观看| 黄色网页在线播放| 日韩免费观看高清完整版| 免费在线观看黄视频| 懂色av一区二区在线播放| 91制片厂免费观看| 亚洲福利合集| 91成人精品网站| 日本在线丨区| 欧美性色aⅴ视频一区日韩精品| 欧美亚洲色综久久精品国产| 久国产精品韩国三级视频| 日韩国产精品毛片| 岛国成人av| 国产精品久久久久久久久久ktv | 国产福利在线免费| 欧美黄色免费| 欧美精品国产精品久久久| 国产精品蜜月aⅴ在线| 欧美精品制服第一页| 天天插天天干天天操| 在线观看日韩毛片| 国产探花在线播放| 久久久噜噜噜久久人人看| 午夜免费福利视频在线观看| 黄色成人91| 日本一区二区久久精品| 麻豆一二三区精品蜜桃| 欧洲精品在线视频| 九义人在线观看完整免费版电视剧| 欧美不卡123| 波多野结衣影片| 一区二区三区四区不卡在线 | 国产精品传媒视频| 视频免费在线观看| 免费成人小视频| 国内精品在线观看视频| 成人3d动漫在线观看| 国产伦精品一区二区三区在线 | 久久日韩视频| 国产视频精品久久久| 国产麻豆一精品一男同| 午夜精品久久久久久久久久久| 天天操天天干天天操天天干| 国产黄人亚洲片| 欧美日韩亚洲一二三| 午夜亚洲福利| 亚洲欧洲精品一区二区三区波多野1战4 | 久久一区二区电影| 国产一区二区三区黄视频 | 成人性教育av免费网址| 久久99亚洲热视| av黄色在线观看| 精品亚洲夜色av98在线观看| 国产wwwwwww| 欧美日韩国产小视频在线观看| 日韩在线视频免费播放| 亚洲精品国产a久久久久久| 在线观看免费黄色网址| 91麻豆国产精品久久| 亚洲成人福利视频| 久久草av在线| 免费看污黄网站| 小嫩嫩精品导航| 欧美视频在线免费播放| 欧美三级网页| 黄色录像特级片| 色综合天天爱| 亚洲欧美影院| 精品国产精品| 蜜桃视频成人| 亚洲另类春色校园小说| 激情伦成人综合小说| 午夜视频一区二区在线观看| 成人福利视频在线观看| 成人在线免费av| 国产精品久久久久久久久借妻| 国产精品av一区二区三区| 91av视频在线观看| 日韩精品美女| 992tv在线成人免费观看| 免费电影视频在线看| 欧美激情网友自拍| 麻豆蜜桃在线| 91wwwcom在线观看| 小视频免费在线观看| 欧美一二三视频| 亚洲一二三四| 日韩av电影中文字幕| gay欧美网站| 国产成人av在线播放| 日本电影欧美片| 国产精品久久二区| 日本一区二区三区中文字幕| 国产欧美日韩免费看aⅴ视频| 另类一区二区| 91亚洲精品一区二区| 欧美日韩黄色| 国产日韩欧美一区二区| 日韩福利视频一区| 日本一区二区三区免费看| 欧美色女视频| 麻豆md0077饥渴少妇| 国产精品草草| 激情婷婷综合网| 精品一区二区精品| 男人添女人荫蒂国产| 99久久婷婷国产综合精品| 我和岳m愉情xxxⅹ视频| 中文字幕久久午夜不卡| 欧美肥妇bbwbbw| 亚洲国产精品嫩草影院| 日韩精品一区二区亚洲av| 欧美色图免费看| 国产黄色高清视频| 亚洲精品自拍第一页| www在线播放| 欧美精品video| 日本美女一区| www.久久爱.cn| 国产精品最新| 男人的天堂视频在线| 尹人成人综合网| 久久综合伊人77777麻豆最新章节| 黄色小说综合网站| 手机在线成人av| 中文字幕永久在线不卡| 国产精品a成v人在线播放| 欧美主播一区二区三区美女| 99在线无码精品入口| 国产网站欧美日韩免费精品在线观看| 日本中文字幕视频在线| 国自产精品手机在线观看视频| 韩日精品一区| 国产日韩欧美一区二区| 91一区在线| 337p粉嫩大胆噜噜噜鲁| 国模一区二区三区白浆| 偷拍女澡堂一区二区三区| 国产精品三级视频| 中文字幕亚洲高清| 欧美一区二区三区四区在线观看| 天堂中文字幕在线| 欧美黑人狂野猛交老妇| av在线一区不卡| 久久精品午夜一区二区福利| 一区二区在线| youjizzxxxx18| 26uuu久久综合| 久久久久久天堂| 欧美久久久久久久久中文字幕| 亚洲av激情无码专区在线播放| 久久亚洲精品一区二区| 亚洲精品国产嫩草在线观看| 国产九区一区在线| 一区二区三区四区电影| 88av.com| www国产精品av| 日本视频www| 精品少妇一区二区三区在线视频 | 成人免费在线观看入口| 日本a级c片免费看三区| 亚洲国产成人精品女人久久久 | 国产在线观看一区二区三区| 亚洲丁香日韩| 人妻少妇精品久久| 国产69精品久久777的优势| av最新在线观看| 欧美日本在线观看| 自拍视频在线| 国产精品视频xxxx| 精品色999| 国产精品久久久久9999小说| 久久久久国产精品人| 91精品国产综合久久久蜜臀九色| 欧美刺激午夜性久久久久久久| 搞黄网站在线观看| 91色视频在线导航| 中文在线日韩| 免费观看黄网站| 亚洲一区二区三区激情| 风流老熟女一区二区三区| 九色成人免费视频| 91成人精品在线| 国产综合中文字幕| 99久久久久久99| 亚洲欧美自拍视频| 亚洲色图色老头| 成人免费黄色| 小说区视频区图片区| 精品系列免费在线观看| 国精品无码一区二区三区| 91精品国产综合久久国产大片| av毛片在线免费看| 动漫美女被爆操久久久| 亚洲精选一区| 日韩人妻一区二区三区| 在线视频综合导航| 999国产在线视频| 91美女高潮出水| 狠狠入ady亚洲精品经典电影| 国产黑丝一区二区| 色综合久久综合网97色综合| 大地资源中文在线观看免费版| 国产精品女主播| 欧美在线1区| 久久久精品人妻无码专区| 日本高清成人免费播放| 337p日本欧洲亚洲大胆鲁鲁| 亚洲精品欧美日韩| 亚洲毛片视频| 精品人妻无码一区| 91精品国产高清一区二区三区蜜臀| 亚洲第一图区| 久久久久久久久一区二区| 日韩专区在线视频| 丝袜美腿小色网| 精品一区二区三区四区| 久久99久久久精品欧美| 大陆极品少妇内射aaaaaa| 91免费观看视频| 91麻豆国产视频| 久久久久久网站| 国产欧美日韩影院| 中文字幕 欧美 日韩| 色婷婷av一区二区三区软件| 麻豆av在线导航| 久久婷婷开心| 狠狠色丁香九九婷婷综合五月| 国产一级视频在线观看| 国产亚洲综合久久| 亚洲日本va午夜在线电影| 精品久久久久久久免费人妻| 亚洲欧美综合另类在线卡通| 头脑特工队2免费完整版在线观看| 国产精品色婷婷视频| 一区二区亚洲| 成人信息集中地| 亚洲女人被黑人巨大进入al| 激情不卡一区二区三区视频在线| 久久婷婷五月综合色国产香蕉|