精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

思維鏈不存在了?紐約大學最新研究:推理步驟可省略

人工智能 新聞
思維鏈技術,可能要被推翻了!來自紐約大學的最新研究表明:大模型并沒有利用思維鏈的推理能力,它只是偷偷加了計算!

紅極一時的思維鏈技術,可能要被推翻了!

還在驚訝于大模型居然能夠利用思維鏈分步驟思考?

還在苦于不會寫思維鏈提示詞?

來自紐約大學的研究人員表示:「沒關系的,都一樣」,

推理步驟不重要,不想寫提示詞也可以不寫,用省略號代替就行了。

論文地址:https://arxiv.org/pdf/2404.15758

這篇文章的標題甚至直接用「Let’s think dot by dot」,來對標思維鏈的「Let’s think step by step」,展現了「省略號」的威力。

「點點點」的威力

研究人員發現,把思維鏈(Chain-of-Thought,CoT)推理中的具體步驟,替換成毫無意義的「...」,產生的推理結果也大差不差。

比如下面這個例子:讓模型數一下前6個數里面有幾個大于5。

如果直接拋出問題讓模型回答,結果會比較逆天:6個數數出來7個。

相比之下,使用思維鏈提示,模型會一步步比較大小,最終得到正確答案:「2<5,7>5,1<5,8>5,2<5,8>5,that's 3 digits」。

但更逆天的是本文使用的「玄學」方法:步驟不用寫了,只需要輸出同樣數量的「點」(dot),居然也不影響最后的結果。

——這并不是巧合,大量實驗證明了,后面兩種方法的性能接近。

也就是說,我們以為的模型性能提升是來自于「think step by step」,但實際上可能只是因為LLM拿到了更多個token的算力!

你以為模型是在思考,但其實是在燒烤。

——愚蠢的人類啊,居然妄圖用幼稚的例子教我如何推理,你可知我要的從來都只是計算。

「思維鏈從來就沒有存在過,將來也不會存在」(狗頭)。

文章的作者Jacob Pfau表示,這篇工作證明了,模型并不是受益于思維鏈帶來的語言推理,使用重復的「...」填充token可以達到跟CoT同樣的效果。

當然,這也引發了對齊問題:因為這個事實表明,模型可以進行CoT中不可見的隱藏推理,在一定程度上脫離了人類的控制。

網友震驚

文章的結論可以說是顛覆了我們長久以來的認知,有網友表示:學到了mask的精髓。

圖片

「這究竟意味著什么:模型可以在我們不知情的情況下使用這些token獨立思考。」

圖片

有網友表示,怪不得我打字總是喜歡用「...」

圖片

還有網友直接開始實戰測試:

雖然咱也不知道他的理解對不對~

不過也有網友認為LLM在思維鏈中進行隱藏推理是沒有根據的,畢竟大模型的輸出從原理上來說是基于概率的,而不是通過有意識的思考。

CoT提示只是將統計模式的一個子集顯式化,模型通過生成與模式一致的文本來模擬推理,但它們不具備驗證或反思其輸出的能力。

Think dot by dot

面對復雜問題,我們人類在潛意識里會進行分步驟的推理。

由此啟發,谷歌的研究人員在2022年發表了大名鼎鼎的Chain-of-Thought。

要求語言模型分步解決問題的方法,使模型能夠解決以前似乎無法解決的問題,顯著提高了LLM的性能,或者說挖掘出了LLM的潛力。

論文地址:https://arxiv.org/pdf/2201.11903

雖然一開始大家也不知道這玩意為啥能work,但是因為確實好用,便很快被廣泛傳播。

隨著大模型和提示詞工程的起飛,CoT成了LLM解決復雜問題的一大利器。

當然了,在這個過程中也有很多研究團隊在探索CoT的工作原理。

模型并沒有推理

思維鏈帶來的性能提升,究竟是模型真的學會了分步驟解決問題,還是僅僅因為更長的token數所帶來的額外計算量?

既然不確定邏輯推理起不起作用,那就干脆不要邏輯,把推理步驟都換成一定沒用的「...」,這里稱為填充(filler)tokens。

研究人員使用了一個「小羊駝」模型:具有4層、384個隱藏維度和6個注意力頭的34M參數Llama,模型參數隨機初始化。

這里考慮兩個問題:

(1)哪些類型的評估數據可以從填充token中受益

(2)需要什么樣的訓練數據來教模型使用填充token

對此,研究人員設計了2個任務并構建了相應的合成數據集,每個數據集都突出了一個不同的條件,在該條件下,填充token能夠為Transformer提供性能改進。

3SUM

先看第一個比較難的任務:3SUM。要求模型在序列中挑選滿足條件的3個數,比如3個數的和除以10余數為0。

在最壞的情況下,這個任務的復雜度是N的3次方,而Transformer層與層之間的計算復雜度是N的二次方,

所以,當輸入序列長度很大的時候,3SUM問題自然會超出Transformer的表達能力。

實驗設置了三組對照:

1. 填充token:序列使用重復的「. . .」作為中間填充,例如「A05

B75 C22 D13 : . . . . . . . . . . . . ANS True」。

每個點代表一個單獨的token,與下面的思維鏈中的token一一對應。

2. 可并行化的CoT解決方案,序列的形式為:「A05 B75 C22 D13 : AB 70 AC 27 AD 18 BC 97 BD 88 CD B ANS True」。

思維鏈通過編寫所有相關的中間求和,將3SUM問題簡化為一系列2SUM問題(如下圖所示)。這種方法將問題的計算量降低到了N的2次方——Transformer可以搞定,而且可以并行。

3. 自適應CoT解決方案,序列的形式為:「A15 B75 C22 D13 : A B C 15 75 22 2 B C D 75 22 13 0 ANS True」。

與上面方案中,將3SUM巧妙地分解為可并行化的子問題不同,這里希望使用啟發式方法來產生靈活的思維鏈,以模仿人類的推理。這種實例自適應計算,與填充token計算的并行結構不兼容。

從上圖的結果可以看出,不輸出填充token的情況下,模型的準確率總體上隨著序列變長而下降,而使用填充token時,準確率一直保持在100%。

2SUM-Transform

第二個任務是2SUM-Transform,只需要判斷兩個數字的和是否滿足要求,計算量在Transformer的掌控之中。

圖片

不過為了防止模型「作弊」,對輸入token就地計算,這里將輸入的每個數字移動一個隨機偏移量。

結果如上表所示:filler token方法的精度達到了93.6%,非常接近于Chain-of-Thought,而不使用中間填充的情況下,精度只有78.7%。

但是,這種改進是否只是由于訓練數據呈現的差異,例如通過正則化損失梯度?

為了驗證填充token是否帶來了與最終預測相關的隱藏計算,研究人員凍結了模型權重,僅微調最后一層注意力層。

上面的結果表明,隨著可用的填充token增多,模型的準確性也不斷提高,這表明填充token確實正在執行與3SUM預測任務相關的隱藏計算。

局限性

雖然填充token的方法很玄學、很神奇,甚至還很有效,但要說思維鏈被干翻了還為時尚早。

作者也表示,填充token的方法并沒有突破Transformer的計算復雜度上限。

而且學習利用填充token是需要特定訓練過程的,比如文中采用密集監督才能使模型最終收斂。

不過,一些問題可能已經浮出水面,比如隱藏的安全問題,比如提示詞工程會不會突然有一天就不存在了?

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-12-17 10:40:26

2023-03-02 11:44:08

AI技術

2025-11-07 01:33:00

AIMeta大模型

2024-12-13 08:25:59

DML操作SQL

2025-08-04 14:17:47

AI馬斯克模型

2024-07-22 08:03:55

2018-07-03 14:20:10

數據庫恢復備份

2010-01-05 13:52:02

2015-10-20 10:30:59

創業時機

2018-07-19 06:14:09

2021-01-25 07:21:24

GitHub 開源代碼下載

2023-09-12 08:02:13

viewport斷點

2009-09-12 09:34:18

Windows 7中國售價

2025-04-21 16:32:29

視覺模型AI

2025-02-07 14:08:45

2009-05-05 17:07:56

2020-11-03 10:23:22

云計算容器技術

2025-10-09 09:15:11

2009-09-02 08:40:01

Windows 7兼容性

2019-12-31 09:11:01

后臺Android系統
點贊
收藏

51CTO技術棧公眾號

性欧美精品高清| 国产精品爽爽久久久久久| 亚洲精品影片| 一区二区三区欧美| 国精产品99永久一区一区| 日本在线视频免费| 日韩影视高清在线观看| 欧美日韩亚洲91| 五月天国产一区| 亚洲天堂男人网| 欧美精品不卡| 亚洲精品黄网在线观看| 男操女免费网站| 麻豆网站在线免费观看| 成人高清视频在线观看| 国产精品日韩精品| 国产一卡二卡在线播放| 在线视频亚洲欧美中文| 亚洲人成在线播放网站岛国| 精品久久sese| 国产又粗又大又爽| 国产欧美在线| 免费av在线一区| 影音先锋制服丝袜| 盗摄牛牛av影视一区二区| 一本到不卡免费一区二区| 日本一道在线观看| 午夜黄色小视频| 九色|91porny| 免费不卡在线观看av| 国产又粗又猛又爽视频| 周于希免费高清在线观看| 久久无码av三级| 亚洲影院污污.| 国产高潮久久久| 国产中文一区| www.久久久久久.com| 欧美一级片黄色| 日本一区二区三区电影免费观看| 亚洲成人av一区二区| 在线观看成人av电影| 亚洲av成人无码久久精品老人| 精品一区二区三区在线视频| 国产99久久久欧美黑人| 日韩av片在线播放| 亚洲婷婷影院| 精品亚洲男同gayvideo网站| 中文字幕一区二区三区人妻在线视频| 中文字幕不卡三区视频| 一区二区三区四区在线免费观看 | 日韩在线你懂得| 欧美日韩精品国产| 国产乱子伦农村叉叉叉| 超碰在线中文字幕| 一区二区三区四区视频精品免费 | 中文字幕一级片| 在线观看视频免费一区二区三区| 久久综合久久88| 91香蕉视频污在线观看| 蜜桃一区二区三区| 亚洲人成在线电影| a天堂中文字幕| 色综合久久中文| 精品久久久久久久久久久久包黑料 | 亚洲人成精品久久久 | 在线视频中文字幕第一页| 国产精品视频免费| 国产私拍一区| 精品国产午夜福利在线观看| 国产精品99久久久久久成人| 久久99偷拍| 亚洲精品v欧美精品v日韩精品| 在线观看你懂的视频| 清纯唯美激情亚洲| 精品免费一区二区三区| 久久久久亚洲AV成人网人人小说| 亚洲高清视频一区二区| 伊人久久久久久久久久久| 久久一日本道色综合| 卡一精品卡二卡三网站乱码| 国产激情久久久久久熟女老人av| 日本免费观看网站| 久久精品国产91精品亚洲| 中文字幕中文乱码欧美一区二区 | 中文字幕日韩国产| 91av在线免费观看| 日韩一区二区在线免费观看| 国产日韩欧美精品一区| 精品亚洲免a| av中文在线| 久久人人爽人人爽人人| 分分操这里只有精品| 欧美va亚洲va| 久久草av在线| 亚洲a级精品| 爱搞国产精品| av成人毛片| 国产精品va在线| 一级黄色大毛片| 国产精品资源在线看| 国产精品免费视频一区二区| 日韩毛片在线一区二区毛片| 国产午夜精品久久久久久免费视| 中文字幕在线亚洲精品| 国产蜜臀在线| 在线免费观看日本一区| 成人一区二区三区仙踪林| 欧美性猛交xxxxx少妇| 日韩久久久久久久久久久久| 国产精品成久久久久三级| 亚洲精品aⅴ中文字幕乱码| 亚洲精品免费播放| 国产日韩一区| 亚洲欧美一级| seseavlu视频在线| 亚洲天堂手机在线| 欧美极品jizzhd欧美18| www黄色av| 日韩久久精品一区二区三区| 91成人免费观看网站| 国产丝袜精品第一页| 国产欧美日韩卡一| 视频一区中文字幕国产| 亚洲夜间福利| 欧美黑人粗大| 999精品视频在线观看播放| 亚洲欧洲在线一区| 亚洲综合成人婷婷小说| 主播福利视频一区| 超碰人人爱人人| 亚洲天堂手机| 欧美xfplay| 欧美亚洲色综久久精品国产| 亚洲精品四区| 国产精品久久久久免费| 国产日产一区二区| 精品福利视频导航| 粉嫩虎白女毛片人体| 国产一精品一av一免费爽爽| 亚洲欧美日韩天堂| 日韩 欧美 综合| 国产91色综合久久免费分享| 一区二区三区在线观看www| 一级黄色大片网站| 国产人与禽zoz0性伦| 少妇一级淫免费放| 精品视频在线观看一区| 国产亚洲自拍偷拍| 91成人精品网站| 久久成人精品视频| 亚洲精品日韩久久久| 欧美色道久久88综合亚洲精品| 国产精品萝li| 成人精品国产一区二区4080| 日本vs亚洲vs韩国一区三区二区 | 亚洲第一精品电影| 欧美在线观看你懂的| 久草在线在线精品观看| 中文字幕乱码在线播放| 偷拍自拍在线| 一级毛片视频在线| 亚洲私拍自拍| 欧美综合第一页| www.中文字幕| 国产精品午夜在线观看| 午夜欧美福利视频| 色777狠狠狠综合伊人| 国产精品久久久久久久av大片| 欧美拍拍视频| 欧美日韩精品中文字幕| 全黄一级裸体片| 亚洲黄色大片| 麻豆av一区二区| 久久亚洲精品爱爱| 色噜噜狠狠狠综合曰曰曰| 亚洲天堂男人网| 亚洲精品乱码久久久久久| 91高清国产视频| 欧美激情在线| 成人网在线观看| 波多野结衣在线播放| 日韩精品中文字幕一区| 久久露脸国语精品国产91| 久久蜜桃香蕉精品一区二区三区| 五月婷婷丁香综合网| 久久视频国产| 美日韩在线视频| 午夜18视频在线观看| 欧美午夜精品一区二区三区| 中文字幕在线看高清电影| 美国一区二区三区在线播放 | 精品国产一区二区三| 色婷婷视频在线观看| 亚洲精品综合久久中文字幕| 黄色大全在线观看| 国产传媒久久文化传媒| 逼特逼视频在线| 日韩一区二区三区免费播放| 成人亚洲综合色就1024| 成人黄色动漫| 色婷婷av一区二区三区在线观看 | 久久精品噜噜噜成人av农村| 日本中文字幕亚洲| 欧美一级色片| 国产精品国产三级国产aⅴ浪潮| 久久综合九色综合久| 日韩欧美亚洲国产精品字幕久久久| 日韩少妇裸体做爰视频| 国产日韩欧美激情| 国产一二精品视频| 青娱乐国产91| 欧美在线一级| 456亚洲影院| 亚洲精品蜜桃久久久久久| 欧美13videosex性极品| 一本色道久久综合狠狠躁篇的优点| 精品人妻一区二区三区麻豆91| 亚洲一区欧美一区| 免费视频91蜜桃| 国产精品资源站在线| 久久久久久久少妇| 国产精品www.| 综合操久久久| 日韩免费久久| 蜜桃视频在线观看成人| 色播一区二区| 国产精品激情av电影在线观看| 男女在线观看视频| 中文字幕亚洲第一| 少妇一级淫片日本| 亚洲国产成人porn| 在线观看亚洲网站| 久久久精品人体av艺术| 香蕉视频xxxx| 精品一区二区三区视频在线观看| 国产理论在线播放| 天堂午夜影视日韩欧美一区二区| 丝袜足脚交91精品| 精品国产乱码久久久久久蜜坠欲下 | www在线观看免费视频| www精品美女久久久tv| 美女久久久久久久久| 国产精品一区二区在线观看网站 | 国产在线精品一区在线观看麻豆| 成年网站在线播放| 在线国产欧美| 怡红院av亚洲一区二区三区h| 成人黄色小视频| 日韩高清专区| 首页亚洲中字| 精品999在线观看| 粉嫩久久久久久久极品| 成人午夜小视频| 成人a在线观看高清电影| 91精品国产91久久久久久| 丁香花在线观看完整版电影| 欧美华人在线视频| www 日韩| 成年人精品视频| 羞羞的网站在线观看| 亚洲亚裔videos黑人hd| 国产黄在线观看免费观看不卡| 亚洲国产精品久久久久秋霞不卡| 在线观看中文字幕av| 欧美美女喷水视频| 国产一区二区小视频| 日韩欧美在线视频观看| 无码日韩精品一区二区| 欧美午夜影院一区| 91国产免费视频| 欧美一区二区三区啪啪| 亚洲老妇色熟女老太| 亚洲国产精品人久久电影| www.中文字幕| 亚洲精品国产品国语在线| 欧美女子与性| 国产一区二区三区视频在线观看 | 黄色一级大片免费| 黄色在线一区| 日韩中文字幕二区| 日韩综合小视频| 日本中文字幕二区| 国产成人综合网站| 波多野结衣先锋影音| 久久久久国产精品免费免费搜索 | 国产精品人妖ts系列视频| 九九热最新地址| 亚洲欧美偷拍另类a∨色屁股| 亚洲欧美一区二区三区四区五区| 一卡二卡三卡日韩欧美| 欧美黑人猛猛猛| 色噜噜久久综合| 瑟瑟视频在线免费观看| 欧美日韩免费不卡视频一区二区三区 | 91麻豆国产视频| 亚洲成人黄色在线观看| 欧美日韩国产中文字幕在线| 在线丨暗呦小u女国产精品| 欧美精品videos另类| 欧美激情精品久久久久久免费印度| 在线视频cao| 成人a在线视频| 无码国模国产在线观看| 欧洲成人一区二区| 在线成人黄色| 亚洲免费黄色网| 91麻豆免费观看| 操人视频在线观看欧美| 日本免费在线视频| 久久免费成人精品视频| а√在线天堂官网| 久久久久久电影| 性生生活大片免费看视频| 成人精品小蝌蚪| 国产美女喷水视频| 中文字幕在线播放不卡一区| 中文字幕精品视频在线观看| 日韩一区二区三区四区五区六区 | 国产精品亚洲成人| 亚洲色图 激情小说| 国产理论在线| 国产中文字幕精品| 精品亚洲一区二区三区在线播放| 国产伦精品一区二区三区照片 | 加勒比视频一区| 丰满白嫩尤物一区二区| 中文字幕日韩av综合精品| 国产freexxxx性播放麻豆| 中文字幕 自拍偷拍| 日韩母乳在线| 最新国产成人在线观看| 国产z一区二区三区| 亚洲图片欧美另类| 黄色美女视频在线观看| 国产成人精品一区二区三区网站观看| 在线看日韩av| 成年女人免费视频| 女人高潮被爽到呻吟在线观看| 国产清纯美女被跳蛋高潮一区二区久久w | 欧美性欧美巨大黑白大战| 无码一区二区精品| 国产精品国产自产拍在线| 在线看成人av| 欧美妇女性影城| 国产高清一区在线观看| 欧美性视频精品| 日韩美女毛片| 自慰无码一区二区三区| 成人av片在线观看| 一级免费在线观看| 亚洲精品久久久久| 樱桃视频成人在线观看| 精品麻豆av| 欧美日韩天堂| 欧美精品欧美极品欧美激情| 精品女同一区二区三区在线播放 | 国产一区不卡在线| 国产成人免费在线观看视频| 色综合天天天天做夜夜夜夜做| 色哟哟在线观看| 国产精品久久久久久久久久99| 精品伊人久久久| 国产成人a亚洲精v品无码| 国产午夜精品久久| 妺妺窝人体色www聚色窝仙踪| 欧美系列一区二区| 在线视频三区| 国产精品美女在线观看| 欧美 日韩 国产 一区| 久久精品无码专区| 狠狠综合久久av一区二区小说| 国产免费永久在线观看| 国产精品一区二区久久国产| 国产videos久久| 国产自偷自偷免费一区| 中文字幕不卡的av| 中文字幕在线观看欧美| 国产丝袜精品视频| 草莓视频成人appios| 在线观看亚洲视频啊啊啊啊| 国产老女人精品毛片久久| 黑鬼狂亚洲人videos| 精品一区二区三区四区| 视频精品导航| 国产视频九色蝌蚪| 久久人人97超碰com| 国产精品无码专区av免费播放| 97精品国产97久久久久久| 蜜桃a∨噜噜一区二区三区| 伊人五月天婷婷| 亚洲美女视频在线观看| 神马一区二区三区| 国产精品一区二区久久久久| 91精品二区| 久久性爱视频网站| 欧美视频在线观看一区二区| 韩国成人免费视频| 久久免费99精品久久久久久| 韩国成人福利片在线播放| 精品一级少妇久久久久久久|