精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM為何頻頻翻車算術題?研究追蹤單個神經元,「大腦短路」才是根源

人工智能
大模型在數學問題上的表現不佳,原因在于采取啟發式算法進行數學運算的,通過定位到多層感知機(MLP)中的單個神經元,可以對進行數學運算的具體過程進行解釋。

由于缺少對運行邏輯的解釋,大模型一向被人稱為「黑箱」,但近來的不少研究已能夠在單個神經元層面上解釋大模型的運行機制。

例如Claude在2023年發表的一項研究,將大模型中大約500個神經元分解成約4000個可解釋特征。

而10月28日的一項研究,以算術推理作為典型任務,借鑒類似的研究方法,確定了大模型中的一個模型子集,能解釋模型大部分的基本算術邏輯行為。 

圖片圖片

論文地址:https://arxiv.org/abs/2410.21272

該研究首先定位了Llama3-8B/70B, Pythia-6.9B及GPT-J四個模型中負責算術計算的模型子集。

如圖1所示,少數注意力頭對大模型面對算術問題的正確率有顯著影響。第一個 MLP(多層感知機) 明顯影響操作數和操作符位置,而中間層和后期層的 MLP 將token信息投影到最后位置,提升正確答案的出現概率。

圖1:Llama3-8B中發現算術相關的模型子集圖1:Llama3-8B中發現算術相關的模型子集

該研究聚焦于單個神經元層面,發現了一組重要的神經元,它們實現了簡單的啟發式算法。只需要關注特定的極少量神經元,就能正確預測大模型進行算術運算的結果(圖2)。

圖2:大模型中每層神經元中只需要關注1.5%的少數子集,就能預測大模型進行四則運算的結果圖2:大模型中每層神經元中只需要關注1.5%的少數子集,就能預測大模型進行四則運算的結果

舉個例子:當輸入的提示詞為“ 226?68= ”時,神經元24|12439在結果介于150和180的減法提示下顯示出高激活值,可被視為一個啟發式算法。而每個啟發式算法識別一個數值輸入模式,并輸出相應的答案。

具體可分為兩種不同的激活模式:第一種直接啟發式指的是在某些神經元中,激活模式取決于兩個操作數,值向量編碼了算術計算的預期結果(圖 3b,c)。

第二種間接激活模式取決于單個操作數對應的神經元中,值向量通常編碼下游處理的特征,而不是直接的計算結果(圖3a)。

圖3:啟發式方法的可視化圖3:啟發式方法的可視化

神經元和運算的因果聯系

該如何確認特定神經元和相關數學運算之間存在因果關系?一種常見的方法是消融分析,即將大模型大模型中特定的神經元敲除,看看模型的效果會有何改變,結果如圖4所示。

圖4:四則運算中敲除對應的算術神經元后模型的性能對比圖4:四則運算中敲除對應的算術神經元后模型的性能對比

去掉了對應神經元后,模型的運算準確性無論加減乘除都顯著下降。

不僅如此,相比去除特定算術神經元時造成的性能下降,可以發現,去除隨機神經元的影響相對較小,而且這種效應在模型8B和70B不同參數量中普遍存在。

圖5:敲除與算術相關的啟發式算法的神經元(實線)相比與算術無關的相同數量的隨機神經元(虛線)圖5:敲除與算術相關的啟發式算法的神經元(實線)相比與算術無關的相同數量的隨機神經元(虛線)

上述結果表明,可僅根據其相關啟發式算法來識別對特定對大模型進行算術重要的神經元,也證明了屬于幾個啟發式算法的神經元與提示正確完成之間的因果關系。

此外,該結果還支持了啟發式算法集合的主張:即每個啟發式算法僅略微提高正確答案的幾率,但它們結合在一起,使得大模型以高概率產生算術題的正確答案。

大模型為何做不對算術題

Llama3-8B模型無法可靠地對每道算術題時給出正確的回答?;趩l式規則,該研究闡述了模型為何會做錯,可能的機制共有兩種:

第一,由于參數量的限制,大模型缺乏足夠的算術神經元,無法針對每一種情況都給出應對。

第二種原因是,可能存在回憶不完整的情況,比如某個啟發式規則對應的神經元沒有在運算時被觸發。

圖片圖片

圖6:隨機抽取了50個正確完成和50個錯誤完成的算術題目,考察大模型中被正確和錯誤激活的算術神經元個數

如圖6所示,在大模型回答正確及錯誤時,激活的算術神經元個數不存在差異,這不支持前述的第一種算術神經元個數不足的假設。

然而,在大模型回答正確的情況下,更多比例的正確神經元被激活了,而回答錯誤的案例中,應當被激活的神經元激活概率反而較小。

這意味著大模型在特定算術題上失敗的主要原因是對能得出正確答案的神經元缺少泛化能力,而不是算術神經元的數量不足。

「算術神經元」何時誕生

由于其訓練檢查點可供公眾獲取,該研究采用Pythia-6.9B來考察大模型過程中算術神經元的出現階段。

結果顯示,大模型在訓練過程中逐漸發展其最終的算術啟發式機制,且算術神經元在模型訓練早期就已出現。

圖7 :啟發式的算術神經元的百分比隨著訓練增加圖7 :啟發式的算術神經元的百分比隨著訓練增加

在模型訓練的不同階段,移除特定的啟發式神經元會大幅降低模型在所有訓練檢查點的準確性,這表明算術準確性主要來自啟發式,即使在早期階段也是如此。算術啟發式神經元與大模型算術能力的因果關系在整個訓練過程中都存在。

圖8:不同階段敲除算術神經元對大模型進行算術運算準確性的影響圖8:不同階段敲除算術神經元對大模型進行算術運算準確性的影響

結論

理解大模型如何進行數學運算,不僅可以打開大模型內部運行的黑箱,解釋它們為何在簡單的數學題上翻車,例如最著名的「9.11和9.8哪個大」。

這項研究告訴我們,并不是因為大模型缺少相關訓練,而是激活了錯誤的啟發式神經元,例如將這個問題當成了詢問哪個版本更大。

理解了大模型的算術運算,是依賴于啟發式方法集,而非單純的依靠記憶(背題目)或學會規則,這表明提高大模型的數學能力可能需要訓練和架構的根本性改變,而不是像激活引導這樣的小修小補。

對訓練過程的分析結果指出,大模型在訓練早期就學會了這些啟發式方法,并隨時間推移逐漸強化。這可能會導致模型過度擬合到早期的簡單策略,因此可作為之后優化方向的參考。

參考資料:https://arxiv.org/abs/2410.21272

責任編輯:武曉燕 來源: 新智元
相關推薦

2022-03-14 11:04:39

人工智能機器學習神經網絡

2022-02-15 15:20:26

計算神經元研究

2022-10-31 15:17:49

AI系統

2021-10-11 20:19:16

AI

2023-10-13 22:03:32

AI訓練

2024-03-13 08:03:44

LLM人工智能技術

2022-04-09 10:16:52

神經網絡深度學習AI

2021-06-01 09:39:24

人工智能機器學習技術

2021-02-25 14:05:43

技術計算機思維

2019-10-11 14:48:42

技術研發指標

2023-10-07 13:16:40

ChatGPT神經元模型

2020-01-23 15:19:26

谷歌Android開發者

2021-06-02 14:48:34

3DAI 人工智能

2023-08-21 10:48:25

2012-10-10 09:32:51

虛擬化

2023-03-15 15:18:22

神經網絡研究

2024-01-11 15:34:18

2022-02-08 15:07:37

AI機器學習電子

2018-04-25 09:07:41

人工智能神經網絡

2021-10-20 10:51:57

AI 數據人工智能
點贊
收藏

51CTO技術棧公眾號

日本一区二区三级电影在线观看| 日韩一级网站| 欧美精品一区二区三区高清aⅴ | 国产永久免费高清在线观看| 蜜臀精品一区二区三区在线观看 | 韩国av中文字幕| 日韩精品首页| 欧美日韩在线另类| 国产精品国产精品国产专区不卡| 国产无套丰满白嫩对白| 99视频精品全部免费在线视频| 欧美亚洲精品一区| 日本成人三级| 亚洲AV无码精品国产| 久久精品成人| 中文字幕日韩免费视频| 91成人在线观看喷潮蘑菇| 色婷婷综合久久久中字幕精品久久| 97se亚洲国产综合在线| 91在线观看免费观看| av图片在线观看| 欧美高清日韩| 亚洲精品在线观看网站| 天天干天天操天天做| 深夜av在线| 久久精品男人天堂av| 国产精品扒开腿做| 韩国av免费观看| 久久99国产成人小视频| 欧美一卡二卡在线观看| 欧美少妇一区二区三区| 91视频在线观看| 久久亚洲私人国产精品va媚药| 99精品国产一区二区| 中文字幕第三页| 亚洲欧美日韩专区| 97婷婷大伊香蕉精品视频| 99久久国产精| 国产精品成人国产| 亚洲免费av网站| 亚洲午夜精品久久久久久浪潮| 日本在线视频1区| 麻豆精品视频在线| 欧美激情亚洲精品| 久草资源在线视频| 午夜精品免费| 国产香蕉精品视频一区二区三区 | jazzjazz国产精品久久| 91精品一区二区三区久久久久久| 亚洲五码在线观看视频| 国产午夜精品久久久久免费视| 日本一区二区免费在线观看视频| 日本精品免费| 亚洲精品国产精品国| 久久精品一区二区国产| www.国产一区| 免费成人美女女在线观看| 日韩精品免费| 久久久精品中文字幕| 天海翼在线视频| 中国av一区| 亚洲欧洲视频在线| 精品国产一二区| 97视频一区| 欧美揉bbbbb揉bbbbb| 国产va亚洲va在线va| 不卡av免费观看| 黄色91在线观看| 青青视频免费在线观看| 国产日韩精品在线看| 国产成人精品亚洲午夜麻豆| 国产精品高潮在线| 亚洲一级片免费看| 国产呦精品一区二区三区网站| 91视频免费网站| 国产黄色片免费| 99久久婷婷国产精品综合| 成人做爰www免费看视频网站| 国产精品久久久国产盗摄| 久久这里只有| 国产日本欧美一区二区三区| av中文字幕第一页| 美女脱光内衣内裤视频久久影院| 1769国内精品视频在线播放| 久久久久久久福利| 一区二区三区导航| 午夜免费在线观看精品视频| 农村黄色一级片| 天天综合一区| 韩国精品美女www爽爽爽视频| 一区二区视频免费看| 亚洲国产综合在线看不卡| 日韩美女av在线免费观看| 国产在线观看成人| 视频一区欧美精品| 91久久在线播放| 国产精品久久影视| av一区二区三区在线| 午夜精品短视频| 亚洲欧美成人影院| 91黄色免费看| 国产精品入口免费软件| 国产精品视频首页| 亚洲人成五月天| 级毛片内射视频| 亚洲国产一区二区三区在线播放| 中文字幕在线日韩| 日本熟妇毛耸耸xxxxxx| 久久成人免费网| 成人欧美一区二区三区黑人孕妇| 欧美熟妇另类久久久久久不卡 | 亚洲国产精品一区在线观看不卡| 天堂av在线7| 1024亚洲合集| 国产精品久久国产| 国语对白在线刺激| 欧美日韩在线一区二区| 国产在线观看无码免费视频| 日韩在线麻豆| 欧美激情视频在线| 国产又粗又猛又黄又爽| 国产一区二区三区免费看| 欧美日韩最好看的视频| 欧美人体视频xxxxx| 天天综合网 天天综合色| 国产熟女高潮视频| 久久精品66| 久精品免费视频| 一区二区三区精彩视频| 中文字幕精品在线不卡| av电影一区二区三区| 精品裸体bbb| 日韩欧美第一区| 爱爱视频免费在线观看| 秋霞电影一区二区| 日本一区免费看| 涩涩涩视频在线观看| 亚洲第一天堂av| 久久免费在线观看视频| 国产乱对白刺激视频不卡| 精品一区二区三区视频日产| 国产粉嫩一区二区三区在线观看| 亚洲日本在线a| 做a视频在线观看| 日韩免费特黄一二三区| 国内精品久久久久影院 日本资源| 亚洲不卡在线视频| 国产乱妇无码大片在线观看| 欧美精品一区二区三区久久| 欧美激情20| 精品亚洲永久免费精品 | 欧美自拍偷拍午夜视频| 在哪里可以看毛片| 日本欧洲一区二区| 国产区一区二区三区| 黄页网站大全在线免费观看| 欧美电影免费观看完整版| 久久久无码精品亚洲国产| 懂色av噜噜一区二区三区av| 国产高清av在线播放| 久久国产精品色av免费看| 日韩中文字幕亚洲| 国产又黄又猛又爽| 亚洲综合图片区| 亚洲中文字幕一区| 亚洲综合色站| 成人在线免费网站| 男人av在线播放| 日韩一区二区三区视频在线观看| 成年人免费观看视频网站| 久久看片网站| 精品一区在线播放| 无人区在线高清完整免费版 一区二 | 97国产精品视频| 欧美亚洲日本| 亚洲成人动漫一区| 四虎影成人精品a片| 免费看欧美女人艹b| 青青草免费在线视频观看| 成人看片黄a免费看视频| 久久综合88中文色鬼| 亚洲欧美强伦一区二区| 色欲综合视频天天天| 一级免费黄色录像| 美腿丝袜亚洲色图| 久久男人资源站| 日本综合精品一区| 青草热久免费精品视频| 免费在线午夜视频| 在线不卡一区二区| 日韩男人的天堂| 国产精品对白交换视频 | 白嫩少妇丰满一区二区| 日韩欧美ww| 91av在线免费观看| 日本电影全部在线观看网站视频| 欧美三区免费完整视频在线观看| 天天看片中文字幕| 久久久久久久久久久电影| 天天操夜夜操很很操| 一区二区三区四区日韩| 精品一区二区三区国产| 高清一区二区| 国产999精品久久久影片官网| 1stkiss在线漫画| 国产午夜精品一区二区三区| 亚洲奶汁xxxx哺乳期| 亚洲国产sm捆绑调教视频| 影音先锋资源av| 亚洲人成免费| 看一级黄色录像| 精品国产一区二区三区av片| 国产午夜精品在线| 美女一区网站| 最新国产精品亚洲| 国产欧美一级片| 亚洲一区二区三区在线播放| 久久久午夜精品福利内容| 性欧美精品高清| 亚洲一区bb| 日本免费一区二区视频| 国产精品爱久久久久久久| 中老年在线免费视频| 尤物yw午夜国产精品视频明星| 亚洲中文字幕在线观看| 色综合咪咪久久| 日韩欧美三级视频| 中文字幕第一区二区| 性久久久久久久久久久久久久| 日本特黄久久久高潮| 北条麻妃在线观看| 99精品美女| 亚洲乱码国产乱码精品天美传媒| 色悠久久久久综合先锋影音下载| 国产成人av网| 男女在线视频| 一区二区在线视频| 日韩大胆视频| 欧美一区二区私人影院日本| 一级片aaaa| 欧美日韩一区不卡| 国产无码精品在线播放| 国产亚洲一区二区三区四区| 亚洲自拍偷拍一区二区| 91麻豆6部合集magnet| 污污网站在线观看视频| 美女在线视频一区| 欧美精品久久久久久久久久久| 欧美91视频| 国产免费裸体视频| 欧美先锋资源| 国产精品我不卡| 给我免费播放日韩视频| 国产精品久久一区二区三区| 韩国精品视频在线观看 | 国产不卡精品视频| 日韩免费电影网站| 国产精品欧美综合| 欧美日韩一二区| 中文字幕视频网| 一本大道综合伊人精品热热| 日本三级一区二区三区| 欧美猛男超大videosgay| 日韩手机在线观看| 中文字幕亚洲一区二区va在线| 性生交大片免费全黄| 久久久久久9999| 欧美日韩生活片| 久久香蕉国产线看观看99| 国产chinesehd精品露脸| av激情亚洲男人天堂| wwwww在线观看| 精品无人码麻豆乱码1区2区 | 国产av人人夜夜澡人人爽麻豆| 国产情侣一区| 黄色片在线免费| 久久午夜精品一区二区| 国产综合中文字幕| 欧美日韩三区| 亚洲av首页在线| 91精品蜜臀一区二区三区在线| 色一情一区二区三区四区| 日韩成人午夜| 在线观看福利一区| 在线播放日韩| a在线视频观看| 蜜桃一区二区三区在线| 极品白嫩少妇无套内谢| 久久亚洲综合av| 欧美色图亚洲视频| 亚洲激情校园春色| 亚洲欧美自拍视频| 欧美一区二区三区在线看| 五月婷婷免费视频| 久久九九亚洲综合| 一区二区三区电影大全| 91视频国产一区| 青草伊人久久| 91精品入口蜜桃| 日韩激情欧美| 日本日本精品二区免费| 欧美先锋影音| 免费一级特黄毛片| 久久99精品国产麻豆不卡| 中文字幕日韩三级片| 亚洲天堂免费在线观看视频| 澳门黄色一级片| 亚洲国产视频一区二区| 日韩免费一级片| 日韩一卡二卡三卡国产欧美| 福利视频在线看| 久久精品国产精品| 都市激情综合| 国产欧美韩日| 久久av网址| 亚洲一二三区在线| 欧美一区二区三区久久精品茉莉花| 日本精品www| 久久精品99久久久| 绯色av蜜臀vs少妇| 国产精品国产三级国产专播品爱网| www.国产高清| 欧美日韩国产综合一区二区| 99热这里只有精品在线| 一区二区三区视频免费在线观看| 天天在线视频色| 日韩免费视频在线观看| 四虎884aa成人精品最新| 亚洲巨乳在线观看| 日韩精品欧美成人高清一区二区| www.桃色.com| 亚洲图片欧美激情| 国产又粗又猛视频| 久久精品免费电影| 日本亚洲欧洲无免费码在线| 水蜜桃一区二区三区| 天堂久久久久va久久久久| 老鸭窝一区二区| 欧美视频在线观看免费| 香蕉视频免费在线看| 91精品国产91久久久久久| 国产精品久久久久久久久久白浆| 精品成在人线av无码免费看| 国产91丝袜在线播放0| 90岁老太婆乱淫| 色香蕉成人二区免费| 精品人妻一区二区三区四区不卡| 亚洲女同性videos| 特黄毛片在线观看| 亚洲free性xxxx护士白浆| 一区二区美女| 乱熟女高潮一区二区在线| 国产二区国产一区在线观看| 色综合伊人色综合网| 国产欧美高清在线| 成人h动漫精品一区二| 中字幕一区二区三区乱码| 亚洲综合一区在线| 精品国产www| 日韩中文字幕视频在线| 国产高清不卡| 色婷婷精品国产一区二区三区| 捆绑变态av一区二区三区| 爱爱的免费视频| 亚洲一区欧美一区| 色哟哟国产精品色哟哟| 欧美疯狂xxxx大交乱88av| 成人精品国产亚洲| 异国色恋浪漫潭| 美女在线视频一区| 精品自拍偷拍视频| 亚洲成在人线av| av在线日韩| 看全色黄大色大片| 久久这里只有精品首页| 中文字幕在线播放不卡| 欧美精品一区二区三区国产精品| 91蜜桃臀久久一区二区| 激情综合网婷婷| 亚洲色图在线播放| 国产精品无码白浆高潮| 欧美精品一区二区免费| 亚洲黄色录像| 亚洲精品视频三区| 精品国产精品三级精品av网址| 丰满人妻一区二区三区免费| 欧美专区日韩视频| 婷婷亚洲五月| 中文字幕一区二区三区人妻不卡| 欧美日韩国产高清一区二区| 国产美女情趣调教h一区二区| 牛人盗摄一区二区三区视频| 国内精品久久久久影院薰衣草| 日韩av一二三区| 久久精品国产欧美亚洲人人爽| 秋霞综合在线视频| 亚洲欧美天堂在线| 日韩欧美视频一区二区三区| 欧美日韩在线精品一区二区三区激情综| 国外视频精品毛片|