精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

xLSTM:拳打Transformer,腳踢M(jìn)amba?! 原創(chuàng)

發(fā)布于 2025-2-17 07:53
瀏覽
0收藏

xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)

大模型技術(shù)論文不斷,每個(gè)月總會(huì)新增上千篇。本專欄精選論文重點(diǎn)解讀,主題還是圍繞著行業(yè)實(shí)踐和工程量產(chǎn)。若在閱讀過程中有些知識(shí)點(diǎn)存在盲區(qū),可以回到如何優(yōu)雅的談?wù)摯竽P椭匦麻喿x。另外斯坦福2024人工智能報(bào)告解讀為通識(shí)性讀物。若對(duì)于如果構(gòu)建生成級(jí)別的AI架構(gòu)則可以關(guān)注AI架構(gòu)設(shè)計(jì)。

記得在《重新審視神經(jīng)網(wǎng)絡(luò)》這篇文章中提及,任何人都可以構(gòu)建自己心目中的神經(jīng)網(wǎng)絡(luò)。在Transformers、Mamba、KAN之后,長(zhǎng)短期記憶 (LSTM) 架構(gòu)的發(fā)明者Sepp Hochreiter和他在NXAI的團(tuán)隊(duì)推出了一種稱為擴(kuò)展LSTM (xLSTM) 的新變體。

1.xLSTM的背景

LSTM在自然語音處理的領(lǐng)域影響巨大,但它也有局限性。在一些特殊的任務(wù)上,比如最臨近鄰搜索的時(shí)候,在記憶細(xì)胞的更新方面就頗有壓力。來自ELLIS、LIT AI實(shí)驗(yàn)室、奧地利林茨NXAI實(shí)驗(yàn)室的研究人員希望通過解決LSTM語言模型的局限性來增強(qiáng)LSTM。

改進(jìn)點(diǎn)有不少,小編認(rèn)為沒有LSTM的基礎(chǔ)很難完全看得明白。因此決定初看改進(jìn)點(diǎn)之后,將一些基本的知識(shí)點(diǎn)做回顧,否則只會(huì)走馬觀花。xLSTM的改進(jìn)點(diǎn):

引入具有適當(dāng)歸一化和穩(wěn)定技術(shù)的指數(shù)門控(可以理解為激活函數(shù))。

修改LSTM記憶結(jié)構(gòu),推出兩種記憶細(xì)胞。第一種是sLSTM,它具有標(biāo)量記憶、標(biāo)量更新和新記憶混合的能力,第二種是mLSTM,它擁有矩陣記憶,而且這些記憶可以通過協(xié)方差更新且全部具備并行運(yùn)算

將上面的LSTM擴(kuò)展體結(jié)合殘差網(wǎng)絡(luò)設(shè)計(jì)模式產(chǎn)生xLSTM塊,然后將這些塊堆疊到xLSTM架構(gòu)。

xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)

和Transformer和狀態(tài)空間模型相比,指數(shù)門控和修改后的記憶結(jié)構(gòu)增強(qiáng)了xLSTM的性能,無論是在性能還是擴(kuò)展方面表現(xiàn)尚可。這些突破讓LSTM長(zhǎng)期在大語言模型上的瓶頸得到解決,也許未來可能會(huì)成為新的大語言技術(shù)巨頭。

Transformer只是一種大語言模型的架構(gòu),核心還是注意力機(jī)制,然而計(jì)算的復(fù)雜度還是擺在那兒。有不少的競(jìng)爭(zhēng)者例如Synthesizer、Linformer、Linear Transformer和Performer專注于線性開銷的注意力技術(shù)。狀態(tài)空間模型 (SSM) 因其上下文長(zhǎng)度的線性也備受關(guān)注,S4、DSS、BiGS和Mamba異軍突起。具有線性單元和門控機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 也在掙扎,HGRN和RWKV。xLSTM則利用協(xié)方差更新規(guī)則、記憶混合和殘差堆疊架構(gòu)進(jìn)行關(guān)鍵組件的增強(qiáng),不容小覷。

在xLSTM用于語言建模的實(shí)驗(yàn)評(píng)估中,xLSTM的功能在形式語言、聯(lián)想回憶任務(wù)和遠(yuǎn)程競(jìng)技場(chǎng)場(chǎng)景上進(jìn)行了測(cè)試。與現(xiàn)有方法的比較揭示了xLSTM 在驗(yàn)證困惑度方面的優(yōu)越性。

消融研究強(qiáng)調(diào)了指數(shù)門控和矩陣記憶在xLSTM性能中的重要性。對(duì)300B 個(gè)token進(jìn)行的大語言建模驗(yàn)證了xLSTM的有效性,顯示了其在處理長(zhǎng)上下文、下游任務(wù)和多樣化文本域方面的魯棒性??s放行為分析表明,隨著規(guī)模的增加,xLSTM與其他模型相比具有良好的性能。隨著序列長(zhǎng)度的增加,xLSTM架構(gòu)的時(shí)間復(fù)雜度為O(N),內(nèi)存復(fù)雜度為O(1),這點(diǎn)比Transformer更加高效。

2.指數(shù)門控

xLSTM論文中引入的指數(shù)門控機(jī)制是對(duì)LSTM中使用的傳統(tǒng)sigmoid門控的重大改進(jìn)。這里要給大家科普一下,模型輸出數(shù)值一般會(huì)經(jīng)過激活函數(shù),sigmoid是其中的一種,任何輸入都會(huì)得到0~1期間的數(shù)值。一般在LSTM中,0就代表著不通過,1代表允許通過。那么門控的意思大白話就是門閥,它決定著信息的穿透度。




xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)







xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)




上圖就對(duì)比了原來LSTM和sLSTM的運(yùn)算公式,新的里面由σ函數(shù)被替代為exp函數(shù)。原論文對(duì)于替換的解釋是由此增強(qiáng)了模型在處理新信息時(shí)能有效修改和更新其記憶的能力。

在傳統(tǒng)的 LSTM 中,sigmoid函數(shù)限制了模型對(duì)記憶單元狀態(tài)進(jìn)行實(shí)質(zhì)性改變的能力,特別是當(dāng)門值接近0或1時(shí)。這種限制阻礙了LSTM快速適應(yīng)新數(shù)據(jù),并可能導(dǎo)致低效的記憶更新。

xLSTM通過用指數(shù)激活函數(shù)替換sigmoid激活函數(shù)來解決此問題。指數(shù)門控允許記憶細(xì)胞狀態(tài)發(fā)生更明顯的變化,(指數(shù)函數(shù)的取值范圍0~+∞)使模型能夠快速整合新信息并相應(yīng)地調(diào)整其記憶。歸一化器有助于穩(wěn)定指數(shù)門控并維持輸入門和遺忘門之間的平衡。

3.矩陣記憶

xLSTM論文的另關(guān)鍵貢獻(xiàn)是引入了矩陣記憶體(內(nèi)存,或者稱之存儲(chǔ)器),它取代了傳統(tǒng) LSTM中使用的標(biāo)量存儲(chǔ)單元。在LSTM中,存儲(chǔ)單元由單個(gè)標(biāo)量表示,約束了每個(gè)時(shí)間步可以存儲(chǔ)和處理的信息量。這種局限性可能會(huì)阻礙模型捕獲和保留復(fù)雜依賴關(guān)系和長(zhǎng)期信息的能力。

xLSTM通過采用矩陣存儲(chǔ)器突破這一限制,其中每個(gè)存儲(chǔ)器單元由矩陣而不是標(biāo)量表示。從標(biāo)量?jī)?nèi)存到矩陣內(nèi)存的轉(zhuǎn)變顯著增強(qiáng)了模型存儲(chǔ)和處理豐富的高維信息的能力。

矩陣內(nèi)存允許xLSTM捕獲輸入數(shù)據(jù)中更復(fù)雜的關(guān)系和依賴關(guān)系。它使模型能夠更全面地表示上下文和長(zhǎng)期依賴性,從而提高需要理解和生成復(fù)雜序列的任務(wù)的性能。

4.可并行架構(gòu)

xLSTM最重要的進(jìn)步是引入了可并行架構(gòu),它解決了傳統(tǒng)LSTM的主要限制。在傳統(tǒng)的LSTM中,令牌的處理是按順序執(zhí)行的,其中每個(gè)令牌一次處理一個(gè),這限制了模型利用并行性的能力,并導(dǎo)致訓(xùn)練和推理時(shí)間變慢。xLSTM 架構(gòu)引入了mLSTM(矩陣內(nèi)存LSTM)和sLSTM(標(biāo)量 LSTM)塊的靈活組合,從而實(shí)現(xiàn)令牌的并行處理。



xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)





xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)



mLSTM塊

sLSTM塊

mLSTM被設(shè)計(jì)為同時(shí)對(duì)整個(gè)令牌序列進(jìn)行操作,從而實(shí)現(xiàn)類似于 Transformer 模型實(shí)現(xiàn)的并行性的高效并行計(jì)算。主要還是利用矩陣存儲(chǔ)機(jī)制,使它們能夠并行捕獲和處理所有令牌的豐富、高維信息。這種并行處理能力顯著加快了訓(xùn)練和推理過程,使 xLSTM 比傳統(tǒng) LSTM 的計(jì)算效率更高。

另一方面,sLSTM 則被設(shè)計(jì)為保留了傳統(tǒng)LSTM的順序處理性質(zhì),允許模型捕獲對(duì)于特定任務(wù)可能很重要的某些順序依賴性。在 xLSTM 架構(gòu)中可以靈活的以不同比例堆疊mLSTM和sLSTM塊,提供了并行性和順序建模之間的平衡,從而能夠適應(yīng)各種語言建模任務(wù)。

本文轉(zhuǎn)載自 ??魯班模錘??,作者: 龐德公



?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
已于2025-2-17 10:26:30修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲欧洲另类国产综合| 狂野欧美一区| 精品国产99国产精品| 性做爰过程免费播放| 国产福利免费视频| 中文欧美日韩| 上原亚衣av一区二区三区| 91香蕉国产线在线观看| 国产在线精彩视频| 91在线精品一区二区| 国产精品久久久久久久av大片| 成年人在线免费看片| xxxxx.日韩| 亚洲美女视频一区| 欧美不卡三区| 国产福利第一页| 日韩在线观看一区二区| 久久伊人免费视频| 精品少妇一区二区三区免费观| 免费一级欧美在线观看视频| 天天色综合天天| 一区二区精品在线观看| 婷婷在线观看视频| 国产乱子伦一区二区三区国色天香| 97超级碰碰碰| 欧美日韩午夜视频| 国产成人久久| 精品少妇一区二区三区在线视频| jizz欧美激情18| 高h视频在线播放| 国产精品久久久久久久久快鸭| 狠狠干一区二区| av中文字幕免费| 日韩av不卡在线观看| 久久久爽爽爽美女图片| 91免费公开视频| 国产一区不卡| 日韩精品视频免费在线观看| 国产裸体视频网站| 四虎精品在线观看| 欧美中文字幕不卡| 欧美日韩在线中文| 9999在线视频| 亚洲综合一二区| 懂色av粉嫩av蜜臀av| porn视频在线观看| 久久久精品影视| 精品一区二区不卡| 人妻偷人精品一区二区三区| 国产iv一区二区三区| 91网站在线免费观看| 中文字幕日韩国产| 青青青伊人色综合久久| 国产精品久久久久999| 亚洲精品中文字幕乱码三区91| 亚洲黄色一区| 性色av一区二区三区| 国产亚洲自拍av| 欧美精品日韩| 欧美丰满少妇xxxxx做受| 午夜免费激情视频| 亚洲九九在线| 欧美老少做受xxxx高潮| 精品爆乳一区二区三区无码av| 亚洲欧美综合久久久| 九九久久久久久久久激情| 国产少妇在线观看| 欧美国产另类| 久久久人成影片一区二区三区观看| 麻豆亚洲av熟女国产一区二| 欧美视频亚洲视频| 亚州欧美日韩中文视频| 一级片中文字幕| 亚洲欧美久久久| 国产精品高潮粉嫩av| 国产精品露脸视频| 精品一区免费av| 97超碰人人看人人| 日韩在线视频第一页| 91香蕉视频在线| 日本免费一区二区三区| 香港伦理在线| 一区二区三区日韩| 1024av视频| 精品视频在线一区二区在线| 在线不卡中文字幕| 欧美激情 亚洲| 久久av中文| 久久精品久久久久| 亚洲一区二区91| 亚洲一区二区成人| 国产精品视频自拍| 亚洲国产av一区二区| 99久久久久免费精品国产 | 成人av网站免费| 欧美久久久久久| 国产在线激情| 欧美日韩性视频| 中文字幕永久视频| 91精品短视频| 亚洲一区二区久久久| 日韩a级片在线观看| 亚洲最黄网站| 国产一区二区视频在线观看| 日韩在线观看视频网站| 国产精品久久久久一区| 亚洲中文字幕无码av永久| 日韩漫画puputoon| 精品国产一区二区三区不卡| 国产又黄又粗视频| 好吊一区二区三区| 国产精品亚洲网站| 天堂a√中文在线| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 无码人妻丰满熟妇区bbbbxxxx | 国产精品网站大全| 无码国产精品高潮久久99| 国产精品高潮呻吟| 超碰网在线观看| 成人香蕉社区| 久久香蕉国产线看观看网| 日韩欧美在线观看免费| 国产成人免费视频一区| 亚洲国产精品毛片| 亚洲天堂导航| 精品国产乱码久久久久久图片 | 欧美日韩国产高清电影| 性欧美xxxx视频在线观看| av中文字幕免费在线观看| 国产精品美女一区二区在线观看| www一区二区www免费| 人人爱人人干婷婷丁香亚洲| 色老头一区二区三区| 国产中文字幕视频| av亚洲产国偷v产偷v自拍| 男人日女人的bb| 亚洲狼人在线| 综合国产在线观看| 欧美 亚洲 另类 激情 另类| 91免费国产在线| 麻豆tv在线播放| jizzjizzjizz欧美| 久久99国产综合精品女同| 国产又粗又黄视频| 国产精品国产三级国产有无不卡 | 婷婷久久伊人| 日韩精品免费观看视频| 夜夜嗨av色一区二区不卡| 性色av免费观看| 91麻豆精品在线观看| 国产欧美日韩网站| 欧美91在线| 91精品91久久久久久| 亚洲色欧美另类| 福利视频导航一区| 88久久精品无码一区二区毛片| 国产精品久久777777毛茸茸| 久久久久久久久一区二区| 欧美aaaaa性bbbbb小妇| 日韩电影中文字幕在线观看| 国产精品21p| 国产午夜亚洲精品午夜鲁丝片| 午夜视频在线瓜伦| 日韩在线理论| 91欧美日韩一区| 手机在线免费av| 亚洲国产精品久久久久久| 国产精彩视频在线观看| 99精品久久免费看蜜臀剧情介绍| 亚洲午夜无码av毛片久久| 欧美女优在线视频| 国产精品综合久久久| 国产黄色小视频在线| 欧美va在线播放| 亚洲国产成人精品激情在线| 久久品道一品道久久精品| 中文字幕视频在线免费观看| 亚洲免费二区| 黄色小网站91| 亚洲电影有码| 欧美成人免费播放| 天天干视频在线观看| 婷婷国产v国产偷v亚洲高清| 偷拍夫妻性生活| 国内精品第一页| 久久精品观看| 69174成人网| 免费看男女www网站入口在线| 亚洲男人的天堂在线| 一级黄色免费片| 亚洲国产一区二区在线播放| 精品人妻少妇嫩草av无码| 人人爽香蕉精品| 女人床在线观看| 免费精品国产| 亚洲wwwav| 亚洲深夜视频| 欧美成人精品xxx| 欧美孕妇孕交| 欧美一区二区不卡视频| 91国产丝袜播放在线| 欧美激情一二三区| 国产伦理在线观看| 久久先锋资源| 久久亚洲国产成人精品无码区| 色婷婷久久久| 成人久久一区二区| 国产免费不卡| 久久69精品久久久久久国产越南| 你懂得在线网址| 欧美成人高清电影在线| 午夜视频网站在线观看| 亚洲高清一区二区三区| 精品国产国产综合精品| 久久综合狠狠综合久久激情 | 亚洲激情视频网站| 国产精品人人妻人人爽| 色天天综合久久久久综合片| 青草草在线视频| 日本一区二区成人| 日韩网站在线播放| 国产a久久麻豆| 九九久久久久久| 免费在线欧美视频| 日韩av资源在线| 亚洲人成高清| 久久久久久av无码免费网站下载| 日韩www.| 日韩亚洲视频在线| 蜜臀久久99精品久久一区二区| 成人h视频在线观看| 国产精品国产三级在线观看| 国产精品久久久久久久久久久不卡| 蜜桃视频m3u8在线观看| 欧美疯狂性受xxxxx另类| 69成人在线| 精品国产欧美成人夜夜嗨| 国产福利片在线| 亚洲色图激情小说| 天堂a√在线| 亚洲精品美女在线观看播放| 色婷婷视频在线| 精品免费视频一区二区| www.97av| 欧美xxxx在线观看| 亚洲AV无码国产精品午夜字幕| 欧美高清激情brazzers| 91成品人影院| 777xxx欧美| 国产欧美第一页| 91麻豆精品国产自产在线 | 精品久久国产字幕高潮| 国产ts变态重口人妖hd| 日韩精品在线一区二区| 精品人妻久久久久一区二区三区| 欧美一级夜夜爽| 亚洲高清视频网站| 亚洲精品美女视频| 国产三级在线| 日韩有码视频在线| a在线免费观看| 欧美国产第一页| 国产乱码午夜在线视频| 欧美专区中文字幕| 日本精品网站| 国产欧美 在线欧美| 精品视频在线观看免费观看| 国产精品theporn88| 美国成人xxx| 清纯唯美一区二区三区| 99国产精品一区二区| 日日噜噜夜夜狠狠久久丁香五月| 欧美精品一卡| 成人免费在线小视频| 日本不卡中文字幕| 古装做爰无遮挡三级聊斋艳谭| 丁香婷婷综合色啪| 美女久久久久久久久久| 国产精品久久久久久久蜜臀| 成人免费黄色小视频| 亚洲成a人v欧美综合天堂| 日韩欧美在线观看免费| 这里只有精品99re| 天天色天天操天天射| 一区二区三区精品99久久| 麻豆影视国产在线观看| 97国产精品免费视频| 日韩一区二区三区在线免费观看| 国产主播喷水一区二区| 精品无人区一区二区| 日韩啊v在线| 国产一区日韩一区| 亚洲中文字幕久久精品无码喷水| 国产在线视视频有精品| 黄色av网址在线观看| 国产精品久久久久久久久免费相片| 久久中文字幕无码| 欧美最新大片在线看| 亚洲伦理在线观看| 最近2019中文字幕第三页视频| 丝袜在线观看| 国产精品亚洲视频在线观看| 欧美韩一区二区| 经典三级在线视频| 日韩中文字幕av电影| 国产精品久久久久久亚洲色| 国产精品美女久久久久久久久| 韩国av免费观看| 制服丝袜中文字幕一区| 黄色av网站在线免费观看| 欧美高清视频免费观看| 五月天色综合| 青娱乐一区二区| 日韩视频不卡| www.色.com| 国产精品毛片高清在线完整版| 亚洲天堂日韩av| 精品久久99ma| 自拍亚洲图区| 国产日韩欧美日韩大片| 欧美**vk| 欧美黑人经典片免费观看| 国产精品99久久不卡二区| 精品少妇一区二区三区密爱| 日韩欧美精品网站| 天天综合在线视频| 欧美激情伊人电影| 国内精品视频| 亚洲一区二区高清视频| 日本中文在线一区| 国产ts在线播放| 午夜精品久久久久久久久久久| 亚洲av无码一区二区乱子伦| 久久精品国产91精品亚洲| 九九九伊在线综合永久| 欧美一区2区三区4区公司二百| 在线亚洲欧美| 日韩成人av一区二区| 亚洲一区二区欧美| 亚洲第一精品网站| 欧美国产在线电影| 日韩一二三区| 欧美这里只有精品| 成人午夜激情影院| 国产香蕉在线视频| 亚洲精品wwww| 天堂√中文最新版在线| 蜜桃传媒视频麻豆一区| 久久xxxx| 微拍福利一区二区| 91激情在线视频| 18视频免费网址在线观看| 国产精品丝袜一区二区三区| 日韩在线观看电影完整版高清免费悬疑悬疑| 又色又爽又高潮免费视频国产| 国产日本欧洲亚洲| 亚洲天堂狠狠干| 播播国产欧美激情| 草草视频在线一区二区| 国产免费黄色一级片| 91原创在线视频| 亚洲乱码国产乱码精品| 中文一区二区视频| 91精品在线免费视频| 欧美交换配乱吟粗大25p| 成人免费高清视频在线观看| 亚洲黄色三级视频| 亚洲欧美在线免费| 精品久久毛片| 久久香蕉视频网站| 成人黄色小视频在线观看| 日本三级一区二区| 一区二区三区黄色| 日韩精品一区二区三区中文| 国产一二三在线视频| 久久色.com| 国产精品国产三级国产aⅴ| 欧美激情视频在线| 嫩草影视亚洲| 中文字幕在线视频一区二区三区| 亚洲午夜免费电影| 国产中文在线| 91久久久久久久久久久| 国产日产高清欧美一区二区三区| 国产精成人品免费观看| 日韩欧美国产综合| 蜜臀国产一区| 日本在线视频www色| 99精品视频在线播放观看| 亚洲一区中文字幕永久在线| 欧美激情视频网| 精品国产91乱码一区二区三区四区| 亚洲一二三av| 欧美性videos高清精品| 麻豆免费在线视频| 欧美精品尤物在线| 国产在线国偷精品产拍免费yy| 国偷自拍第113页| 久久人人爽人人爽爽久久| 天美av一区二区三区久久|