精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案 原創(chuàng)

發(fā)布于 2024-11-11 08:08
瀏覽
0收藏

本文介紹了長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU)這兩種流行的RNN變體的最小化版本——minLSTM和minGRU,這兩個(gè)模型在訓(xùn)練期間可以完全并行,并且使用的參數(shù)顯著減少,使它們成為Tansformer的快速和有效的替代方案。

Transformer如今已經(jīng)成為大型語(yǔ)言模型(LLM)和其他序列處理應(yīng)用程序的主要架構(gòu)。然而,它們固有的二次方計(jì)算復(fù)雜性成為了將Transformer擴(kuò)展至超長(zhǎng)序列時(shí)的巨大障礙,顯著增加了成本。這引發(fā)了人們對(duì)具有線性復(fù)雜性和恒定內(nèi)存需求的架構(gòu)的興趣。

Mila公司和Borealis AI的研究人員重新審視了遞歸神經(jīng)網(wǎng)絡(luò)(RNN)作為Transformer架構(gòu)的潛在替代方案。他們?cè)诎l(fā)布的一篇論文中,介紹了長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU)這兩種流行的RNN變體的最小化版本——minLSTM和minGRU,這兩個(gè)模型在訓(xùn)練期間可以完全并行,并且使用的參數(shù)顯著減少,使它們成為Transformer的快速和有效的替代方案。

Transformer的局限性和RNN的復(fù)興

每當(dāng)Transformer模型接收的輸入序列長(zhǎng)度翻倍時(shí),就需要四倍的內(nèi)存和計(jì)算量。這種二次方計(jì)算復(fù)雜性使得Transformer在處理長(zhǎng)序列來(lái)說(shuō)成本高昂,在資源受限的環(huán)境中尤為棘手。

另一方面,RNN按順序處理輸入數(shù)據(jù),并且相對(duì)于序列長(zhǎng)度具有線性計(jì)算復(fù)雜度。它們?cè)谕评磉^(guò)程中還需要恒定的內(nèi)存,這使得它們適合于非常長(zhǎng)的序列。然而,傳統(tǒng)的RNN存在梯度消失和梯度爆炸的問題。當(dāng)用于更新神經(jīng)網(wǎng)絡(luò)權(quán)值的梯度過(guò)小或過(guò)大,阻礙有效學(xué)習(xí)時(shí),就會(huì)出現(xiàn)梯度消失和梯度爆炸。從而嚴(yán)重影響學(xué)習(xí)效果。這一局限性制約了RNN學(xué)習(xí)長(zhǎng)期依賴關(guān)系的能力。為了解決這一問題,LSTM和GRU引入了創(chuàng)新的門控機(jī)制,以精確調(diào)控信息在網(wǎng)絡(luò)中的傳遞。

盡管傳統(tǒng)的LSTM和GRU具有優(yōu)勢(shì),但它們有一個(gè)關(guān)鍵的限制:只能按順序計(jì)算。這意味著它們必須在訓(xùn)練期間使用時(shí)間反向傳播(BPTT),這是一個(gè)緩慢的過(guò)程,極大地限制了它們擴(kuò)展到長(zhǎng)場(chǎng)景的能力。

Transformer的局限性重新引起了人們對(duì)循環(huán)模型的興趣。在過(guò)去的一年,引入了新的循環(huán)架構(gòu),例如S4和Mamba,這些架構(gòu)有望在實(shí)現(xiàn)可比性能的同時(shí)解決Transformers的可擴(kuò)展性問題。這些模型使用“并行前綴掃描”等算法,通過(guò)并行化輸入序列上的計(jì)算來(lái)加快訓(xùn)練速度。

重新審視LSTM和GRU

受到最近提出的序列模型之間算法相似性的啟發(fā),研究人員重新審視了LSTM和GRU。他們發(fā)現(xiàn),通過(guò)從門控機(jī)制中消除對(duì)先前隱藏狀態(tài)的依賴,這些模型可以使用并行掃描算法進(jìn)行高效訓(xùn)練。

傳統(tǒng)的LSTM和GRU有多個(gè)門來(lái)控制網(wǎng)絡(luò)中的信息流。這些門依賴于之前的隱藏狀態(tài)來(lái)確定保留或丟棄多少當(dāng)前輸入和之前的內(nèi)存。這創(chuàng)建了一個(gè)順序依賴關(guān)系,要求模型一次處理一個(gè)令牌。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖1 minGRU通過(guò)刪除組件和計(jì)算簡(jiǎn)化了GRU

研究人員發(fā)現(xiàn),他們可以消除對(duì)先前隱藏狀態(tài)的依賴,同時(shí)保持計(jì)算中的時(shí)間一致性。這使得能夠通過(guò)并行掃描算法訓(xùn)練模型。他們通過(guò)刪除一些不必要的計(jì)算進(jìn)一步簡(jiǎn)化了架構(gòu),生成了最小化的LSTM(minLSTM)和最小化的GRU(minGRU),這兩種模型不僅使用的參數(shù)大幅減少,而且訓(xùn)練速度也得到了顯著提升。

minGRU和minLSTM通過(guò)實(shí)現(xiàn)并行計(jì)算解決了傳統(tǒng)RNN的訓(xùn)練瓶頸。在T4 GPU上,與傳統(tǒng)的序列長(zhǎng)度為512個(gè)令牌相比,這一變化使得minGRU的速度提高了175倍,minLSTM的速度提高了235倍。隨著序列的延長(zhǎng),這種改善變得更加顯著。對(duì)于長(zhǎng)度為4096的序列,minGRU和minLSTM的速度比傳統(tǒng)版本快1300倍以上。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖2 minLSTM通過(guò)刪除不必要的組件和計(jì)算來(lái)簡(jiǎn)化LSTM

研究人員寫道:“因此,在minGRU需要一天的時(shí)間來(lái)完成固定次數(shù)的訓(xùn)練的情況下,傳統(tǒng)的GRU可能需要3年以上的時(shí)間。”

與傳統(tǒng)GRU相比,minGRU將所需參數(shù)的數(shù)量減少了87%,與傳統(tǒng)LSTM相比,minLSTM將所需參數(shù)的數(shù)量減少了85%。

最小化RNN與SOTA循環(huán)模型

研究人員將minLSTM和minGRU的性能與最先進(jìn)的循環(huán)序列模型Mamba進(jìn)行了比較。他們測(cè)量了訓(xùn)練時(shí)間、內(nèi)存使用情況和多項(xiàng)任務(wù)的表現(xiàn),包括選擇性復(fù)制、強(qiáng)化學(xué)習(xí)(RL)和語(yǔ)言建模。

在運(yùn)行時(shí)間方面,minLSTM和minGRU取得了與Mamba相似的結(jié)果。雖然它們比傳統(tǒng)的RNN使用更多的內(nèi)存,但它們的內(nèi)存效率仍然比Mamba高。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖3 訓(xùn)練最小化 RNN 模型(橙色和藍(lán)色實(shí)線)比傳統(tǒng) RNN(虛線)更快,并且比 Mamba使用更少的內(nèi)存

在選擇性復(fù)制(需要內(nèi)容感知推理和記憶的任務(wù))方面,minLSTM和minGRU的表現(xiàn)與Mamba相當(dāng)。

在D4RL基準(zhǔn)的RL實(shí)驗(yàn)中,minLSTM和minGRU的性能優(yōu)于除Decision Mamba之外的所有基線,其中差異很小。

在語(yǔ)言建模任務(wù)中,minLSTM和minGRU在訓(xùn)練過(guò)程中達(dá)到峰值性能的速度略慢于Mamba,但最終收斂的損失更低。值得注意的是,它們比Transformer的效率高得多,Transformer需要2.5倍的時(shí)間才能達(dá)到最佳性能。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖4 在語(yǔ)言建模任務(wù)中,最小化的RNN(橙色和藍(lán)色實(shí)線)的損失低于Mamba,收斂速度至少是Transformers的2.5倍

與其他研究Transformer替代方案的類似工作一樣,最小化RNN研究的局限性之一是實(shí)驗(yàn)的規(guī)模。這些架構(gòu)是否能夠在非常大的模型和場(chǎng)景窗口下提供類似的結(jié)果還有待觀察。

盡管如此,這項(xiàng)研究的結(jié)果意義重大,因?yàn)檠芯勘砻鳎S著新信息的出現(xiàn),重新審視原有的想法是值得的。

研究人員在文章中寫道:“鑒于這些簡(jiǎn)化的RNN在實(shí)際應(yīng)用中所展現(xiàn)出的卓越性能,并且它們與眾多最新提出的循環(huán)序列方法存在著本質(zhì)上的相似之處,我們不禁反思并提出疑問,‘我們是否僅僅依靠RNN就足以滿足需求?’。”

原文標(biāo)題:??Minimized RNNs offer a fast and efficient alternative to Transformers??,作者:Ben Dickson

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
91精品国产乱码久久久久久久久| 欧美午夜xxx| 欧美在线视频免费| 亚洲中文字幕无码一区| 成人午夜在线影视| 成人h版在线观看| 国产极品jizzhd欧美| 91杏吧porn蝌蚪| 要久久爱电视剧全集完整观看 | 日本不卡一区| 国产精品久久影视| 亚洲精品国产偷自在线观看| 欧美精品一区二区三区一线天视频| 国产欧美日韩小视频| 国产色在线 com| 成人午夜免费视频| 国产日韩亚洲欧美| www亚洲视频| 亚洲成人免费| 欧美人妻精品一区二区三区 | 国产伦精品一区二区三区高清版 | 色综合久久久无码中文字幕波多| 亚洲精品天堂| 国产日韩精品一区| 国产精品一区=区| 中日韩黄色大片| 欧美va亚洲va日韩∨a综合色| 精品成人佐山爱一区二区| 成人日韩在线视频| 欧美三区四区| 日韩欧美亚洲范冰冰与中字| 欧美亚洲日本一区二区三区 | 91美女片黄在线观看91美女| 国产精品一区二区女厕厕| 五月天综合激情网| 欧美xxxx中国| 国产一区二区三区在线观看视频| 国产一伦一伦一伦| 手机av在线播放| ●精品国产综合乱码久久久久| 超碰97在线播放| 国产偷拍一区二区| 韩国v欧美v日本v亚洲v| 国产精品专区一| 中文字幕乱码视频| 青青国产91久久久久久| 日韩av观看网址| 男人天堂2024| 日日摸夜夜添夜夜添精品视频| 精品国内亚洲在观看18黄| 在线观看欧美一区二区| 日韩一区二区三区精品视频第3页 日韩一区二区三区精品 | 久久五月精品中文字幕| 一区二区三区久久| 国产青草视频在线观看| 精精国产xxxx视频在线中文版 | 国产亚洲精品自在久久| 最新国产中文字幕| 一区二区亚洲| 97热精品视频官网| 国产www在线| 久久亚洲国产精品一区二区| 97视频在线观看视频免费视频 | 亚洲国产一区在线观看| 在线观看污视频| 18aaaa精品欧美大片h| 五月婷婷综合在线| 少妇人妻互换不带套| 亚洲综合在线电影| 欧美人妇做爰xxxⅹ性高电影| 国产午夜福利在线播放| sese综合| 欧美色图一区二区三区| 污免费在线观看| 欧美天堂一区二区| 欧美一级国产精品| 亚洲av成人片色在线观看高潮 | 午夜国产一区| 色av吧综合网| 亚洲天堂黄色片| 色777狠狠狠综合伊人| 精品网站999www| 18精品爽国产三级网站| 欧美 日韩 国产精品免费观看| 中文字幕9999| 欧美三级小视频| 国产一区二区三区久久| 国产精品美女av| 精品国产av一区二区三区| 久久国产免费看| 成人免费视频观看视频| 国产中文在线视频| 久久久精品日韩欧美| 蜜桃视频在线观看91| 免费大片在线观看www| 五月天激情小说综合| 中文字幕亚洲乱码| 婷婷成人影院| 久色乳综合思思在线视频| 日韩精品在线免费看| 美女网站在线免费欧美精品| 国产专区一区二区| 九色porny在线| 一区在线观看视频| 日本精品一区二区三区四区| 在线观看网站免费入口在线观看国内 | 日本视频一区二区不卡| а√资源新版在线天堂| 日本精品视频一区二区| 性高潮久久久久久| 成人在线超碰| 色青青草原桃花久久综合| 日本熟妇毛茸茸丰满| 极品美女销魂一区二区三区| 欧美国产二区| 男女免费观看在线爽爽爽视频| 亚洲成在线观看| 亚洲免费黄色网| 国产欧美亚洲精品a| 欧美极品少妇xxxxx| 一级黄色免费看| 日本一区二区三区国色天香 | 色的视频在线免费看| 亚洲少妇中出一区| 亚洲欧美另类动漫| 亚洲第一二三区| 国语自产精品视频在线看一大j8 | 欧美一级欧美三级| 调教驯服丰满美艳麻麻在线视频| 欧美gay男男猛男无套| 日本人成精品视频在线| 国产精品乱码一区二区| 中文幕一区二区三区久久蜜桃| 日韩视频一二三| 色综合视频一区二区三区日韩| 欧美成人午夜电影| 国产老头老太做爰视频| 国产精品日韩久久久| 国产日韩欧美视频在线| 国产人成在线视频| 日本久久电影网| 国产一级久久久久毛片精品| 欧美成人中文| 97碰碰视频| 欧美videossex| 欧美刺激午夜性久久久久久久| 成年人网站免费看| 中文字幕一区二区三三| 91九色视频导航| 免费a级在线播放| 欧美理论片在线| 日韩在线视频网址| 国产精品一二三| 奇米777四色影视在线看| 日韩精品专区| 国产一区二区三区久久精品| 小泽玛利亚一区二区三区视频| 大白屁股一区二区视频| 日韩 欧美 视频| 国产精品久久久久久久久久辛辛| 亚洲精品网址在线观看| 日韩 国产 欧美| 中文字幕av一区二区三区| 高清一区在线观看| 亚洲激情中文| 肥熟一91porny丨九色丨| 国产高潮在线| 日韩精品一区二区三区在线观看| av中文字幕免费观看| 亚洲久久一区| 欧美日韩另类丝袜其他| 成人国产精品| 夜夜嗨av色一区二区不卡| 97超碰中文字幕| 亚洲一区中文日韩| 亚洲成人网在线播放| 99精品国产在热久久婷婷| 成人av蜜桃| 一区二区三区四区日本视频| 中文字幕不卡av| 国产 欧美 精品| 色婷婷久久久久swag精品 | 久久亚洲欧美日韩精品专区| 国产av无码专区亚洲av麻豆| 午夜精品久久久久影视| 丁香花五月婷婷| 国产精品911| 国产成人精品无码播放| 欧美 日韩 国产精品免费观看| 成人精品视频久久久久| jizz一区二区三区| 一区二区三区国产在线观看| 午夜精品一区二区三| 色香蕉久久蜜桃| 国产一级视频在线播放| 中文字幕精品一区二区精品绿巨人 | 欧美三级午夜理伦三级中视频| 中国毛片在线观看| 久久久成人网| 欧美性猛交内射兽交老熟妇| 免费精品国产的网站免费观看| 欧美在线视频在线播放完整版免费观看| 日本xxxx人| 欧美日韩一区二区三区在线| 香蕉免费毛片视频| 最近中文字幕一区二区三区| 手机av在线网站| 久久久久久婷| 激情五月婷婷六月| 青青视频一区二区| 亚洲精品日韩激情在线电影| 色婷婷在线播放| 中文字幕在线观看日韩| 亚洲三级黄色片| 91精品办公室少妇高潮对白| 久久综合综合久久| 亚洲欧洲精品一区二区三区不卡| 国偷自产av一区二区三区麻豆| 伊人成人在线| 欧洲精品久久| 三级小说欧洲区亚洲区| 成人自拍偷拍| 日本少妇精品亚洲第一区| 韩国美女主播一区| 日本成人不卡| 久久av在线播放| 欧美天天影院| 最新亚洲国产精品| 99riav在线| 在线观看国产欧美| wwwav网站| 宅男噜噜噜66一区二区66| 日本a在线观看| 一区二区三区四区精品在线视频 | 九九热在线免费| 久久久久免费| wwwjizzjizzcom| 一区二区国产在线| 大桥未久一区二区| 在线看片不卡| 秋霞在线观看一区二区三区| 欧美xxxx在线| 久久99国产精品| 国产区一区二| 国产精品1234| √8天堂资源地址中文在线| 亚洲人成电影在线播放| 国产成人精品毛片| 日韩一区二区精品在线观看| a级片在线视频| 精品三级在线观看| 人妻一区二区三区免费| 亚洲国产精品推荐| 四虎影视精品成人| 亚洲天堂开心观看| 日本在线观看视频| 欧美久久精品午夜青青大伊人| 你懂得网站在线| 一区二区三区回区在观看免费视频| 亚洲国产精品久久久久爰性色| 欧美少妇xxx| 国产影视一区二区| 欧美成人一级视频| 十九岁完整版在线观看好看云免费| 91麻豆精品国产无毒不卡在线观看| 日韩人妻精品中文字幕| 欧美亚洲自拍偷拍| 国产精品久久久久久久久久久久久久久久 | 欧美一级特黄视频| 欧洲一区在线电影| 国产精品久久久久久久久毛片 | 希岛爱理中文字幕| 一区二区三区不卡在线观看| 在线免费观看毛片| 色狠狠色狠狠综合| 国产女人18毛片水18精| 亚洲精品一区二区三区福利| 欧美另类自拍| 不卡av日日日| 成人欧美magnet| 91在线视频一区| 欧美巨大xxxx| 中文字幕不卡每日更新1区2区| 欧洲激情视频| 国产91在线亚洲| 视频一区在线播放| 成人一区二区三区仙踪林| 91免费国产视频网站| 国产一区二区精彩视频| 午夜免费久久看| 国产精品日韩无码| 日韩av综合中文字幕| 毛片免费不卡| 人人爽久久涩噜噜噜网站| 欧美影院在线| 色乱码一区二区三在线看| 在线免费观看欧美| 伊人成人222| 久久综合五月天婷婷伊人| 9.1成人看片| 亚洲精品v日韩精品| 免费在线一级片| 欧美视频一区二区| 五月天婷婷视频| 欧美理论电影在线播放| 欧美hdxxxxx| 成人av电影天堂| 国产一区二区三区四区五区传媒| 亚洲二区三区四区| 国产日韩欧美三区| 一级全黄裸体片| 亚洲日本韩国一区| 真实新婚偷拍xxxxx| 亚洲精品一区二三区不卡| 手机在线免费看av| 亚洲xxxx18| 久久香蕉国产| mm1313亚洲国产精品无码试看| 精品亚洲aⅴ乱码一区二区三区| 久久无码人妻一区二区三区| 亚洲国产精品传媒在线观看| www.毛片.com| 亚洲精品国产精品国产自| 成在在线免费视频| 91av视频在线观看| 欧美成人一区在线观看| 久久久久99精品成人片| 国产福利91精品| h色网站在线观看| 91.成人天堂一区| 在线观看的av| 国产精品视频资源| 成人高潮视频| 免费看日本黄色| 国产**成人网毛片九色 | 北条麻妃在线一区| 99久久久国产精品| 午夜精品一区二区三级视频| 亚洲一本大道在线| 中文字幕日日夜夜| 在线播放国产一区二区三区| 久久野战av| 国产精品一 二 三| 亚洲国产专区校园欧美| 日韩中文字幕a| 中文一区二区完整视频在线观看| 日韩美女视频网站| 亚洲精品videossex少妇| 国产黄色在线观看| 91九色视频在线观看| 亚洲视频碰碰| 天天插天天射天天干| 日本韩国精品在线| 午夜伦理在线| 91在线色戒在线| 亚洲国产第一| 国产精品成人一区二区三区电影毛片 | 亚洲一区二区自拍偷拍| 国产中文字幕一区| 久久久久黄色片| 日韩av在线一区| 欧美成人黑人| 久久99影院| 天堂影院一区二区| 亚洲 欧美 国产 另类| 欧美一区二区高清| 成人在线黄色电影| 91久久久久久久久| 日韩在线理论| 亚洲欧美日韩中文字幕在线观看| 亚洲欧洲精品一区二区三区不卡| 青青国产在线视频| 日韩精品小视频| а√天堂资源国产精品| 91网站在线观看免费| 久久影院视频免费| 国产精品国产av| 欧美一级大片在线免费观看| 日韩成人综合| 亚洲国产精品第一页| 欧美在线视频全部完| 亚洲综合图区| 日本黑人久久| 粉嫩欧美一区二区三区高清影视| 国产精品视频一区二区三| 亚洲二区在线播放视频| 日韩三区免费| 亚洲午夜精品久久久久久浪潮| 日本免费新一区视频| 免费人成年激情视频在线观看| 精品欧美乱码久久久久久 | 日韩美女毛片| 天天干天天色天天干| 欧美日韩一区免费| 国产一级在线观看| 国产精品麻豆免费版| 国产亚洲福利| 国产一区二区播放| 亚洲最新av网址| 美女一区二区在线观看|