精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭 精華

發(fā)布于 2024-4-15 08:51
瀏覽
0收藏

谷歌又放大招了,發(fā)布下一代 Transformer 模型 Infini-Transformer。


Infini-Transformer 引入了一種有效的方法,可以將基于 Transformer 的大型語言模型 (LLM) 擴(kuò)展到無限長輸入,而不增加內(nèi)存和計算需求。使用該技術(shù),研究者成功將一個 1B 的模型上下文長度提高到 100 萬;應(yīng)用到 8B 模型上,模型能處理 500K 的書籍摘要任務(wù)。


自 2017 年開創(chuàng)性研究論文《Attention is All You Need》問世以來,Transformer 架構(gòu)就一直主導(dǎo)著生成式人工智能領(lǐng)域。而谷歌對 Transformer 的優(yōu)化設(shè)計最近比較頻繁,幾天前,他們更新了 Transformer 架構(gòu),發(fā)布 Mixture-of-Depths(MoD),改變了以往 Transformer 計算模式。沒過幾天,谷歌又放出了這項新研究。


專注 AI 領(lǐng)域的研究者都了解內(nèi)存的重要性,它是智能的基石,可以為 LLM 提供高效的計算。然而,Transformer 和基于 Transformer 的 LLM 由于注意力機(jī)制的固有特性,即 Transformer 中的注意力機(jī)制在內(nèi)存占用和計算時間上都表現(xiàn)出二次復(fù)雜性。例如,對于批大小為 512、上下文長度為 2048 的 500B 模型,注意力鍵 - 值 (KV) 狀態(tài)的內(nèi)存占用為 3TB。但事實上,標(biāo)準(zhǔn) Transformer 架構(gòu)有時需要將 LLM 擴(kuò)展到更長的序列(如 100 萬 token),這就帶來巨大的內(nèi)存開銷,并且隨著上下文長度的增加,部署成本也在增加。


基于此,谷歌引入了一種有效的方法,其關(guān)鍵組成部分是一種稱為 Infini-attention(無限注意力)的新注意力技術(shù)。不同于傳統(tǒng)的 Transformer 使用局部注意力丟棄舊片段,為新片段釋放內(nèi)存空間。Infini-attention 增加了壓縮內(nèi)存(compressive memory),可以將使用后的舊片段存儲到壓縮內(nèi)存中,輸出時會聚合當(dāng)前上下文信息以及壓縮內(nèi)存中的信息,因而模型可以檢索完整的上下文歷史。


該方法使 Transformer LLM 在有限內(nèi)存的情況下擴(kuò)展到無限長上下文,并以流的方式處理極長的輸入進(jìn)行計算。


實驗表明,該方法在長上下文語言建?;鶞?zhǔn)測試中的性能優(yōu)于基線,同時內(nèi)存參數(shù)減少了 100 倍以上。當(dāng)使用 100K 序列長度進(jìn)行訓(xùn)練時,該模型實現(xiàn)了更好的困惑度。此外該研究發(fā)現(xiàn),1B 模型在 5K 序列長度的密鑰實例上進(jìn)行了微調(diào),解決了 1M 長度的問題。最后,論文展示了具有 Infini-attention 的 8B 模型經(jīng)過持續(xù)的預(yù)訓(xùn)練和任務(wù)微調(diào),在 500K 長度的書籍摘要任務(wù)上達(dá)到了新的 SOTA 結(jié)果。


本文貢獻(xiàn)總結(jié)如下:


  • 引入了一種實用且強大的注意力機(jī)制 Infini-attention—— 具有長期壓縮內(nèi)存和局部因果注意力,可用于有效地建模長期和短期上下文依賴關(guān)系;
  • Infini-attention 對標(biāo)準(zhǔn)縮放點積注意力( standard scaled dot-product attention)進(jìn)行了最小的改變,并通過設(shè)計支持即插即用的持續(xù)預(yù)訓(xùn)練和長上下文自適應(yīng);
  • 該方法使 Transformer LLM 能夠通過流的方式處理極長的輸入,在有限的內(nèi)存和計算資源下擴(kuò)展到無限長的上下文。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


  • 論文鏈接:https://arxiv.org/pdf/2404.07143.pdf
  • 論文標(biāo)題:Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention?


方法介紹


Infini-attention 使 Transformer LLM 能夠通過有限的內(nèi)存占用和計算有效地處理無限長的輸入。如下圖 1 所示,Infini-attention 將壓縮記憶融入到普通的注意力機(jī)制中,并在單個 Transformer 塊中構(gòu)建了掩碼局部注意力和長期線性注意力機(jī)制。

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

對 Transformer 注意力層進(jìn)行這種微妙但關(guān)鍵的修改可以通過持續(xù)的預(yù)訓(xùn)練和微調(diào)將現(xiàn)有 LLM 的上下文窗口擴(kuò)展到無限長。


Infini-attention 采用標(biāo)準(zhǔn)注意力計算的所有鍵、值和查詢狀態(tài),以進(jìn)行長期記憶鞏固(memory consolidation)和檢索,并將注意力的舊 KV 狀態(tài)存儲在壓縮內(nèi)存中,而不是像標(biāo)準(zhǔn)注意力機(jī)制那樣丟棄它們。在處理后續(xù)序列時,Infini-attention 使用注意查詢狀態(tài)從內(nèi)存中檢索值。為了計算最終的上下文輸出,Infini-attention 聚合了長期記憶檢索值和局部注意力上下文。


如下圖 2 所示,研究團(tuán)隊比較了基于 Infini-attention 的 Infini-Transformer 和 Transformer-XL。與 Transformer-XL 類似,Infini-Transformer 對 segment 序列進(jìn)行操作,并計算每個 segment 中的標(biāo)準(zhǔn)因果點積注意力上下文。因此,點積注意力計算在某種意義上是局部的。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


然而,局部注意力在處理下一個 segment 時會丟棄前一個 segment 的注意力狀態(tài),但 Infini-Transformer 復(fù)用舊的 KV 注意力狀態(tài),以通過壓縮存儲來維護(hù)整個上下文歷史。因此,Infini-Transformer 的每個注意力層都具有全局壓縮狀態(tài)和局部細(xì)粒度狀態(tài)。


與多頭注意力(MHA)類似,除了點積注意力之外,Infini-attention 還為每個注意力層維護(hù) H 個并行壓縮內(nèi)存(H 是注意力頭的數(shù)量)。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

下表 1 列出了幾種模型根據(jù)模型參數(shù)和輸入 segment 長度,定義的上下文內(nèi)存占用和有效上下文長度。Infini-Transformer 支持具有有限內(nèi)存占用的無限上下文窗口。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


實驗


該研究在長上下文語言建模、長度為 1M 的密鑰上下文塊檢索和 500K 長度的書籍摘要任務(wù)上評估了 Infini-Transformer 模型,這些任務(wù)具有極長的輸入序列。對于語言建模,研究者選擇從頭開始訓(xùn)練模型,而對于密鑰和書籍摘要任務(wù),研究者采用不斷預(yù)訓(xùn)練 LLM 的方式,以證明 Infini-attention 即插即用的長上下文適應(yīng)能力。


長上下文語言建模。表 2 結(jié)果表明 Infini-Transformer 優(yōu)于 Transformer-XL 和 Memorizing Transformers 基線,并且與 Memorizing Transformer 模型相比,存儲參數(shù)減少了 114 倍。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


密鑰任務(wù)。表 3 為 Infini-Transformer 在 5K 長度輸入上進(jìn)行微調(diào)后,解決了高達(dá) 1M 上下文長度的密鑰任務(wù)。實驗中輸入 token 的范圍從 32K 到 1M,對于每個測試子集,研究者控制密鑰的位置,使其位于輸入序列的開頭、中間或結(jié)尾附近。實驗報告了零樣本準(zhǔn)確率和微調(diào)準(zhǔn)確率。在對 5K 長度輸入進(jìn)行 400 個步驟的微調(diào)后,Infini-Transformer 解決了高達(dá) 1M 上下文長度的任務(wù)。


直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

摘要任務(wù)。表 4 將 Infini-Transformer 與專門為摘要任務(wù)構(gòu)建的編碼器 - 解碼器模型進(jìn)行了比較。結(jié)果表明 Infini-Transformer 超越了之前最佳結(jié)果,并且通過處理書中的整個文本在 BookSum 上實現(xiàn)了新的 SOTA。 

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)

研究者還在圖 4 中繪制了 BookSum 數(shù)據(jù)驗證分割的總體 Rouge 分?jǐn)?shù)。根據(jù)折線趨勢表明,隨著輸入長度的增加,Infini-Transformers 提高了摘要性能指標(biāo)。

直接擴(kuò)展到無限長,谷歌Infini-Transformer終結(jié)上下文長度之爭-AI.x社區(qū)


本文轉(zhuǎn)自 機(jī)器之心 ,作者:機(jī)器之心


原文鏈接:??https://mp.weixin.qq.com/s/4cOsPWWDLSMpnQcbUc8Wxg??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
亚洲18色成人| 久久精品国产一区二区三| 欧美成人激情免费网| 中国丰满熟妇xxxx性| 久久久久久久久亚洲精品| 日本不卡在线视频| 久久综合久中文字幕青草| 美女搡bbb又爽又猛又黄www| 小h片在线观看| 国产日韩精品一区二区浪潮av | 成人亚洲免费| 亚洲女与黑人做爰| 美国av一区二区三区| 亚洲一区二区影视| 国产一级一区二区| 久久成人av网站| 30一40一50老女人毛片| 9999精品视频| 日本高清不卡在线观看| 亚洲天堂第一区| 激情小视频在线| 国产成人精品一区二区三区四区 | 久久国产欧美日韩精品| 欧美高清电影在线看| 国产精品密蕾丝袜| 国产精品中文字幕制服诱惑| 欧美日韩国产免费| 18禁男女爽爽爽午夜网站免费 | 欧美激情精品久久久久久变态| 播金莲一级淫片aaaaaaa| 91精品福利观看| 欧美午夜片欧美片在线观看| 青青草视频在线视频| 九色在线免费| 97久久超碰国产精品| 91丨九色丨国产| 依依成人在线视频| 久久精品国语| 91精品国产一区| 久久久久久免费观看| 99热精品久久| 在线免费观看羞羞视频一区二区| 亚洲熟女乱综合一区二区三区| 久久影院一区二区三区| 欧美日韩综合在线| 亚洲性生活网站| 在线女人免费视频| 疯狂做受xxxx高潮欧美日本| 国产免费裸体视频| av网站免费在线观看| 亚洲欧美影音先锋| 做爰高潮hd色即是空| 91电影在线播放| 国产视频视频一区| 日本一区高清不卡| 国产1区2区3区在线| 久久久蜜桃精品| 高清视频一区| www.蜜臀av| 成人涩涩免费视频| 国产欧美日韩在线播放| 亚洲h视频在线观看| 高清成人在线观看| 国产伦理一区二区三区| 亚洲 欧美 激情 另类| 99天天综合性| 欧美日韩国产精品一卡| 你懂的视频在线| 国产视频一区在线播放| 亚洲春色在线视频| 黄a在线观看| 亚洲在线观看免费| 丰满少妇久久久| xx欧美视频| 欧美日韩一卡二卡| 免费不卡av网站| 欧美日本三级| 日韩成人网免费视频| 一区二区三区久久久久| 日韩一区二区在线| 久久国产色av| 日韩美女视频网站| 日韩中文欧美在线| 成人免费视频97| 空姐吹箫视频大全| 久久先锋影音av鲁色资源网| 色播亚洲婷婷| 性欧美video高清bbw| 欧美日韩美女在线观看| 国产一二三四在线视频| 国产高清亚洲| 日韩电影中文字幕一区| 国产免费嫩草影院| 欧美日韩一区二区高清| 1769国内精品视频在线播放| jizz国产在线| 国产成人在线视频播放| 欧美精品欧美精品系列c| 老司机精品视频在线观看6| 亚洲成人1区2区| 欧美午夜aaaaaa免费视频| 国内精品视频| 国产小视频国产精品| 农村黄色一级片| 首页综合国产亚洲丝袜| 亚洲自拍偷拍视频| 欧洲天堂在线观看| 亚洲猫色日本管| 日本精品久久久久中文字幕| 欧美成人精品午夜一区二区| 亚洲深夜福利在线| 麻豆国产尤物av尤物在线观看| 久久这里只有| 国产精品久久一区二区三区| av影片在线看| 精品国产31久久久久久| 97人人爽人人| 久久97视频| 久久频这里精品99香蕉| 国产精品熟女久久久久久| 久久网站热最新地址| 人妻激情另类乱人伦人妻| 岛国精品在线| 亚洲精品午夜精品| 久久婷婷一区二区| 国产综合久久久久久鬼色| 日韩av高清| 伊人网在线播放| 精品国产成人在线影院| 亚洲最大的黄色网址| 日韩成人一级大片| 蜜桃狠狠色伊人亚洲综合网站| 99视频免费在线观看| 欧美日韩免费一区二区三区| 制服 丝袜 综合 日韩 欧美| 中国女人久久久| 国产精品免费在线| 午夜av在线播放| 91精品一区二区三区在线观看| 无码少妇一区二区| 久久久久中文| 国产精品乱码一区二区三区| 青青青国内视频在线观看软件| 欧美日本精品一区二区三区| 国产真人做爰视频免费| 日日夜夜精品视频免费| 欧美日韩在线不卡一区| 欧美一级大片| 亚洲视频在线视频| 欧美一级做a爰片免费视频| 久久久亚洲高清| 亚洲视频在线观看一区二区三区| 亚洲精品推荐| 国产极品jizzhd欧美| av中文天堂在线| 欧美性淫爽ww久久久久无| 精品一区二区三区蜜桃在线| 日av在线不卡| 在线无限看免费粉色视频| 中文字幕成人| 色在人av网站天堂精品| 成人乱码一区二区三区| 五月天网站亚洲| 99久久久久久久久久| 丝袜亚洲另类欧美| 亚洲毛片aa| 国产亚洲观看| 久久免费在线观看| 黄色av网址在线免费观看| 欧美怡红院视频| 成人黄色短视频| 国产精品一二三区| 美女日批免费视频| av在线不卡顿| 亚洲在线视频福利| a√中文在线观看| 亚洲人a成www在线影院| 一区二区三区精| 一区二区三区成人| a级在线观看视频| 久久精品国产99| 免费极品av一视觉盛宴| 日韩mv欧美mv国产网站| 国产精品成人v| av软件在线观看| 国产视频久久久久| 91在线精品入口| 亚洲成人av福利| 91狠狠综合久久久久久| 高清av一区二区| 日韩欧美黄色大片| 欧美精品偷拍| 日韩和欧美的一区二区| 日本在线成人| 国产97人人超碰caoprom| 黄色网址在线免费| 亚洲欧美另类国产| 国产后入清纯学生妹| 欧美日韩国产一中文字不卡| 韩国一级黄色录像| 99re6这里只有精品视频在线观看| 中文av一区二区三区| 91久久综合| 免费久久久久久| 国产伦一区二区三区| 99热在线国产| 色999久久久精品人人澡69| 97热在线精品视频在线观看| 欧美天天影院| 亚洲日韩欧美视频一区| 亚洲老妇色熟女老太| 欧美日免费三级在线| 国产午夜免费福利| 亚洲精品国产无天堂网2021| av女人的天堂| 99精品视频一区二区| 免费观看黄网站| 免费不卡在线视频| 欧美韩国日本在线| 在线看片欧美| 日本福利视频在线观看| 日韩精品久久久久久久电影99爱| 国内精品视频免费| 麻豆国产精品| 国产精品自产拍高潮在线观看| 国产拍在线视频| 欧美日韩国产成人高清视频| 欧美一区二区三区在线观看免费| 亚洲人午夜精品| 亚洲区小说区图片区| 亚洲а∨天堂久久精品喷水| 国产浮力第一页| 制服丝袜中文字幕一区| 中文字幕+乱码+中文| 一本色道久久综合亚洲91| 日本熟妇毛茸茸丰满| 亚洲高清一区二区三区| 少妇久久久久久被弄高潮| 亚洲欧美中日韩| 成年人网站在线观看视频| 日本一区二区三区国色天香 | 男人添女荫道口喷水视频| 99国产精品免费视频观看| 性欧美精品一区二区三区在线播放| 亚洲资源网你懂的| 欧美一级二级三级九九九| 精品在线91| 视频一区亚洲| 欧美激情777| 亚洲一区二区在| 99久久综合| 国产女主播av| 国产一区二区三区四区老人| 日韩精品一区二区在线视频| 欧美成人有码| 妞干网视频在线观看| 亚洲区第一页| 国产精品免费观看久久| 久久亚洲风情| 99热一区二区| 国产麻豆91精品| av漫画在线观看| 91一区在线观看| 国产精品成人一区二区三区电影毛片| 久久久久亚洲蜜桃| 国产在线免费av| 亚洲欧美日韩国产综合在线| 欧美日韩激情在线观看| 婷婷综合五月天| 无码一区二区三区| 欧美群妇大交群中文字幕| av在线资源观看| 亚洲第一av在线| 国际av在线| 精品国偷自产在线| 波多野结衣精品| 69久久夜色精品国产7777| 性欧美1819sex性高清| 91精品国产综合久久香蕉922| 国产麻豆一区二区三区| 国产乱子伦精品| 精品视频免费在线观看| 亚洲国产精品女人| 99成人免费视频| www.色就是色| 成人性生交大合| 摸摸摸bbb毛毛毛片| 亚洲女同女同女同女同女同69| 日韩福利片在线观看| 欧美专区在线观看一区| www久久久久久| 亚洲午夜精品视频| 污片在线免费观看| 日韩av免费网站| 天堂精品在线视频| 欧美一二三区| 1000部精品久久久久久久久| 一区二区三区 欧美| 成人在线视频首页| 久久久精品成人| 精品国产老师黑色丝袜高跟鞋| 在线视频1卡二卡三卡| 精品第一国产综合精品aⅴ| 成人高清免费观看mv| 欧美精品激情在线观看| 美女色狠狠久久| 国产一区精品在线| 91精品国产91久久久久久密臀| 1024av视频| 国产成人综合视频| 91视频最新网址| 欧美性生活大片免费观看网址| 99在线精品视频免费观看软件| 亚洲日本中文字幕免费在线不卡| 超碰97免费在线| 亚洲一区二区三区香蕉| 日韩一区电影| 爱情岛论坛vip永久入口| av网站免费线看精品| 久久久全国免费视频| 欧美夫妻性生活| av大片在线播放| 欧洲亚洲妇女av| 麻豆一区二区| 国产一级大片免费看| 美女精品一区二区| 自拍偷拍视频亚洲| 欧美性生交xxxxx久久久| 欧美一级特黄aaaaaa大片在线观看| 久久精品亚洲热| 色综合视频一区二区三区44| 人偷久久久久久久偷女厕| 国产精品久久久亚洲一区| 精品久久久久久无码人妻| 亚洲精品成人天堂一二三| 在线播放一级片| 一夜七次郎国产精品亚洲| 色豆豆成人网| 欧美日韩在线精品一区二区三区| 亚洲欧美视频| 香蕉网在线播放| 一本大道综合伊人精品热热| 亚州av在线播放| 欧日韩不卡在线视频| 日本成人中文| 少妇高清精品毛片在线视频| 久久一二三国产| 亚洲大片免费观看| 亚洲午夜小视频| 欧美三区四区| 亚洲一区二区三区免费观看| 美女精品自拍一二三四| 超碰人人干人人| 欧美日韩成人综合在线一区二区| 中文字幕在线观看日本| 成人精品一区二区三区| 欧美/亚洲一区| 91九色蝌蚪porny| 午夜电影久久久| 黄色片在线免费观看| 国产精品亚洲欧美导航| 亚洲一区二区日韩| 精品人妻二区中文字幕| 香蕉加勒比综合久久| 日韩亚洲视频在线观看| 国产精品视频男人的天堂| 欧美激情电影| 在线观看你懂的视频| 亚洲va韩国va欧美va精品| 欧美另类自拍| 国产精品视频色| 雨宫琴音一区二区三区| 亚洲一区二区三区四区av| 欧美日韩一区二区三区| 成年人视频在线观看免费| 91视频-88av| 亚洲人妖在线| 人妻一区二区视频| 日韩欧美一区电影| 在线一区av| 400部精品国偷自产在线观看| 成人深夜福利app| 国产美女www爽爽爽| 久久久999精品| 美女午夜精品| 午夜免费看毛片| 午夜伦欧美伦电影理论片| 成人p站proumb入口| 成人在线免费观看一区| 久久久久国产一区二区| 国产一区二区精彩视频| 亚洲韩国日本中文字幕| 欧美亚洲人成在线| 一女被多男玩喷潮视频| 国产精品久久久久桃色tv| 少妇人妻偷人精品一区二区 | 日韩亚洲欧美视频| 亚洲国产精品精华液ab| www久久久久久| 国产精品自产拍在线观|