精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2 精華

發布于 2024-4-17 13:26
瀏覽
0收藏

繼Mamba之后,又一敢于挑戰Transformer的架構誕生了!


來自Meta、南加州大學(USC)、CMU和UCSD的研究人員提出了全新的神經網絡架構——Megalodon(巨齒鯊)。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

這是專為有效處理「無限上下文」長度的LLM預訓練,以及推理而設計的架構。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

論文地址:??https://arxiv.org/abs/2404.08801??


我們都知道,Transformer架構個在處理長上下文時,會受到二次復雜度,以及長度外推能力弱的限制。


盡管已有次二次方解決方案(諸如線性注意力,狀態空間模型),但它們在預訓練效率,甚至下游任務的準確率上,通常還不及Transformer。


Megalodon的出現,就是為了解決無限處理上下文的難題。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

同時,它可以同時實現高效訓練(減少通信和計算量),以及高效推理(保持恒定的KV緩存)。


值得一提的是,在與Llama 2的直接比較中,Megalodon在處理70億參數和2萬億訓練token的任務上,不僅訓練更高效,而且準確率也超過了Transformer。


具體來說,Megalodon的訓練損失為1.70,位于Llama2-7B(1.75)和 13B(1.67)之間。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

這一改變范式的創新代表著AI領域的巨大飛躍,Megalodon開啟了計算效率和性能的新時代。

GPT-3發布以來最大里程碑

網友表示,先是谷歌,又是Meta,無限上下文離我們更進一步,LLM將會釋放出無限潛力。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

還有人認為「無限上下文長度,絕對是游戲規則的改變者」!

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

更有甚者,初創公司CEO稱,「這是自GPT-3發布以來最大的里程碑,但卻沒有任何動靜?!


Megalodon就相當于是AGI的基礎」。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

「Meta的Megalodon是一項突破性進展,對AGI具有重要意義。它的無限上下文長度模擬了人類的認知,實現了無縫任務切換」。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

論文作者Hao Zhang表示,這是一種全新替代Transformer的架構。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

論文作者Beidi Chen稱,「注意力雖好,但你不需要完整的注意力機制」!

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

普林斯頓助理教授Tri Dao表示,「將SSM/RNN/EMA與注意力相結合是獲得更高質量、更長上下文和更快推理的方法!Griffin、Jamba、Zamba和現在的Megalodon都是很好的例子」。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

革命性架構,訓練更穩定

那么,Megalodon架構采用了怎樣的設計,才能取得如此優異的表現?


據介紹,它基于MEGA架構進行了改進,并新增了多個技術組件。


首先,復雜指數移動平均(CEMA)組件是一種全新技術,擴展了MEGA中使用的多維阻尼指數移動平均方法到復數域,可以增強模型處理復雜數據的能力。


其次,研究人員提出了一種創新的歸一化技術——「時間步歸一化層」。


它將傳統的組歸一化技術擴展到自回歸序列建模任務中,允許模型在處理序列數據時,進行有效的歸一化。


以往,「層歸一化」(Layer Normalization)與Transformer相結合性能,雖令人印象深刻。


但很明顯,層歸一化并不能直接減少時間步長或順序維度的內部協變量偏移。


另外,「組歸一化」(Group Normalization)雖比「層歸一化」在CV任務中獲得改進,但它卻無法直接應用于Transformer的自回歸序列建模,因未來信息會通過時間步維度的均值和方差泄漏。


如下圖所示,c展示了Megalodon架構中,層標準化和時間步標準化的方法。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

最后,研究人員為了增強大規模LLM預訓練的穩定性,提出了將歸一化注意力,和帶有兩跳殘差的預歸一化相結合的配置。


這種配置可以優化模型的學習過程,提高訓練的穩定性。


下圖3中,a是Megalodon的完整框架草圖。


中間和右邊兩張圖分別介紹了,預歸一化和帶有兩跳殘差預歸一化的配置。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

2T token訓練,性能超越Llama2-7B

在具體實驗評估中,研究人員將Megalodon擴展到70億參數規模,并將其應用于2萬億token的大規模LLM預訓練中。


此外,作者還在中/小參數規模的序列建模基準上進行了實驗,包括Long Range Arena (LRA) 、Speech Commands上的原始語音分類、ImageNet-1K上的圖像分類,以及WikiText-103和PG19上的語言建模。


結果顯示,在這些任務中,Megalodon在各種數據模式下的表現明顯優于所有最先進的基線模型。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

數據學習效率

?

通過訓練損失圖以及多個benchmark的結果可以看出,Megalodon比Transformer在7B參數下有更好的數據學習效率。


計算效率

?

針對不同的4K和32K上下文長度,Megalodon這一架構的預訓練的計算效率也是非常強的。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

學術基準上短上下文評估

?

具體來說,研究人員在短上下文(4K token)的標準學術基準上,對Megalodon與Llama 2,以及開源基礎模型進行了比較。


在相同的2萬億token訓練后,Megalodon-7B的表現明顯優于Llama2-7B。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

長上下文評估

?

針對不同長上下文困惑度,證明了Megalodon可以利用很長的上下文進行下一個token預測的能力。


圖5顯示了,驗證數據集在4K到2M各種上下文長度下的困惑度(PPL)。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

在Scroll數據集中的長上下文QA任務中,Megalodon在NaQA上獲得最佳F1,并與Llama 2 Long相競爭。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

中等規模基準評估

?

在Long Range Arena(LRA)的測試中,新架構顯著縮小了分塊注意力和全注意力之間的性能差距。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

其他評測集,如原始語音分類、ImageNet-1K、WikiText-103和PG-19的結果如下:

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

一些感想

這里quote一下這項研究原作者的一些感悟和經歷:

這個工作從有想法到最終完成,經歷了近兩年的時間。期間經歷數次失敗,也學習到了很多大規模預訓練時代正確做科研的方法。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

通過這個項目,研究者們也體會到了在大模型時代做新的模型架構時要注意的問題。總結來說:

  • 對于兩個不同模型架構的比較必須要在數據完全相同的條件下才有說服力。當數據不同的時候,哪怕不同的比例很?。?lt;10%),最后的結果也可能有明顯的差別。包括training loss和下游任務的結果,都受到訓練數據的很大影響。
  • 對于不同的架構,一定要在模型得到充分訓練的條件下的比較才有意義。例如對于7B大小的模型,2T的訓練數據幾乎是基本要求。有的模型可能在數據少的時候表現的很好,但是數據規模增大后反而落后其他模型。因此,對于大模型架構的比較,結果有說服力的前提是充分的訓練。

革命新架構掀翻Transformer!無限上下文處理,2萬億token碾壓Llama 2-AI.x社區

  • 對于架構差別很大的模型,傳統的基于flops的scaling law的比較意義在降低。原因是兩個不同架構的模型,即使有相同的flops,他們的實際速度可能差幾倍。這個和架構算法本身是不是適合在最先進的GPU上計算有很大的關系。因此,真正貼合實際的比較方法是像本文中那樣分成數據學習效率和計算效率兩個方面。但是這樣在實際中對于研究員的工程能力有很高的要求。在大模型時代,新算法的開發已經和系統等方面高度結合在一起。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/xgP9P51gjqJ93FYSWfPeaA??

收藏
回復
舉報
回復
相關推薦
国产视频在线视频| 亚洲 日韩 国产第一区| 日本一区二区三区免费视频| 日韩av系列| 欧美在线视频全部完| 亚洲欧美国产精品桃花| 精品国产av一区二区| 亚洲麻豆av| 影音先锋欧美精品| 日本成人在线免费| 香蕉视频亚洲一级| 一区二区三区四区av| 精品人伦一区二区三区| 在线观看视频中文字幕| 黄色av日韩| 最近2019中文字幕mv免费看 | 国产精品成人观看视频免费| 99热在线观看免费精品| 欧美高清视频手机在在线| 精品久久久久久久久久久久久久久久久 | 69av在线| 99久久久久免费精品国产 | 中文字幕乱码日本亚洲一区二区| julia一区二区中文久久94| 最新中文字幕在线观看视频| 精品白丝av| 日韩中文字在线| 亚洲精品女人久久久| 成人免费91| 欧美在线不卡视频| 两根大肉大捧一进一出好爽视频| 成年人黄视频在线观看| 久久一区二区三区四区| 国产不卡一区二区在线观看| 91久久久久国产一区二区| 午夜宅男久久久| 国外成人性视频| 激情综合五月网| 亚洲激情五月| 色妞色视频一区二区三区四区| 黄色a一级视频| 99精品在免费线中文字幕网站一区| 色综合久久久久久久久久久| 日韩小视频在线播放| 性欧美猛交videos| 亚洲美女视频一区| 综合网五月天| 乱人伦中文视频在线| 中文字幕乱码久久午夜不卡| 日韩久久久久久久| 成年女人的天堂在线| 久久精品夜夜夜夜久久| 欧美大陆一区二区| 日本一区视频| 久久亚洲私人国产精品va媚药| 精品国产一区二区三区久久久久久| www.香蕉视频| 成人免费精品视频| 国产一区国产精品| 香港一级纯黄大片| 99re6这里只有精品视频在线观看| 国产精品亚洲综合| 香蕉视频成人在线| 久久久99免费| 亚洲图片在线观看| 黄色网在线播放| 伊人色综合久久天天人手人婷| 男女裸体影院高潮| av资源中文在线天堂| 午夜精品久久久久久久99樱桃| 成熟丰满熟妇高潮xxxxx视频| 欧美日韩国产观看视频| 欧美性xxxxxxxx| 国产福利精品一区二区三区| 亚洲国产视频二区| 精品国产精品网麻豆系列| 午夜av免费看| 精品国产一区二区三区香蕉沈先生 | 亚洲国产精品影院| 欧美成人一区二区在线观看| 经典三级一区二区| 91麻豆精品国产自产在线| 精产国品一二三区| 蜜桃久久久久| 亚洲最新av在线网站| 日本精品在线免费观看| 亚洲国产午夜| 国产精品高潮呻吟久久av无限| 国产精品久久777777换脸| 国产成人精品免费在线| 欧美成ee人免费视频| 日本免费视频在线观看| 亚洲va在线va天堂| 国产区二区三区| 成人偷拍自拍| 自拍视频国产精品| 国产午夜精品无码一区二区| 日韩中文欧美在线| 超碰国产精品久久国产精品99| 欧美在线一卡| 亚洲欧美一区二区三区极速播放 | 一区二区三区观看| heyzo中文字幕在线| 欧美性大战久久久| a级一a一级在线观看| 99久久.com| 91av在线不卡| 国产精品色综合| 91免费看片在线观看| 中文字幕人成一区| 成人片免费看| 欧美xxxxxxxxx| 中文字幕91视频| 亚洲免费婷婷| 成人久久18免费网站漫画| 成人高清免费在线播放| 日韩毛片精品高清免费| 黄色成人免费看| 动漫视频在线一区| 不卡伊人av在线播放| 亚洲无码精品一区二区三区| www.日韩在线| 精品人妻大屁股白浆无码| 久久久久伊人| 亚洲欧洲中文天堂| 亚洲免费黄色网址| 成人美女视频在线观看18| 青青草影院在线观看| 国产经典一区| 亚洲午夜性刺激影院| 日韩欧美a级片| 国产成+人+日韩+欧美+亚洲 | 99国产精品99久久久久久粉嫩| 国产在线精品一区免费香蕉| 高清福利在线观看| 色女孩综合影院| 日韩精品卡通动漫网站| 亚洲欧洲一区| 国产亚洲一区二区三区在线播放 | 国产91色在线免费| 欧美日韩免费做爰大片| 舔着乳尖日韩一区| 男人网站在线观看| 一区在线观看| 国产伦精品一区二区三区视频免费 | 久久嫩草精品久久久精品| 日本丰满少妇xxxx| 欧美自拍一区| 4p变态网欧美系列| 黄色大片在线看| 欧美在线一区二区三区| 欧洲性xxxx| 毛片av中文字幕一区二区| 亚洲免费精品视频| 中文字幕日韩亚洲| 不用播放器成人网| 亚洲精品久久久久久久久久久久久久 | 韩国av一区二区| 亚洲av首页在线| 中文字幕一区二区三区中文字幕| 欧美尺度大的性做爰视频| 国产精品怡红院| 亚洲制服欧美中文字幕中文字幕| 风韵丰满熟妇啪啪区老熟熟女| 亚洲激情女人| 日韩欧美精品一区二区三区经典| 韩日一区二区| 久久91亚洲人成电影网站| 亚洲av色香蕉一区二区三区| 亚洲第一久久影院| 中文幕无线码中文字蜜桃| 日韩精品一二三区| 福利网在线观看| 99精品中文字幕在线不卡| 欧洲成人午夜免费大片| 97人人在线| 精品剧情在线观看| 久草视频一区二区| 中文字幕亚洲欧美在线不卡| 一级片免费在线观看视频| 伊人蜜桃色噜噜激情综合| 精选一区二区三区四区五区| 精品视频一区二区三区四区五区| 久久久国产成人精品| 超碰人人人人人人| 色综合视频在线观看| 亚洲色图100p| 不卡一区二区在线| 91小视频网站| 国自产拍偷拍福利精品免费一| 蜜桃传媒视频麻豆第一区免费观看 | 亚洲黄色影院| 亚洲免费精品视频| 欧美激情极品| 亚洲自拍偷拍第一页| 性xxxxfreexxxxx欧美丶| 日韩一区二区av| 日韩一区av| 日韩亚洲欧美中文三级| 波多野结衣啪啪| 亚洲综合999| 刘亦菲国产毛片bd| 99精品桃花视频在线观看| 日本在线播放一区二区| 免费一区视频| 美女扒开大腿让男人桶| 北条麻妃国产九九九精品小说| av日韩中文字幕| 欧美一级做a| 青青青国产精品一区二区| 2020国产在线视频| 色系列之999| 欧洲成人av| 亚洲第一级黄色片| 精品久久久久久亚洲综合网站| 色999日韩国产欧美一区二区| 国产一级av毛片| 亚洲天堂精品在线观看| 黄色片在线观看免费| 99re热这里只有精品免费视频 | 真实的国产乱xxxx在线91| 婷婷开心久久网| 青青草成人免费| 亚洲视频香蕉人妖| 国产aaaaaaaaa| 久久精品免视看| 中文字幕丰满孑伦无码专区| 成人永久免费视频| 人妻巨大乳一二三区| 国产综合色产在线精品| 欧美成人黄色网址| 日本欧美在线观看| 欧美视频第三页| 亚洲影音一区| 亚洲中文字幕无码专区| 中文久久精品| 国产综合av在线| 夜久久久久久| 日韩五码在线观看| 影音先锋亚洲一区| 久久国产精品网| 伊人激情综合| 国产婷婷一区二区三区| 亚洲视频免费| 国产无限制自拍| 日韩午夜精品| 日本成年人网址| 久久国产毛片| caopor在线视频| 男女男精品视频| 国产色视频在线播放| 狠狠色丁香久久婷婷综合_中| 午夜视频在线网站| 国产一区不卡视频| 无码人妻一区二区三区免费n鬼沢| 岛国精品在线观看| 国产精品无码永久免费不卡| aaa国产一区| 三上悠亚影音先锋| 欧美国产一区二区| www色aa色aawww| 亚洲午夜影视影院在线观看| 久久草视频在线| 色嗨嗨av一区二区三区| 中文字幕一区二区三区四区视频 | 日韩美女毛茸茸| 亚洲日本在线观看视频| 成人免费网站在线观看| 美女国产精品久久久| 国产精品一区二区三区不卡| 九九热播视频在线精品6| 快播亚洲色图| 欧美大片aaaa| 日韩一级性生活片| 日韩**一区毛片| 无人码人妻一区二区三区免费| 99久久综合色| 青青青视频在线免费观看| 一级特黄大欧美久久久| 在线观看免费av片| 91麻豆精品久久久久蜜臀| 色欲久久久天天天综合网| 国产一区二区激情| 99热国产在线| 日本欧美一二三区| 榴莲视频成人app| 久久久久一区二区| 仙踪林久久久久久久999| 免费不卡av在线| 久久精品国产免费| 中文字幕第九页| 国产精品免费人成网站| 国产一卡二卡在线播放| 欧美吞精做爰啪啪高潮| 成人爽a毛片一区二区| 一区二区欧美日韩视频| 日本大胆在线观看| 国产精品视频免费在线| 国产96在线亚洲| 桥本有菜av在线| 亚洲欧美日韩国产一区| 性色av浪潮av| 欧美激情在线一区二区| 久久影院一区二区| 欧美精品日日鲁夜夜添| 青梅竹马是消防员在线| 欧美激情精品久久久久久免费印度 | 成人在线视频网址| 成人系列视频| 国产在线青青草| 国产成+人+日韩+欧美+亚洲| 亚洲综合第一区| 色综合天天综合在线视频| 高清一区二区三区四区| 久久伊人91精品综合网站| 日本一区二区三区视频在线| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 欧美色欧美亚洲另类七区| 亚洲天堂偷拍| 日本特黄在线观看| 国产精品三级久久久久三级| 国产无遮挡呻吟娇喘视频| 欧美成人a∨高清免费观看| 日本中文字幕视频在线| 国产成人拍精品视频午夜网站| 国产精品对白久久久久粗| 喜爱夜蒲2在线| 极品少妇一区二区| 精品一区二区6| 色噜噜久久综合| 免费在线观看污视频| 久久久综合av| 哺乳一区二区三区中文视频| 日本黄网站色大片免费观看| 老汉av免费一区二区三区| 波多野结衣家庭教师在线观看| 色婷婷av一区二区三区软件| 日韩精品视频无播放器在线看| 午夜精品一区二区三区视频免费看 | 日av在线不卡| 免费看黄色av| 91极品美女在线| 成人性生交大片免费看午夜| 国产激情久久久| 欧美视频免费| 在线免费av播放| 中文字幕一区视频| 国产日产亚洲系列最新| 免费不卡欧美自拍视频| 免费观看性欧美大片无片| 欧美美女黄色网| 成年人网站91| 极品国产91在线网站| 中文亚洲视频在线| va天堂va亚洲va影视| 久久福利一区二区| 国产91高潮流白浆在线麻豆| www.youjizz.com亚洲| 亚洲精品电影久久久| 成人勉费视频| 一区二区欧美日韩| 国产激情一区二区三区桃花岛亚洲| 91视频综合网| 亚洲国产美女久久久久| 成人香蕉视频| 亚洲欧洲精品一区二区三区波多野1战4 | 日韩av成人在线观看| 欧洲美女日日| 免费黄频在线观看| 亚洲成国产人片在线观看| 欧美香蕉爽爽人人爽| 国产欧美在线观看| 国产精品国码视频| 精品夜夜澡人妻无码av| 欧美日韩免费在线视频| 性爱视频在线播放| 免费h精品视频在线播放| 久草精品在线观看| 国产大片中文字幕在线观看| 亚洲欧美日韩精品久久| 日韩美女在线| 欧美久久久久久久久久久久久| 国产偷国产偷精品高清尤物| 国产乱淫片视频| 91超碰caoporn97人人| 久久中文视频| 成人在线视频免费播放| 欧美日韩一区二区三区在线看| 欧美hdxxx| 亚洲成人a**址| 高清成人在线观看| 在线视频精品免费| 久久久免费观看视频| av亚洲在线观看| 人妻体内射精一区二区三区| 欧美午夜精品免费| 91在线三级| 伊人久久青草| www日韩大片| www.黄色片|