精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Transformer挑戰(zhàn)者出現(xiàn)!斯坦福CMU聯(lián)合團(tuán)隊(duì),開源模型及代碼,公司已創(chuàng)辦

人工智能
Mamba是第一個真正實(shí)現(xiàn)匹配Transformer性能的線性時間序列模型,無論是在預(yù)訓(xùn)練困惑度還是下游任務(wù)評估方面。并且在音頻和DNA序列建模上也優(yōu)于之前的SOTA模型,表現(xiàn)出一定的通用性。

現(xiàn)在ChatGPT等大模型一大痛點(diǎn):

處理長文本算力消耗巨大,背后原因是Transformer架構(gòu)中注意力機(jī)制的二次復(fù)雜度。

FlashAttention作者Tri Dao參與提出的新架構(gòu),成為有力挑戰(zhàn)者,引起大量關(guān)注:

Mamba(曼巴,一種蛇),在語言任務(wù)上擊敗/匹配Transformer性能,具有線性復(fù)雜度和5倍推理吞吐量。

圖片圖片

具體來說,Mamba在語言、音頻、DNA序列模態(tài)上都實(shí)現(xiàn)SOTA。

在最受關(guān)注的語言任務(wù)上,Mamba-3B超越同等規(guī)模的Transformer,與兩倍大的Transformer匹敵。

并且相關(guān)代碼、預(yù)訓(xùn)練模型checkpoint都已開源。

兩位作者的解讀都獲得大量轉(zhuǎn)發(fā)。

圖片圖片

有網(wǎng)友發(fā)現(xiàn),連在線預(yù)測平臺上的“Transformer在2027年還是SOTA嗎?”都在這一天出現(xiàn)明顯下降。

圖片圖片

有選擇處理信息+硬件感知算法。

Mamba是一種狀態(tài)空間模型(SSM,State Space Model)。

建立在更現(xiàn)代的適用于深度學(xué)習(xí)的結(jié)構(gòu)化SSM(S4, Structured SSM)基礎(chǔ)上,與經(jīng)典架構(gòu)RNN有相似之處。

圖片圖片

在先前研究的Mamba主要有三點(diǎn)創(chuàng)新:

  • 對輸入信息有選擇性處理
  • 硬件感知的算法
  • 更簡單的架構(gòu)

選擇性狀態(tài)空間模型

作者認(rèn)為,序列建模的一個基礎(chǔ)問題是把上下文壓縮成更小的狀態(tài)。

從這個角度來看,注意力機(jī)制雖然高性能但低效率,需要顯式地存儲整個上下文(也就是KV緩存),直接導(dǎo)致訓(xùn)練和推理消耗算力大。

類RNN的循環(huán)神經(jīng)網(wǎng)絡(luò)具有有限的狀態(tài),高效,但性能受到對上下文壓縮程度的限制。

Mamba的解決辦法,是讓模型對信息有選擇性處理,可以關(guān)注或忽略傳入的內(nèi)容,即使?fàn)顟B(tài)大小固定也能壓縮上下文。

一個直觀的類比:

Transformer就像人類每寫一個字之前,都把前面的所有字+輸入都復(fù)習(xí)一遍,所以寫的慢。

RNN每次只參考前面固定的字?jǐn)?shù),寫的快,但容易忘掉更前面的內(nèi)容。

Mamba每次參考前面所有內(nèi)容的一個概括,越往后寫對前面內(nèi)容概括得越狠,丟掉細(xì)節(jié)保留大意。

在其前身結(jié)構(gòu)化狀態(tài)空間模型(S4)中,四個參數(shù)A、B、C、?都是固定的,不隨輸入變化。

在Mamaba中,作者讓這些參數(shù)B、C、?成為輸入的函數(shù),讓模型能夠根據(jù)輸入內(nèi)容自適應(yīng)地調(diào)整其行為。

圖片圖片

硬件感知的狀態(tài)擴(kuò)展

為了讓古老的SSM在現(xiàn)代GPU上也能高效計(jì)算,Mamba中使用了FlashAttention同款技術(shù)。

核心思想是利用內(nèi)存的不同層級結(jié)構(gòu)處理SSM的狀態(tài),減少高帶寬但慢速的HBM內(nèi)存反復(fù)讀寫這個瓶頸,具體來說:

  • 在更高速的SRAM內(nèi)存中執(zhí)行離散化和遞歸操作,再將輸出寫回HBM。
  • 通過并行掃描算法實(shí)現(xiàn)并行化。
  • 當(dāng)輸入從HBM加載到SRAM時,中間狀態(tài)不被保存,而是在反向傳播中重新計(jì)算。

圖片圖片

簡化的SSM架構(gòu)

將大多數(shù)SSM架構(gòu)的基礎(chǔ)塊,與現(xiàn)代神經(jīng)網(wǎng)絡(luò)中普遍存在的門控MLP相結(jié)合,組成新的Mamba塊。

重復(fù)這個塊,與歸一化和殘差連接結(jié)合,構(gòu)成Mamba架構(gòu)。

圖片圖片

實(shí)驗(yàn)結(jié)果

Mamba在Chinchilla縮放定律下預(yù)訓(xùn)練時,語言任務(wù)優(yōu)于同類開源模型。

對比對象中的Transformer++為標(biāo)準(zhǔn)GPT-3架構(gòu)加上谷歌PaLM和Meta Llama中的改進(jìn)方案,也就是已知最強(qiáng)Transformer配方。

圖片圖片

下游任務(wù)上,每個規(guī)模尺寸的Mamba都是同類最佳,并且通常與兩倍規(guī)模的基線性能匹配。

圖片圖片

特別是當(dāng)序列長度增加到512k時,相比使用FlashAttention-2的Transformer快幾個數(shù)量級,而且不會內(nèi)存不足。

圖片圖片

Transformer的下一步?

最終,Mamba是第一個真正實(shí)現(xiàn)匹配Transformer性能的線性時間序列模型,無論是在預(yù)訓(xùn)練困惑度還是下游任務(wù)評估方面。

并且在音頻和DNA序列建模上也優(yōu)于之前的SOTA模型,表現(xiàn)出一定的通用性。

作者在結(jié)論中提出,Mamba是通用序列模型骨干的有力候選者。

Stability AI創(chuàng)始人當(dāng)即表示關(guān)注。

圖片圖片

英偉達(dá)科學(xué)家Jim Fan也對Transformer的挑戰(zhàn)者出現(xiàn)感到興奮。

圖片圖片

論文兩位作者Albert Gu和Tri Dao,博士都畢業(yè)于斯坦福大學(xué),導(dǎo)師為Christopher Ré。

Albert Gu現(xiàn)在是CMU助理教授,多年來一直推動SSM架構(gòu)發(fā)展。

他曾在DeepMind 工作,目前是Cartesia AI的聯(lián)合創(chuàng)始人及首席科學(xué)家。

圖片圖片

Tri Dao,以FlashAttention、FlashDecoding系列工作聞名,現(xiàn)在是普林斯頓助理教授,和Together AI首席科學(xué)家,也在Cartesia AI擔(dān)任顧問。

圖片圖片

Cartesia AI公司介紹中提到致力于基于新架構(gòu)構(gòu)建下一代基礎(chǔ)模型,現(xiàn)在看來主要就是指創(chuàng)新的SSM架構(gòu)。

聯(lián)創(chuàng)及CEO Karan Goel同為斯坦福博士畢業(yè),也是Mamba的前身S4論文作者之一。

圖片圖片

對于Mamba的下一步,在論文中有提到“探索新架構(gòu)是否能適用于Transformer已建立起的豐富大模型生態(tài)”。

其中包括微調(diào)、自適應(yīng)、提示學(xué)習(xí)、上下文學(xué)習(xí)、指令微調(diào)、RLHF、量化……也就是要把基礎(chǔ)模型發(fā)展成GPT-3.5、Llama同類的助手模型了。

圖片圖片

但作者也提到,目前的實(shí)驗(yàn)規(guī)模較小,要全面評估SSM是否能與Transformer和其他架構(gòu)如RWKV、微軟RetNet競爭,至少還需要驗(yàn)證7B規(guī)模。

圖片圖片

在擴(kuò)展SSM的過程中,還會遇到新的工程挑戰(zhàn)和對模型的調(diào)整,論文中沒有涉及。

最后,Albert Gu還分享了為什么把新架構(gòu)起名為一種毒蛇的名字:

速度快、對序列建模問題很致命、前身S4是SSSS(嘶嘶嘶嘶)。

圖片圖片

論文:https://arxiv.org/abs/2312.00752

參考鏈接:
[1]https://twitter.com/_albertgu/status/1731727672286294400
[2]https://twitter.com/_albertgu/status/1731727672286294400

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2022-10-08 12:38:23

模型開源

2023-04-04 13:17:00

GPUCMU開源

2024-11-26 10:44:18

2023-03-22 15:14:00

數(shù)據(jù)模型

2025-01-17 10:26:19

模型開發(fā)ChatGPT

2022-07-14 15:08:23

AI模型

2023-12-08 13:22:00

數(shù)據(jù)模型

2024-06-04 14:09:00

2023-03-15 10:26:00

模型開源

2024-09-11 14:59:00

2023-06-25 13:28:21

2025-05-06 00:45:00

2025-10-11 08:52:06

2025-07-21 11:51:12

模型AI工具

2023-07-03 13:23:47

OpenChatOpenLLMChatGPT

2023-03-31 13:55:00

模型智能

2021-04-02 15:02:42

開源技術(shù) 工具

2024-04-24 09:47:36

2012-03-21 21:38:27

蘋果
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

久久久久久久91| 国产精品天干天干在观线| 欧美精品一区二区三区国产精品| 另类小说色综合| 国产福利在线观看| 蜜桃一区二区三区在线| www.亚洲成人| 手机在线视频一区| 一色桃子av在线| 久久精品国产亚洲高清剧情介绍 | 四虎成人精品一区二区免费网站| 国产精品日产欧美久久久久| 国产精品国产亚洲伊人久久| 国产在线免费看| 欧美成人精品一级| 自拍av一区二区三区| 岛国视频一区免费观看| 视频一区二区三区四区五区| 欧美日韩国产传媒| 69堂精品视频| 缅甸午夜性猛交xxxx| 欧美一区二区少妇| 久久99最新地址| 久久久久成人精品| 欧美18—19性高清hd4k| 国产95亚洲| 午夜国产不卡在线观看视频| 日韩偷拍一区二区| 国产综合视频在线| 日本免费在线视频不卡一不卡二| 俺也去精品视频在线观看| 欧美xxxxx少妇| 国产激情欧美| 午夜国产精品一区| japanese在线视频| 青青青草原在线| 国产麻豆视频精品| 国产成人在线视频| 成人免费看片98| 99精品国产一区二区三区| 精品亚洲一区二区| 无码一区二区精品| 涩爱av色老久久精品偷偷鲁 | 超碰地址久久| 亚洲主播在线| 国产一区二区三区视频 | 亚洲在线日韩| 日韩在线视频播放| 中国毛片在线观看| 日韩中文字幕一区二区高清99| 色婷婷av一区| 91午夜在线观看| 日本福利专区在线观看| 91亚洲精华国产精华精华液| 亚洲影视九九影院在线观看| 波多野结衣啪啪| 伊人久久大香线蕉综合热线| 久久精品成人动漫| 波多野结衣一二三四区| 全球av集中精品导航福利| 欧美日韩在线播放三区四区| 久久精品免费一区二区| 欧美精品电影| 国产欧美日产一区| 成人免费在线看片| av手机免费看| 国模一区二区三区白浆| 国产精品久久国产精品99gif| 亚洲一区欧美在线| 在线精品小视频| 久久精品视频99| 国产小视频你懂的| 五月天久久网站| 综合激情国产一区| mm131丰满少妇人体欣赏图| 林ゆな中文字幕一区二区| 日韩写真欧美这视频| 九九九久久久久久久| 国产精品国产亚洲精品| 在线播放/欧美激情| 国产精品人人爽人人爽| 国产一区二区三区朝在线观看| 欧美性猛交xxxx乱大交极品| 免费观看日韩毛片| 超碰aⅴ人人做人人爽欧美| 欧美性生交大片免网| 精品视频在线观看一区| 超碰97免费在线| 亚瑟在线精品视频| 国产97在线 | 亚洲| 亚洲欧洲自拍| 91国在线观看| 日韩av.com| 日韩一区二区三区色| 欧美mv日韩mv国产网站| 欧美xxxx×黑人性爽| 天堂av一区二区三区在线播放| 亚洲美女视频网站| 91社区视频在线观看| 婷婷亚洲五月| 性欧美xxxx交| 精品国产乱子伦| 激情综合网最新| 99久久国产免费免费| 国产伦一区二区| 成人h动漫精品一区二区| 久久伊人一区| 欧美成人二区| 亚洲成人自拍偷拍| 欧美精品第三页| www.欧美| 亚洲精品动漫100p| 免费看91的网站| 国产中文一区| 国产美女主播一区| 能在线看的av| 亚洲精品毛片一区二区三区| 欧美电影在线观看完整版| 日韩电影中文字幕在线| 免费看污黄网站在线观看| heyzo久久| 久久99久久99精品中文字幕| 久久久一二三区| 国产亚洲精品v| 国产美女91呻吟求| 色丁香婷婷综合久久| 欧美韩日一区二区三区四区| 最近免费观看高清韩国日本大全| h片在线观看下载| 亚洲一级二级三级| 国产v亚洲v天堂无码久久久| swag国产精品一区二区| 日韩中文在线观看| 人人草在线观看| 不卡区在线中文字幕| 国产美女视频免费| 精品176极品一区| 亚洲午夜av久久乱码| 国产午夜视频在线播放| 国产一区二区三区四区五区入口| 视频一区视频二区视频三区高| 污的网站在线观看| 欧美一个色资源| 国产美女高潮视频| 久久精品国产一区二区| 视频一区国产精品| 经典三级一区二区| 亚洲偷熟乱区亚洲香蕉av| 久久久久久少妇| 91片在线免费观看| 久久久999视频| 牛牛影视久久网| 久久久久久97| 成人爽a毛片一区二区| 夜夜精品视频一区二区| 国产大学生av| 欧美日韩国产精品一区二区亚洲| 91中文字幕一区| 黄色av电影在线播放| 3d动漫精品啪啪1区2区免费| 国精产品一区一区二区三区mba| 美女国产一区二区三区| 亚洲精品二区| 欧美一区=区三区| 久久精品中文字幕| 国产欧美日韩综合精品一区二区三区| 中文字幕一区二区三区乱码在线 | 国产成人一区二区三区小说| 国产在线超碰| 欧美日韩一区二区三区在线| 亚洲精品电影院| 国产激情精品久久久第一区二区| 日韩成人手机在线| 欧美影院天天5g天天爽| 国产成人精品最新| a√资源在线| 欧美片网站yy| 激情五月少妇a| av成人动漫在线观看| 成年人视频网站免费观看| 国产真实有声精品录音| 国产日韩精品综合网站| 怡红院在线播放| 日韩不卡在线观看| 日韩欧美国产另类| 樱花影视一区二区| aaaaa一级片| 久久国产三级精品| 久久综合亚洲精品| 亚洲bt欧美bt精品777| 国产精品吹潮在线观看| 国产视频一区二区| 日韩av中文字幕在线播放| 在线观看亚洲黄色| 一区二区在线观看视频| 国产精品一级黄片| 蜜臀av一级做a爰片久久| 狠狠干视频网站| 竹菊久久久久久久| 91久久偷偷做嫩草影院| 亚洲高清黄色| 免费91在线视频| 男同在线观看| 日韩午夜在线观看视频| 无码人妻熟妇av又粗又大| 亚洲人成影院在线观看| 日韩人妻无码一区二区三区| 久草精品在线观看| 少妇高潮喷水久久久久久久久久| 久久久久亚洲| 开心色怡人综合网站| 国产美女亚洲精品7777| 日本aⅴ大伊香蕉精品视频| 毛片免费不卡| 欧美精品一区二区在线播放| 懂色av蜜臀av粉嫩av喷吹| 亚洲综合视频在线| 日本黄区免费视频观看| 91理论电影在线观看| 韩国三级与黑人| 日韩电影一区二区三区| 成人免费在线网| 婷婷精品进入| 亚洲二区自拍| 亚洲v天堂v手机在线| 7777精品伊久久久大香线蕉语言| 欧美xxxx做受欧美护士| 91国产中文字幕| 污污影院在线观看| 日韩有码片在线观看| 国产日本在线观看| 日韩高清不卡av| 韩国av电影在线观看| 欧美精品色一区二区三区| 91青青草视频| 欧美日韩免费区域视频在线观看| 青青草原在线免费观看| 中文字幕一区日韩精品欧美| 亚洲久久久久久久| 久久综合久久久久88| 国产xxx在线观看 | 久久精品无码一区二区三区毛片| 天堂在线亚洲视频| 亚洲午夜精品久久久久久人妖| 黄色亚洲精品| 国产精品三级一区二区| 天天综合网91| 伊人色综合影院| 色乱码一区二区三区网站| 日韩电影免费观看高清完整| 国产毛片一区二区三区| 欧美日韩在线高清| 国产一区二区三区四区| 婷婷久久青草热一区二区| 国产最新精品| 色狠狠久久av五月综合| 国产欧美高清视频在线| 日韩成人在线资源| 日韩在线综合| 乱子伦一区二区| 一区二区三区四区日韩| 超级碰在线观看| 国产精品第十页| 日本欧美视频在线观看| 亚洲美女色禁图| 337p粉嫩大胆噜噜噜鲁| 久久综合九色| 69久久久久久| 国产在线日韩欧美| 国产精品99精品无码视亚| 亚洲一区二区福利| 国产在线视频在线观看| 亚洲一区二区三区精品在线| 久久久全国免费视频| 亚洲成人tv网| www.毛片.com| 亚洲精品字幕| 欧美日本视频在线观看| 葵司免费一区二区三区四区五区| 国产91在线视频观看| 丝袜美腿亚洲一区二区图片| 粉嫩虎白女毛片人体| 免费成人美女在线观看| 天堂在线资源8| 欧美一级二级三级蜜桃| 国产黄色一级大片| 亚洲成av人片在线观看香蕉| 天堂av在线免费| 亚洲香蕉伊综合在人在线视看 | 蜜臀av在线播放一区二区三区| 九九热免费在线观看| 国产精品一区专区| 欧美无人区码suv| 欧美激情一区在线| 久久久国产成人| 欧美视频第一页| 一级片视频播放| 精品国一区二区三区| 欧洲毛片在线| 欧美大胆在线视频| 一级毛片久久久| 91亚洲精品在线观看| 丝袜连裤袜欧美激情日韩| 亚洲美女搞黄| 一区二区亚洲| 国产野外作爱视频播放| 成人精品视频一区| www久久久久久久| 亚洲精品视频自拍| 国产免费a视频| 欧美变态tickle挠乳网站| 粉嫩一区二区三区国产精品| 欧美激情视频在线| 成人国产在线| 久久久久久久久久码影片| 午夜精品婷婷| 一区二区在线播放视频| 福利一区二区在线观看| 中文字幕第69页| 黑人巨大精品欧美一区二区免费 | 日韩欧美一级二级| 番号集在线观看| 97国产精品人人爽人人做| 91精品一区| 日产国产精品精品a∨| 亚洲性图久久| www.成年人| 日本一区二区三级电影在线观看| 久久久久亚洲天堂| 51精品秘密在线观看| av网站在线免费观看| 奇米4444一区二区三区| 97超碰成人| 欧美人与动牲交xxxxbbbb| 精品系列免费在线观看| 蜜桃传媒一区二区亚洲| 精品久久香蕉国产线看观看gif| 国产精品无码久久av| 中文字幕av一区二区| 三上悠亚亚洲一区| 久久av二区| 亚洲一级一区| 国偷自产av一区二区三区麻豆| 一区精品在线播放| 中文精品久久久久人妻不卡| 日韩精品免费视频| www.51av欧美视频| 国产美女精品在线观看| 好看的亚洲午夜视频在线| 被黑人猛躁10次高潮视频| 18成人在线视频| 亚洲在线精品视频| 伊人久久男人天堂| 欧美与亚洲与日本直播| 日本一区二区精品视频| 久久福利一区| 免费观看av网站| 在线影视一区二区三区| 搞黄视频免费在线观看| 国产精品99一区| 欧美日韩精品在线一区| 少妇激情一区二区三区| 国产欧美一区二区三区网站| 久久国产黄色片| 日韩久久免费电影| 深夜视频一区二区| 伊人天天久久大香线蕉av色| 免费人成精品欧美精品| 五月婷婷综合激情网| 欧美军同video69gay| 黄色成年人视频在线观看| 96精品久久久久中文字幕| 欧美国产三区| 亚洲午夜久久久久久久久| 狠狠色狠狠色综合日日五| 极品白浆推特女神在线观看| 国产精品久久一| 中文字幕一区二区av | 亚洲图片都市激情| 国产一区在线看| 妺妺窝人体色www婷婷| 亚洲第一区第一页| 日韩制服一区| 亚洲免费视频播放| 99精品视频一区| 青青草视频在线观看免费| 色诱女教师一区二区三区| 日韩免费一级| 午夜精品久久久久久久无码 | www成人啪啪18软件| 91精品国产手机| 国产高清自产拍av在线| 亚洲国产欧美日韩| 懂色av一区二区三区免费看| 五月天婷婷久久| 日韩在线高清视频| 国产福利一区二区精品秒拍| 亚洲色图38p| 亚洲伦理在线精品| 日本福利片在线|