精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無Tokenizer時代真要來了?Mamba作者再發顛覆性論文,挑戰Transformer

人工智能 新聞
Tokenization,一直是實現真正端到端語言模型的最后一個障礙。

我們終于擺脫 tokenization 了嗎?

答案是:可能性無限大。

最近,Mamba 作者之一 Albert Gu 又發新研究,他參與的一篇論文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一個分層網絡 H-Net,其用模型內部的動態分塊過程取代 tokenization,從而自動發現和操作有意義的數據單元。

圖片

「這一研究預示著 Tokenizers 正在退場,智能字節分塊(Smart Byte Chunks)開始登場。或許無需 Tokenizer 訓練的時代真的要來了 —— 可能性無限大。」X 知名博主 Rohan Paul 表示道。

image.png

現階段,Tokenization 仍然是語言模型和其他順序數據不可或缺的組成部分,因為它能夠壓縮和縮短序列。然而 Tokenization 存在許多缺點,如可解釋性差,在處理復雜語言(如中文、代碼、DNA 序列)時性能下降等。

迄今為止,尚未有任何端到端的無 tokenizer 模型在計算預算相匹配的情況下超越基于 tokenizer 的語言模型的表現。最近,已經有研究開始致力于在自回歸序列模型中突破 Tokenization 限制。

在此背景下,來自 CMU、 Cartesia AI 等機構的研究者提出了一系列新技術,通過動態分塊機制實現內容與上下文自適應的分割策略,該機制可與模型其他部分聯合學習。將這一機制融入顯式分層網絡(H-Net)后,原本隱含分層的「tokenization–LM–detokenization」流程可被完全端到端的單一模型取代。

在計算資源和數據量對等的條件下,僅采用單層字節級分層的 H-Net 模型,其表現已優于基于 BPE token 的強 Transformer 語言模型。通過多級分層迭代建模不同抽象層級,模型性能得到進一步提升 —— 這不僅展現出更優的數據規模效應,更能媲美兩倍規模的基于 token 的 Transformer 模型。

在英語預訓練中,H-Net 展現出顯著增強的字符級魯棒性,并能定性學習有意義的、數據依賴的分塊策略,全程無需啟發式規則或顯式監督。

最后,在 tokenization 啟發式方法效果較弱的語言和模態(如中文、代碼或 DNA 序列)中,H-Net 相比 tokenization 流程的優勢進一步擴大(數據效率較基線提升近 4 倍),這證明了真正端到端模型從未經處理數據中實現更優學習和擴展的潛力。

image.png

論文地址:https://arxiv.org/pdf/2507.07955v1

沒有 Tokenization 的端到端序列建模

本文提出了一種端到端的分層網絡(H-Net),通過遞歸、數據依賴的動態分塊(DC,dynamic chunking)過程壓縮原始數據(見圖 1)。H-Net 在保持與 token 化流程相同效率的同時,通過用從數據中學習的內容感知和上下文依賴的分割替代手工啟發式方法,顯著提高了建模能力。 

2025-07-12_093909.png

分層處理

H-Net 采用了分層架構,其工作流程分為三步:

  • 精細處理:先用小型編碼器網絡處理原始數據(如逐個字節 / 字符);
  • 壓縮抽象:將數據壓縮下采樣后,交給主網絡(可理解為大腦核心)處理;
  • 還原輸出:最后上采樣并通過解碼器還原到原始精度。

這種設計形成了天然的認知分層 —— 外層捕捉細粒度的模式,內層處理抽象概念。

關鍵是,主網絡包含了大部分參數,并且可以適配任何標準架構,例如 Transformer 或狀態空間模型(SSM)。

動態分塊

H-Net 的核心是動態分塊(DC)機制,它位于主網絡與編碼器 / 解碼器網絡之間,用于學習如何分割數據,同時使用標準的可微優化方法。DC 由兩種互補的新技術組成:

(i) 路由模塊,通過相似度評分預測相鄰元素之間的邊界;

(ii) 平滑模塊,使用路由器的輸出插值表示,通過減弱不確定邊界的影響,顯著提高學習能力。

通過將這些技術與一個新的輔助損失函數結合,并利用現代基于梯度的離散選擇學習技術,DC 使得 H-Net 能夠以完全端到端的方式學習如何壓縮數據。

信號傳播

本文還引入了幾種架構和訓練技術,以提高端到端優化過程中的穩定性和可擴展性。這些技術包括:(i) 精心布置的投影層和歸一化層,以平衡交互子網絡之間的信號傳播;(ii) 根據每層的維度和有效批次大小調整其優化參數。

總的來說,H-Net 學習了與主干網絡聯合優化的分割策略,基于上下文信息動態地將輸入向量壓縮成有意義的數據塊。

H-Net 代表了第一個真正的端到端、無 tokenizer 的語言模型:通過一個動態分塊階段,字節級的 H-Net 在超過 10 億參數的規模下,達到了與強大的 BPE token 化 Transformer 相當的困惑度和下游性能。

從經驗上看,動態分塊模塊自然地將數據壓縮到與 BPE tokenizer 相似的分辨率(每塊 4.5-5 字節),并且在沒有任何外部監督或啟發式方法的情況下,定性地學習到有意義的邊界。 

實驗及結果

實驗中,本文采用的主要語言模型架構如下所示,如 MambaByte 是使用純 Mamba-2 層的各向同性模型。

image.png

 Training Curves. Figure 3 presents validation BPB metrics throughout training for both Large and XL model scales

訓練曲線。圖 3 顯示了 Large 和 XL 規模模型在整個訓練過程中的驗證 BPB 指標。

image.png

在較大規模上,本文注意到:

所有各向同性模型在性能上都遠遜色于分層模型。在這些模型中,MambaByte 明顯優于 LlamaByte。

SpaceByte 明顯遜色于 SpaceByte++,這一結果驗證了本文在外部網絡中使用 Mamba 的有效性。SpaceByte++ 又比 H-Net(space)差,表明本文提出的改進信號傳播技術的有效性。

H-Net(space)是一個非常強大的模型,達到了與 BPE Transformer 相當的性能,驗證了數據依賴的分塊策略與精心設計的分層架構的效果。

表 2 展示了不同模型在多個下游基準測試上的零樣本準確率。

SpaceByte++、H-Net(space)和 H-Net(1-stage)在大規模上與 BPE Transformer 的性能相似,在 XL 規模上稍微超越了 BPE Transformer。 

image.png

表 3 評估了模型在 HellaSwag 上的魯棒性。與所有基準模型相比,H-Net(2-stage)顯著提高的魯棒性。 

image.png

圖 4 提供了 H-Net(1-stage)和 H-Net(2-stage)動態繪制的邊界的可視化圖。這些可視化提供了關于模型如何決定邊界的幾個重要見解。 

2025-07-12_104349.png

即使使用 Llama3 tokenizer,本文發現 H-Net(2-stage)在中文和代碼處理上,比 BPE Transformer 和 H-Net(space)具有更好的擴展性(圖 5),并且在衰退階段后實現了更低的壓縮率(表 4)。

之前的研究已經證明,SSM 在 DNA 序列建模上比 Transformer 表現更好。實驗(表 5)也驗證了這一點:即使換成 Mamba-2 作為主網絡,SSM 的優勢仍然存在。

image.png

image.png

實際上,通過直接比較訓練穩定階段的困惑度曲線(圖 6),本文發現 H-Net 模型在數據量僅為 3.6 倍的情況下,能夠達到與各向同性模型相似的性能,這一發現適用于兩種主網絡架構的選擇。 

image.png

最后,Albert 還撰寫了精彩的博客文章,介紹關于 H-Net 的幕后故事和精彩見解。感興趣的讀者可以前去閱讀。

博客地址:https://goombalab.github.io/blog/2025/hnet-past/

了解更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-10 08:50:00

2023-12-25 15:11:16

AI模型

2018-07-06 14:34:36

iPad Pro平板電腦蘋果

2009-05-08 09:00:51

微軟鮑爾默谷歌

2024-05-13 10:38:08

2013-08-28 10:39:45

視覺設計顛覆性思維設計

2025-08-06 07:00:00

CIOIT路線圖企業

2023-02-02 11:17:44

數據中心運營商集群

2022-07-01 05:47:19

PyCharm插件開發

2017-11-15 06:55:00

區塊鏈比特幣區塊鏈技術

2023-12-29 08:02:17

大模型人工智能AI

2013-11-27 10:35:14

大數據+云顛覆科技

2019-02-21 00:06:57

物聯網IOT技術

2025-07-15 02:00:00

UIUCEBT架構

2013-05-27 10:46:05

移動互聯網自動化物聯網

2015-06-29 10:28:39

Home交互設計蘋果

2011-10-17 14:10:54

云計算服務器

2013-03-27 15:58:36

思科硅光子技術SDN

2013-02-26 13:21:33

SDN網絡世界軟件定義網絡

2013-08-20 10:05:39

Windows Azu微軟創投云平臺
點贊
收藏

51CTO技術棧公眾號

国产精品v亚洲精品v日韩精品| 精品欧美一区二区久久久久| 91精品国产综合久久精品| 精品国产999久久久免费| 制服丝袜一区二区三区| 国产在线观看精品一区| 97人人模人人爽人人喊38tv| 麻豆精品国产91久久久久久| 中文字幕一区二区免费| 欧美孕妇孕交黑巨大网站| 中文字幕日韩亚洲| 男女啪啪的视频| 久久久久亚洲蜜桃| 深夜福利视频在线观看| 久久久精品美女| av2020不卡| 国产精品久久国产三级国电话系列| 九九国产精品视频| 国产精品爽爽久久久久久| 最近免费中文字幕视频2019| 亚洲国产精品综合久久久 | 大尺度做爰床戏呻吟舒畅| 日韩一区二区视频在线观看| av手机在线观看| 国产男女无遮挡| 亚洲一区免费视频| 日本伦理一区二区| 免费视频爱爱太爽了| 99在线精品观看| 熟女俱乐部一区二区视频在线| 国产视频久久久久久久| 欧美调教在线| 少妇久久久久久久久久| 亚洲第一网站男人都懂| 国产精品玖玖玖在线资源| 无码国产精品一区二区免费式直播 | 蜜桃av久久久亚洲精品| 国产精品一区二区x88av| 国产精品视频久久久久久久| 中文字幕av一区二区| 日韩精品dvd| 午夜成人亚洲理伦片在线观看| 中文欧美日本在线资源| 欧美午夜不卡| 一区二区三区免费在线观看视频| 久久网福利资源网站| 久久不射网站| 亚洲天堂网在线视频| 国产日韩av在线| 亚洲麻豆一区| 日本私人网站在线观看| 超碰超碰超碰超碰超碰| 欧洲在线/亚洲| 欧一区二区三区| 女人裸体性做爰全过| 大胆人体色综合| 欧美一级播放| ,亚洲人成毛片在线播放| 欧美日韩精品免费观看视一区二区| 欧美婷婷六月丁香综合色| 欧美日韩国产在线一区| 久草福利在线视频| 天天爽人人爽夜夜爽| 欧美乱熟臀69xxxxxx| 欧美日韩国产一区精品一区| 精品国产18久久久久久| 久久爱av电影| 91.com视频| 欧美国产精品| 老司机午夜在线| 亚洲成年人av| 日本精品视频在线播放| 国产精品日韩| 天天摸天天碰天天爽天天弄| 国产精品一区二区欧美| 欧美伊人精品成人久久综合97| 欧美裸体在线版观看完整版| 国产在线拍揄自揄拍无码视频| 国产精品色婷婷视频| 国产精品色哟哟网站| 欧美亚洲大陆| 国产特级黄色录像| 久久久中精品2020中文| 国产成人综合在线观看| 视频在线不卡| 午夜国产福利在线观看| 国产成人在线一区| 在线免费观看日韩欧美| 窝窝社区一区二区| 婷婷开心激情网| 黄页网站大全在线观看| 亚洲成色999久久网站| 国产91综合一区在线观看| 2019年精品视频自拍| 日本老熟俱乐部h0930| 亚洲精品欧美精品| 亚洲欧美日韩在线高清直播| 成人国产免费视频| 精品欧美激情在线观看| 91久久精品无码一区二区| 国产超碰91| 欧美三级视频在线| 9色精品在线| 91美女视频在线| 欧美手机在线观看| 日韩偷拍一区二区| 亚洲片在线资源| 国产精品污www在线观看| 韩国三级成人在线| 国产一级av毛片| 视频一区二区在线| 久久福利网址导航| 成人国产精品视频| 牛牛影视一区二区三区免费看| 亚洲AV成人无码网站天堂久久| 999国内精品视频在线| 在线播放国产精品二区一二区四区| 成人av网站免费| 欧美在线首页| 久久人体大尺度| 国产毛片一区二区三区va在线| 日韩精品――色哟哟| 国产成人鲁鲁免费视频a| 欧美日韩黄色大片| 国产一区二区福利| 免费成人三级| 国产小视频福利在线| 日韩欧美国产成人精品免费| 国产主播自拍av| 欧美成人精品三级在线观看| 91精品国产综合久久福利软件| 西西裸体人体做爰大胆久久久| 国产传媒在线观看| 日本高清视频在线| 久久亚洲AV成人无码国产野外| 99re8这里只有精品| 欧美激情国产日韩精品一区18| 亚洲人成7777| 色老太综合网| 日本少妇高潮喷水xxxxxxx| 日韩视频精品| 97免费视频在线播放| 欧美一区二区三区免费| 亚洲小说区图片区| 久久久人成影片一区二区三区| 日韩久久中文字幕| 国内成人自拍视频| 日韩经典在线视频| 日本蜜桃在线观看视频| 欧美一二区视频| 91成人在线免费视频| 影音先锋亚洲精品| 国产精品日韩精品| 韩国av免费在线观看| 99久精品国产| 免费高清一区二区三区| 澳门成人av网| 亚洲欧美日韩网| 丁香激情五月少妇| 视频一区欧美精品| 欧美一区二区三区四区夜夜大片| 日韩免费网站| 欧美裸体一区二区三区| 久久精品无码一区| 美女诱惑黄网站一区| 久久99精品久久久久久三级| 国产精品原创| 亚洲精品国产免费| 国产精品第九页| 成人免费高清在线观看| 国产精品网站免费| 亚洲黄色录像| 国产成人在线播放| av中文字幕一区二区三区| 欧美影院一区二区| 风间由美一二三区av片| 99热在线精品观看| 欧美日韩在线一区二区三区| 丁香花在线电影| 日韩国产欧美精品一区二区三区| 亚洲欧美综合自拍| 国产精品网站在线观看| 在线观看日本一区二区| 雨宫琴音一区二区三区| 99热在线播放| 888av在线视频| 亚洲欧美制服中文字幕| 亚洲AV无码成人精品区东京热 | 3d动漫一区二区三区| 人人精品亚洲| 国产精品视频中文字幕91| 免费在线观看黄色| 欧美一卡二卡三卡四卡| 黄色激情视频在线观看| 93久久精品日日躁夜夜躁欧美| 国产性生交xxxxx免费| 婷婷伊人综合| 国产精品国产精品| 欧美日韩五码| 欧美成人午夜免费视在线看片 | 国产精品视频123| 中文字幕欧美激情| 被黑人猛躁10次高潮视频| 国产欧美精品久久| 亚洲欧美丝袜| 高潮按摩久久久久久av免费| 日韩av免费在线观看| 久久日韩视频| 日韩成人av在线播放| 亚洲中文字幕在线一区| 一区二区三区精品| 国产一区二区三区四区五区六区| 国产精品一区在线观看你懂的| 男女午夜激情视频| 一区二区免费不卡在线| 精品久久久久久一区二区里番| 韩国久久久久久| 欧美激情在线狂野欧美精品| 成黄免费在线| 日韩亚洲电影在线| 中文av免费观看| 亚洲国产成人高清精品| av在线免费播放网址| 99re热视频精品| 午夜视频在线观| 日韩国产高清影视| 免费毛片网站在线观看| 久久人体视频| 欧美日韩亚洲在线| 国产成人夜色高潮福利影视| 国产日韩欧美电影在线观看| free性欧美| 久久综合久久美利坚合众国| 国产区视频在线播放| 精品av综合导航| 一级黄色录像大片| 日韩欧美国产中文字幕| 国产一级淫片免费| 一区二区在线观看不卡| 国产探花在线视频| 国产精品久久久99| 成人影视免费观看| 91麻豆产精品久久久久久 | 长河落日免费高清观看| 久久综合狠狠综合久久综合88| 国产伦精品一区三区精东| 国产米奇在线777精品观看| 亚洲精品永久视频| 久久精品国产**网站演员| 日本男人操女人| 国产精品视频| 免费在线观看的av网站| 美女黄网久久| 男人插女人下面免费视频| 久久免费高清| 亚洲五月天综合| 日韩成人一级大片| 国产成人手机视频| 久久综合综合久久综合| 色婷婷.com| 精品一区二区三区免费| 欧美激情第一区| 日韩av一区二区在线影视| 无限资源日本好片| 日韩激情av在线| 午夜精品免费看| 捆绑调教美女网站视频一区| 日本一二区免费| 国产成人在线视频网站| 麻豆精品国产传媒av| wwwwxxxxx欧美| 六月婷婷七月丁香| 97se亚洲国产综合自在线不卡| 中文字幕一区二区人妻在线不卡| 久久久久久久久久久久久女国产乱| 亚洲专区区免费| 91免费在线播放| 又黄又爽的网站| 国产日产欧美一区二区视频| 糖心vlog免费在线观看| 一区二区三区四区国产精品| 日韩av在线电影| 91久久精品国产91性色tv| 91丨porny丨在线中文 | 国产精品h在线观看| 精品欧美日韩精品| 91日韩在线视频| 国产调教精品| 色阁综合av| 五月天激情综合网| 日韩a级黄色片| 国产日韩精品视频一区二区三区| 国产aaa一级片| 久久激五月天综合精品| 久久久午夜精品福利内容| 久久精品水蜜桃av综合天堂| 青青草国产在线观看| 精品久久久久久中文字幕大豆网| 又骚又黄的视频| 亚洲国产精品成人一区二区| 青青草免费在线| 久久国产精品久久国产精品| 久久久123| 国产欧美中文字幕| 九九热hot精品视频在线播放| 久久综合中文色婷婷| 午夜精品一区二区三区国产| 日韩成人午夜影院| 日产国产欧美视频一区精品| 动漫av在线免费观看| 国产精品久久一级| 久久久精品人妻一区二区三区四| 日韩欧美成人免费视频| 亚洲精品网站在线| 在线观看视频99| 川上优av中文字幕一区二区| 国产精品一区二区三区在线播放 | 成人看av片| 国产精品电影一区| 国产一区二区三区亚洲| 综合国产精品久久久| 久久一区欧美| 久久久久成人精品无码中文字幕| 亚洲日本va在线观看| 色播视频在线播放| 日韩欧美一二三区| www.久久ai| 成人福利网站在线观看| 国产精品嫩模av在线| 免费看一级大黄情大片| 成人毛片视频在线观看| 成年人午夜剧场| 欧美日韩在线播放三区四区| 你懂的视频在线观看| 久久久久中文字幕| 欧美激情精品| 最近看过的日韩成人| 男男视频亚洲欧美| 摸摸摸bbb毛毛毛片| 色综合久久久久网| 可以免费看污视频的网站在线| 91国产在线精品| 精品精品国产毛片在线看| 99er在线视频| 国产精品白丝jk白祙喷水网站| 欧美成人久久久免费播放| 欧美中文字幕久久| 嫩草研究院在线| 97久久久免费福利网址| 香蕉久久99| 欧美中日韩在线| 白白色 亚洲乱淫| 欧美bbbbbbbbbbbb精品| 精品粉嫩超白一线天av| 黄网站免费在线观看| 成人精品在线观看| 偷拍自拍亚洲色图| 九九热免费精品视频| 国产精品国模大尺度视频| 一级aaaa毛片| 久久精品国产成人精品| 久久久人成影片一区二区三区在哪下载 | 亚洲欧美日本另类| 偷拍视频一区二区三区| 日韩欧美一区二区在线观看| 久久 天天综合| 在线免费观看亚洲视频| 精品国产一区二区三区av性色 | 欧美自拍偷拍一区二区| 91黄色8090| 欧美理论在线播放| 在线免费看v片| 亚洲成av人片www| 神马亚洲视频| 国产精品吴梦梦| 午夜性色一区二区三区免费视频 | 波多野结衣电影在线播放| 色综合影院在线| 97精品久久| 北条麻妃在线视频| 国产色产综合产在线视频| 四虎成人在线观看| 最好看的2019的中文字幕视频| 日韩影片在线观看| 免费观看国产精品视频| 久久婷婷一区二区三区| 日韩av免费网址| 色多多国产成人永久免费网站 | 美女黄毛**国产精品啪啪| 人人狠狠综合久久亚洲| 久久综合加勒比| 亚洲色图在线观看| 亚洲国产中文在线二区三区免| aa在线免费观看| 国产精品国产馆在线真实露脸| 欧美熟妇交换久久久久久分类| 国产不卡视频在线| 伊人影院久久| 日本高清不卡免费| 亚洲乱码一区二区|