精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2! 原創

發布于 2024-11-25 14:54
瀏覽
0收藏

編輯 |言征

小模型王座一夜易主了!冷不防,英偉達就丟出了一個新混合架構,以后不再只是Transformer的天下了。

日前,NVIDIA剛剛發布了Hymba-1.5B-Base,這是一個將Transformer注意力機制與狀態空間模型(SSM)集成的小型語言模型。

這種全新的混合架構只使用1.5T的Tokens進行訓練,性能、速度卻全面超越了市面上主流的所有小模型!英偉達的科學家兼研究經理Pavlo Molchanov在X上宣布了這一最新發展。

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區圖片

Hugging Face 的技術負責人及大型語言模型(LLMs)專家 Philipp Schmid 對此發展發表評論說:“Hymba 在僅使用1.5萬億個標記進行訓練的條件下,性能超越了其他小型大型語言模型,如Meta 3.2或SmolLM v2。”

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區圖片

1.雙重架構、精確回憶、高效上下文

據“抱抱臉”上公開資料顯示,Hymba-1.5B-Base是在今年年9月1日至2024年11月10日期間進行訓練的,許可證方面則根據NVIDIA開放模型許可協議發布。

Hymba模型使用雙重結構,具有精確回憶的注意力頭和高效上下文總結的SSM頭。

具體來講,其特點在于采用了混合頭并行架構,該架構將Transformer注意力機制與狀態空間模型(SSM)相結合,以提高效率。注意力頭提供高分辨率的回憶能力,而SSM頭則實現高效的上下文總結。此外,模型還引入了可學習的Meta標記,這些標記被添加到提示之前,用于存儲關鍵信息,并減輕與注意力機制相關的“被迫關注”負擔。通過引入跨層鍵值(KV)共享和部分滑動窗口注意力,該模型得到了進一步優化,從而實現了緊湊的緩存大小。

在一項對比相同設置下不同架構的受控研究中,Hymba-1.5B-Base 展現出了顯著優勢。

它在所有公開可用的、參數少于20億的模型中表現優異,并以平均準確率高出1.32%、緩存大小減少11.67倍、吞吐量提升3.49倍的成績超越了Llama-3.2-3B。

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區

2.模型架構非常巧妙

Hymba-1.5B-Base是一款基礎文本到文本的模型,可用于多種自然語言生成任務。論文《Hymba: A Hybrid-head Architecture for Small Language Models》進一步闡述了模型的思想和實驗對比。

論文地址:https://arxiv.org/pdf/2411.13676

該模型采用混合架構,其中Mamba和注意力頭并行運行。每個提示前都會添加一組可學習的標記(稱為Meta標記),以提高模型的有效性。該模型在兩層之間以及單層內的各個頭之間共享鍵值(KV)緩存。90%的注意力層采用滑動窗口注意力機制。

Hymba-1.5B-Base的模型嵌入大小為1600,擁有25個注意力頭,MLP中間維度為5504,總層數為32層,16個SSM狀態,3個全注意力層,其余為滑動窗口注意力層。與標準Transformer不同,Hymba中的每個注意力層都并行結合了標準注意力頭和Mamba頭的混合組合。此外,它還使用了分組查詢注意力(GQA)和旋轉位置嵌入(RoPE)。

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區圖片

概括來講,這架構有三個值得注意的特點:

首先,在同一層內融合注意力頭和SSM頭,對相同輸入進行并行且互補的處理;此外,還引入了元標記(meta tokens),這些標記被添加到輸入序列的前面,并與所有后續標記進行交互,從而存儲重要信息并減輕注意力中“必須關注”的負擔;最后,還結合了跨層KV共享和全局-局部注意力,進一步提升內存和計算效率。

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區圖片

3.性能超越所有主流小模型,包括Llama3.2

Hymba-1.5B-Base在所有低于20億的公開模型中表現優異。

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區圖片

研究人員從準確率、緩存大小、處理速度三個方面綜合評估了現在主流的小語言模型,比如Meta的Llama3.2-1B、Apple的OpenELM-1B、微軟的Phi-1.5B、抱抱臉的SmoILM2-1.7B、阿里巴巴的Qwen2.5-1.5B等。 

綜合評估和消融研究表明,Hymba不僅在眾多具有代表性的任務中樹立了新的最優(SOTA)基準性能,而且在效率方面相比Transformer和之前的混合模型也更高。例如,在常識推理任務中,Hymba-1.5B的平均準確率比Llama-3.2-3B高出1.32%,而所需的緩存大小卻小了11.67倍,速度快了3.49倍。

一夜小模型王座易主!英偉達發布超強小模型,性能、速率、緩存全面超越Llama3.2!-AI.x社區圖片

NVIDIA 還提供了一個設置腳本,以簡化環境配置,支持CUDA 12.1和12.4版本。

4.不過,需要小心

英偉達承認該模型是利用從互聯網上原始抓取的數據進行訓練的,這就意味著訓練數據包含有毒語言、不安全內容和社會偏見。因此,該模型可能會放大這些偏見,并在接收到有毒提示時返回有毒的回應。

即使提示本身不包含任何明顯冒犯性的內容,該模型也可能生成不準確、遺漏關鍵信息或包含不相關或冗余文本的答案,從而產生社會不可接受或不受歡迎的文本。

除了有毒內容方面需要注意,工程方面也需要注意:

用戶應在生成期間將批處理大小設置為1,因為當前設置不完全支持帶有滑動窗口注意的填充元標記。然而,任何批次大小都適用于訓練和預填充。

5.本月25日公開模型權重,可商用

英偉達非常強調在創建值得信賴的人工智能方面分擔責任的重要性,并為其發展制定了道德準則。建議用戶負責任地使用該模型,同時注意其局限性。

“在按照我們的服務條款下載或使用時,開發者應與內部模型團隊合作,確保該模型滿足相關行業和使用場景的要求,并解決產品濫用等不可預見的問題。”

Molchanov 評論道:“我不確定我們是否應該為使用1.5萬億個標記的訓練感到自豪。原因是我們要追求速度;在接下來的兩周里,就會有人做得更好。”

不過好消息是,Hymba模型已準備好用于商業用途了,而且模型權重也即將推出,預計11月25日發布!

相信大家這兩天就可以快速用上這款非常nice的小模型了。

本文轉載自??51CTO技術棧??,作者:言征

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
亚洲国产综合91精品麻豆| 激情久久五月天| 日韩电影中文字幕在线| 日韩中文字幕免费在线| 又爽又大又黄a级毛片在线视频| 久久se精品一区精品二区| 久久国产精品久久久久久| 日韩少妇一区二区| 成人在线观看免费播放| 亚洲精品乱码久久久久久久久 | 深夜福利一区| 欧美日韩一区二区精品| 亚洲永久一区二区三区在线| 色wwwwww| 黄页网站大全一区二区| 51午夜精品视频| 全程偷拍露脸中年夫妇| 国产免费久久| 亚洲成人a级网| 男插女视频网站| 午夜精品久久久久久久久久蜜桃| 一区二区三区在线观看国产| 午夜久久资源| 天堂а在线中文在线无限看推荐| 国产一区久久久| 国产成人在线播放| 日韩少妇裸体做爰视频| 一区二区三区四区在线观看国产日韩| 亚洲乱码av中文一区二区| 美女又黄又免费的视频| www.久久99| 在线免费不卡电影| 男女午夜激情视频| 成人三级高清视频在线看| 亚洲天堂福利av| 亚洲国产精品一区二区第四页av| 婷婷国产在线| 成人一区二区三区视频在线观看| 成人精品在线视频| 国产一级免费视频| 亚洲欧美久久久| 午夜精品理论片| 国产在线观看你懂的| 一区二区日韩欧美| 欧美成在线观看| 久久久久久久久久久久久女过产乱| 不卡在线一区| 在线观看不卡av| 阿v天堂2014| 波多野结衣在线观看一区二区| 亚洲欧美日韩国产中文专区| 久久精品老司机| 亚洲区小说区图片区qvod按摩| 日韩电视剧免费观看网站| 精品久久久久久无码人妻| 欧美日本三级| 日韩一级大片在线观看| 熟妇女人妻丰满少妇中文字幕| 久久国产精品美女| 日韩午夜激情视频| 国产免费a级片| 男人的天堂久久| 国产视频精品久久久| 国产又爽又黄无码无遮挡在线观看| 亚州综合一区| 一本色道久久综合狠狠躁篇怎么玩| 国产亚洲精品熟女国产成人| 国语产色综合| www.亚洲成人| 麻豆亚洲av成人无码久久精品| 欧美在线91| 国模精品一区二区三区色天香| 久久亚洲天堂网| 日韩和的一区二区| 成人黄色在线免费| 成人久久精品人妻一区二区三区| 成人av网址在线| 日本高清视频一区二区三区 | 国产欧美精品一区| aaa免费在线观看| 18video性欧美19sex高清| 精品久久久久久中文字幕大豆网| 成年人网站大全| www.成人| 亚洲精品一二区| 亚洲精品电影院| 国产精品videosex极品| 欧美在线观看日本一区| 亚洲系列第一页| 国产精品1区2区| 久中文字幕一区| 精品麻豆一区二区三区| 亚洲va国产va欧美va观看| 久久精品视频91| 亚洲一区网址| 国产一区二区三区18| 国产91色在线免费| 在哪里可以看毛片| 天天综合国产| 26uuu日韩精品一区二区| 在线视频你懂得| 成年人午夜久久久| 亚洲图片都市激情| 久久久男人天堂| 538prom精品视频线放| 久久一区二区电影| 亚洲成人精选| 国产成人免费91av在线| 亚洲国产精彩视频| 国产欧美一区二区精品性| 久久久久久久香蕉| 成人全视频在线观看在线播放高清| 欧美大肚乱孕交hd孕妇| 欧美一区二区三区粗大| 亚洲国产国产亚洲一二三| 国产精品美女999| 天天综合天天综合| 亚洲精品免费电影| 午夜啪啪小视频| 精品视频免费在线观看| 2019中文字幕在线观看| 亚洲最大成人av| 久久久午夜精品理论片中文字幕| 日产精品久久久久久久蜜臀| 成人高清一区| 亚洲天堂网站在线观看视频| 国产一级免费av| 国产精品一卡二卡在线观看| 亚洲巨乳在线观看| 3d欧美精品动漫xxxx无尽| 亚洲精品xxxx| 黄色小视频在线免费看| 国产精品正在播放| 一区二区三区在线视频看| 精品日韩视频| 亚洲美女精品久久| 中日韩黄色大片| 成人高清伦理免费影院在线观看| 第九区2中文字幕| 亚洲成a人片777777久久| 在线日韩日本国产亚洲| 99久久久久久久久| 久久免费视频色| 日日摸日日碰夜夜爽av| 日韩av字幕| 98精品国产高清在线xxxx天堂| 亚洲精品国产av| 亚洲一二三区不卡| 97中文字幕在线观看| 国产一区二区三区四区三区四 | 福利电影一区| 韩国v欧美v日本v亚洲| 亚洲欧美高清视频| 午夜视频久久久久久| 国产麻豆剧传媒精品国产av| 在线观看的日韩av| 国产日韩在线一区二区三区| 99热99re6国产在线播放| 亚洲精品一线二线三线无人区| 免费在线黄色片| 成a人片亚洲日本久久| 伊人成色综合网| 嫩草影视亚洲| 国产欧美日韩免费| 在线看女人毛片| 亚洲国产欧美一区二区三区久久| 免费在线不卡视频| 日本一二三四高清不卡| av在线免费看片| 黄色av一区| 精品一区2区三区| 日本肉肉一区| 久热精品视频在线免费观看| 朝桐光av在线一区二区三区| 午夜精品久久久久| 青娱乐国产视频| 国产一区二区三区精品欧美日韩一区二区三区 | 中国黄色片视频| 校园激情久久| 中文字幕成人一区| 精品素人av| 国产精品综合久久久| av黄在线观看| 亚洲欧美日韩视频一区| 国产成年妇视频| 黑人精品xxx一区一二区| jizzjizz日本少妇| 成人免费黄色大片| 欧美精品aaaa| 欧美日韩一区二区高清| 欧美日韩在线精品| 麻豆国产一区| 国产成人精品在线| 在线观看中文字幕的网站| 精品视频在线导航| 国产伦精品一区二区三区四区| 亚洲一区二区三区视频在线 | 国产日韩欧美电影在线观看| 免费毛片在线看片免费丝瓜视频| 亚洲视频一区二区| 亚洲经典一区二区三区| 欧美美女直播网站| 国产剧情在线视频| 一区二区三区四区国产精品| 调教驯服丰满美艳麻麻在线视频| 国产91精品精华液一区二区三区| 青青青国产在线视频| 国内久久视频| 自拍偷拍一区二区三区| 亚洲素人在线| 国产欧美亚洲日本| 国产美女精品视频免费播放软件| 日本免费一区二区三区视频观看| 免费毛片在线看片免费丝瓜视频 | 国产精品一区免费在线 | 久久久999视频| 欧美破处大片在线视频| 亚洲精蜜桃久在线| 免费成人av| 国产一区二区三区无遮挡| 国产va免费精品观看精品| 国产成人一区二区三区小说| av在线资源| 欧美激情第6页| 蜜芽在线免费观看| 综合国产在线视频| 国产精品二线| 亚洲人成啪啪网站| 视频一区二区三区国产| 精品成人私密视频| 国产黄色片免费| 91精品在线观看入口| 性色av一区二区三区四区| 欧美日韩中文字幕在线| 亚洲视频免费播放| 婷婷开心激情综合| 日韩三级视频在线播放| 亚洲3atv精品一区二区三区| 激情五月少妇a| 一区二区三区四区不卡在线| 黄色在线观看免费| 亚洲一二三四在线观看| 久久综合激情网| 亚洲一级电影视频| 国产污片在线观看| 午夜不卡av免费| 女人十八岁毛片| 欧美色视频日本版| 日本一区二区网站| 亚洲va国产天堂va久久en| 日韩xxxxxxxxx| 欧美性xxxx极品hd欧美风情| 久草手机在线视频| 色久优优欧美色久优优| 黄色av一区二区| 欧美性xxxxxx少妇| 91精品国产乱码久久久久| 这里只有精品视频在线观看| 99热这里精品| 亚洲国产成人在线视频| 先锋av资源站| 国产亚洲欧美日韩美女| 日本在线视频网| 久久久精品国产网站| 亚洲色图美国十次| 97超碰国产精品女人人人爽| 午夜日韩成人影院| 国产在线精品播放| 一本一道久久a久久| 精品视频在线观看| 精品国产一区二区三区| 在线观看成人免费| 亚洲激情国产| 亚洲天堂av线| 国产精品原创巨作av| 少妇精品无码一区二区三区| 久久午夜色播影院免费高清| 一级片黄色录像| 一区二区三区中文字幕在线观看| 国产成人精品片| 欧美综合视频在线观看| a天堂中文在线观看| 日韩国产欧美区| 久草中文在线观看| 欧美一级电影久久| 日韩午夜电影免费看| 国内精品**久久毛片app| 成人一区不卡| 搞av.com| 蓝色福利精品导航| 2一3sex性hd| 国产精品激情偷乱一区二区∴| 久久久久久国产精品视频 | 午夜精品一区二区三区在线| 日韩在线短视频| av一本久道久久波多野结衣| 国产精品美女久久久久久不卡| 成人短视频在线看| 美女国产精品| 扒开伸进免费视频| 亚洲国产精品t66y| 国偷自拍第113页| 日韩欧美视频一区| 日本在线免费看| 日本韩国在线不卡| avtt综合网| 日本道在线视频| 日韩电影在线观看电影| 亚洲精品第二页| 国产精品成人午夜| 日韩免费av网站| 亚洲第一页在线| av在线官网| 国产一区二区丝袜| 精品日韩一区| 色欲av无码一区二区人妻| 成人毛片老司机大片| 精品视频第一页| 日本大香伊一区二区三区| 日批免费在线观看| 欧美大荫蒂xxx| 久久精品九色| 国产精品av免费| 麻豆视频一区二区| 一级肉体全黄裸片| 色综合色综合色综合| 人妻精品一区一区三区蜜桃91| 久久久国产视频| 95精品视频| 致1999电视剧免费观看策驰影院| 视频一区中文字幕国产| 欧美bbbbb性bbbbb视频| 亚洲不卡av一区二区三区| www久久久com| 欧美老女人性视频| 视频一区日韩精品| 精品日韩在线播放| 国产麻豆视频一区二区| 日本少妇高清视频| 欧美一区二区三区系列电影| 黄色在线观看网站| 91久久嫩草影院一区二区| 欧美国产小视频| 亚洲一区二区福利视频| 欧美国产日本韩| 中文字幕精品无码亚| 中文字幕免费精品一区| 日韩五码电影| 三上悠亚免费在线观看| 国产成人精品aa毛片| 豆国产97在线 | 亚洲| 亚洲精品在线电影| 不卡av播放| 日韩欧美在线观看强乱免费| 日本不卡高清视频| 99热这里只有精品4| 7777精品伊人久久久大香线蕉超级流畅 | 精品少妇av| 无尽裸体动漫2d在线观看| 亚洲欧美偷拍卡通变态| 成人福利小视频| 欧美性做爰毛片| 欧美日韩一区二区三区视频播放| 亚洲天堂国产视频| 亚洲精品网站在线观看| 婷婷丁香一区二区三区| 欧美中文在线视频| 色男人天堂综合再现| 日本女人黄色片| 欧美日韩黄色大片| 97电影在线观看| 国产成人精品福利一区二区三区 | 国产精品视频免费在线观看| 久久视频在线| 亚洲av午夜精品一区二区三区| 午夜精品一区二区三区电影天堂 | 欧美日韩另类图片| 国产精品人人爽人人爽| 一区免费观看视频| 天堂av中文字幕| 国产精品欧美风情| 欧美日韩一区自拍| 免费黄色在线视频| 91精品国产麻豆| 热三久草你在线| 中文字幕一区综合| 97久久精品人人澡人人爽| 中文字幕av影视| 97免费在线视频| 欧美电影《睫毛膏》| 日本三级日本三级日本三级极| 在线看日韩精品电影| 青青草视频在线免费直播| 欧美高清一区二区| 国产成人免费视频一区| 无码免费一区二区三区| 欧美另类交人妖| 欧美亚洲国产一区| 制服丝袜在线第一页| 欧美嫩在线观看|