精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

馬斯克新模型背后算法來自英偉達???

人工智能
正如Grok-4-fast所表現出來的一樣,這篇論文解決了困擾行業已久的推理成本問題。一味的硬件Scaling只會讓模型廠商賬單上的數字越來越長,用戶耐心也在漫長的推理時間中逐漸被消耗殆盡。為此,英偉達研究團隊推出了一種全新「混合結構」模型——Jet-Nemotron。

Grok-4-fast最近在降本增效上的表現堪稱一騎絕塵,連有「路由器」傍身的GPT5都給干趴下了。

面對如此驚艷的推理效率,很多人第一反應就是:堆卡式的算力scaling又一次大顯神威了。

實際上,Grok的背后確實有英偉達的影子。

但這次立功的,或許不是老黃的顯卡,而是算法。

沒錯,Grok-4-fast的秘密武器,被和一篇英偉達的算法論文關聯在了一起。

讓LLM快53倍的火箭發動機

正如Grok-4-fast所表現出來的一樣,這篇論文解決了困擾行業已久的推理成本問題。

一味的硬件Scaling只會讓模型廠商賬單上的數字越來越長,用戶耐心也在漫長的推理時間中逐漸被消耗殆盡。

為此,英偉達研究團隊推出了一種全新「混合結構」模型——Jet-Nemotron。

經過一系列全面的基準測試,發現Jet-Nemotron-2B的表現與Qwen3、Qwen2.5、Gemma3和Llama3.2等頂尖開源模型不相上下,還能實現約53倍的速度提升。

圖片

例如在MMLU-Pro上,Jet-Nemotron-2B不僅準確率比Qwen3-1.7B-Base更高,就連生成速度也要快上47倍。

此外,Jet-Nemotron-2B即便遇上參數更大的模型也絲毫不虛,它在MMLU和MMLU-Pro上的準確率甚至可以超過DeepSeek-V3-Small和Moonlight(總參數量15B,激活參數量2.2B)。

改變這一切的關鍵,在于一個叫PortNAS的新框架。

不同于以往的方法,PostNAS不是從零開始訓練,而是以一個預訓練的全注意力模型為起點,并凍結其MLP權重,只探索注意力機制的改進。

這樣一來,不僅能讓訓練成本直接降低幾個數量級,還能有更多精力用于全面探索模型結構。

其流程包括四個核心部分:全注意力層放置、選擇最優的線性注意力模塊、設計更優的線性注意力模塊、硬件感知架構搜索。

全注意力層放置

大多數團隊會在模型的所有層里統一使用全注意力,但這會浪費算力資源。

因此,英偉達團隊希望保留少量關鍵的全注意力層,以維持復雜任務的準確性,同時剔除冗余層以提升效率。

PostNAS的做法是:先構建一個同時包含兩種注意力機制的超級網絡,再通過特征蒸餾來訓練子網絡,最后用beam search找到最優的注意力層放置方案。

圖片

事實證明,的確并非所有注意力層都重要,不同任務依賴不同層,少量關鍵層即可覆蓋大部分任務需求。

實驗結果顯示,PostNAS優于均勻放置策略——在只使用2層全注意力的情況下,PostNAS的準確率約49%,而均勻放置的準確率約40%。

選擇最優的線性注意力模塊

在確定了全注意力層后,英偉達團隊開始進行注意力模塊搜索,旨在找到目前最優的線性注意力模塊。

論文評估了六種當前最先進的線性注意力模塊,包括RWKV7、RetNet、Mamba2、GLA、DeltaNet和Gated DeltaNet。

圖片

這六個之中,Gated DeltaNet的準確率最高,這主要歸功于兩個因素:

1、數據依賴門控機制(Data-Dependent Gating Mechanism):可以理解成一個路由器。模型會根據輸入的內容,決定是更重視新信息,還是之前的歷史狀態,從而在不同任務里找到平衡。

2、Delta規則(Delta Rule):不是每次都把記憶里的東西全部覆蓋,而是只更新新變化的部分。這樣能減少不必要的重復存儲,節省內存,同時保持信息的連續性。

更優解:JetBlock

不過,英偉達并不打算止步于Gated DeltaNet,而是設計了一款比它更強的線性注意力模塊——JetBlock。

卷積對線性注意力模塊的準確率至關重要,然而,以往方法大多使用的是靜態卷積核,它們無法根據輸入自動調整特征提取方式。

相比之下,JetBlock使用動態卷積,通過在線性注意力中引入一個卷積核生成器模塊,JetBlock能根據輸入特征動態地產生卷積核。

圖片

結果顯示,JetBlock在數學推理和檢索任務上的準確率優于Gated DeltaNet,而且仍然保持了不錯的生成效率。

要是跟表現最差的Mamba2比起來,JetBlock的優勢就更明顯了。

圖片

硬件感知架構搜索

在確定了宏觀架構以及選擇了線性注意力模塊之后,英偉達團隊進一步進行了硬件感知架構搜索,用于優化核心超參數(key/value的維度、注意力頭的數量…)。

過去,參數規模通常被作為衡量模型效率的主要指標,用來指導架構設計。

但英偉達團隊認為這種方法并不理想,因為參數量并不能直接反映真實硬件上的效率。

對此,他們改進的方法是:以生成吞吐量作為直接目標來選擇超參數。

英偉達團隊發現,相比起參數量,KV緩存大小才是影響長上下文和長文本生成吞吐量的最關鍵因素。而當KV緩存大小固定時,不同參數規模的模型,其生成吞吐量表現相似。

基于此,英偉達團隊選擇保持KV緩存大小與原始設計一致,然后在key維度、value維度和注意力頭數上進行小規模網格搜索。

圖片

實驗證明,優化后的版本在保持吞吐量不變的情況下,參數量增加(1.84億 vs 1.7億),同時數學準確率得到提升(34.8% vs 32.8%)(藍色行代表實驗組,灰色行代表對照組。)

綜上,PortNAS有望為目前的AI行業帶來三點影響。

1、推理階段GPU使用時長減少47倍,這讓LLM能夠以更快的速度完成高質量任務。

2、更小的內存需求,這使得更廉價的硬件部署成為可能。

3、更高吞吐量,意味著模型廠商可在現有基礎設施規模下服務更多用戶。

而且,PostNAS提供低成本、高效率的架構探索方式,適用于任何預訓練Transformer

所以基本上,任何廠商都可以在不重新訓練模型的情況下嵌入PortNAS,模型的成本可以大幅降低,同時準確率幾乎不會受到影響。

此外,Jet-Nemotron居然還是開源的。

通訊作者Han Cai在Github上表示Jet-Nemotron的代碼和預訓練模型將在法律審查完成后發布。

圖片

感興趣的朋友可以查看文末的鏈接~

Grok-4-fast的背后是英偉達?

同時看到Grok-4-fast和Jet-Nemotron二者同樣驚艷且高度相似的表現,很難不讓人懷疑老馬和老黃這一次是不是聯手了。

在Reddit上,有網友推測Grok-4-Fast應該就是基于Jet-Nemotron創造的。

圖片

Jet-Nemotron可以在不犧牲模型性能的情況下,大幅減少推理所需的計算量,這與Grok-4-fast所展現出來的能力高度相似。

這一觀點能從數據上得到支撐——從Grok-4-fast的定價來看,其價格下降水平與NVIDIA對這種架構模型的預測相符(論文預計會便宜20倍到50倍)。

更重要的是,如果Jet-Nemotron能夠應用于Grok,那它同樣能被OpenAI、Anthropic、Google等公司部署。

也有網友不同意這種說法,認為Grok此次的降價也許只是一種營銷手段,并不能從中推斷出xAI是否采用了什么新技術。

圖片

他們可能只是在燒錢獲取市場份額,我不認為你可以從中推斷出是采用了某種特定架構。

但是,即便Grok-4-fast沒有采用英偉達的技術,這篇論文也是極有價值的,因為Jet-Nemotron同樣可以被用來進一步降低成本。而且,xAI也不太可能在這么短時間研究出來了另一種和Jet-Nemotron一樣效果顯著的技術。

當然,也可能是其他算法上的突破。如果真是這樣,那仍然是極具突破性的,因為Jet-Nemotron也可以被用來進一步降低成本。但說實話,XAI真的又發現了一個能讓價格再下降20倍以上的算法改進的可能性有多大呢?

圖片

不過,上述觀點都只是猜測,目前這些說法都未得到xAI驗證…

華人學者的又一力作

Grok-4-fast是否真的采用了這項技術我們不得而知,可以明確的是,在這項突破性研究成果背后,是華人學者的又一次集中發力——論文作者全部為華人。

圖片

論文的一作是顧煜賢,他是清華大學計算機科學與技術系交互式人工智能(CoAI)課題組的四年級博士生,師從黃民烈教授。

圖片圖片

顧煜賢致力于提升LLM在整個生命周期中各個環節的效率,包括預訓練、下游適配以及推理階段。

近期,他的工作重點放在LLM的數據策劃策略研究、高效模型架構設計,以及運用知識蒸餾技術(knowledge distillation)進行語言模型壓縮。

此前,他曾在微軟亞洲研究院實習,由董力博士指導。他還曾作為訪問學生赴麻省理工學院HAN實驗室,導師為韓松教授。

論文的通訊作者是Han Cai,他目前是NVIDIA Research的一名研究科學家

圖片圖片

在加入NVIDIA之前,Han Cai麻省理工學院EECS獲得了博士學位,他的本科和碩士均就讀于上海交通大學。

Han Cai的研究重心在于高效的基礎模型(擴散模型、LLM等)、EdgeAI和AutoML,除了Jet-Nemotron,他還參與了不少英偉達的重要項目,包括ProxylessNAS、Once-for-all…

目前,他的論文在Google Scholar上累計被引用超1萬次。

圖片


論文:https://arxiv.org/pdf/2508.15884v1
Github:https://github.com/NVlabs/Jet-Nemotron

參考鏈接:
[1]https://pub.towardsai.net/jet-nemotron-nvidias-new-ai-architecture-achieves-53x-speed-improvement-71a5cf2baeeb
[2]https://www.reddit.com/r/singularity/comments/1nmzqj5/there_is_a_very_real_possibility_that_google/
[3]https://t1101675.github.io/
[4]https://han-cai.github.io/

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-09-16 09:02:00

AI馬斯克模型

2025-10-13 09:37:58

2025-02-24 13:00:00

2022-05-23 15:57:18

加密貨幣黑客網絡攻擊

2025-10-23 16:38:30

2022-01-23 10:53:47

星鏈互聯網衛星

2023-11-03 15:38:26

網絡安全人工智能數字化轉型

2023-08-26 19:14:21

開源算法Linux

2025-02-11 09:20:00

LLM模型AI

2022-04-15 10:55:59

Web3反壟斷元宇宙

2024-04-07 11:25:54

2021-06-11 17:14:26

黑客馬斯克加密貨幣

2025-07-01 04:45:00

馬斯克腦機接口

2025-01-16 11:55:00

2024-03-11 15:57:45

OpenAI

2025-02-11 11:46:48

OpenAI奧特曼馬斯克

2024-03-18 14:17:06

大模型開源人工智能

2023-04-18 15:03:24

模型數據

2023-08-14 08:07:46

ChatGPTAI

2021-12-09 10:18:29

芯片半導體技術
點贊
收藏

51CTO技術棧公眾號

国产精品毛片大码女人| 噜噜噜久久亚洲精品国产品小说| 日韩午夜精品视频| 美女黄色免费看| 天天摸天天干天天操| 久久精品欧洲| 久色乳综合思思在线视频| 秘密基地免费观看完整版中文 | 亚洲精品国产偷自在线观看| 2021国产精品久久精品| 国产精品久久久91| 久久国产露脸精品国产| 久久99高清| 91精品免费在线观看| 日本精品免费在线观看| 黄视频网站在线| 99久久婷婷国产精品综合| 国产精品亚洲аv天堂网| 国产一级在线免费观看| 欧美午夜精彩| 亚洲精品福利视频| 中文字幕亚洲影院| 欧美男男tv网站在线播放| 国产精品免费免费| 久久久久久欧美精品色一二三四| 中文字幕有码视频| 亚洲激情女人| 欧美国产精品人人做人人爱| 日本少妇xxxxx| 美女视频亚洲色图| 91精品国产91热久久久做人人| 日本三级免费网站| 手机在线免费av| 18欧美乱大交hd1984| 欧洲在线视频一区| 神马电影在线观看| 播五月开心婷婷综合| 成人精品水蜜桃| 国产又爽又黄免费软件| 秋霞电影一区二区| 国产成人精品999| 国产精品久免费的黄网站| 亚洲片区在线| 国外成人免费在线播放| 精国产品一区二区三区a片| 亚欧美无遮挡hd高清在线视频| 亚洲一区二区精品| 无码人妻aⅴ一区二区三区69岛| 国产成人精品福利| 亚洲国产成人久久综合| 国产乱国产乱老熟300部视频| 精品三级久久久| 欧美一区二区国产| 国产农村妇女精品久久| 国产高清精品二区| 欧美一区二区日韩| 国产一精品一aⅴ一免费| 亚洲啊v在线免费视频| 日韩精品一区二区在线观看| 色欲无码人妻久久精品| 亚洲三区欧美一区国产二区| 欧美成人一区二区三区在线观看| 欧美熟妇另类久久久久久多毛| 国产一区二区三区视频在线| 欧美一级夜夜爽| 成年人看片网站| 风间由美性色一区二区三区四区 | 国产91在线播放| 亚洲男人天堂网址| 麻豆精品一区二区av白丝在线| 91精品国产综合久久香蕉| 一区二区三区黄| 国产米奇在线777精品观看| 99国产超薄丝袜足j在线观看| 亚洲精品一区二区三区蜜桃| 成人av电影免费在线播放| 久久99久久精品国产| 国产在线电影| 亚洲日本青草视频在线怡红院| www.69av| 波多视频一区| 777色狠狠一区二区三区| 国产精品二区视频| 九九亚洲视频| 精品国产欧美一区二区五十路| 精品国产精品国产精品| 亚洲天堂男人| 国产精品久久久久久久av电影 | 久久网中文字幕| 亚洲视频1区| 成人av在线亚洲| 色欲av永久无码精品无码蜜桃| 国产日韩精品一区二区三区| dy888午夜| 忘忧草在线日韩www影院| 欧美日韩午夜精品| 污污免费在线观看| 久久中文视频| 97在线观看视频| 一级片一区二区三区| a在线欧美一区| 亚洲一区二区精品在线观看| xxx性欧美| 欧美久久婷婷综合色| 国产a级黄色片| 久久神马影院| 日本久久久久久久久久久| 国产免费久久久| 久久久久一区二区三区四区| 国产高清免费在线| 快播电影网址老女人久久| 欧美成va人片在线观看| 女人十八毛片嫩草av| 伊人久久久大香线蕉综合直播 | 国产99久久九九精品无码| 久久伦理中文字幕| 在线色欧美三级视频| 日韩成人免费在线视频| 精品一区二区在线视频| 欧美色欧美亚洲另类七区| av在线中出| 欧美一区二区黄色| 日韩三级久久久| 青青草国产成人av片免费| 国内一区二区在线视频观看| a毛片在线播放| 欧美精品日日鲁夜夜添| 受虐m奴xxx在线观看| 99pao成人国产永久免费视频| 91久久久久久国产精品| 日韩伦理在线观看| 日本大香伊一区二区三区| 国产麻豆剧传媒精品国产av| 欧美freesex交免费视频| 成人h视频在线| a级黄色片免费| 国产毛片久久久久| 国产精品乱码人人做人人爱 | 日产欧产美韩系列久久99| 久久亚洲高清| xxxxx性欧美特大| 亚洲美女黄色片| youjizz在线视频| 91亚洲精品一区二区乱码| 搞av.com| 久久精品国产亚洲blacked| 久久久久久久爱| 亚洲精品久久久久久久久久| 一区二区三区精品视频| 日本成人xxx| 国内激情久久| 国产精品亚洲综合| 黄色18在线观看| 日韩高清不卡av| 天堂中文在线网| 国产欧美视频一区二区| 亚洲最大综合网| 99久久99久久精品国产片果冰| 成人精品视频在线| av毛片在线看| 亚洲第一福利网站| 黄色在线免费观看| 亚洲国产激情av| 不卡中文字幕在线观看| 亚洲香蕉av| 国产伦精品一区二区三区视频孕妇| 免费人成又黄又爽又色| av在线成人| 欧美精品在线网站| 日韩中文字幕免费观看| 欧美日韩免费在线观看| 免费视频91蜜桃| 国产在线精品一区二区夜色| 五月天激情图片| 欧美一级二级三级视频| 国产精品999999| 精品麻豆一区二区三区| 欧美成人激情免费网| 日韩aaaaaa| 国产欧美一区二区精品久导航 | 懂色av粉嫩av蜜臀av| 久久久久久爱| 66m—66摸成人免费视频| 国产精品天堂| 日韩亚洲欧美在线| 伊人中文字幕在线观看| 国产精品福利电影一区二区三区四区 | 青春草在线视频| 亚洲美女又黄又爽在线观看| 亚洲天堂中文网| 午夜精品久久一牛影视| 国产精品理论在线| 成人黄页毛片网站| 日本xxxx黄色| 日韩五码在线| 黄色www在线观看| 亚洲婷婷影院| 亚洲精品免费在线视频| 日本电影欧美片| 欧美丰满片xxx777| 69av在线| 精品亚洲一区二区三区在线观看 | 欧洲一级精品| 欧美激情一级二级| av大片在线播放| 亚洲国产日韩欧美在线99| 在线观看国产一区二区三区| 午夜欧美大尺度福利影院在线看| 久久精品国产亚洲AV成人婷婷| 成人午夜视频福利| 久久久久久久久久久久久久久国产| 99精品视频免费观看| 在线视频一二三区| 日韩dvd碟片| 久久综合久久久| 都市激情久久| 91嫩草免费看| 亚洲免费一区| 国产精品久久久久久久久久99| 99热99re6国产在线播放| 久久视频在线直播| 午夜视频在线看| 亚洲图片制服诱惑| 神马久久久久| 日韩精品小视频| 日本黄色不卡视频| 精品国产一区二区三区四区四| 影音先锋黄色网址| 色猫猫国产区一区二在线视频| 日韩 欧美 亚洲| 亚洲无人区一区| 欧美激情精品久久| 亚洲日本乱码在线观看| 黑人狂躁日本娇小| 中文字幕精品一区二区精品绿巨人 | 国产美女精品视频国产| 在线中文字幕一区| 69xxxx国产| 在线观看三级视频欧美| 福利网址在线观看| 一本久久a久久精品亚洲| 黑人一级大毛片| 精品露脸国产偷人在视频| 日本学生初尝黑人巨免费视频| 亚洲一二三四在线| 久久精品亚洲无码| 亚洲国产视频一区二区| 久久久全国免费视频| 亚洲影院在线观看| 国产网站在线看| 精品国产成人在线| 日本中文在线播放| 在线视频欧美区| 中文字幕免费播放| 欧美美女直播网站| a视频免费在线观看| 欧美一区二区三区男人的天堂 | 亚洲精品视频久久| 国产视频精选在线| 最好看的2019年中文视频| 久操视频在线观看| 欧美大荫蒂xxx| 黄频免费在线观看| 国产精品美女在线| 精品国产18久久久久久二百| http;//www.99re视频| 国产欧美自拍一区| 日本精品二区| 亚洲精品电影| 欧美乱大交xxxxx潮喷l头像| 亚洲欧美日韩一区在线观看| 97公开免费视频| 国内精品伊人久久久久av影院| 日本在线视频播放| 99久久久国产精品免费蜜臀| 精品人伦一区二区| 亚洲另类中文字| 四虎成人精品永久免费av| 色婷婷一区二区| av网站免费大全| 亚洲精品电影网在线观看| 91这里只有精品| 欧美大秀在线观看| 经典三级一区二区| av色综合网| 精品视频黄色| 毛片av在线播放| 久久综合图片| 男人操女人下面视频| 91麻豆福利精品推荐| 免费成人深夜夜行网站| 午夜伦欧美伦电影理论片| 亚洲性猛交富婆| 精品成a人在线观看| 91官网在线| 久久久久久久久91| 国产亚洲人成a在线v网站| 国产精品一区二区三区免费| 日韩理论在线| 18禁男女爽爽爽午夜网站免费| 国产在线麻豆精品观看| 精品无码在线观看| 亚洲成人777| 国产成年妇视频| 中文字幕av一区二区三区谷原希美| 高h视频在线播放| 91精品久久久久久久久中文字幕| 五月天亚洲色图| www.日本在线视频| 国模一区二区三区白浆| 伊人网伊人影院| 一区二区三区色| 国产一区二区三区中文字幕 | 国产成人l区| 人人澡人人澡人人看欧美| 亚洲一区电影| 一级特黄录像免费播放全99| 久久亚洲图片| 欧美亚一区二区三区| 亚洲一区二区五区| 国产婷婷在线视频| 色哟哟入口国产精品| 韩国三级一区| 欧美日韩国产免费一区二区三区| 国模吧视频一区| 国产sm在线观看| 亚洲另类中文字| 精品久久久无码中文字幕| xxxxxx国产| 一区二区三区免费网站| 一级黄色片在线看| 亚洲一二三在线| 国产超碰精品| 欧美精品成人一区二区在线观看 | 成人免费直播在线| 精品一区二区成人免费视频 | 国产调教打屁股xxxx网站| 国产精品国产自产拍高清av| 糖心vlog精品一区二区| 亚洲天堂影视av| 中文字幕在线视频网站| 精品日韩美女| 国产精品日韩精品欧美精品| 9.1在线观看免费| 亚洲午夜三级在线| 国精产品一品二品国精品69xx| 欧美放荡办公室videos4k| 亚洲综合色婷婷在线观看| 99久久久精品视频| 成人手机电影网| 国产无码精品在线播放| 亚洲二区在线播放视频| 国产拍在线视频| 日本成人三级| 久久国产麻豆精品| 国产精品夜夜夜爽阿娇| 日韩一区二区三区精品视频| 日本三级在线观看网站| 国产麻豆日韩| 新狼窝色av性久久久久久| 男女黄床上色视频| 欧美视频你懂的| 黄色精品免费看| 国产精品一国产精品最新章节| 亚洲一区欧美二区| 国产第一页精品| 日韩一区二区免费在线电影| 波多野结衣在线观看| 另类视频在线观看+1080p| 青青草国产精品亚洲专区无| 在线看的片片片免费| 精品国产电影一区二区| 小草在线视频免费播放| 日韩精品av一区二区三区| 狠狠色丁香婷婷综合| 久久精品国产亚洲av麻豆色欲 | 久久久久久亚洲精品杨幂换脸| 夫妇交换中文字幕| 日韩精品一区二区三区视频播放| 麻豆免费版在线观看| 一区视频二区视频| av亚洲精华国产精华精华| 伊人免费在线观看高清版| 久久久久久久久久亚洲| 欧美日韩xxxx| 巨乳女教师的诱惑| 欧美性开放视频| 综合久久2o19| 日本一区二区三区视频在线播放| 国产专区欧美精品| 国产午夜免费福利| 不卡av电影在线观看| 米奇777超碰欧美日韩亚洲| 午夜精品免费看| 欧美日韩一区免费| av色综合久久天堂av色综合在| 久久综合九色99| 国产成人精品一区二| 国产成人av免费| 91av福利视频|