英偉達亮出最強AI芯片!性能暴增3倍,算力競賽迎來新節(jié)點 原創(chuàng)
一場關于AI算力的競賽再次刷新紀錄,這一次,英偉達將推理性能推向了新的高度。
?
在剛剛召開的GTC 2025大會上,英偉達CEO黃仁勛首次向世界展示了下一代Vera Rubin超級芯片。這款芯片以著名天文學家命名,正定義下一代計算模式。
?

?
官方數(shù)據(jù)顯示,Vera Rubin NVL144平臺可實現(xiàn)3.6 Exaflops的FP4推理算力與1.2 Exaflops的FP8訓練算力,相較GB300 NVL72提升約3.3倍。
?

?
架構突破
?
Vera Rubin超級芯片采用全新的架構設計,主板整合了一顆Vera CPU與兩顆Rubin GPU,配備最多32個LPDDR內存插槽。
?
而芯片內部構造方面, Rubin GPU擁有8個HBM4接口及兩顆光罩尺寸相同的GPU核心芯片,由臺積電代工生產,目前已進入實驗室測試階段。
?
Vera CPU則搭載88個定制Arm架構核心,最高支持176線程,為整個系統(tǒng)提供強大的通用處理能力。
?
在互聯(lián)技術上,NVLINK-C2C互聯(lián)帶寬達到1.8 TB/s,系統(tǒng)總顯存帶寬為13 TB/s,快速存儲容量為75 TB,分別較上一代提升60%。
?
這種架構設計使得Vera Rubin在保持高性能的同時,能夠高效處理大規(guī)模AI工作負載。
?
產品路線圖:從NVL144到Ultra NVL576
?
英偉達已經規(guī)劃了清晰的產品藍圖。根據(jù)計劃,Rubin GPU預計將在2026年第三或第四季度進入量產,時間點與現(xiàn)有的Blackwell Ultra“GB300”Superchip全面量產相當,甚至可能更早。
?
針對不同市場需求,英偉達準備了兩大平臺。首先是2026年下半年推出的Vera Rubin NVL144平臺,配備兩顆Rubin GPU,提供50 PFLOPS的FP4精度算力,搭載288 GB HBM4顯存。
?
更為強大的Rubin Ultra NVL576平臺則計劃于2027年下半年亮相,將NVL規(guī)模從144擴展至576。
?
這一平臺的GPU升級為四顆Reticle尺寸核心,性能最高達100 PFLOPS,搭載1 TB HBM4e顯存。
?
Rubin Ultra NVL576平臺的FP4推理算力達到15 Exaflops,F(xiàn)P8訓練算力為5 Exaflops,相較GB300 NVL72提升高達14倍。
?

?
顯存帶寬和快速存儲容量更是分別達到上一代的8倍。
?
推理專用:Rubin CPX的成本革新
?
除了主打產品,英偉達還專門針對推理場景推出了Rubin CPX,這一設計顯著降低了長上下文推理和視頻生成應用的成本。
?
Rubin CPX采用與傳統(tǒng)Rubin芯片不同的技術路徑,配備128GB GDDR7顯存,NVFP4優(yōu)化算力達30PFLOPS,專為百萬級token的推理場景優(yōu)化。
?

?
而在成本方面,Rubin CPX的BOM成本可能低至標準Rubin平臺的四分之一。
?
這種成本降低主要來自四個方面,包括用GDDR取代HBM使每GB成本降低約50%,采用成熟的FCBGA單die封裝規(guī)避CoWoS帶來的成本上升和良率損失,以及無須NVLink Scale-up而節(jié)約約8000美元/GPU的擴展成本。
?
黃仁勛特別強調,Rubin平臺并非單純?yōu)锳I設計,而是兼顧科研與AI的雙重任務。
?
它未為低精度AI性能犧牲傳統(tǒng)高效能運算能力,依舊支持高精度FP64科學計算,確保物理模擬、氣候模型、量子化學等科研任務能獲得充分性能。
?
惠普協(xié)助構建的系統(tǒng)將部署于美國洛斯阿拉莫斯國家實驗室,分別命名為“Mission”和“Vision”,前者專注國安任務,計劃在2027年上線,后者服務開放科研與AI模型開發(fā)。
?
性能預計將較實驗室前代系統(tǒng)Venado提升一倍以上。
?
在AI推理層面,Rubin平臺的技術突破將直接降低大規(guī)模模型部署的門檻。尤其是其3.6 Exaflops的FP4推理算力,為未來多模態(tài)大模型的實時應用掃清了算力障礙。
?
從Blackwell到Vera Rubin,英偉達在一年內完成了兩次架構迭代,這種創(chuàng)新速度令競爭對手難以企及。
?
黃仁勛在舞臺上展示那顆承載著88個Arm核心的Vera CPU時,業(yè)界看到的是一個正在重新定義計算界限的公司。
?
隨著2026年Rubin芯片的量產,AI推理的成本曲線將繼續(xù)下探,這意味著智能體時代的應用場景將迎來新一輪爆發(fā)。
?
除了備受矚目的Vera Rubin超級芯片,黃仁勛在GTC 2025大會上還勾勒了一幅更為宏大的技術藍圖,核心圍繞AI工廠、6G通信、量子計算以及美國本土制造與科研基建展開 。
?
算家計算將所有關鍵亮點整理成了表格,幫大家快速了解本次大會的全貌:
?

?
總的來說,在所有這些具體發(fā)布的背后,貫穿著兩個核心的技術理念:
?
極端協(xié)同設計:英偉達強調從芯片、系統(tǒng)、軟件棧到AI模型和應用的全鏈路同步設計與優(yōu)化,以最大化整體系統(tǒng)的性能和效率。
?
軟件生態(tài)是核心壁壘:黃仁勛將龐大的CUDA-X全棧加速庫稱為"公司最珍貴的寶藏"。這個包含超過350個專用庫的軟件生態(tài),構成了其技術護城河,支撐著從計算光刻到量子計算等眾多關鍵領域。

















