Gemini 3 Pro:谷歌悄然實現的規模擴展革命,證明Scaling Laws依然有效,且正在加速
2025年11月18日,Google DeepMind以預覽形式低調發布了Gemini 3 Pro,并稱其為“迄今最具智能的模型”。它沒有伴隨盛大的發布會,也沒有公布具體的參數量,僅有一張基準測試表。DeepMind的Oriol Vinyals在帖文中表示,從Gemini 2.5到3.0的預訓練(Pre-training)提升是“我們迄今所見最大的一次”,并斷言“前方沒有任何墻”。
AI社區瞬間沸騰。短短幾小時內,泄露消息、內部傳聞以及粗略計算迅速匯聚成一個驚人共識:Gemini 3 Pro是一個參數量達數萬億的MoE模型,其總參數很可能落在5到10萬億(5T–10T)區間。該模型原生運行在谷歌全新一代TPU v7 “Ironwood”集群上,而該集群僅在兩周前(11月6日)才正式進入全面可用階段。
這不僅僅是又一次增量迭代。它是迄今最有力的證據,證明純粹的規模擴展(更多數據、更多算力、更大的模型)仍然是前沿AI進步的主導力量,即便其他參與者正在追逐架構創新或測試時計算(Inference-time Compute)。
打破“平臺期”敘事的性能飛躍
Gemini 3 Pro的官方評測結果(全部為單次嘗試、無投票、無額外測試時算力)相較Gemini 2.5 Pro以及競品實現了爆炸性提升:

這些并非挑選性的結果。谷歌在幾乎所有主要基準上都取得領先或并列領先,優勢往往達到兩位數。特別是在代理式任務(工具使用、終端操作、編程)和視覺推理領域表現出的躍升尤為驚人,這正是純規模擴展在跨越特定算力閾值后,歷史上帶來超額回報的領域。
Gemini 3 Deep Think(一個類似于o3-mini high的推理模式預覽)進一步將記錄推高:在ARC-AGI-2上配合代碼執行達到45.1%,Humanity's Last Exam達到41%,均為目前公開的最高分數。
參數量傳聞:5T是底線,7.5T–12T成為主流共識
谷歌一如既往地沒有公布模型規模。但謠言傳播極快,且來源可信:
- Max Weinbach(Creative Strategies分析師,多次準確命中谷歌供應鏈信息):表示“約5T參數,運行在Ironwood上。很多內部人士都這么認為。”
- @scaling01基于近期稀疏MoE推理模型回歸與Ironwood內存限制的詳細分析:平均估算約7.5T(95%置信區間1.7T–12.6T),上限由單機架FP4推理時的KV Cache限制決定(約12.6T)。
- 其他聲音(Ben Pouladian等硬件圈人士):預估在4T–10T區間,多人認為5T仍是“保守估計”。
- 模型卡片(Model Card)(短暫泄露,后經多方證實):明確標注為“稀疏混合專家(sparse mixture-of-experts,MoE)Transformer模型”。雖無具體數字,但確認了支持超大規模總參數的架構(活躍參數預計1000億–4000億左右)。
時間線完美契合:Ironwood于11月6日正式可用,Gemini 3 Pro預覽版11月18日上線。這顯然是一款從零開始為新芯片量身打造的模型。
Ironwood:讓多萬億參數模型實際可用的推理巨獸
谷歌第七代TPU “Ironwood”專為推理時代而優化:
- 單芯片:4614 TFLOPS FP8算力,192 GB HBM3E內存(帶寬7.37 TB/s)
- 完整Pod:9216芯片 → 42.5 ExaFLOPS FP8總算力,總計1.77 PB HBM內存
- 專有的9.6 Tb/s芯片間互連(Interconnect)+光電路交換(Optical Circuit Switching),支持零宕機擴展(Zero-downtime Scaling)
- 單機架在FP4精度下可支持約12–24T參數推理(取決于KV Cache占用情況)
正因如此,Gemini 3 Pro才能在發布當天即覆蓋谷歌全部產品表面(搜索AI模式、Gemini App、NotebookLM等),實現盈利級經濟學(Profit-level Economics)。同時,API定價為2–18美元/百萬token,雖貴但物有所值。
NVIDIA仍主導開放市場,但谷歌已擁有生產就緒的Ironwood Pod,這意味著他們能在其他人還在等待Blackwell Ultra或Rubin晶圓時,提前6–12個月迭代前沿規模。
這意味著什么:Scaling Laws不僅活著,而且在谷歌這里正在加速
Oriol Vinyals的說法非常明確:2.5到3.0的性能增量主要來自預訓練改進,直接打臉了GPT-4.5提升有限、o3高度依賴測試時算力后一度流行的“規模已死”論調。
谷歌擁有三個獨一無二的優勢:
- 自定義芯片(Ironwood)剛剛進入量產階段。
- 實際上無限的高質量數據(YouTube、搜索、Android等)。
- 全棧護城河:TPU訓練 → TPU服務 → 即時覆蓋40億+用戶變現。
其他參與者都在搶購NVIDIA晶圓,谷歌只需要繼續“打印”更多Pod。
未來12個月將極為殘酷
如果Gemini 3 Pro確實已達5–10T參數并帶來如此增量,那么:
- 2026年的Gemini 3.5/4.0在下一代TPU上將輕松邁入20–50T+時代。
- OpenAI、Anthropic、xAI、Meta要么跟上規模,要么永久落后。
- NVIDIA大賺(其他人瘋狂購買GPU),但谷歌在每輪周期中獲得最大躍升。
我們已不再處于“架構彩票”階段。我們進入了“誰能最快交付最新芯片”的階段。
Scaling Laws依舊不敗。算力軍備競賽剛剛進入“核時代”。?
本文轉載自????Andy730????,作者:常華

















