精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?) 原創

發布于 2025-10-11 09:44
瀏覽
0收藏


編者按: 為什么訓練大語言模型需要如此苛刻的網絡條件?InfiniBand 真的是“封閉”技術嗎?英偉達在 AI 網絡領域的優勢究竟從何而來?

文章從 LLM 訓練的梯度下降過程切入,生動闡釋了為何在包含數萬 GPU 的集群中,哪怕一個 GPU 延遲 20 微秒,都會造成算力的巨大浪費。作者隨后對比了企業網絡、超大規模云網絡和高性能計算網絡三種場景,指出只有 HPC 網絡的設計理念與 AI 訓練需求高度契合。文章還破除了一個普遍的認知誤區:InfiniBand 并非 Mellanox 或英偉達的私有技術,而是 1999 年由 180 余家企業聯合制定的開放行業標準;同樣,從 Mellanox 時代就開始推動的 RoCE 協議,也為今天的 AI 以太網方案(如 Spectrum-X 和 UEC 1.0)奠定了基礎。

作者 | Austin Lyons

編譯 | 岳揚

本文將解析低延遲與低抖動如何主導分布式訓練的迭代效率,指出現有傳統以太網技術的局限性,并闡釋 InfiniBand 為何能成為高性能計算鎖步工作負載的默認網絡架構。

我們還將厘清一些常見的認知誤區(別擔心,我在撰寫本文前也曾存在這些誤解!)。例如:Mellanox 并非 InfiniBand 技術的發明者,InfiniBand 也并非私有協議,而是由行業聯盟制定的開放標準。從 Mellanox 到 Nvidia,長期通過 RoCE 及其演進技術支持以太網橫向擴展。文中還將明確定義網絡技術中“開放”的真實含義。當然,精彩內容不止于此!

01 AI 通信網絡的特殊性

那么 AI 工作負載對通信網絡究竟有何需求?

注:本文討論的 AI 訓練特指推動生成式 AI 熱潮的大語言模型及其變體的訓練。

本質上,大語言模型的訓練是一個分布式計算任務 —— 成千上萬臺機器協同解決單一問題。

分布式計算并非新概念。還記得曾利用志愿者電腦運行蛋白質模擬的 Folding@Home 嗎?

Vijay Pande:早在 2000 年我們就萌生了借助海量計算機解決問題的構想 —— 與其用一臺電腦耗時百萬天,不如用十萬臺電腦在十天內完成。但當時面臨一個關鍵的抉擇:是止步于理論探討,還是付諸實踐?于是我們決定創建 Folding@Home,將理論轉化為現實。2000 年夏天我們編寫了軟件的初始版本,于同年 10 月正式發布。幸運的是當時吸引了大量關注者 —— 所謂“大量”指的是約五千至一萬人。八年后,該項目已發展到擁有近 25 萬個活躍處理器,累計參與設備超 200 萬臺。

如今的 AI 算力集群同樣規模驚人。訓練尖端模型可能需要數十萬個 GPU 協同工作:每個 GPU 處理部分計算任務后,需與同伴交換結果。正是這種結果共享環節,讓網絡性能成為關鍵支撐……或瓶頸所在!

作為習慣看圖理解知識內容的人,我將通過示意圖展示 LLM 訓練過程中驚人的網絡通信量。為控制篇幅(畢竟沒法花太多時間繪圖),僅以簡易圖示說明,但您可由此推想數十萬臺設備互聯的場景。

02 梯度下降與網絡通信

假設我們在四個 GPU 上訓練一個大語言模型,每個 GPU 都在內存中保存著完整的模型權重。這一假設雖然經過簡化,但仍有教學意義。

宏觀來看,AI 的訓練過程本質就是幾個步驟的重復循環。

前向傳播 – 每個 GPU 處理一部分訓練樣本,根據上文預測下一個詞元。比如“Four score ___”可能會預測出“and”。

反向傳播 – 每個 GPU 計算梯度,這些信號指示了應該如何調整權重來減少誤差。例如剛才預測“and”是正確的,那這部分就不需要調整。

梯度聚合(全規約)  – 在每個 GPU 計算出自己的調整量(梯度)之后,它們會互相比較并取平均值,確保所有 GPU 獲得統一的模型更新指令。這一過程需要 GPU 之間進行大量的雙向通信!

權重更新 – 所有 GPU 應用相同的更新指令調整權重,保持模型的一致性。如果沒有這種同步,每個 GPU 都會自行其是,最終訓練出不同的模型。

若想深入了解,3Blue1Brown 有一個出色的梯度下降講解視頻[1]。

這是我制作的一個示意圖,讓大家先有個直觀感受。全規約是分布式訓練的核心。每個 GPU 都必須完成計算、貢獻自己的梯度,然后等待聚合結果,之后才能繼續前進。

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

每條線代表兩個 GPU/XPU 之間的某種網絡通信

如果有某一個 GPU 產生延遲了,其他所有 GPU 都必須停下來等待。

想象一下步驟 1 中所有黃色的 GPU 在不同時間點收到各自的輸入,它們將不得不空轉,直到每個輸入都接收完畢。

這就是為什么在 AI 通信網絡中延遲和抖動如此讓人重視。

延遲是數據包在網絡中傳輸的單向時間,包括傳輸、交換和排隊延遲。 在這個只有四個 GPU 的例子中,很難想象會有延遲……但在大規模場景下,當數千個 GPU 通過一兩層交換機連接時,擁堵就會發生,延遲也會累積。AI 訓練需要盡可能低的延遲。

抖動是指延遲的波動性。可以把它想象成上面 GPU 的接收結果的到達時間分布。 即使平均延遲非常低,這種波動性也會導致結果到達時間的不確定性。AI 訓練需要非常低的抖動。

假設一個包含 10,000 個 GPU 的集群完成一次全規約操作需要 40-45 微秒,但唯獨有一個掉隊者花了 60 微秒。這可不妙!每個 GPU 都不得不額外等待那 20 微秒。9999 個 GPU 各自多等 20 微秒,加起來就是 0.2 秒的 GPU 時間!對于如此龐大的集群來說,由于網絡性能不佳導致 GPU 空轉損耗,這可能意味著真金白銀的損失。??

因此,確定性的、低抖動的通信對于保持 GPU 快速且步調一致地前進至關重要。

那么,傳統的網絡技術能否滿足要求,為 AI 訓練提供確定性的、低抖動的通信呢?

答案當然是不能 ?? 所以就有了 InfiniBand,所以就有了為 AI 重新設計以太網的事情,比如 Spectrum-X……我下面會解釋。

我猜想讀到這里的大部分讀者并非網絡通信專家,所以我們快速梳理一下常見的網絡應用場景,看看為什么傳統以太網不是為這種需求設計的。

2.1 通用的企業網絡場景

我們從最簡單的場景說起。

閱讀以下這個演示樣例時,請始終思考一個問題:這種網絡技術能否以低延遲和低抖動支持大規模的 AI 訓練?

大多數傳統網絡系統誕生時,分布式 AI 訓練尚未興起,其設計理念源于截然不同的應用場景。將企業交換機直接用于 AI 數據中心并非易事。

首先來看企業網絡場景。

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

企業網絡中有多臺服務器,每臺服務器運行多個虛擬機處理不同的工作負載

企業網絡需同時運行多種業務應用:如郵件服務器、數據庫、ERP、CRM、分析工具等。這些工作負載通常運行在搭載多個虛擬機的高性能多核服務器上,每個虛擬機隔離執行獨立任務。

這些工作負載常在數據中心內部相互通信,產生東西向流量,例如分析工具從數據庫拉取數據。

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

分析工具與數據庫間的“東西向”通信

此類場景默認采用以太網作為基礎架構。

整個系統圍繞企業需求設計。因此交換機側重于提供安全功能(如隔離人力資源系統與開發環境)和流量管理(如在大型文件傳輸時保障視頻通話流暢)。

這類網絡多采用博通的 Trident 系列芯片。例如相關視頻[2]展示了基于 Trident 4 芯片的交換機的監控功能,雖視頻稍舊,但仍具參考價值。

企業網絡能否滿足 AI 訓練的需求?答案是否定的。其設計目標本就不包含超低延遲與抖動!

企業級交換機強調功能性與靈活性,而非確定性。普通業務場景可接受一定的延遲與抖動,因為工作負載相互獨立。數據庫查詢或郵件傳輸中的數據包延遲不會阻塞其他應用。

這些網絡生來就不是為大規模 AI 訓練所需的鎖步式、低抖動通信而構建的。

2.2 超大規模云網絡

更接近了一些……

超大規模數據中心專為將單一服務擴展至數百萬乃至數十億用戶而構建,例如 Gmail、YouTube、Netflix 或亞馬遜電商。成千上萬臺服務器各司其職,共同構成一個龐大的分布式系統。

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

以太網仍是默認的基礎架構。

在此規模下,成本與能效是需要首要考量的因素。交換機的設計追求高端口密度和高帶寬,以極低功耗傳輸海量數據。

博通 Tomahawk 系列便是典型代表。相關視頻[3]介紹了上一代 Tomahawk 4 芯片,并將其與 Trident、Jericho 系列進行對比(建議觀看 1:50 至 2:50 部分)。

這類網絡能否勝任 AI 訓練?

超大規模云網絡以保持服務響應速度為目標,注重降低平均延遲,但無需保證確定性。

網絡波動(抖動)在可接受范圍內。慢查詢可重試,數據副本確保了系統韌性。

就此而言,超大規模網絡架構因已具備協調大型分布式系統的能力,相比企業網絡更接近 AI 訓練需求。但它們仍無法滿足 LLM 訓練的要求 —— 后者需要成千上萬的 GPU 在每次迭代中保持嚴格同步。

2.3 超級計算機(高性能計算)

近期“超級計算機”一詞熱度攀升,諸如“丹麥的 AI 超算”或“桌面級 AI 超算”的報道頻現。

當然,超級計算機或高性能計算集群的概念早已有之。每每提到“超級計算機”,我總會想到克雷公司的傳奇設備。

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

組裝完成的克雷超級計算機外觀(紅色圓柱體)。Source[4]

拆除面板后的內部結構如下:

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

印刷電路板間密布的連接線纜...這正是某種形式的網絡!

這張照片讓我聯想到現代 AI 超級計算機的結構:

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

埃隆公布的 Colossus 2 機房照片。Source[5]

順帶一提,埃隆的這張照片揭示了為大規模 AI 訓練和推理設計的網絡基礎設施為何如此熱門。

紫色線纜代表 CRDO。你可以想象連接數十萬 GPU 需要多少 Credo 有源電纜[6]!

Colossus 還搭載大量 Nvidia Spectrum-X 交換機和 Nvidia SuperNIC[7]。這正是英偉達網絡業務版圖擴張的縮影。

回歸正題。

超級計算機由大量處理器構成,每個處理器能同步處理海量數據(單指令多數據[8]),適用于核科學模擬與氣象預報等科學計算。維基百科“TOP 500[9]”超級計算機榜單收錄了豐富的發展史料。

與企業級網絡環境或超大規模網絡環境不同,高性能計算(HPC)任務是橫跨數千服務器的單一工作負載。一個模擬任務可能調度數萬 CPU 或 GPU 節點,每個節點承擔部分計算任務。

是否似曾相識?這完全契合 AI 訓練的運行模式!

與 AI 工作負載類似,HPC 需要節點間持續通信來保持全局同步。因此,HPC 網絡專為超低延遲和近乎零抖動而設計。任一節點產生延遲將導致整個模擬任務停滯 —— 這與 LLM 訓練過程面臨的挑戰完全一致!

事實上......InfiniBand 這類技術正是為 HPC 環境量身定制的。

03 面向 AI 工作負載的 InfiniBand

自誕生之初,InfiniBand 就瞄準了需要數千處理器鎖步運行的分布式計算場景。

其設計特性堪稱 AI 網絡的理想清單(本文暫不深入技術細節,后續另文探討,此處概述要點):

  • 遠程直接內存訪問(RDMA):允許 GPU(與 CPU)直接讀寫對方內存,繞過 CPU 與系統內存,消除了緩沖區之間復制數據與上下文切換的性能開銷。
  • 無損轉發:InfiniBand 采用基于信用的流量控制機制避免數據包丟棄,從設計上保障零丟包,從而消除抖動與代價高昂的重傳。
  • 直通交換(Cut-through switching):InfiniBand 交換機在收到數據包頭時立即開始轉發,無需等待完整幀到達,最大限度降低每跳延遲。
  • OS bypass 與 Transport Offload:InfiniBand 網卡將傳輸功能(如可靠傳輸、擁塞控制)從 CPU 卸載,應用程序可繞過操作系統內核直接向網卡提交任務。這大大減少了軟件開銷與延遲。

正因如此,InfiniBand 非常適合 AI 訓練。它本就是為低延遲、低抖動的分布式計算工作負載而生。

但眾所周知,英偉達并非 InfiniBand 的發明者。

啊不錯!若您聽過《Acquired》播客的英偉達專題便知,沒錯,Mellanox 堪稱史上最成功的收購案例之一。

但您是否知道... Mellanox 也非 InfiniBand 的發明者!

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

是的!說實話我曾以為 Mellanox 創造了 InfiniBand。畢竟現在 InfiniBand 是私有技術。

但我最近才了解到... InfiniBand 并非私有協議。

但如今只能從英偉達購買 InfiniBand 交換機和線纜了,對吧?這不算私有嗎?

好吧,這里需要厘清很多概念。單一的供應商并不意味著技術私有化。我們稍后會詳解。

在本文的調研過程中,我對 InfiniBand 有了全新認知。若您也曾存在類似誤解,實屬正常 —— 畢竟我們曾站在同樣的信息盲區。

3.1 開放與封閉

在 2001 年 IEEE 國際集群計算會議的特邀論文《Aspects of the InfiniBand Architecture》[10]中,IBM 的 Gregory F. Pfister 寫道:

“InfiniBand 架構(IBA)是一種用于服務器 I/O 和服務器間通信的新行業標準架構。它由 InfiniBand 貿易協會(IBTA)制定,旨在為當前及未來的服務器系統提供所需的可靠性、可用性、性能與擴展性保障 —— 這些特性遠非面向總線的 I/O 結構所能企及。”

行業標準?由行業協會制定?

看來 Mellanox 確實不是 InfiniBand 的發明者!

繼續往下看。

“IBTA 由 180 余家企業在 1999 年 8 月聯合創立,目的是共同開發 IBA。該協會也向高校、研究實驗室等機構開放。指導委員會成員來自戴爾、康柏、惠普、IBM、英特爾、微軟和太陽微系統,由 IBM 與英特爾共同擔任主席。贊助企業包括 3Com、思科系統、富士通-西門子、日立、Adaptec、朗訊科技、NEC 和北電網絡。”

原來有這么多企業參與其中!

“來自 IBTA 成員企業的約 100 名專家歷時 14 個月共同定義和描述了 IBA......它應當為技術創新與廠商差異化提供充分的空間。”

顯然,InfiniBand 的起源與“私有”毫不相干。它誕生于 90 年代末計算與網絡巨頭組成的開放標準委員會。

這個行業協會是如何起步的?根據 2006 年《NetworkWorld》中的一篇文章[11]:

“有些讀者可能還記得 90 年代康柏、惠普和 IBM 共同推動的 Future I/O 高速串行連接技術。或許也有人對英特爾、微軟和太陽微系統聯合推出的一項競爭技術【Next Generation I/O (NGIO)】留有印象。”

“最終兩大陣營合并力量,共同開發被普遍視為下一代服務器與存儲連接技術的 InfiniBand。”

“最初這項合作成果被稱為 System I/O,但這個名字未能持續多久。如今我們稱其為 InfiniBand。”

兩個相互競爭的開放標準計劃合并為一個,也就是我們現在所知的 InfiniBand。

事實上,InfiniBand 這種協作、開放的基礎,與當下超以太網聯盟(UEC)[12]的發展如出一轍。UEC 在 2023 年成立時宣稱[13]:

“今日宣布成立的超以太網聯盟正在匯聚行業領軍企業,共同構建一個完整的基于以太網的高性能網絡通信棧架構。人工智能(AI)與高性能計算(HPC)工作負載正在迅速發展,它們既需要頂尖的功能性、互操作性、性能表現及較低的總體擁有成本,同時又不能犧牲開發者友好性與終端用戶體驗。超以太網解決方案將利用以太網的普遍性與靈活性來處理各種工作負載,同時兼具可擴展性和成本效益。”

“超以太網聯盟由在高性能解決方案領域擁有深厚積淀的企業共同創立。各成員正以平等的方式為更廣泛的高性能生態系統做出重要貢獻。創始成員包括 AMD、Arista、博通、思科、Eviden(Atos 旗下業務)、HPE、英特爾、Meta 和微軟,這些企業在網絡、人工智能、云與大規模高性能計算部署領域擁有數十年經驗。”

兩者何其相似!都是主要計算與網絡廠商聯合為分布式工作負載設計高性能架構。

因此將 InfiniBand 定性為“封閉”,而將 UEC 定性為“開放”并不準確。二者最初都是由行業聯盟起草的開放規范,任何人都可參照實施。

理論上,任何企業都可以基于 InfiniBand 規范開發 IB 交換機和網卡與英偉達競爭。

技術規范是公開可用的。這已經是最大程度的開放了。

誠然,創辦一家 InfiniBand 初創公司可能不是最佳商業決策,但這完全是可能做到的。

我認為困惑源于此:雖然英偉達是目前唯一大規模供應 IB 設備的廠商,但這是市場選擇的結果,而非規范限制。

準確來說,AI 網絡領域的“開放”,指的是規范制定過程的可參與性和可實現性,而非現有供應商的數量。

那么什么是封閉的規范?

如果某公司編寫僅供內部使用的保密產品需求文檔,這屬于封閉。若員工離職攜帶該文檔至競爭對手,即使新設計存在差異,也構成商業秘密侵權。這才是封閉。

顯然超以太網擁有開放的規范。UEC 1.0 規范可免費查閱[14]。任何企業都可參照該產品需求文檔(PRD)開發解決方案。Astera Labs 正在這樣做[15]。

但你猜怎么著!InfiniBand 同樣擁有開放的規范。雖然需要支付 5000 至 10000 美元成為 IBTA 會員才能查閱(并非免費),但這不意味著“封閉”。

實際上,威斯康星大學圖書館館藏有 InfiniBand 1.0 規范的兩卷本書籍,讀者可通過館際互借借閱。我剛查詢發現愛荷華州立大學圖書館的書架上就有一本。

可見,獲取其規范或許需要借書證或協會會費,但該規范本身并非封閉。它不屬于任何單一企業的私有財產。

我先前認為 InfiniBand “封閉”的認知是錯誤的!

3.2 InfiniBand 的淵源

最初的 InfiniBand 聯盟引入了許多對當今 AI 訓練工作負載來說非常重要的技術。

那么,它最終是如何與 Mellanox 聯系起來的呢?

Ted Kim 博士 2004 年的一篇博客文章[16]提供了第一手的資料。Ted[17] 在太陽微電子任職期間,曾參與了 InfiniBand 1.0 規范的撰寫。

Ted 回憶道,互聯網泡沫破滅和英特爾轉向 PCI Express,引發了 InfiniBand 的衰落:

有一段時間,InfiniBand 非常熱門。關注度不斷上升,涌現出大量初創公司,人人都在宣傳自己的 IB 路線圖。隨后泡沫破裂了。這不僅僅是 IB 的問題 —— 而是整個互聯網泡沫的破滅、股市調整、企業 IT 支出趨于謹慎、經濟衰退、9·11 事件等等共同作用的結果。最終,沒人愿意采納或投資這樣一項影響深遠的技術變革。于是,新一輪的懷疑情緒開始蔓延。

然后另一個打擊接踵而至。英特爾決定停止 IB 芯片開發,盡管他們仍在推廣這項技術。他們為什么要這么做?我只能在此猜測。他們最初的開發基于 1x 鏈路(譯者注:指的是單通道鏈路,即由一個信號通道組成的物理連接。),但這一選擇似乎偏離了市場(4x 成為了最受歡迎的規格)。英特爾也難以擺脫研發上的財政壓力,因此需要將資源轉向 PCI Express 的開發。此外,他們可能也對 IB 市場接受度不佳的狀況做出了反應。無論如何,英特爾的退出讓許多人認為 IB 市場規模有限。這也導致一大批供應商延遲擴張或收縮了他們的 IB 路線圖。微軟離開了 IBTA,轉而投向 RDMAC。初創公司或合并或失敗。殘酷的現實擺在眼前。在 SIGCOMM 2003 會議上有人問我:"InfiniBand 是不是已經死了?"

看來 InfiniBand 當時幾乎夭折!Ted 繼續寫道。

時至今日。在經歷漫長的低落和絕望之后,IB 似乎正在特定市場卷土重來……

Mellanox 是那些堅持下來的初創公司之一,即使在互聯網泡沫破裂后的黑暗時期,也持續為 HPC 領域開發 InfiniBand。

順帶一提,如果您正在尋覓網絡專家,Ted 似乎最近結束了在 SambaNova 的工作,根據其 LinkedIn 信息[17],他正在尋找工作機會。

在過去的十年里,InfiniBand 已成為 HPC 工作負載的黃金標準,這一點可從世界大多數頂級超級計算機(位列 TOP500 超級計算機榜單[18]中的那些)都采用它得到印證。

04 面向 HPC/AI 的以太網

正如你所料,直到最近,都鮮有超級計算機在 HPC 網絡采用以太網。

然而,由于 Ethernet 的無處不在,從 InfiniBand 誕生之初,就一直有人在問:“為什么不能直接用以太網?”

那篇 2001 年的 IBM 論文中寫道:

“人們經常問及 InfiniBand 架構的一個問題是:‘我們為何需要另一種網絡架構?為何不使用以太網和 IP?’”

正如我們之前討論過的,以太網最初并非為高性能分布式計算工作負載設計。

直到 RoCE(RDMA over Converged Ethernet)問世才改變這一局面。妙極了,一個縮寫詞(RDMA)嵌套在另一個縮寫詞(RoCE)里,哈哈。

RoCE 成功將 InfiniBand 的“verbs”引入以太網世界。這些“verbs”是軟件可調用的 RDMA 基本操作,包括 read(直接從對端內存拉取數據)、write(直接向對端內存寫入數據)以及 send/receive(消息式通信)。它們允許 GPU 在彼此內存之間傳輸數據,而無需 CPU 介入。

而且,請注意下面這句話:

Mellanox 協助編寫了 RoCE 規范,且 InfiniBand 貿易協會還在大力推廣它!

等等,我原以為故事是這樣的:

  • Mellanox 被 Nvidia 收購了
  • Nvidia 只關心“私有”的 InfiniBand/NVLink
  • Nvidia 通過捆綁銷售強迫客戶購買 InfiniBand/NVLink

事實恰恰相反,Nvidia 內部那些出身 Mellanox 的網絡團隊,長期以來一直是以太網用于分布式計算的堅定支持者。

2009 年《HPCWire》一篇題為《An Ethernet Protocol for InfiniBand》[19]的文章指出:

“無損以太網進入數據中心是大勢所趨...但由于其技術原理趨近 InfiniBand,Voltaire 和 Mellanox 等廠商正借此進軍以太網領域。‘我們不會天真地認為全世界都將轉向 InfiniBand,’Mellanox 營銷副總裁 John Monson 表示...”

‘我們堅信業界已有經過驗證且廣泛應用的 RDMA 傳輸機制,’Monson 斷言,‘它就是 InfiniBand。’

他指出,如若你的目標是實現 10Gb 的無損以太網,完全可以在以太網框架內植入類似功能。Mellanox 將其 RDMAoE 原型稱為低延遲以太網,但實質上就是運行在以太網上的 InfiniBand...

這些 InfiniBand 先驅將他們的經驗應用于以太網,展示了這些經驗如何讓以太網更適合 HPC(以及 AI)。

“如今你能在 10Gb 以太網上實現接近 InfiniBand 的延遲,”IBTA 市場工作組聯合主席、Mellanox 市場傳播總監 Brian Sparks 表示,“且不必面對 InfiniBand 的技術門檻和隨之而來的陡峭的學習曲線。”

但 RoCE 的性能仍略遜于 InfiniBand:QDR IB 可實現 32 Gb 帶寬與亞微秒級延遲,而 RoCE 當時僅限于 10Gb 帶寬及微秒級延遲。不過對大多數應用而言,10Gb 帶寬已綽綽有余...

對于偏好以太網的客戶來說,借助 RoCE,他們能獲得更接近 InfiniBand 的特性與性能,雖仍存在一定差距但方向是對的。

有人可能會疑惑 IBTA 及 InfiniBand 的擁護者為何要推動一種以太網協議。若 RoCE 成功,勢必會蠶食 InfiniBand 市場。但此觀點有失偏頗:首先,嚴格意義上的純 InfiniBand 廠商已不復存在 —— Mellanox、Voltaire 與 QLogic 均以某種形式提供以太網產品。市場早已判定 InfiniBand 技術的普及存在天然上限,RoCE 為這些廠商提供了觸達此前無法吸引的客戶的新途徑。他們判斷,RoCE 與 InfiniBand 之間仍有足夠大的性能差距,足以支撐兩種技術共存。

這句話至今依然成立:“RoCE 是這些廠商觸達此前無法吸引的客戶的又一途徑。” 即使在 15 年后的今天,在 LLM 訓練與推理時代,我依然堅信這一點。頭部客戶將性能置于一切之上;其他客戶則尋求性能與成本的平衡;還有一些企業更愿意沿用他們熟悉的技術。

而且有證據表明,IBTA 十多年來一直在為偏好以太網的用戶推動以太網在 HPC/AI 領域的應用。根據 IBTA 在 2015 年的一篇文章[20]:

“IBTA 今日宣布啟動 RoCE 計劃,以進一步推動 RDMA over Converged Ethernet(RoCE)技術的發展,并提升 RoCE 的行業認知度……該計劃將幫助我們向需要最高性能以太網絡的群體提供解決方案信息和資源...RoCE 倡議匯集了 IBTA 中致力于展示該技術的性能與效率優勢、以及多廠商競爭生態價值的成員。”

早在十年前,他們就已構想出一個多廠商生態系統……如今,這一愿景正隨著 Nvidia 之外的廠商推動以太網用于 AI 網絡而逐步實現。

這一生態系統的基石,正是 RoCE 的第二代版本——RoCEv2,它為 HPC/AI 工作負載增加了更多功能。

如今新興的 AI 專用以太網協議棧,例如 Nvidia 的 Spectrum-X 和 Ultra Ethernet Consortium 的 UEC 1.0 規范,都直接構建于 RoCEv2 之上,在保留 RDMA 語義的同時,也著力解決其原有缺陷。我們將在后續文章中詳細解析這些創新。

05 英偉達的 AI 以太網方案

所以今天的 InfiniBand 是一個開放標準規范,卻只有單一供應商提供產品。

但你猜怎么著?英偉達同樣推出了名為 Spectrum-X 的 AI/HPC 以太網解決方案。這步棋下得漂亮。

這里有一段短視頻[21],現在你應該能看懂其中一些內容了!

如視頻所示,英偉達的 Spectrum-X 將其交換機和 DPU/SuperNIC 協同搭配,構成面向 GPU 集群的“全棧式網絡架構”

06 英偉達芯片戰略的優勢

在探究橫向擴展技術時,我意外發現了英偉達芯片戰略中一個被低估的優勢。

英偉達共設計了七種不同類型的芯片。

其一是 GPU,其二是基于 Arm 的CPU,另外五款全是網絡芯片。

你瞧瞧!

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

來自英偉達演示 PPT 的截圖

這種在網絡領域的深耕非常重要。這也是為什么博通(Broadcom)能夠為超大規模云廠商定制 AI ASIC —— 因為它早已具備將加速器互聯所需的網絡技術專長。

而 Nvidia 用于反駁的觀點自然是:那些定制 ASIC 廠商能否既跟上 AI 加速器飛快的迭代節奏,還能同步應對同樣高速演進的網絡需求?博通(Broadcom)加上云廠商內部的芯片團隊,真的能跟得上嗎?

GPU 網絡通信基礎,Part 3(LLM 訓練過程的網絡通信;InfiniBand 真的是“封閉”技術嗎?)-AI.x社區

Courtesy Nvidia.

相較之下,AMD 雖然擁有 GPU 和 CPU 產品,但在橫向擴展(scale-out)和縱向擴展(scale-up)的競爭力上,仍依賴更廣泛的生態系統 —— 即 UEC 和 UALink。他們的賭注是:網絡領域的專業廠商能否足夠快速地創新,并與 AMD 步調一致,最終在系統層面實現同步發展。

END

本期互動內容 ??

?在閱讀本文之前,您是否也曾認為 InfiniBand 是英偉達的“私有”技術?這個“認知誤區”的澄清,是否改變了您對 AI 基礎設施競爭格局的看法?

文中鏈接

[1]??https://www.youtube.com/watch?v=IHZwWFHWa-w??

[2]??https://youtu.be/PvA4LvPJg0I??

[3]??https://youtu.be/B-COGMbaUg4??

[4]??https://www.computerhistory.org/revolution/supercomputers/10/7/68?position=0??

[5]??https://x.com/elonmusk/status/1947715674429919279??

[6]??https://credosemi.com/products/hiwire-aec/??

[7]??https://nvidianews.nvidia.com/news/spectrum-x-ethernet-networking-xai-colossus??

[8]??https://en.wikipedia.org/wiki/Single_instruction,_multiple_data??

[9]??https://en.wikipedia.org/wiki/TOP500??

[10]??https://ieeexplore.ieee.org/document/960002??

[11]??https://www.networkworld.com/article/845980/servers-infiniband-back-to-the-beginning.html??

[12]??https://ultraethernet.org/??

[13]??https://ultraethernet.org/leading-cloud-service-semiconductor-and-system-providers-unite-to-form-ultra-ethernet-consortium/??

[14]??https://ultraethernet.org/wp-content/uploads/sites/20/2025/06/UE-Specification-6.11.25.pdf??

[15]??https://www.asteralabs.com/news/astera-labs-to-share-vision-for-expanding-opportunities-in-ai-infrastructure-with-ualink/??

[16]??https://web.archive.org/web/20140808200954/https://blogs.oracle.com/RandomDude/entry/history_hype_to_pragmatism??

[17]??https://www.linkedin.com/in/ted-kim-8816641/??

[18]??https://top500.org/??

[19]??https://www.hpcwire.com/2009/05/21/an_ethernet_protocol_for_infiniband/??

[20]??https://www.infinibandta.org/infiniband-trade-association-launches-the-roce-initiative-to-advance-rdma-over-converged-ethernet-solutions/??

[21]??https://youtu.be/nKqfi3q4S5I??

本文經原作者授權,由 Baihai IDP 編譯。如需轉載譯文,請聯系獲取授權。

原文鏈接:

??https://www.chipstrat.com/p/gpu-networking-basics-part-3-scale??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
特级西西人体4444xxxx| 最近中文字幕免费mv| 精品成人免费视频| 国产99久久| 欧美日韩情趣电影| 91嫩草国产丨精品入口麻豆| 天天操天天操天天干| 日日欢夜夜爽一区| 欧美高清自拍一区| 小早川怜子久久精品中文字幕| 亚洲精品自拍| 亚洲一区二区三区三| 欧美视频1区| 精品久久国产视频| 日韩精品久久久久久| 欧美猛少妇色xxxxx| xxx在线播放| 成人自拍在线| 欧美日韩成人高清| 91精品91久久久中77777老牛| 国产写真视频在线观看| 99re热视频这里只精品 | 欧美日韩精品一区二区三区视频| 亚洲伦理在线精品| 日韩精品一线二线三线| 黄色一级a毛片| 国产一区二区三区高清播放| 国产成人精品最新| 国产精品18p| 亚洲91视频| 在线看日韩欧美| 亚洲天堂成人av| aaa国产精品视频| 5566中文字幕一区二区电影| 久草综合在线观看| 国产在线观看www| 亚洲精品视频在线| 一区精品视频| 亚洲欧美另类久久久精品 | 免费又黄又爽又色的视频| 亚洲丝袜美腿一区| 欧美精品一区二区久久久| 久热精品在线观看视频| 欧美www.| 色综合久久天天| 97国产精东麻豆人妻电影| 久草在线视频网站| 一区二区三区国产| 99视频精品全部免费看| 久操视频在线观看| 亚洲欧洲无码一区二区三区| 亚洲高清在线观看一区| 黄色av网站在线免费观看| 91麻豆精东视频| 免费电影一区| 久久精品色图| 久久久www免费人成精品| 鲁鲁视频www一区二区| 亚洲 国产 欧美 日韩| 99热精品一区二区| 蜜桃成人在线| 黄色网址在线播放| 中文在线免费一区三区高中清不卡| 欧美精品二区三区四区免费看视频 | 四季久久免费一区二区三区四区| 亚洲欧美日韩在线| 人妻激情另类乱人伦人妻| 在线看福利影| 亚洲国产精品综合小说图片区| 免费看欧美黑人毛片| heyzo一区| 狠狠综合久久av一区二区小说| 日韩黄色片视频| 国产精品无码久久久久| 在线成人av网站| 台湾佬美性中文| 风间由美性色一区二区三区四区 | 色综合久久中文综合久久97| 在线观看高清免费视频| 91成人福利社区| 精品日本一线二线三线不卡| 亚洲国产第一区| heyzo久久| 欧美精品在线免费播放| 日韩三级小视频| 青青草伊人久久| 97视频中文字幕| 奇米影视888狠狠狠777不卡| 国产精品久久久久影院亚瑟| 亚洲人成精品久久久久| 欧美视频不卡中文| 国产精品免费入口| 欧美日韩五区| 日韩午夜精品视频| 国产伦精品一区二区三区妓女| 国产成人影院| 美日韩精品视频免费看| 日韩av在线天堂| 蜜臀va亚洲va欧美va天堂 | 国产午夜视频在线播放| 久久国产88| 亚洲va欧美va国产综合久久| 性xxxfllreexxx少妇| 国产精品天美传媒沈樵| japanese在线播放| 91精品xxx在线观看| 91精品国产美女浴室洗澡无遮挡| 精品国产一区在线| 水蜜桃久久夜色精品一区| 欧美精品成人在线| 中文字幕黄色av| 成人黄色小视频在线观看| 亚洲ai欧洲av| 国产亚洲成av人片在线观看| 538prom精品视频线放| 波多野结衣av在线免费观看| 欧美在线不卡| 国产精品旅馆在线| 日韩在线视频免费| 成人欧美一区二区三区黑人麻豆 | 日韩精品大片| 成av人片在线观看www| 欧美电影一区二区| 美女被到爽高潮视频| 在线高清一区| 96pao国产成视频永久免费| 猫咪在线永久网站| 午夜精品久久久久久久久| 一区二区三区四区毛片| 激情五月色综合国产精品| 午夜精品一区二区三区在线播放 | 国产v日产∨综合v精品视频| 亚洲精品影院| 韩国成人在线| 国产一区二区三区高清在线观看| 日韩欧美亚洲一区二区三区| 国产91在线观看丝袜| 艳母动漫在线免费观看| 开心久久婷婷综合中文字幕 | a在线免费观看| 欧美视频精品在线| 久久美女免费视频| 亚洲一区二区免费看| 国产精品香蕉视屏| 黄色美女视频在线观看| 日韩欧美一区二区视频| 青花影视在线观看免费高清| 日本成人中文字幕在线视频| 日产精品一线二线三线芒果| 日韩精品专区| 亚洲欧美精品一区| 无码aⅴ精品一区二区三区| 久久品道一品道久久精品| 久久久999视频| 久久综合欧美| 国产精品美腿一区在线看| 成人午夜影视| 欧美日本国产一区| 黄色a级片在线观看| 国产精品一卡二| 精品无码一区二区三区爱欲| 久久九九热re6这里有精品| 77777亚洲午夜久久多人| 神马久久精品| 欧美午夜片在线看| www深夜成人a√在线| 国产精品99久久久久| 91免费黄视频| 国产成人精品999在线观看| 国产精品福利片| 麻豆视频在线观看免费| 日韩精品一区二区三区在线| 日韩av在线天堂| 中文字幕+乱码+中文字幕一区| 永久免费的av网站| 国内视频精品| 欧美福利一区二区三区| 福利一区在线| 欧美激情精品久久久久久黑人| 欧美成人片在线| 欧美日韩精品免费观看视频| 久久黄色免费视频| 2023国产精品自拍| 亚洲无在线观看| 日韩一级在线| 亚洲一区二区在线看| 999国产精品一区| 国产精品国产三级国产aⅴ9色| 天堂аⅴ在线地址8| 欧美mv日韩mv国产| 看黄色一级大片| 亚洲精品国产第一综合99久久| 无码人妻精品一区二区三应用大全 | 国产欧美一区视频| 日本少妇激三级做爰在线| 99视频精品| 精品久久免费观看| 亚洲国产网址| 2019国产精品视频| 欧美精品日日操| 欧美激情精品久久久久久大尺度| 国产精品麻豆一区二区三区| 日韩免费一区二区三区在线播放| 天天射天天干天天| 免费亚洲网站| 91精品在线麻豆| 国产乡下妇女做爰毛片| 91小视频在线| 极品人妻一区二区| 人人爽香蕉精品| 黄色av网址在线播放| 91精品综合久久久久久久久久久 | 精品久久久久久久免费人妻| 亚洲字幕久久| 亚洲精品成人三区| 日韩影视高清在线观看| 91人人爽人人爽人人精88v| 澳门成人av网| 91极品视频在线| 影音先锋中文在线视频| 在线午夜精品自拍| 外国精品视频在线观看 | 日韩精品视频一二三| 亚洲欧美高清| 成人精品视频在线播放| 日韩激情一区| 日韩av大全| 深夜福利久久| 欧美重口乱码一区二区| 国产香蕉精品| 国产精品露出视频| 秋霞一区二区三区| 91在线观看免费高清| 久久天天久久| 青青精品视频播放| а√在线天堂官网| 久久男人av资源网站| 天堂av在线电影| 久久777国产线看观看精品| 免费高清完整在线观看| 丝袜美腿精品国产二区| yes4444视频在线观看| 亚洲欧美国产精品va在线观看| 四虎在线视频免费观看| 亚洲成年人在线| 丰满少妇高潮在线观看| 欧美mv和日韩mv国产网站| 午夜久久久久久久久久| 日韩免费成人网| 亚洲AV无码精品国产| 日韩精品自拍偷拍| 成人免费一级视频| 亚洲精品在线观看视频| 亚洲免费成人在线| 精品国产凹凸成av人导航| 成人久久久精品国产乱码一区二区 | 免费看污黄网站| 欧美aaa在线| 午夜视频在线网站| 国产一区二区久久| 不卡的一区二区| eeuss国产一区二区三区| 在线观看国产三级| 国产日韩欧美制服另类| 成人在线观看免费高清| 亚洲天堂av老司机| 免费在线观看a级片| 亚洲综合一区在线| 欧美一二三区视频| 欧洲视频一区二区| 国产精品久久影视| 精品国产91亚洲一区二区三区婷婷| 五月天婷婷视频| 伊人男人综合视频网| 精品国产99久久久久久| 欧美福利在线观看| 手机在线观看av| 国产欧美一区二区三区在线看| 精品视频在线播放一区二区三区| 福利精品视频| 国产中文字幕一区二区三区| av不卡在线免费观看| 亚洲午夜在线| 亚洲精品视频导航| 国产乱码精品一区二区三区av| 88av在线播放| 国产精品卡一卡二卡三| 国产一级做a爰片在线看免费| 欧美性猛交xxxx乱大交蜜桃| 国产又粗又猛又爽又黄91| 亚洲国模精品私拍| 91激情在线| 亚州成人av在线| 91麻豆精品国产综合久久久 | 香蕉视频免费看| 久久精品国产91精品亚洲| 成av人片在线观看www| 国产区精品视频| 日韩手机在线| 99久久免费观看| 免费不卡在线观看| 亚洲熟女乱综合一区二区三区| 国产精品视频yy9299一区| 国产无遮挡又黄又爽在线观看| 欧美日韩中文另类| 日韩一区二区三区不卡| 久久综合亚洲社区| 亚洲电影有码| 久久久av水蜜桃| 欧美性久久久| 天堂在线一区二区三区| 久久久亚洲国产美女国产盗摄| 国产黄色片在线免费观看| 在线观看一区二区视频| 天天舔天天干天天操| 欧美成人精品激情在线观看| 成人自拍视频网| 免费在线国产精品| 黄色精品一区| 国产人妻精品久久久久野外| 欧美激情在线观看视频免费| 800av免费在线观看| 亚洲成**性毛茸茸| 91高清在线观看视频| 国产精品专区一| 九热爱视频精品视频| 婷婷五月综合缴情在线视频| 国产精品99久久久久| av成人免费网站| 欧美猛男gaygay网站| 超碰97在线免费观看| 日韩av免费一区| 亚洲人成网www| www黄色日本| 97se亚洲国产综合在线| 欧美成人aaaaⅴ片在线看| 欧美成人激情免费网| 中文字幕资源网在线观看| 国产日韩欧美日韩| 日韩免费视频| 粉色视频免费看| 国产精品的网站| 97人妻人人澡人人爽人人精品 | 丁香花高清在线观看完整版| 亚洲精品欧美日韩| 亚洲精品99| 原创真实夫妻啪啪av| 一区二区三区精品| 高潮一区二区三区乱码| 久久久久这里只有精品| 麻豆精品av| 欧美极品欧美精品欧美图片| 久久久久国产精品免费免费搜索| 欧美日韩一级黄色片| 亚洲欧美中文在线视频| 日本高清不卡一区二区三区视频| 欧美最大成人综合网| 日本女优在线视频一区二区 | 婷婷夜色潮精品综合在线| 欧美一区二区公司| 7m第一福利500精品视频| 美女久久99 | 国产成人免费视频网站高清观看视频| 91人妻一区二区三区蜜臀| 欧美一级高清片| 高清视频在线观看三级| 欧美高清一区二区| 免费久久99精品国产| 一起操在线播放| 欧美va亚洲va| 新片速递亚洲合集欧美合集| 亚洲最大色综合成人av| 国产老肥熟一区二区三区| 国产亚洲第一页| 亚洲开心激情网| 欧美极品在线| 免费看欧美黑人毛片| 久久久久久99精品| 国产精品区在线观看| 国内精品一区二区三区四区| 久久99视频| 亚洲精品国产久| 狠狠色狠色综合曰曰| av在线天堂播放| 国产91免费视频| 日韩精品欧美成人高清一区二区| 欧美国产日韩在线观看成人| 亚洲激情视频在线播放| av亚洲一区| 水蜜桃色314在线观看| 国产精品系列在线| 秋霞视频一区二区| 国产精品日韩一区| 在线观看不卡| 国产亚洲精品久久久久久豆腐| 精品久久久久久亚洲综合网| 69堂精品视频在线播放| 国产传媒久久久| 国产精品免费aⅴ片在线观看| 女人18毛片一区二区三区|