精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型步入「推理Scaling」時代,SambaNova如何挑戰英偉達的霸主地位?

人工智能 新聞
在深度學習引發的第三次人工智能浪潮中,算力對人工智能發展的決定作用已成共識。一系列極具影響力的 AI 研究,如 AlexNet、ResNet 和 Transformer 都是在 GPU 上實現和評估的,這也讓英偉達十年來始終處于 AI 硬件市場的主導地位。

OpenAI o1 的發布,再次給 AI 領域帶來了一場地震。

o1 能像人類一樣「思考」復雜問題,擁有優秀的通用推理能力。在未經專門訓練的情況下,o1 能夠直接拿下數學奧賽金牌,甚至能在博士級別的科學問答環節上超越人類專家。

在性能躍升之外,更重要的是,它揭示了大模型進化范式的轉變:通過更多的強化學習(訓練時計算)和更多的推理(Test-Time 計算),模型可以獲得更強大的性能。

這又一次讓我們想起 Richard Sutton 在《The Bitter Lesson》中所說的,利用計算能力的一般方法最終是最有效的方法。這類方法會隨著算力的增加而繼續擴展,搜索和學習似乎正是兩種以此方式隨意擴展的方法。連山姆?奧特曼也坦言,在未來的一段時間里,新范式進化的曲線會非常陡峭。

從「訓練 Scaling」到「推理 Scaling」的范式轉變,也引發了關于計算資源分配和硬件選擇的重新思考。

圖片

領域內的研究者和從業者認識到,一方面,更多的計算資源應該投入到推理階段,另一方面,優化硬件配置以提升大模型推理的效率將是下一階段的攻關重點。而大模型要進行推理 Scaling,實際上比訓練 Scaling 對芯片并行處理能力的要求更高。

GPU 最初設計用于圖形渲染,由于其并行處理能力,過去數年一直是以海量數據集訓練大模型的熱門選擇。雖然 GPU 非常適合實現神經網絡的訓練工作,但在全新的范式下,由于其在延遲、功耗等方面表現不佳, 并不是進行大規模推理的最好選擇。

在 GPU 之外,什么是大模型推理的更好選擇?現在的 AI 芯片有各種流派:ASIC、FPGA、DSP、Neuromorphic Chip,以及大量 DSA (Domain-specific architectures)芯片。其中,以 SambaNova RDU(Reconfigurable Dataflow Unit)為代表的動態可重構數據流(Dataflow)架構的芯片,能夠通過并行處理和高效數據移動來優化性能和效率,近年越來越被認為是一個重要的發展方向。

數倍于 GPU 推理性能

來自 SambaNova 最新一代 RDU SN40L

近日的芯片盛會 Hot Chips 上,圍繞大模型的議題比以往任何一屆都更加活躍。SambaNova 的最新一代 RDU 產品 SN40L 也在這場大會上引發持續討論。大家也充分了解到,Sambanova 如何實現大模型的快速推理以及提供 GPU 之外的更優方案。

我們知道,大模型在推理時會逐步生成輸出序列的 Token,每生成每一個 token 都會需要把模型的參數從 HBM(High Bandwidth Memory)搬運到片上進行計算。對于利用 HBM 來推理的芯片來說,HBM 的利用率是推理速度的關鍵,越快從內存中訪問數據,就越能縮短處理時間。

SambaNova 的 RDU 既有 GPU 10 倍以上的片上分布 SRAM,也有適用于需要快速數據傳輸的大規模計算任務的 HBM。其架構可以自動做到極致的算子融合,達到 90% 以上的 HBM 利用率,使得 RDU 對 GPU 有了 2-4 倍的性能優勢。

當前的 AI 推理平臺中,SambaNova 是唯一能在 Llama 3.1 405B 上提供每秒超過 100 個 Token 推理速度的平臺。

圖片

如下圖所示,每個框都是一個算子。一般來說,多個算子會同時運行,并將數據保存在芯片上以重復使用。但在 RDU 中,整個解碼器是一個 Kernel 調用。

圖片

這意味著調用開銷會顯著減少,芯片對數據進行有效工作的時間則增加了。

圖片

另外一方面,極致的算子融合使 RDU 能夠達到類似 GPU 的批處理能力。GPU 有很好的批處理能力(比如從 BS1 到 BS16),可將吞吐量提高 12 到 15 倍。比如在上圖中,當 decoder0 在進行批處理運算時,可以同時從 HBM 讀取 decoder1 的參數。

圖片

SambaNova 的研究者觀察到,SN40L 在 Llama 3.1 70B 上可以實現較好的吞吐量 Scaling。

為什么業內普遍看好數據流架構?

SN40L 讓我們重新認識了 SambaNova RDU 相對于主流 GPU 的速度優勢,而數據流架構的價值也在被越來越多的從業者重新發現。

與 GPU 本質上不同的是,數據流架構通過數據流動來驅動計算過程,而非常規指令流動。在該架構中,程序被表示為一個 Dataflow Graph,其中節點代表計算操作,邊代表數據依賴關系。每個節點在其所有輸入數據準備好后立即執行,并將結果傳遞給下游節點。這種架構天然支持并行處理,多個獨立的計算操作可以同時執行,從而顯著提高了計算性能。

從下圖可以看到,SambaNova RDU 的片上空間數據流可以做自動的算子融合 (kernel fusion),與 GPU 的傳統 kernel-by-kernel 運行相比,明顯消除了大量的內存流量和開銷。

圖片

圖片

近年來,GPU 廠商明顯意識到非 Dataflow 架構的短板,并為 GPU 部分引入一些 Dataflow 的功能。例如,從 H100 開始,GPU 開始加入分布式共享內存(Distributed Shared Memory) ,也加入了新的張量內存加速器 (Tensor Memory Accelerator) 單元,使其某種程度上模仿了片上空間流水線運行的「范式」。

但這種程度的改動遠遠不夠,GPU 追趕的速度恐怕已經跟不上 AI 領域推理需求的暴漲。畢竟 GPU 最初不是專門為 AI 而設計的,廠商們很難在不影響主營業務的情況下對基本架構做完全的重新設計,即使增加了上述的「修補」工作,也無法完全采用高效的數據流架構,這從根本上限制了 GPU 推理的提速。

當前的幾家主流 AI 芯片 Startup,都選擇了數據流架構。其中來自 SambaNova 的 RDU 展現出了獨特優勢,也被視為 GPU 的最有力競爭者 。與英偉達相比,Sambanova 最新 Llama 3.1 模型上生成 token 的性能快了 10 倍以上,并且通過 cloud.sambanova.ai 公開供開發人員使用。

圖片

RDU 能夠實現更快的推理速率,更利于大模型的部署。連人工智能專家吳恩達也驚嘆 SambaNova 的推理速率: 

圖片

從最基礎的成本上說,由于 Sambanova 的數據流架構 RDU 不僅擁有大的片上 SRAM,同時擁有 HBM 層面的優勢,相比于其他的幾個單純依靠片上 SRAM 的數據流企業,用戶需要支持大型語言模型的基礎設施更少。例如,想在 Llama 70B 上推理,對于有些 AI 芯片來說需要五百多個芯片,或者相當于三百多個芯片的 4 個 wafer ,而 SambaNova 只需要 擁有 16 個芯片的 1 個機架。(https://sambanova.ai/blog/sn40l-chip-best-inference-solution)

圖片

更進一步說,RDU 所帶來推理速度提升的意義不只是體現在效率上,更能體現在質量上,也體現對 AGI 探索的加速上。

基于 OpenAI o1 帶來的推理 Scaling Law 的啟發,人們意識到,在推理端,更多的算力同樣會帶來更強的智能。因為在同一時間單位內,推理速度越快,就能實現越復雜的推理,就能解鎖越多復雜任務,大模型應用的天花板就越高。

這意味著,如果我們想更快實現 AGI,我們本質上最需要建設足夠的基礎設施并持續降低計算成本。與此同時,計算資源還要更多地向推理側增加。但在目前的條件下,算力往往是大模型廠商們拓展技術上限的頭道難關,即使對于實力雄厚的玩家們也一樣。

OpenAI 在發布 o1 時似乎就遇到了這個問題。機器學習研究員 Nathan Lambert 在博客《逆向工程  OpenAI 的 o1》中寫到,在已發布的基準測試分數和曲線圖中,o1 preview 并非是能力最強的,但 OpenAI 并未立即發布最強版本的 o1 (詳情見下圖),原因是「最強配置」過于昂貴,他們沒有對應的基礎設施支持大規模的部署。

圖片

但推理算力需求并非天塹不可跨越。在 o1 發布后不久,SambaNova 便在 Hugging Face 上發布了 Llama 3.1 Instruct-O1 演示 。這個項目由 SambaNova 的 SN40L RDU 提供算力支持,用戶可與 LLama 3.1 405B-instruct 模型進行實時對話,體驗風馳電掣般類 o1 的推理過程。

項目地址:https://huggingface.co/spaces/sambanovasystems/Llama3.1-Instruct-O1

這意味著,在強大算力的支持下,開源大模型推理能力會不斷提升,復現完整 o1 甚至觸達更高級的智能是指日可待的。

一個新的時代正在開啟,當大模型 Scaling Law 的重心從預訓練向后訓練和推理側轉移,廠商們在算力層面的分配與設計也會更深刻影響大模型領域的競爭格局。而對于 SambaNova 或其他以提供算力和計算基礎設施見長的公司來說,接下來會迎來前所未有的機遇。

英偉達的挑戰者

在 AI 芯片賽道的諸多初創公司中,SambaNova 是目前估值最高的一家獨角獸。

SambaNova 成立于 2017 年,擁有三位資深的聯合創始人:Rodrigo Liang、Kunle Olukotun、Christopher Ré。CEO Rodrigo Liang 畢業于斯坦福大學,在創立 SambaNova 之前,Rodrigo 領導了甲骨文和 Sun Microsystems 的工程團隊,負責 SPARC 處理器和 ASIC 的開發。Kunle Olukotun 和 Christopher Ré 都來自斯坦福大學。

圖片

從左到右分別為 Kunle Olukotun、Rodrigo Liang、Christopher Ré。

此外,被譽為「芯片風險投資教父」的陳立武,自創立之初便作為創始投資人和董事會主席加入 SambaNova,并于 2024 年 5 月出任執行主席,以加速和擴大公司的發展。自 1987 年創立華登國際(Walden International)以來,陳立武投資了許多公司(包括 SambaNova),在推動半導體創新和發展方面發揮了重要作用。

圖片

在深度學習引發的第三次人工智能浪潮中,算力對人工智能發展的決定作用已成共識。一系列極具影響力的 AI 研究,如 AlexNet、ResNet 和 Transformer 都是在 GPU 上實現和評估的,這也讓英偉達十年來始終處于 AI 硬件市場的主導地位。

不過,時代可能真要變了。正如 Transformer 會迎來新的挑戰者,比如 Mamba;英偉達和 GPU 也會迎來下一階段的強勁競爭者,比如 SambaNova 的 RDU。

o1 發布之后,AI 推理市場正處于爆炸式增長的新起點。從 SambaNova 的 RDU 開始,人工智能領域可能正在翻開全新的一頁。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-28 13:20:18

2023-11-14 07:37:21

芯片英偉達

2025-06-04 13:56:06

英偉達訓練模型

2024-11-06 14:00:00

蘋果英偉達

2012-12-27 10:12:22

Google微軟Office

2012-11-12 10:01:35

2012-05-11 09:56:54

2025-07-30 09:05:00

2022-06-01 16:47:53

AI模型開源

2023-09-12 10:22:30

英偉達AI芯片

2024-11-04 09:07:00

2025-11-04 16:01:56

英偉達模型AI

2016-11-21 16:25:10

5G霸主中國

2025-02-21 13:20:00

2023-10-31 19:20:29

語言模型英偉達芯片

2025-05-30 15:52:05

訓練代碼推理

2024-11-12 13:07:44

2024-09-09 16:22:51

2025-04-07 09:45:00

點贊
收藏

51CTO技術棧公眾號

啪啪激情综合网| 大黄网站在线观看| 奇米一区二区三区av| 最新中文字幕亚洲| 中文字幕一二三区| 国产精品xx| av网站免费线看精品| 国产福利精品在线| 日本黄色片免费观看| 免费福利视频一区| 精品视频一区二区不卡| 免费网站在线观看视频| 国产免费av高清在线| 国内精品伊人久久久久av一坑 | 在线观看免费视频你懂的| 成人高清免费观看| 国产日韩av在线播放| 福利一区二区三区四区| 99久久久久久中文字幕一区| 亚洲国产天堂久久综合| 天天干天天操天天做| 91九色国产在线播放| 国产精品欧美一区喷水| 国产一区免费视频| av av片在线看| 日本伊人色综合网| 久久一区91| 国产肉体xxxx裸体784大胆| 高清电影在线免费观看| 日本一区二区三区国色天香 | 91丝袜一区二区三区| 68国产成人综合久久精品| 亚洲欧美日韩另类| 成人区人妻精品一区二| 精品国模一区二区三区欧美| 在线视频观看一区| 无码人妻精品一区二区三区在线| 国产精品久久麻豆| 中文字幕乱码日本亚洲一区二区| 精品国产福利| 亚洲AV无码成人片在线观看| 久久国产夜色精品鲁鲁99| 日本人成精品视频在线| av资源吧首页| 欧美女激情福利| 久久国产精品久久久久| 熟女少妇a性色生活片毛片| 久久99免费视频| 日韩精品免费一线在线观看| 无码人妻精品一区二区三| av日韩久久| 欧美日韩国产精品成人| 69久久久久久| 久久久国产精品网站| 欧美在线观看禁18| 四季av一区二区| 秋霞国产精品| 在线欧美日韩精品| 色哟哟精品视频| 高清亚洲高清| 欧美日韩的一区二区| 在线观看免费成人av| 一呦二呦三呦精品国产| 91久久精品午夜一区二区| 91猫先生在线| 欧美成人精品一区二区男人小说| 富二代精品短视频| 日本精品一区二区三区四区| 日韩高清中文字幕一区二区| 91官网在线观看| 国产精品自在自线| 欧美成人精品一级| 精品不卡在线视频| 国产ts丝袜人妖系列视频 | 亚洲第一二三四区| 在线观看精品一区| 国产免费中文字幕| 视频精品一区| 日韩精品在线免费播放| 国产精品密蕾丝袜| 国产精品久久久久久久久妇女| www.久久撸.com| 久艹视频在线观看| 久久久蜜桃一区二区人| 国产精品专区一| 国内毛片毛片毛片毛片| 92国产精品观看| 图片区小说区区亚洲五月| 黄色精品免费看| 性欧美大战久久久久久久久| 男人天堂999| 国产精品亚洲一区二区在线观看| 欧美精品一区二区三区四区 | 精品国产一区探花在线观看| 精品国模在线视频| 动漫精品一区一码二码三码四码| 久久一区二区三区四区五区| 91精品久久久久久久久久另类 | 亚洲综合视频| 亚洲激情小视频| 亚洲精品国产精品国自| 欧美精品国产一区| 青青草国产精品一区二区| 一区二区日韩在线观看| www.亚洲在线| 中文网丁香综合网| 成人免费短视频| 日韩午夜小视频| 日本少妇xxxxx| 亚洲精品看片| 91情侣偷在线精品国产| 可以在线观看的av网站| 亚洲一区在线视频| 日本激情视频在线播放| 久久a爱视频| 欧美精品日韩三级| 天天天天天天天干| 99视频一区二区三区| 爱爱爱视频网站| 欧美精品高清| 亚洲精品成a人在线观看| 欧美一级特黄高清视频| 日韩av中文字幕一区二区三区 | 欧美日韩亚洲自拍| 久久激情av| 欧美精品免费在线观看| 97超碰人人模人人人爽人人爱| 91在线国内视频| 日本香蕉视频在线观看| aa亚洲一区一区三区| 自拍偷拍亚洲在线| av毛片在线免费观看| av在线不卡免费看| 日韩一级免费看| 中文字幕日韩亚洲| 中国日韩欧美久久久久久久久| 99精品视频99| 99国产精品久久久久久久久久久| 成人在线免费高清视频| 精品国产亚洲一区二区三区在线| 中文字幕欧美国内| av首页在线观看| 91蝌蚪porny九色| 欧美精品久久久久久久免费| 国产精品毛片视频| 九九热精品在线| 99久久精品无免国产免费| 国产精品―色哟哟| 网站一区二区三区| 久久亚洲在线| 91久久久久久久| 岛国成人毛片| 日韩欧美一区中文| 麻豆chinese极品少妇| 国产激情精品久久久第一区二区| dy888午夜| 亚洲精品在线a| 久久久久久久久91| 婷婷五月综合久久中文字幕| 欧美日韩激情美女| 三级黄色片网站| 日本中文字幕一区二区有限公司| 婷婷亚洲婷婷综合色香五月| 欧美一级做一级爱a做片性| 日韩视频一区在线| 精品人妻一区二区三区换脸明星| 有坂深雪av一区二区精品| 风韵丰满熟妇啪啪区老熟熟女| 在线欧美不卡| 欧美一区二区三区四区五区六区| 成人天堂yy6080亚洲高清| 中文国产成人精品久久一| 国产又爽又黄又嫩又猛又粗| 一区二区三区四区亚洲| 欧美在线一级片| 日韩经典中文字幕一区| 中文字幕制服丝袜在线| 亚洲精品黑牛一区二区三区| 国产91精品久久久久| 成年人免费在线视频| 这里是久久伊人| 九九热国产视频| 国产欧美一区二区在线观看| 17c国产在线| 亚洲黄色天堂| 亚洲日本精品一区| 99久久香蕉| 国产精品国产福利国产秒拍 | 伊人色在线观看| 欧美性色综合| 欧美一区二区综合| 国产在线视频欧美一区| 97色伦亚洲国产| 日本暖暖在线视频| 亚洲国产99精品国自产| 一二三区免费视频| 亚洲精品va在线观看| 30一40一50老女人毛片| 狠狠色丁香九九婷婷综合五月| 妞干网视频在线观看| 国产欧美日韩免费观看 | 日av中文字幕| 女人色偷偷aa久久天堂| 欧美一区二区三区电影在线观看| 秋霞影院一区| 国产精品三级在线| 99riav视频在线观看| 日韩中文字幕网站| 手机福利小视频在线播放| 欧美一级精品大片| 国产情侣免费视频| 红桃视频成人在线观看| 免费在线观看a级片| 久久久99精品久久| 91精品又粗又猛又爽| 国产综合一区二区| 日本999视频| 国产亚洲午夜| 国产在线拍揄自揄拍无码| av一区二区高清| 另类视频在线观看+1080p| 日韩精品一区国产| 国产欧美一区二区| 日本免费久久| 538国产精品视频一区二区| av毛片在线免费看| 日韩一区视频在线| 东凛在线观看| 亚洲欧美第一页| 污污网站在线免费观看| 日韩精品一区二区三区四区视频| 亚洲在线精品视频| 欧美自拍丝袜亚洲| 精品视频一二三区| 欧美性xxxx在线播放| 日本三级午夜理伦三级三| 亚洲精品国产一区二区精华液 | 四虎成人免费视频| 国产一区二区成人久久免费影院| 日日躁夜夜躁aaaabbbb| 日日噜噜夜夜狠狠视频欧美人| 激情五月宗合网| 一区二区三区四区五区精品视频 | 蜜桃一区二区三区在线| 成人在线观看黄| 久久亚洲国产精品一区二区| 日韩精品一区二区三区色欲av| 一区二区三区四区五区在线| 欧美黄色免费影院| 三级在线观看一区二区| 成人在线观看黄| 日韩中文字幕区一区有砖一区 | 超碰成人在线免费观看| 91影院成人| 18视频在线观看娇喘| 欧美精品黄色| 无码专区aaaaaa免费视频| 亚洲伦理精品| 日日摸日日碰夜夜爽av| 国产婷婷精品| 免费日韩中文字幕| 秋霞午夜鲁丝一区二区老狼| 中文字幕亚洲欧洲| 国产精品一二三四区| 国产婷婷在线观看| 久久综合狠狠综合久久激情 | 天堂在线观看免费视频| 日韩精品高清在线| 国产高清免费av在线| www.xxxx精品| 国产在线拍揄自揄拍视频| 国内精品一区二区三区四区| 在线天堂中文资源最新版| 国产成人精品综合| 亚洲午夜国产成人| 91久久精品国产91久久性色tv | 日韩精品99| 国产日韩欧美视频在线| 日韩三级av高清片| 久久av一区二区三区漫画| 日韩欧美视频在线播放| 女同性恋一区二区| 在线午夜精品| 免费看涩涩视频| 国产成人精品免费看| 欧美做受喷浆在线观看| 中文字幕在线不卡| 国产在线视频在线观看| 欧美羞羞免费网站| 亚洲高清在线观看视频| 国产一区二区三区在线看| 色综合999| 国产精品扒开腿做| 亚洲精品午夜| 亚洲成人在线视频网站| 欧美日韩成人| 国产精品视频分类| 不卡一区二区三区四区| 男人天堂资源网| 精品国产91久久久久久| 91影院在线播放| 亚洲精品久久久久久久久久久久久| 99青草视频在线播放视| 国模叶桐国产精品一区| 亚洲精品一区av| 久久99精品国产一区二区三区| 91精品二区| caopor在线视频| 丁香五精品蜜臀久久久久99网站| 国产美女免费网站| 亚洲国产乱码最新视频| 国产精品久久免费| 亚洲欧洲在线播放| 超碰在线中文字幕| 成人a在线观看| 国产aⅴ精品一区二区三区久久| 亚洲乱码日产精品bd在线观看| 日韩av成人高清| 欧美多人猛交狂配| 亚洲国产视频在线| 国产女人高潮毛片| 中文字幕日韩精品有码视频| 人人草在线视频| 粉嫩av四季av绯色av第一区| 亚洲成人国产| 久久人人爽av| 国产精品乱人伦| 成人毛片一区二区三区| 国产丝袜一区二区三区| 1区2区3区在线| 国产精品免费在线| 欧美日本三区| 无套内谢丰满少妇中文字幕 | 日本特级黄色大片| 日本中文字幕一区二区有限公司| 免费看污片网站| 欧美性猛交xxxx乱大交蜜桃| 少妇高潮一区二区三区99小说| 欧美国产乱视频| 999久久精品| 久久香蕉视频网站| 国产不卡免费视频| 青娱乐av在线| 日韩视频一区二区| 欧美韩日亚洲| 国产乱人伦精品一区二区| 激情av一区| av2014天堂网| 欧美日韩亚洲91| 日本ー区在线视频| 国产成+人+综合+亚洲欧美丁香花| 女优一区二区三区| 又色又爽又高潮免费视频国产| 久久久www免费人成精品| 成人免费一级片| 久久九九全国免费精品观看| 欧美高清一级片| 妺妺窝人体色777777| 99久久777色| 好吊色在线视频| 日韩在线一区二区三区免费视频| 国产精品美女午夜爽爽| 一本久道久久综合| 国产精选一区二区三区| 国产一级免费av| 精品偷拍各种wc美女嘘嘘| 91精品韩国| 一区二区三区四区免费观看| 福利91精品一区二区三区| 日操夜操天天操| 亚洲欧洲视频在线| 人人精品久久| 亚洲激情免费视频| 97精品久久久久中文字幕| 精品人妻无码一区二区性色| 在线精品视频视频中文字幕| 国产精品免费精品自在线观看| 青青草视频国产| 久久色视频免费观看| 亚洲在线视频播放| 久久久久免费精品国产| 国产伦精品一区二区三区视频| 亚洲精品第三页| 午夜精品福利在线| yjizz视频网站在线播放| 97视频中文字幕| 老色鬼久久亚洲一区二区| 侵犯稚嫩小箩莉h文系列小说| 精品国产91乱码一区二区三区| 性高爱久久久久久久久| 亚洲免费av网| 久久综合999| 国产v在线观看| 国产成人精品久久亚洲高清不卡| 希岛爱理一区二区三区| free性中国hd国语露脸| 欧美一区二区三区在线视频| 欧美日韩视频网站| 日本人妻伦在线中文字幕| 国产偷国产偷精品高清尤物|