精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福意外用AI生成超強CUDA內核,性能比人類專家優化得還要好!翻倍碾壓原生PyTorch,華人主創

人工智能 新聞
由AI優化的內核,在常見深度學習操作上,翻倍超越原生PyTorch,性能至多可以提升近400%。

好家伙,AI意外生成的內核(kernel),性能比人類專家專門優化過的還要好!

斯坦福最近披露了一組新發現,結果真的太亮眼了。

由AI優化的內核,在常見深度學習操作上,翻倍超越原生PyTorch,性能至多可以提升近400%——

  • 矩陣乘法(Matmul,FP32):性能達到PyTorch torch.matmul的101.3%。
  • 二維卷積(Conv2D):性能達到 torch.nn.Conv2D的179.9%。
  • Softmax:性能達到 torch.softmax的111.8%。
  • 層歸一化(LayerNorm):性能達到torch.nn.LayerNorm的484.4%。
  • Conv2D+ReLU+MaxPool組合操作:性能達到PyTorch參考實現的290.1%,以及torch.compile()參考實現的189.0%。

(在NVIDIA L40S GPU上進行基準測試,性能百分比定義為參考時間除以生成的kernel_size時間)

圖片

更驚人的是,這一切都是意外實現的。

研究團隊本來的目標是生成合成數據以訓練內核生成模型。

結果發現,僅在測試階段生成的合成數據本身,竟然可以生成性能非常優秀的內核。

圖片

圍觀網友:沒想到AI也要取代內核工程師了。

圖片

還有人發現,除了性能大幅提升外,研究團隊采用的方法也非常有趣:

他們沒有簡單的在操作上逐步優化(類似于爬坡算法),而是在每次迭代之間加入了一個語言推理的步驟,通過這種方式鼓勵搜索過程更加多樣化。

也就是說,他們是讓系統在每次改進時通過類似“思考”的方式產生更多想法,從而找到更好的解決方案。

圖片

具體如何實現,一起來看。

改代碼前先生成自然語言優化思想

按照斯坦福團隊博客的描述,這種內核生成的思路非常簡單——給定torch代碼,然后告訴都能寫編寫自定義內核來替換torch算子。

這些內核是用純CUDA-C編寫,無需使用CUTLASS和Triton等庫和DSL(Domain-Specific Language,領域專用語言)。

不同于傳統方法的是,模型并不是一上來就直接改代碼,而是先用自然語言生成優化思想,然后再將這些思想轉化為新的代碼變體。

團隊這樣做的理由是,“按順序修改”式的優化思路缺乏多樣性,導致陷入局部極小值,重復訪問同一類轉換或無休止地優化沒有前景的軌跡。

為了進一步增強思路多樣性,斯坦福團隊還使用了多分支的探索模式。

具體來說,他們的方法并非每一步都只優化一個候選方案,而是將每個想法分散開來,使其衍生出多個實現,并使用性能最高的內核作為下一輪的種子。

圖片

團隊使用OpenAI o3和Gemini 2.5 Pro挑戰KernelBench 1級中的10個問題,運行多輪后,最佳內核開始出現。

其中大多數最佳結果出現在后續輪次(總共5輪),并且主要是第4輪或第5輪。

KernelBench是斯坦福團隊自己提出的一套AI生成內核測試基準,基準中的任務分為3個級別,其中1級是指單一原始操作(Single primitive operation),包括AI的基礎構建塊(例如卷積、矩陣-向量與矩陣-矩陣乘法、損失函數、激活函數以及層歸一化)。

圖片

這一發現再加上之前DeepMind的AplhaEvolve,以及o3發現Linux的0day漏洞等一系列事件,讓網友們認為Gemini 2.5Pro和o3的能力水平已經達到了新的層級。

圖片

回到斯坦福的項目,在生成過程當中,可以看到模型的生成思路開始顯現出與人類的經驗相似之處——

  • 內存訪問優化: 提高不同內存層次結構(全局內存、共享內存、寄存器)之間數據移動的效率,并確保以最大化帶寬和最小化沖突的方式訪問數據;
  • 異步操作和延遲隱藏: 通過將慢速操作(如全局內存訪問)與計算或其他內存傳輸重疊,“隱藏”慢速操作的延遲;
  • 數據類型和精度優化: 盡可能使用低精度數據類型(如 FP16 或 BF16)以減少內存帶寬要求、提高緩存效率;
  • 計算和指令優化:提高算術計算本身的效率,減少指令數量,或利用專門的硬件指令;
  • 并行性和占用率增強:最大化流多處理器(SM)上的活動線程數量,以更好地隱藏延遲并提高整體吞吐量;
  • 控制流和循環優化:減少與循環、分支和索引計算相關的開銷。

并且斯坦福團隊還展示了一組具體的優化軌跡,從中可以看出,并不是每一步優化都一定能讓速度更快,但經過多個步驟的組合,內核的速度能夠得到大幅提升,并最終超越PyTorch。

圖片

在具體實現上,有人詢問AI生成CUDA內核時的優化建議,是否可以被轉化為對應代碼實現、還是說只是觸發了隨機探索?

作者回應說,盡管還沒有進行更嚴謹的系統驗證,但是手動檢查的案例中,生成的CUDA視線與提出的優化建議是大致匹配的。

即AI并不是在完全隨機做優化,而是確實在嘗試實現它自己提出的策略。

圖片

華人主創團隊意外發現

這項研究共有三位作者:Anne Ouyang、Azalia Mirhoseini和Percy Liang。

Ouyang目前是斯坦福大學擴展智能實驗室的博士生,她本碩畢業于麻省理工,曾在英偉達cuDNN團隊工作。

圖片

Percy Liang是斯坦福大學計算機科學副教授兼統計學助理教授,目前擔任斯坦福基礎模型研究中心主任。

曾和李飛飛一起發布、推進了多項研究工作。

圖片

Azalia Mirhoseini是斯坦福大學計算機科學助理教授、斯坦福擴展實驗室創始人。她曾在DeepMind、Google Brain以及Anthropic工作過。

她此前參與的研究包括MoE、芯片設計算法AlphaChip等。

圖片

本次研究,本來是希望生成數據來訓練內核生成模型。

但是在過程中卻出現了意想不到的結果,僅在測試階段生成的合成數據本身,竟然可以生成性能非常優秀的內核。

因為這些內核利用了此前被認為很難實現的高級優化和硬件特性,所以團隊決定以博客形式分享此次成果。

不過具體是如何生成數據的,研究團隊暫時不對外發布,只是提到了這種設計理念也很簡單

最關鍵的還是,它已經展示出了巨大潛力。

此外,研究團隊也認為此次發現也與最近的一些趨勢相呼應——大規模再訓練已不是必需。

有時,聰明的搜索和分支策略,可以解鎖科學創新并解決復雜問題,通過verifier進行廣泛搜索還能有更多收獲。

將強大推理能力與同時探索多個假設結合起來,能帶來更好結果。就像AlphaEvolve、AlphaEvolution、 Gemini 2.5 Pro深度思考一樣。

最后,團隊表示這項研究還有很多可優化的空間。比如他們手頭上就還在優化兩個維度:

  • FP16 Matmul:52% performance of torch.matmul
  • FP16 Flash Attention::9% performance of torch.nn.functional.scaled_dot_product_attention

與FP16或BF16相比,FP32在新推出硬件上的優化程度通常比較低,這也是為何使用FP32內核比PyTorch更容易實現性能提升。

他們表示,雖然現在還有不少限制,但是對于未來前景還是很樂觀的。

畢竟最開始,他們連能正常運行的內核都生成不了,但是通過不斷優化搜索方法,已經能讓flash attention的性能提升到了一個不錯的水平。

值得一提的是,搜索使用的資源也很少,大概只用了300萬token輸入和400萬token輸出。

One More Thing

實際上,不只是一個團隊在嘗試開發內核大模型。

就在5月,開發了Devin的Cognition開源了首個通過強化學習即可編寫CUDA內核的大模型Kevin-32B。

它基于QwQ-32B在KernelBench數據集上使用GRPO,實現了多輪強化學習,性能優于o3、o4-mini。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-12-16 14:33:01

AI人工智能斯坦福

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2025-09-01 02:00:00

AI署名論文推理

2022-07-20 16:39:37

AI數據

2025-09-08 09:10:00

2025-07-14 02:15:00

2025-01-17 10:26:19

模型開發ChatGPT

2025-03-12 10:38:05

2025-02-28 09:22:00

2017-11-28 14:18:29

2023-02-14 09:45:11

模型測試

2023-12-26 14:56:59

模型訓練

2023-02-12 14:00:52

ChatGPTAI人類

2023-03-06 10:26:37

AI研究

2022-02-18 09:53:17

AI芯片設計

2019-03-24 12:11:47

AI 數據人工智能

2018-01-23 16:48:47

AI

2025-08-27 09:06:00

AI工具通訊

2024-01-02 14:07:00

2025-07-14 08:57:00

點贊
收藏

51CTO技術棧公眾號

亚洲视频精品在线| 一本色道久久综合精品竹菊| 亚洲jizzjizz日本少妇| 亚洲欧美一区二区三区四区五区| 草莓视频一区二区三区| 色综合久久久网| 成人在线免费观看网址| 图片区 小说区 区 亚洲五月| 久久综合九色综合欧美狠狠| 伊人久久久久久久久久久久久| 亚洲欧美手机在线| 秋霞伦理一区| 亚洲日本va在线观看| 九色91国产| 亚洲综合网av| 日韩视频在线一区二区三区| 中文字幕不卡在线视频极品| 大桥未久恸哭の女教师| 成人1区2区| 亚州成人在线电影| 糖心vlog在线免费观看| 国产免费永久在线观看| 丁香婷婷综合激情五月色| 国产精品日韩在线一区| 草久视频在线观看| 在线播放不卡| 久久在线视频在线| 非洲一级黄色片| 久久亚州av| 日韩视频一区在线观看| 污污动漫在线观看| 中文在线а√天堂| 亚瑟在线精品视频| 日韩欧美猛交xxxxx无码| 在线观看完整版免费| 99精品桃花视频在线观看| 91夜夜揉人人捏人人添红杏| 久久精品99北条麻妃| 国产精品呻吟| 韩日精品中文字幕| 久久精品无码人妻| 午夜久久福利| 欧美美女15p| 性色av无码久久一区二区三区| 国产99久久精品一区二区300| 欧美精品一区二| 久久发布国产伦子伦精品| 色婷婷成人网| 9191精品国产综合久久久久久| 日韩精品视频一二三| 精品裸体bbb| 欧美在线不卡视频| 高清一区在线观看| 国产精品66| 欧美久久久一区| 99日在线视频| 99精品在线免费观看| 91精品久久久久久蜜臀| www.国产福利| 亚洲不卡在线| 亚洲爱爱爱爱爱| 亚洲欧美日韩色| 欧美亚洲tv| 亚洲视频欧美视频| 久久视频一区二区三区| 亚洲国产精品日韩专区av有中文 | 国产福利小视频在线| 国产视频一区不卡| 亚洲精品在线观看免费| 成人影欧美片| 亚洲最快最全在线视频| 国产午夜大地久久| yy6080久久伦理一区二区| 欧美丰满一区二区免费视频| 性一交一黄一片| 国产精品极品| 国产亚洲在线播放| 爱爱视频免费在线观看| 亚洲网址在线| 欧美中在线观看| 中文字幕在线播出| 国产福利一区在线| 久久精品国产99精品国产亚洲性色| 日韩在线无毛| 成人免费在线播放视频| 野外做受又硬又粗又大视频√| 在线高清av| 欧美精三区欧美精三区| 成熟妇人a片免费看网站| 精品国产成人| 欧美理论电影在线观看| 日韩美一区二区| 黄色小说综合网站| 国产一区再线| 黄网页在线观看| 五月天一区二区三区| 国产一线二线三线在线观看| 日韩一级淫片| 亚洲人成在线观看网站高清| 九九视频免费在线观看| 日本欧美一区二区| 国产98在线|日韩| 成人动漫在线播放| 亚欧色一区w666天堂| 亚洲欧美天堂在线| 天天躁日日躁狠狠躁欧美巨大小说 | 国产成人精品视频在线| 国产精品女人久久久| 久久亚洲一区二区三区四区| 91精品国产毛片武则天| 日韩一区二区三区免费| 精品电影一区二区三区 | 天天操天天干天天干| 亚洲欧美自拍偷拍色图| 18岁视频在线观看| 国产精伦一区二区三区| 日韩视频免费大全中文字幕| 天天操夜夜操视频| 东方欧美亚洲色图在线| 爱爱爱视频网站| 欧美精品高清| 精品亚洲国产视频| 久久一级黄色片| 国内精品自线一区二区三区视频| 免费国产在线精品一区二区三区| 怡红院av在线| 这里只有精品免费| 国产综合精品久久久久成人av| 夜夜精品视频| 国产视频99| heyzo在线播放| 日韩欧美国产电影| 日韩欧美123区| 精品一区二区日韩| 一区二区三区四区免费视频| 久久99久久99精品免观看软件| 亚洲第一精品夜夜躁人人爽| 久久精品女人毛片国产| 福利一区二区在线观看| 成人免费在线视频播放| 99re6热只有精品免费观看| 久久韩国免费视频| 国产又大又黄的视频| 国产精品国产三级国产专播品爱网| 少妇人妻互换不带套| 精品国产91| 国产精品小说在线| 超碰免费97在线观看| 欧美日韩一区二区不卡| 中文字幕第69页| 久久99九九99精品| 欧美 日韩 国产 在线观看| 伊人久久综合网另类网站| 日韩中文字幕在线视频| 国产理论视频在线观看| 亚洲免费视频成人| 亚洲少妇中文字幕| 亚洲福利久久| 欧洲精品一区色| 久久91视频| 日韩一区二区av| 99热这里只有精品66| 亚洲午夜电影在线| 亚洲黄色免费在线观看| 日韩国产欧美三级| 99re99热| www.成人网| 国产成人精品久久二区二区| 国产爆初菊在线观看免费视频网站| 欧美亚洲日本一区| 日本少妇高清视频| a级高清视频欧美日韩| 50路60路老熟妇啪啪| 久久伦理在线| 国产一区二区三区奇米久涩| 欧美色网一区| 久久亚洲欧美日韩精品专区| 全部免费毛片在线播放一个| 色爱区综合激月婷婷| 亚洲欧美卡通动漫| 成人精品鲁一区一区二区| 日本精品www| 婷婷精品进入| 国产综合18久久久久久| 日本一区二区电影| 欧美巨猛xxxx猛交黑人97人| 日本福利片在线| 在线播放欧美女士性生活| 久久网中文字幕| 欧美国产精品一区二区| 中国特级黄色大片| 蜜臀av一区二区| 欧美不卡在线播放| 99精品在线免费在线观看| 精品91免费| 99精品在线免费观看| 人人澡人人澡人人看欧美| av官网在线播放| 亚洲天堂av综合网| 天堂中文资源在线观看| 777a∨成人精品桃花网| 香蕉影院在线观看| 亚洲综合色婷婷| 老司机精品免费视频| 久久先锋影音av鲁色资源| 中文字幕avav| 欧美aaa在线| 国产午夜伦鲁鲁| 亚洲欧洲日韩| 亚洲精品成人久久久998| 欧美91在线| 91精品国产91久久久久青草| 激情亚洲影院在线观看| 国内精品久久久久伊人av | 97久久国产精品| а√天堂资源地址在线下载| 中文字幕日韩精品有码视频| 日韩一区二区三区中文字幕| 欧美大片日本大片免费观看| 91精品中文字幕| 欧美在线一区二区三区| 久久不卡免费视频| 性欧美疯狂xxxxbbbb| 久草免费在线视频观看| 亚洲欧美一区二区三区久本道91| 日韩不卡av在线| 久久久久久久精| 国精品无码人妻一区二区三区| 成人av高清在线| 伊人久久一区二区三区| 成人视屏免费看| 精品无码av一区二区三区不卡| 琪琪一区二区三区| 欧洲精品毛片网站| 三年中国中文观看免费播放| 国产一区二区三区四区五区入口 | 日韩欧美亚洲在线| 天堂在线精品| 精品一区二区三区国产| 国产在线播放精品| 国产99在线免费| julia中文字幕一区二区99在线| 97se亚洲综合| 美女精品久久| 3d动漫精品啪啪一区二区三区免费 | 欧美日韩国产精品专区| 欧美一级高潮片| 午夜视频在线观看一区二区 | 亚洲婷婷在线| 久久国产精品网| 在线成人欧美| 精品人妻一区二区三区四区在线| 亚洲精品一二| 999香蕉视频| 日韩不卡一二三区| 三上悠亚在线一区| 国产电影精品久久禁18| 美女流白浆视频| av在线不卡免费看| 91网站免费入口| 国产精品久久久久精k8| 人妻人人澡人人添人人爽| 一区二区三区在线视频免费观看| 国产亚洲第一页| 精品日本高清在线播放| 国产一区免费看| 67194成人在线观看| 亚洲精品一区二区三区不卡| 精品视频www| 尤物网址在线观看| 久久久久国色av免费观看性色 | 欧美性xxxxhd| 亚洲视频中文字幕在线观看| 日韩欧美激情一区| 日本韩国一区| 久久精品亚洲国产| 国产精品25p| 国产欧美一区二区三区在线看| 国产va免费精品观看精品| 国内成+人亚洲| 成人在线免费小视频| 大荫蒂性生交片| 久久这里有精品15一区二区三区| 久久精品视频在线观看免费| 91免费看视频| 国产美女久久久久久| 欧美性猛交xxxxx免费看| 在线播放国产一区| 亚洲国产成人精品久久| 国产51人人成人人人人爽色哟哟| 欧美成人手机在线| 国产精品伦理| 国产精品二区在线观看| 免费看av成人| 男人天堂网站在线| 青青草一区二区三区| 亚洲一区和二区| 国产精品久久久久影院亚瑟| 久久精品美女视频| 欧美另类一区二区三区| 日韩精品系列| 欧美国产日韩二区| av久久网站| 久久av免费观看| 欧美一区二区三区久久精品| 国产精品-区区久久久狼| 国产白丝精品91爽爽久久 | 四季av一区二区凹凸精品| 中文字幕无码精品亚洲资源网久久| 久久国产免费看| 插吧插吧综合网| 亚洲在线观看免费| 国产永久免费视频| 国产一区av在线| 黄在线观看免费网站ktv| 91九色精品视频| 91欧美在线| wwwwww.色| 91免费视频网| 日本黄色片视频| 日韩精品资源二区在线| 在线观看精品一区二区三区| 日韩av免费看网站| 日韩激情网站| 2018国产在线| 国产高清在线精品| 国产一区二区播放| 欧美日韩一区二区电影| yw在线观看| 国产精品爱啪在线线免费观看| 日韩欧美四区| 99爱视频在线| 91色porny在线视频| 日韩一区二区视频在线| 亚洲第一视频网站| 高潮在线视频| 韩国一区二区三区美女美女秀| 欧美日韩99| 无码人妻丰满熟妇区毛片蜜桃精品| 中文字幕在线不卡| 中文字幕在线播放日韩| 少妇高潮久久77777| 欧美一区=区三区| 致1999电视剧免费观看策驰影院| 蜜臀va亚洲va欧美va天堂| 精品少妇一区二区三区密爱| 欧美日韩久久久| 麻豆传媒免费在线观看| 92福利视频午夜1000合集在线观看| 久久伦理在线| 亚洲三级在线视频| 亚洲777理论| 日韩私人影院| 国产精品久久久久久久久借妻| 精品一二三区| 国产美女视频免费看| 亚洲美女一区二区三区| 精品人妻久久久久一区二区三区| 欧美日韩福利在线观看| 国产精品毛片av| 每日在线更新av| 久久久久久久久久久久久久久99 | 亚洲欧美日韩国产成人| 3d性欧美动漫精品xxxx软件| 亚洲第一综合| 国产一区二区三区日韩| 亚洲国产精一区二区三区性色| 亚洲级视频在线观看免费1级| 欧美大片免费| 资源网第一页久久久| 国产不卡在线视频| 中文字幕第15页| 国产亚洲人成网站在线观看| 九色精品蝌蚪| 日韩少妇内射免费播放| 国产欧美一区二区精品秋霞影院| 国产原创中文av| 久久久免费观看| 精品久久久久久久| 日韩av影视大全| 黑人巨大精品欧美一区二区| 国产精品影院在线| 亚洲自拍偷拍区| 久久精品女人| 1024手机在线视频| 亚洲欧美中文另类| 日韩最新av| 五月婷婷狠狠操| 亚洲图片欧美综合| 午夜视频在线| 蜜桃日韩视频| 国产精品资源在线看| caoporn国产| 久国内精品在线| 欧美日韩中字| 国产肉体xxxx裸体784大胆| 欧美丰满美乳xxx高潮www| 欧美极品videos大乳护士| 欧美性受xxxx黑人猛交88| 久久久亚洲欧洲日产国码αv|