精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta「輕量級」KernelLLM顛覆GPU內核生成,8B參數碾壓GPT-4o

人工智能
Meta推出KernelLLM,這個基于Llama 3.1微調的8B模型,竟能將PyTorch代碼自動轉換為高效Triton GPU內核。實測數據顯示,它的單次推理性能超越GPT-4o和DeepSeek V3,多次生成時得分飆升。

在AI領域,參數規模曾被視為「性能天花板」。

Meta最新發布的KernelLLM,卻用8B參數的「小身板」,在GPU內核生成任務中把200B的GPT-4o按在地上摩擦。

這是一個基于Llama 3.1 Instruct進行微調的8B參數模型,旨在將PyTorch模塊自動轉換為高效的Triton GPU內核。

圖片圖片

KernelLLM簡直是GPU內核開發神器,用更少的參數實現了更強的性能,且簡單易用。

它只有8B參數,但是在KernelBench-Triton Level 1,單次推理性能超過了GPT-4o和DeepSeek V3。

通過多次推理,KernelLLM性能優于DeepSeek R1。

圖片圖片

這一切都來自一個參數規模比競爭對手小兩個數量級的模型。

@Denis Kanonik吐槽「這又是用測試集訓練的嗎?」

圖片圖片

KernelLLM讓內核開發更易上手

KernelLLM是一款基于Llama 3.1 Instruct的8B模型,專門針對用Triton編寫GPU內核的任務進行了訓練。

它能讓GPU編程變得更簡單,實現高性能GPU內核生成的自動化。

KernelLLM通過自動化生成高效的Triton實現,滿足對高性能GPU內核日益增長的需求。

隨著工作負載的增大和加速器架構的多樣化,對定制化內核解決方案的需求顯著增加。

現在市面上很多相關工具,要么只能在測試的時候優化,要么就只盯著KernelBench的問題調優,很難應對更廣泛的場景。

KernelLLM是首個在外部(PyTorch,Triton)代碼對數據上進行微調的LLM。

Triton內核生成工作流程

把PyTorch代碼輸進去,KernelLLM就會生成Triton內核候選代碼。

然后用單元測試來驗證這些代碼,用隨機輸入跑一跑,看看輸出對不對。要是生成好幾個候選代碼,還能比比哪個最好,挑出最優的。

圖片圖片

KernelLLM的Triton內核生成流程:用KernelLLM把PyTorch代碼翻譯成Triton內核的候選代碼。生成的代碼會通過單元測試驗證,測試用已知形狀的隨機輸入數據運行內核。這個流程支持生成多個候選代碼(通過 pass@k評估),增加候選數量來提高質量,最后選出最好的Triton內核實現作為輸出(綠色部分)

為了訓練這個模型,團隊可是下了大功夫,用了25000多對(PyTorch,Triton)代碼示例,還有合成的樣本。

這些數據一部分來自TheStack的過濾代碼,一部分是通過torch.compile () 和提示技術生成的。

數據集KernelBook,參考鏈接:https://huggingface.co/datasets/GPUMODE/KernelBook。

訓練時用的是Llama3.1-8B-Instruct模型,在自定義數據集上做了監督微調(SFT),測試它在KernelBench-Triton上生成正確Triton內核及調用代碼的能力。

KernelBench-Triton是基于KernelBench[Ouyang et al. 2025]開發的變體,專注Triton內核生成。

訓練和評估時,PyTorch代碼會配置一個包含格式示例的提示模板作為指令。

模型訓練了10個epoch,批大小為32,采用標準SFT方法,超參數根據驗證集的困惑度(perplexity)來選擇。

訓練用了16個GPU,共耗時12小時(192 GPU小時),報告了最佳檢查點的驗證結果。

性能評估

盡管模型規模較小,但其性能可與最先進的LLM相媲美。

圖片圖片

KernelBench-Triton測試中,8B參數的KernelLLM,單次推理得分20.2,比671B參數的DeepSeek V3(16分)和200B參數的GPT-4o(15分)都高。

圖片圖片

要是多生成幾個候選代碼,得分還能蹭蹭往上漲,生成10個的時候能到51.8分,20個的時候能到57.1分。

KernelLLM推理用temperature=1.0和top_p=0.97運行。

在KernelBench上測試了模型,這是一個開源基準測試,用于評估LLM編寫的高效GPU內核的能力。

它包含250個精心挑選的PyTorch模塊,按負載調整,從簡單的單操作(如Conv2D或Swish,Level 1)到完整的模型架構(Level 3)。

它在不同難度的任務里表現都很穩,不管是簡單的單個操作符,還是復雜的模型架構,都能應對。

測試會同時降低代碼的正確性(通過與參考PyTorch輸出對比)和性能(通過與基準實現的加速比)。

團隊開發了一個新的KernelBench-Triton變體,專門評估LLM生成Triton內核的能力,非常適合測試KernelLLM。

所有測試都在NVIDIA H100 GPU上完成。

圖片圖片

KernelLLM在pass@k中表現出近似對數線性的擴展行為

KernelLLM怎么用?

先裝幾個依賴包:

pip install transformers accelerate torch triton
pip install transformers accelerate torch triton

用的時候,先導入庫,調用generate_triton函數,就能生成優化后的Triton代碼啦。

KernelLLM提供了一個簡單的接口,用于從PyTorch代碼生成Triton核。

from kernelllm import KernelLLM# Initialize the modelmodel = KernelLLM()# Define your PyTorch modulepytorch_code = '''import torchimport torch.nn as nnclass Model(nn.Module):    """    A model that computes Hinge Loss for binary classification tasks.    """        def __init__(self):                super(Model, self).__init__()         def forward(self, predictions, targets):                return torch.mean(torch.clamp(1 - predictions * targets, min=0))batch_size = 128input_shape = (1,)def get_inputs():        return [torch.randn(batch_size, *input_shape), torch.randint(0, 2, (batch_size, 1)).float() * 2 - 1]def get_init_inputs():    return []'''# Generate optimized Triton codeoptimized_code = model.generate_triton(pytorch_code, max_new_tokens=512)print(optimized_code)

from kernelllm import KernelLLM
# Initialize the model
model = KernelLLM()
# Define your PyTorch module
pytorch_code = 
'''
import torch
import torch.nn as nnclass Model(nn.Module):    
"""
    A model that computes Hinge Loss for binary classification tasks.    
"""    
    def __init__(self):        
        super(Model, self).__init__()     
    def forward(self, predictions, targets):        
        return torch.mean(torch.clamp(1 - predictions * targets, min=0))
batch_size = 128
input_shape = (1,)
def get_inputs():    
    return [torch.randn(batch_size, *input_shape), torch.randint(0, 2, (batch_size, 1)).float() * 2 - 1]
def get_init_inputs():
    return []
'''
# Generate optimized Triton code
optimized_code = model.generate_triton(pytorch_code, max_new_tokens=512)
print(optimized_code)

要是不想寫腳本,還能直接運行python kernelllm.py,使用內置的REPL接口,打開交互式界面,實時看結果。

kernelllm.py提供了多種與模型交互的方法。

python kernelllm.py
python kernelllm.py

KernelLLM提供了幾種自定義生成過程的方法:

from kernelllm import KernelLLMmodel = KernelLLM()# Stream output in real-timemodel.stream_raw("Your prompt here", max_new_tokens=2048)# Generate raw text without the Triton-specific prompt templateraw_output = model.generate_raw("Your prompt here", temperature=1.0, max_new_tokens=2048)

from kernelllm import KernelLLM
model = KernelLLM()
# Stream output in real-time
model.stream_raw("Your prompt here", max_new_tokens=2048)
# Generate raw text without the Triton-specific prompt template
raw_output = model.generate_raw("Your prompt here", temperature=1.0, max_new_tokens=2048)

有時它會犯點小錯誤,比如API引用不對、語法出錯,有時候還不太能按指令生成理想的內核。

生成的代碼結構有點像編譯器自動吐出來的,有時在變量命名、張量形狀、類型處理和數值精度這些細節上也容易出問題。

參考資料:

https://x.com/reach_vb/status/1924478755898085552

https://huggingface.co/facebook/KernelLLM

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2025-01-16 16:39:44

2025-04-08 02:26:00

2024-08-15 15:45:00

AI訓練

2025-10-10 01:00:00

8B模型GPT-4oAgent

2025-08-21 16:01:58

2025-06-11 09:00:00

2025-04-15 08:01:12

2025-10-13 08:50:00

2024-12-02 14:20:00

模型訓練

2025-06-26 09:09:31

2025-07-23 09:32:02

2025-05-26 09:05:00

2024-05-21 12:23:17

2024-06-05 08:29:35

2025-01-02 11:00:34

2025-01-02 13:00:00

2024-05-20 08:50:00

模型神經網絡

2025-09-28 15:35:32

AI模型強化學習

2025-03-31 08:50:00

AI生成模型
點贊
收藏

51CTO技術棧公眾號

97在线免费视频观看| 99中文字幕在线| 国产成人自拍在线| 草逼视频免费看| 激情五月综合色婷婷一区二区| 国产精品香蕉一区二区三区| 中文字幕一区二区人妻| 久久久久久久久综合| 欧美伊人影院| 青青国产在线观看| 色狠狠色噜噜噜综合网| 你懂得在线网址| 一区二区三区在线视频111| 亚洲特黄一级片| 伊人在线视频| 99国产精品白浆在线观看免费| 日韩毛片视频在线看| 黑人极品ⅴideos精品欧美棵| 亚洲 欧美 综合 另类 中字| 色就色 综合激情| 日韩三级精品| 日韩福利在线视频| 老牛影视精品| 久久精品久久久久久| 欧美亚洲激情| 欧美 亚洲 另类 激情 另类| 欧美va亚洲va在线观看蝴蝶网| 最新日韩精品| 免费a级黄色片| 欧美在线精品免播放器视频| 国产不卡免费视频| mm视频在线视频| 成年人性生活视频| 久久免费成人精品视频| 国产一区二区三区蝌蚪| 性网站在线观看| 日韩成人高清视频| 日韩av中文字幕第一页| 欧美大片免费久久精品三p| 国产精品精品| 中文字幕一区二区免费| 精品久久国产老人久久综合| 日韩成人影院| 无码人妻av一区二区三区波多野| 欧美大片免费观看在线观看网站推荐| 亚洲欧洲综合| 天天综合永久入口| 国产中文字幕二区| 亚洲视频在线播放| 美女国产精品久久久| 久久无码高潮喷水| 欧美精品一区二区三区视频| 清纯唯美亚洲综合一区| 91在线精品入口| 亚洲福利av| 欧洲精品视频在线观看| 亚洲丁香日韩| 自拍偷拍欧美亚洲| 成人欧美一区二区三区视频xxx| 亚洲欧美国产毛片在线| 青草久久视频| 在线视频 91| 中文字幕av久久| 日韩一区二区在线观看视频| 成人av二区| 精品人妻一区二区三区含羞草| 9l视频自拍9l视频自拍| 欧美在线影院一区二区| 在线一区视频| www在线免费观看视频| 久久精品国产亚洲av麻豆| 国产精品第二页| 美女在线观看视频一区二区| 日韩有码电影| 中文字幕人妻一区| 国产一区二区色| 亚洲成人免费电影| 亚洲黄色高清| 午夜视频在线| 日日操免费视频| 九9re精品视频在线观看re6| 欧美一二三区在线| 狠狠色丁香九九婷婷综合五月| 丰满的护士2在线观看高清| 久久久99999| 日韩欧美视频一区二区三区四区| 日韩一级二级三级| 亚洲国产精品一区制服丝袜| 国产精品蜜臀| 久久久精品国产sm调教网站| 日韩电影在线播放| 日韩精品欧美激情| 久久久久成人黄色影片| 精品日韩免费| 韩日在线视频| 免费在线黄色网| 欧美亚洲视频一区二区| 国产精品久久久爽爽爽麻豆色哟哟| 日韩精品首页| 久久精品视频观看| 日韩精品一区二区亚洲av| 中文字幕国产免费| 91亚洲精品久久久| 日韩视频一区二区三区| 国产精品1024| 成人影院网站ww555久久精品| 国产精品国产精品国产专区| 久久免费精品国产| 久久av一区二区三区漫画| 亚洲欧洲午夜一线一品| 久久精品一区二区| 91亚洲自偷观看高清| 欧美78videosex性欧美| 日本aⅴ在线观看| aaa毛片在线观看| 成人免费视频视频在| 亚洲人在线视频| 亚洲色图20p| 欧美日韩理论| 午夜精品成人av| 人妻少妇精品无码专区久久| 日日噜噜夜夜狠狠久久波多野| 日韩亚洲欧美在线| 国产欧美日产一区| 国产精品99一区二区三| 成人毛片av在线| 国产一区二区三区黄片| 少妇搡bbbb搡bbb搡打电话| 亚洲精品乱码视频| 欧日韩不卡在线视频| 日韩欧美在线网站| 国产福利精品一区二区| 国产成人ay| 国产婷婷视频在线| 午夜精品久久久久久久96蜜桃| 天天插天天射天天干| 国产日产欧美视频| 久久精品国产精品国产精品污| 欧美一级片在线播放| 亚洲精品99999| 午夜视频在线观看一区二区| 黑人巨大精品欧美黑白配亚洲 | 欧美hd在线| 韩日成人影院| 欧美色18zzzzxxxxx| 日韩视频在线观看一区| 在线看黄色的网站| 中文字幕久精品免| 色激情天天射综合网| 免费人成在线不卡| 久久精品播放| 国产精品久久久久77777丨| 天堂影院在线| 91丨九色丨丰满| 久久久免费看片| 久久无码专区国产精品s| 日本福利视频导航| 久久av免费一区| 91亚洲国产成人久久精品网站| 欧美另类xxx| 亚洲第一福利视频| 日本高清视频一区二区| 亚洲激情第一区| 久草在线在线精品观看| 丝袜亚洲精品中文字幕一区| 午夜精品一区二区三区国产 | 亚洲xxx大片| 欧美黄色片免费观看| 亚洲视频国产视频| 亚洲国产精品va在线看黑人动漫| 欧美一区二区三区电影| 在线观看成人小视频| 色婷婷综合在线| 日韩欧亚中文在线| 六月丁香婷婷久久| 久久久久久美女精品| 欧美艳星介绍134位艳星| 亚洲福利天堂| 日韩av黄色在线| 日韩欧美天堂| 丝袜连裤袜欧美激情日韩| 日韩欧美美女在线观看| 国产精品羞羞答答在线观看 | 久久女同互慰一区二区三区| 成人av网站免费| 国产ts人妖一区二区| 久久国产三级精品| 免费不卡在线视频| 久久只有精品| 精品一区二区三区免费播放| 免费精品视频在线| 久久草av在线| 日本欧美一区二区| 国产麻豆精品在线观看| 狠狠狠色丁香婷婷综合激情| 日韩高清不卡在线| 国产精品一二三区在线| 国产精品一区二区91| 成人永久免费视频| 99精品视频中文字幕| 91在线视频官网| 国产精品色婷婷| 亚洲高清视频的网址| 久久亚洲图片| 小说区亚洲自拍另类图片专区| 在线精品国产| 激情91久久| 蜜臀99久久精品久久久久久软件| 青青草视频一区| 国产精品综合一区二区三区| 久久综合久久99| 亚洲自拍偷拍av| 欧美在线不卡视频| 精品电影一区二区| 视频在线观看99| 97人人爽人人喊人人模波多| 91久久国产婷婷一区二区| 精品网站在线看| 国产911在线观看| 久久综合伊人77777麻豆最新章节| 2018中文字幕第一页| 好吊操视频这里只有精品| 少妇被躁爽到高潮无码文| 91国内精品久久久| 免费观看久久久久| 久久久精品一区二区毛片免费看| 麻豆视频在线观看| 亚洲精品国产无码| 二区三区在线播放| 黄色精品视频| 加勒比视频一区| 亚洲女同在线| 精品高清久久| 欧美日韩国产色综合一二三四| 亚洲成人二区| 国产不卡高清在线观看视频| 亚洲一二三区不卡| 日韩精品亚洲精品| 国产精品第一页在线| www亚洲国产| 在线播放av中文字幕| 小早川怜子一区二区的演员表| 日韩人妻精品中文字幕| 国产一级免费在线观看| 麻豆蜜桃在线| 久久av免费看| 免费av成人在线| 亚洲美女屁股眼交| 欧美大肚乱孕交hd孕妇| 欧美在线中文字幕| 久久久久久久久久码影片| 天天爽人人爽夜夜爽| 一级免费黄色录像| 成人毛片在线免费观看| 性感美女一区二区在线观看| 自拍偷拍一区| 性一交一乱一区二区洋洋av| 亚洲欧美在线另类| 欧美mv和日韩mv的网站| 日韩av日韩在线观看| 精品视频在线观看一区二区| 亚洲午夜福利在线观看| 国产美女自慰在线观看| av中文在线资源库| 2023国产精品久久久精品双| 国产精品一区二区果冻传媒| 欧美日韩亚洲国产综合| 国内精品视频在线| 亚洲视频在线二区| 日本成人在线免费观看| 中日韩av在线| 久久久一本精品| 国产精品av久久久久久麻豆网| 欧美国产日韩精品免费观看| 精品国产乱子伦一区| 91九色视频在线观看| 亚洲色图欧美自拍| 99精品人妻无码专区在线视频区| 神马午夜在线视频| av不卡在线看| 欧美无乱码久久久免费午夜一区| 欧美自拍视频在线观看| 99精品视频播放| 男人天堂中文字幕| 二区三区不卡| 日日夜夜免费精品| 色综合天天做天天爱| 欧美一区二区.| 午夜免费高清视频| 中文字幕一区2区3区| www.久久热| 不卡视频免费播放| 精品国产乱码91久久久久久网站| 97伦理在线四区| 波多野结衣影院| av影片在线看| 欧美精品一区二区三区中文字幕| 国产精品卡一卡二| 欧美激情videoshd| www日韩视频| av网站在线免费看| 久久97视频| 亚洲图片你懂的| 欧美一区二区视频97| 国产成人精品一区二区在线小狼| 亚洲精品福利视频网站| 欧洲成人性视频| 巨乳女教师的诱惑| 99热国产在线| 激情五月婷婷综合网| 日韩精品免费在线视频| 日韩一级片免费视频| 91精品国产乱码久久久久| 欧美美女啪啪| 国产精品三级电影| 97超级碰碰人国产在线观看| 手机免费av片| 香蕉人妻av久久久久天天| 欧美成人国产| 欧美日韩成人高清| 中文字幕免费在线不卡| 国产精品福利电影| 日本女优一区| 精品视频在线免费| 国产高清在线精品一区二区三区| 黄色国产在线播放| 日本在线视频站| 久久精品天堂| 国产亚洲精品成人av久久ww| 18禁网站免费无遮挡无码中文| 亚洲第一色视频| 欧美日韩专区| 日韩av在线免费播放| 黄色激情在线视频| 日本一二三区在线视频| 欧美激情成人在线| 亚洲人成网7777777国产| 欧洲av无码放荡人妇网站| 久蕉在线视频| 国产麻豆成人传媒免费观看| 日韩在线观看高清| 91porn在线| 日韩电影免费观看| 久久久精品国产免费观看同学| 国产精品人人做人人爽| 永久免费看mv网站入口| 哺乳一区二区三区中文视频| 激情av一区二区| 先锋影音一区二区三区| 国产白浆在线观看| 亚洲另类黄色| 亚洲香蕉成人av网站在线观看 | 中文字幕 亚洲一区| 欧美大电影免费观看| 中文字幕一区二区在线播放| 国产一区在线免费观看| 一本久道久久综合无码中文| 国内揄拍国内精品久久| 亚洲视频欧洲视频| 极品粉嫩美女露脸啪啪| 欧美色图天堂| 国产精品成人一区二区艾草| 久久精品国产精品青草色艺 | 国产欧美自拍一区| 欧美日韩国产在线播放网站| 日本韩国欧美在线观看| 国产超级va在线视频| 99国内精品久久| 精品福利影视| 精品久久久免费视频| 青青草伊人久久| 国产啪精品视频网站| 日本a在线观看| 女人天堂亚洲aⅴ在线观看| 日韩在线欧美在线| xxxx黄色片| 久久资源综合| 精品亚洲一区二区三区四区五区| 中文字幕乱妇无码av在线| 高清精品久久| 亚洲电影在线观看| 国产sm在线观看| 97久久亚洲| 中国china体内裑精亚洲片| 无码 人妻 在线 视频| 国产一区二区三区91| 另类少妇人与禽zozz0性伦| a级在线免费观看| 欧美在线电影| 日韩中文在线中文网三级| 国产一区在线观看免费| 日韩在线看片| 中文字幕精品一区二区精品| 中文字幕美女视频| 亚洲三级毛片| 国产日韩精品在线| 欧美一区二区三区成人片在线| 国产亚洲午夜高清国产拍精品| 伊人久久av导航| 怡红院红怡院欧美aⅴ怡春院|