精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達

發布于 2025-2-13 16:51
瀏覽
0收藏

DeepSeek 引爆 AI 社區后,人們都在嘗試本地部署和各領域應用,在新模型基礎上持續改進的方向也被不斷提出。與此同時,英偉達卻在嘗試用 DeepSeek 給大模型 pipeline 本身搞自動化。


本周三,英偉達在博客中介紹了利用 DeepSeek-R1 和推理時擴展技術來自動生成優化 GPU 內核的最新研究成果,效果異常的好。

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

對此有人評價道:難不成英偉達在自拆護城河?

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

也有人已經開始擔心自己的工作會不會被 AI 代替了。

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

隨著 AI 大模型規模不斷擴展,能力持續進步,測試時擴展(TTS:Test-Time Scaling)或推理時擴展(Inference-Time Scaling)法則正在興起。這項技術也被稱為 AI 推理或長思考,它通過在推理過程中分配額外的計算資源來評估多種可能的結果,然后選擇最佳的一個,從而提高模型整體性能。


推理能力的加強使得 AI 初步掌握了類似于人類剖析復雜問題的能力,能逐個解決以得出最終解決方案的方式,進行策略性思考和系統性地解決復雜問題。


在英偉達這篇文章中,工程師們進行了一項實驗,他們使用最新、最熱門的開源大模型 DeepSeek-R1 在推理過程中利用額外的計算能力來解決一個復雜問題 —— 自動生成數值正確,且針對不同注意力變體優化的 GPU 注意力內核,而無需任何顯式編程。


人們發現在某些情況下,R1 輸出的結果甚至優于由熟練工程師開發出來的優化內核。

對優化注意力內核的需求及相關挑戰

注意力機制是徹底改變大型語言模型(LLM)發展的一個關鍵概念。它是一種強大的機制,使 AI 模型在執行任務時能夠選擇性地關注輸入中最相關的部分。通過專注于重要信息,注意力操作幫助模型做出更好的預測并發現數據中的隱藏模式。


注意力操作的計算復雜度與輸入序列長度的平方成正比增長。這促使我們需要開發優化的底層實現(即 GPU 內核),以防止簡單實現導致的運行時錯誤(如內存不足錯誤),并提高計算效率。


另外,注意力有多種變體(因果注意力、相對位置嵌入、ALiBi 等),工程師通常需要為特定任務組合使用這些變體。


多模態模型(例如視覺 Transformer)引入了額外的挑戰,因為它們需要專門的注意力機制(如空間鄰域注意力)來維護計算機視覺、視頻生成模型等中常見的時空信息。

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

圖 1:2D 輸入上的鄰域注意力。


但在這個任務上,即使對于經驗豐富的軟件工程師來說,創建針對注意力的優化 GPU 內核也需要大量技能和時間。


最近的大模型(如 DeepSeek-R1)在代碼生成任務中表現出了很大的潛力,但它們在第一次嘗試創建優化代碼時仍然效果不好。這使得在推理時使用其他策略來生成優化代碼成為了必要。


以下 Prompt 是相對位置嵌入注意力內核的示例用戶輸入。

復制

Please write a GPU attention kernel to support relative position encodings. Implement the relative positional encoding on the fly within the kernel. The complete code should be returned, including the necessary modifications.

Use the following function to compute the relative positional encoding:

def relative_positional(score, b, h, q_idx, kv_idx):

    return score + (q_idx - kv_idx)

When implementing the kernel, keep in mind that a constant scaling factor 1.44269504 should be applied to the relative positional encoding due to qk_scale = sm_scale * 1.44269504. The PyTorch reference does not need to scale the relative positional encoding, but in the GPU kernel, use:

qk = qk * qk_scale + rel_pos * 1.44269504

Please provide the complete updated kernel code that incorporates these changes, ensuring that the relative positional encoding is applied efficiently within the kernel operations.

大模型有時會產生幻覺,或輸出混合不同語言或框架的語法,導致生成的代碼錯誤或效率低下。計算最佳 GPU 線程映射也是一項艱巨而具有挑戰性的任務,通常需要迭代細化才能獲得正確且高效的內核。

用于生成優化 GPU 內核的推理時擴展

為了利用優化的注意力內核獲得最佳結果,英偉達工程師創建了一個新的工作流程,包括了一個特殊的驗證器以及一個在預定時間內以閉環方式進行推理的 DeepSeek-R1 模型。

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

圖 2:在 Nvidia Hopper 平臺上利用 DeepSeek-R1 的推理時擴展。


具體地講,該工作流程首先由手動提示進行初始化,然后 DeepSeek-R1 在第一次遍歷中生成 GPU 代碼(即內核)。驗證器在一塊英偉達 H100 GPU 上運行,它對生成的內核進行分析,并創造新的提示以作為輸入提供給 DeepSeek-R1。


這種閉環方法每次都以不同的方式引導代碼生成過程,從而實現更好的效果。英偉達發現,這個過程持續 15 分鐘就可以得到一個改進的注意力內核。

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

圖 3:使用 flex attention 自動生成的優化注意力內核的性能。

根據斯坦福的 KernelBench 基準測試,該工作流程可以為 100% 的 Level-1 問題和 96% 的 Level-2 問題生成數值正確的內核。


其中,KernelBench 中的 Level-1 解決率是指:評估 LLM 為特定計算任務生成高效 GPU 內核的能力的數值正確指標。該測試是一系列「測試最新 LLM GPU 編程能力」挑戰的一部分。


圖 4 顯示了推理時預算對 agent 解決率的影響,結果顯示,在 Level-1 類別中為每個問題分配超過 10 分鐘的時間,可以使工作流程為 100 個問題中的大多數生成數值正確的代碼。

DeepSeek R1不編程就能生成GPU內核,比熟練工程師好,驚到了英偉達-AI.x社區

這些結果表明,在使用最新的 DeepSeek-R1 模型時,如果在推理階段投入更多計算,則可以獲得更好的 GPU 內核。英偉達表示,其對于 DeepSeek-R1 的最新進展及其應用潛力感到非常興奮。


本文轉自機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/8GE8xqY-7V3c4LFU4fcT2Q??

收藏
回復
舉報
回復
相關推薦
国产精品videosex极品| 美女100%一区| 国产成人av电影在线| 欧美精品18videos性欧| 日韩一级视频在线观看| 日韩高清成人| 亚洲精品视频免费观看| 好吊妞www.84com只有这里才有精品| 久久精品美女视频| 狠狠做六月爱婷婷综合aⅴ| 欧美日韩二区三区| 日韩av高清在线看片| 黄色av免费在线观看| 国产一区二区三区久久悠悠色av| 97视频网站入口| 自拍偷拍你懂的| 久久超级碰碰| 欧美一区二区三区在线电影| 妞干网在线视频观看| 在线国产91| 久久只精品国产| 亚洲专区国产精品| 性高潮视频在线观看| 一区二区日韩欧美| 亚洲人成电影在线观看天堂色| 在线免费黄色小视频| 在线免费日韩片| 亚洲综合自拍偷拍| 影音欧美亚洲| 欧美18xxxxx| youjizz久久| 亚洲aa在线观看| 中文有码在线播放| 老鸭窝91久久精品色噜噜导演| 久久91超碰青草是什么| 精品手机在线视频| 国产99精品| 亚洲精品国产拍免费91在线| 99精品视频免费版的特色功能| 最新欧美电影| 欧美日韩免费看| 国产不卡一区二区视频| 日韩精品卡一| 亚洲精品视频在线| 糖心vlog在线免费观看| 成年女人的天堂在线| 91免费版在线| 久久精品99久久| 天天操天天操天天| 成人网在线免费视频| 444亚洲人体| 国产探花精品一区二区| 美女网站一区二区| 国产日韩欧美夫妻视频在线观看| 天天爱天天做天天爽| 久久成人免费| 国产成人精品电影| 亚洲图片欧美日韩| 视频一区二区三区中文字幕| 国产91精品久| 中文字幕黄色片| 久久一区中文字幕| 国产精品白嫩美女在线观看 | 国产精品一国产精品| 亚洲精品wwwww| 熟女丰满老熟女熟妇| 欧美日韩一区二区三区在线电影| 亚洲成人aaa| 黄色网址在线视频| 亚洲va久久久噜噜噜久久| 亚洲精品国精品久久99热| a级一a一级在线观看| 任我爽精品视频在线播放| 亚洲福利视频专区| 三级黄色片网站| 欧美日韩伦理| 久久夜精品香蕉| 精品一级少妇久久久久久久| 亚洲欧洲综合| 国产成人精品av在线| 亚洲综合五月天婷婷丁香| 精品一区二区三区免费观看| www.久久爱.cn| 四虎精品成人影院观看地址| 久久精品网站免费观看| 一区二区三区电影| 日本在线视频网址| 欧美日韩一区二区三区| 日本久久精品一区二区| 北岛玲精品视频在线观看| 日韩欧美不卡一区| 亚洲 小说 欧美 激情 另类| 四季av一区二区三区免费观看| 久久国产视频网站| 亚洲日本韩国在线| 美国一区二区三区在线播放 | 中文字幕亚洲一区二区av在线| 中文精品无码中文字幕无码专区| 综合日韩av| 91精品久久久久久久91蜜桃 | 欧美激情一区三区| 国产aaa免费视频| 波多野结衣久久精品| 欧美精品日韩精品| 国产精品福利导航| 天天射综合网视频| 欧美性视频精品| 99久久精品日本一区二区免费| av不卡免费电影| 影音先锋欧美资源| 涩涩视频在线播放| 欧美一区二区播放| 美女被到爽高潮视频| 欧美午夜a级限制福利片| 国产精品久久在线观看| 乱精品一区字幕二区| 中文字幕欧美三区| 欧美黑人经典片免费观看| 国产91欧美| 日韩激情在线视频| 久久国产露脸精品国产| 视频一区二区不卡| 国产欧美一区二区三区不卡高清| 亚洲乱亚洲乱妇| 丁香五六月婷婷久久激情| 99精品视频国产| 欧美综合在线视频观看| 97在线免费观看| 性欧美18一19性猛交| 国产精品丝袜一区| 美女福利视频在线| 欧美一性一交| 欧美大片免费观看| 夜夜嗨aⅴ一区二区三区| 91在线你懂得| 人妻夜夜添夜夜无码av| 涩爱av色老久久精品偷偷鲁| 最新69国产成人精品视频免费| 亚洲黄色免费观看| 99精品一区二区三区| 日韩精品一区在线视频| 国产精品igao视频网网址不卡日韩 | 欧美高跟鞋交xxxxhd| 91尤物国产福利在线观看| 国产视频在线观看一区二区三区 | 1区2区在线| 欧美sm极限捆绑bd| 九九热国产精品视频| 精品午夜久久福利影院| 一区二区三区的久久的视频| 精品美女一区| 日韩在线视频播放| 一二三区中文字幕| 国产精品美女久久福利网站| 中文字幕第36页| 欧美色蜜桃97| 国产精品爽爽爽爽爽爽在线观看| av在线天堂播放| 欧美精品日韩精品| 国模无码国产精品视频| 国产高清在线观看免费不卡| 国产精品视频网站在线观看| 波多野结衣欧美| 午夜精品久久久99热福利| 人妻中文字幕一区| 精品av在线播放| 人妻精品久久久久中文字幕| 免费亚洲婷婷| 亚洲午夜精品福利| www一区二区三区| 欧美国产日韩精品| 视频国产在线观看| 欧美午夜电影网| 老司机成人免费视频| 国产精品一区二区男女羞羞无遮挡| 国产女人18毛片| 9l视频自拍蝌蚪9l视频成人| 97免费在线视频| 成人性生交大片免费看午夜| 欧美精品色综合| 四虎永久在线精品| 久久久久9999亚洲精品| 亚州精品一二三区| 国产精品vip| 欧美一二三区| 粉嫩一区二区三区在线观看| 国内揄拍国内精品少妇国语| 男人的天堂av高清在线| 欧美日韩激情在线| 国产乱码久久久久久| 久久奇米777| 天天色天天干天天色| 99热这里只有精品8| 亚洲国产精品123| 亚洲一区二区三区中文字幕在线观看 | 毛片在线看网站| 亚洲精品一区二区三区四区高清 | 日本网站在线观看一区二区三区| 中文字幕久精品免| 欧美综合精品| 91精品久久久久久久久久久久久久 | 在线综合色站| 国产999精品久久久影片官网| 麻豆免费在线视频| 国产丝袜一区视频在线观看 | 亚洲国产精品悠悠久久琪琪| 久久久久久久亚洲| 亚洲一区二区三区影院| 三年中国中文观看免费播放| 国产成人精品一区二区三区网站观看| 国产真实乱子伦| 中文精品电影| 亚洲精品第一区二区三区| 9999久久久久| 国产精品视频1区| 亚洲美女炮图| 欧美精品久久久久久久| 1pondo在线播放免费| 亚洲国产中文字幕在线观看| 国产露脸国语对白在线| 色网综合在线观看| 日本免费观看视| 亚洲精选视频免费看| 欧美激情亚洲色图| 国产91精品久久久久久久网曝门| 亚洲欧美自拍另类日韩| 久久国产免费| 日本www在线播放| 欧美亚韩一区| 国产高清免费在线| 成人在线电影在线观看视频| 欧美国产综合视频| 日本成人中文| 久久久久网址| 天海翼精品一区二区三区| av色综合网| 欧美专区一区| 91gao视频| 精品国产鲁一鲁****| 国产剧情日韩欧美| 深夜视频一区二区| 国产成人小视频在线观看| 超碰激情在线| 7m第一福利500精品视频| 电影k8一区二区三区久久| 欧美精品免费看| 性网站在线观看| 欧美日本亚洲视频| 人人超在线公开视频| 久久av资源网站| 在线网址91| 欧美成在线视频| 欧美极品少妇videossex| 欧美高清电影在线看| 婷婷色在线资源| 欧美精品激情在线观看| av电影免费在线看| 欧美在线观看视频| 美女18一级毛片一品久道久久综合| 国产成人久久精品| 精品无人乱码一区二区三区 | 免费一级欧美在线大片| 91嫩草免费看| 日韩影视高清在线观看| 欧美极品色图| 欧美好骚综合网| 国产人妻互换一区二区| 欧美日韩午夜| 欧美三级在线观看视频| 国产精品一二| 久久午夜夜伦鲁鲁一区二区| 奇米综合一区二区三区精品视频| 亚洲一区日韩精品| 国产经典欧美精品| 影音先锋黄色资源| 国产日本亚洲高清| 中国一级片在线观看| 亚洲国产精品欧美一二99| 亚洲男人第一av| 欧美色网站导航| 亚洲AV无码成人片在线观看| 亚洲第一网站男人都懂| 免费看男男www网站入口在线| 中文字幕视频在线免费欧美日韩综合在线看 | 成人免费网站视频| 成人a在线视频| 成人午夜大片| 视频一区亚洲| 欧美日本在线| 免费看a级黄色片| 国产又黄又大久久| 中文字幕在线观看的网站| 中文字幕第一区| 国产亚洲成人av| 在线观看免费视频综合| 国产www免费观看| 亚洲女人被黑人巨大进入| 麻豆视频免费在线观看| 88国产精品欧美一区二区三区| 国产精品成人国产| 国产一区二区三区黄| 欧美色女视频| 免费av观看网址| 狠狠v欧美v日韩v亚洲ⅴ| 亚洲av成人片色在线观看高潮 | 亚洲国产欧美一区二区三区久久| 春暖花开成人亚洲区| 欧美精品videosex极品1| jvid一区二区三区| 韩国成人一区| 亚洲久久久久| 无码人妻精品一区二区三区66| 福利电影一区二区| 少妇高潮在线观看| 色综合av在线| 色欲av永久无码精品无码蜜桃| 久久精品国产精品| 日本精品裸体写真集在线观看| 国产精品久久精品国产| 欧美成免费一区二区视频| 免费观看精品视频| 成人看片黄a免费看在线| 精品无码久久久久成人漫画| 日本久久电影网| 污视频软件在线观看| 久久91精品国产91久久久| 欧美视频免费看| 先锋影音网一区| 老鸭窝毛片一区二区三区| xxxx黄色片| 亚洲国产一区二区三区| 国产丰满美女做爰| 久久久久99精品久久久久| 日韩中文视频| 日本一区免费| 性伦欧美刺激片在线观看| 污污免费在线观看| 亚洲一区二区精品3399| 国产丝袜视频在线观看| 久久精品成人一区二区三区| 欧美一级在线| 亚洲一区二区三区色| 青青青爽久久午夜综合久久午夜| 亚洲人成人无码网www国产| 午夜激情综合网| 午夜在线观看视频18| 国模精品系列视频| 国产欧美三级电影| 成人午夜精品久久久久久久蜜臀| 国产成人精品免费| 精品一级少妇久久久久久久| 亚洲第一av在线| 国产理论在线| 欧美日韩电影一区二区三区| 欧美一级播放| 男人舔女人下部高潮全视频 | 国产情侣激情自拍| 欧美成人精品激情在线观看| 老司机亚洲精品一区二区| 日韩欧美一级在线| 成人自拍视频在线| 一级免费在线观看| 国产亚洲xxx| 精品美女一区| 日本男女交配视频| 99视频精品免费视频| 69国产精品视频免费观看| 在线播放日韩专区| 国产精品2区| 五十路熟女丰满大屁股| 久久久无码精品亚洲日韩按摩| 91青青草视频| 裸体女人亚洲精品一区| 91夜夜蜜桃臀一区二区三区| 国产精品一区二区免费在线观看| 久久精品亚洲精品国产欧美| 一起草av在线| 久久久久久久av| 神马电影久久| 亚洲国产午夜精品| 亚洲成人www| 成黄免费在线| 国产精品9999久久久久仙踪林| 国产人成精品一区二区三| 老头老太做爰xxx视频| 91精品国产91久久综合桃花| 免费在线观看的电影网站| 欧美高清视频一区| 国产在线视频一区二区| 久久久久久久久久久久久久av| 在线视频欧美性高潮| 亚洲综合网站| 日韩中文字幕免费在线| 亚洲精品菠萝久久久久久久| 日本一二三区在线视频| 成人黄色网免费| 国产模特精品视频久久久久| 成人信息集中地| 亚洲精品成人久久久| 欧美亚洲人成在线|