精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

并行革命,32倍吞吐量躍升!英偉達(dá)Helix架構(gòu)突破百萬Token推理瓶頸

人工智能 新聞
長期以來,大模型受限于有限的上下文窗口,在處理長任務(wù)或?qū)υ挄r(shí)不得不忘記早期信息,英偉達(dá)近日推出的Helix并行技術(shù)受DNA結(jié)構(gòu)啟發(fā),分割顯存和處理任務(wù),顯著提升大模型的上下文長度,并發(fā)能力,并可降低響應(yīng)延遲。

想象一個(gè)使用大模型的任務(wù),需要一次處理百萬字符的文檔,例如從百科全書中獲取信息,或是分析數(shù)百頁的法律卷宗,異或追蹤持續(xù)數(shù)月的對(duì)話記錄,都需要越來越長的上下文。

而大模型生成的每個(gè)詞都需要掃描存儲(chǔ)在所謂的KV緩存中存儲(chǔ)的過去標(biāo)記。

反復(fù)讀取這個(gè)緩存會(huì)消耗GPU內(nèi)存帶寬。大模型還需要從內(nèi)存中重新加載大量的前饋網(wǎng)絡(luò)(FFN)權(quán)重來處理每個(gè)新詞。

這個(gè)過程會(huì)減慢效應(yīng)速度,從而導(dǎo)致用戶與大模型對(duì)話時(shí)出現(xiàn)卡頓。

傳統(tǒng)的解決方案,是使用張量并行(Tensor Parallelism, TP)將此負(fù)載分散到多個(gè)GPU上。但這僅能起到一定作用。

當(dāng)規(guī)模超過一定限度后,GPU開始復(fù)制KV緩存,導(dǎo)致內(nèi)存壓力進(jìn)一步增大。

而Helix這一英偉達(dá)針對(duì)其最新的Blackwall開發(fā)的并行策略,通過將模型Transformer層的注意力機(jī)制和前饋網(wǎng)絡(luò)部分分開處理來解決卡頓問題。

Helix受DNA雙螺旋結(jié)構(gòu)的啟發(fā),Helix將KV、張量和專家等多個(gè)維度的并行性交織到一個(gè)統(tǒng)一的執(zhí)行循環(huán)中。

每個(gè)階段在其自身的瓶頸配置下運(yùn)行,同時(shí)復(fù)用相同的GPU池。

圖片

論文鏈接:https://d1qx31qr3h6wln.cloudfront.net/publications/Helix_0.pdf

Helix是怎么做到百萬上下文不卡頓

在注意力階段,Helix使用一種名為KV并行(KVP)的新方法,將龐大的KV緩存分散到多個(gè)GPU上。

當(dāng)TP超過KV頭的數(shù)量時(shí),張量并行會(huì)進(jìn)行復(fù)制,從而增加了內(nèi)存和帶寬開銷,如圖1a到c描述的過程。

Helix通過將TP=2與KVP=2相結(jié)合,形成2D布局來避免內(nèi)存和帶寬開銷的增加,對(duì)應(yīng)圖1d。

圖片

圖1:傳統(tǒng)的張量并行(TP)與Helix的不同注意力分片策略KVP的對(duì)比示意圖

同時(shí),由于KVP GPU持有與其本地KV頭相關(guān)聯(lián)的所有查詢頭,并冗余地計(jì)算QKV投影。

這使得每個(gè)KV分片能夠進(jìn)行完全本地的FlashAttention,確保了模型的推理精度。

之后KVP GPU之間沿著查詢頭維度進(jìn)行單對(duì)單的全連接通信,通信的成本和KV緩存的大小無關(guān),因此大模型的上下文長度即使擴(kuò)展到百萬token,也不會(huì)影響查詢效率。

此外,Helix還通過重疊通信和計(jì)算,一旦計(jì)算出一個(gè)token的注意力輸出,Helix就會(huì)啟動(dòng)該token的全對(duì)全交換,同時(shí)計(jì)算下一個(gè)token的注意力。

這種緊密的重疊將通信延遲隱藏在有用的工作之后,保持GPU利用率高,并進(jìn)一步加速實(shí)時(shí)解碼。

圖2中上圖的八個(gè)請(qǐng)求會(huì)同步執(zhí)行注意力計(jì)算。隨后進(jìn)行順序的全對(duì)全通信。

圖2表底部對(duì)應(yīng)使用HOP-B時(shí),一個(gè)請(qǐng)求的通信與下一個(gè)請(qǐng)求的計(jì)算重疊,通過細(xì)粒度流水線減少了token間的延遲。

圖片

圖2:Helix通過細(xì)粒度流水線技術(shù)加速大模型的響應(yīng)

引入Helix帶來的高并發(fā)和低延遲

根據(jù)英偉達(dá)官網(wǎng)給出的計(jì)算,使用DeepSeek-R1 671B模型,在給定延遲下,當(dāng)并發(fā)的用戶數(shù)增大時(shí),Helix相比傳統(tǒng)方法體現(xiàn)出優(yōu)勢。

而到了圖中第一個(gè)箭頭標(biāo)注的點(diǎn)時(shí),其單GPU產(chǎn)出的token數(shù)是傳統(tǒng)方法的32倍,這意味著可以將并發(fā)用戶數(shù)量提高高達(dá)32倍。

圖片

圖3:使用100萬上下文長度的DeepSeek-R1,評(píng)估使用經(jīng)過最新NVIDIA GB200 NVL72(Blackwell)在固定延遲下的并發(fā)能力

在低并發(fā)設(shè)置下,Helix可以通過減token與token間的最低延遲時(shí)間,來提高用戶交互體驗(yàn),如圖3右下方的對(duì)比所示。

該研究的參與者St-Maurice指出「Helix正在重塑我們處理LLM交互和設(shè)計(jì)的方式?!?/span>

他指出,Helix并行處理和優(yōu)化的KV緩存分片正在為大模型提供可擴(kuò)展的顯存外掛,這與開發(fā)者改進(jìn)舊處理器(如奔騰)的方式高度相似。

該技術(shù)能允許大模型應(yīng)用擴(kuò)展其用戶規(guī)模的同時(shí),保證其快速響應(yīng)。

對(duì)于虛擬助手、法律機(jī)器人以及AI Copolit等應(yīng)用,Helix的引入可以做到既處理大量工作負(fù)載,同時(shí)還保持低延遲響應(yīng)能力。

Helix是否為畫靶射箭的爭論

對(duì)于這項(xiàng)技術(shù)突破,西北人工智能咨詢公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Wyatt Mayham表示:「英偉達(dá)的數(shù)百萬個(gè)token的上下文窗口是一項(xiàng)令人印象深刻的工程里程碑,但對(duì)于大多數(shù)公司來說,它是一個(gè)尋找問題的解決方案,它解決了現(xiàn)有模型如長上下文推理和二次擴(kuò)展等真實(shí)限制,但技術(shù)可能性和實(shí)際實(shí)用性之間存在差距?!?/span>

Mayham承認(rèn)Helix在特定領(lǐng)域中很有用,例如需要完整文檔保真度的合規(guī)性強(qiáng)的行業(yè),或醫(yī)療系統(tǒng)一次性分析患者終身病史。

但這只是部分特例,大多數(shù)組織最好是構(gòu)建更智能的流水線,而不是購買helix所需的Blackwell架構(gòu)下的GB200機(jī)架。

且通常情況下,檢索增強(qiáng)生成(RAG)系統(tǒng)能夠在百萬個(gè)token的范圍內(nèi),表現(xiàn)的比將上下文長度提升到100k更好。

而Info-Tech研究集團(tuán)技術(shù)顧問Justin St-Maurice則指出:在當(dāng)今世界,為人類生成百科全書大小的回答并不是勝利。

相反,關(guān)鍵在于使大模型的輸出對(duì)其他人工智能相關(guān)且可用。

這種能力可能成為未來智能體進(jìn)步的推手。

有了當(dāng)大模型的輸出能具有對(duì)應(yīng)的認(rèn)知框架,智能體可以保持更豐富的內(nèi)部狀態(tài),參與更復(fù)雜、更長時(shí)間的聊天,并執(zhí)行更深入文檔分析。

St-Maurice指出:Helix帶來的長上下文窗口,能夠支持context engineer(上下文工程)在龐大的上下文窗口中管理和優(yōu)化信息,以最大限度地提高智能體的有效性和可靠性。

憑借在擴(kuò)展的上下文窗口中處理和交換更大數(shù)據(jù)量的能力,AI智能體可以以以前不切實(shí)際的方式溝通和協(xié)作,從而改變多智能體應(yīng)用的設(shè)計(jì)框架。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-08-19 09:14:44

2012-09-11 09:35:42

Office 2013

2025-11-19 07:59:57

2025-02-27 09:09:45

2023-09-10 12:37:38

模型英偉達(dá)

2025-07-30 08:40:00

AI編程模型

2025-03-19 09:52:50

2025-03-20 09:00:00

2025-06-18 08:51:28

2025-04-09 10:40:32

2023-03-22 13:53:26

芯片英偉達(dá)

2022-12-23 09:49:42

算法開源

2009-03-04 17:44:47

域名

2025-05-09 02:00:00

代碼接口吞吐量

2024-11-08 13:36:09

2024-12-13 13:58:53

2024-05-23 16:41:40

2013-04-19 09:45:20

AMPLabHadoopHDFS

2025-06-05 03:00:00

Spring異步接口
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

羞羞答答一区二区| 美洲精品一卡2卡三卡4卡四卡| 久久综合伊人| 最新中文字幕亚洲| 九九热视频免费| 国模雨婷捆绑高清在线| 26uuu国产在线精品一区二区| 日产日韩在线亚洲欧美| 香蕉成人在线视频| 超碰地址久久| 欧美三级中文字幕| a级片一区二区| 青青草在线免费视频| 看电视剧不卡顿的网站| 欧美激情精品久久久久久大尺度| 国产激情第一页| 欧美视频免费看| 一区二区三区四区亚洲| 日韩av一区二区三区在线| 国产精品人妻一区二区三区| 亚洲黄色毛片| 日韩在线视频一区| www.超碰97| 中文字幕综合| 91精品福利视频| 天堂v在线视频| 免费一级毛片在线观看| 国产成人一区二区精品非洲| 国产极品jizzhd欧美| 国产一级二级毛片| 97精品国产福利一区二区三区| 亚洲аv电影天堂网| 九色porny自拍| 在线中文字幕播放| 亚洲国产一区二区三区| 国产又爽又黄ai换脸| 激情在线视频| 99精品1区2区| av一区二区在线看| 97人妻精品一区二区三区| 久久亚洲美女| 午夜精品美女自拍福到在线| 曰本女人与公拘交酡| 欧美色图在线播放| 国产午夜精品视频| 熟女人妻在线视频| 精品国产18久久久久久洗澡| 日韩视频免费观看高清完整版 | 亚洲自拍偷拍区| av一级在线观看| 欧美亚洲专区| 欧美与黑人午夜性猛交久久久| 久久午夜鲁丝片午夜精品| 一区二区三区午夜探花| www.国产一区| 熟女少妇a性色生活片毛片| jizzjizz欧美69巨大| 亚洲欧美日韩在线高清直播| 亚洲专区区免费| 日韩av影院| 亚洲精品成人久久久| 好男人香蕉影院| 黄色欧美在线| 日韩精品在线第一页| 最新在线黄色网址| 天天躁日日躁狠狠躁欧美巨大小说| 亚洲第一页自拍| 国产精品嫩草av| 国产另类在线| 精品网站999www| 中文幕无线码中文字蜜桃| 久久综合影院| 色999日韩欧美国产| 中文字幕乱码av| 欧美久久影院| 午夜精品99久久免费| 黄色激情视频在线观看| 亚洲精品社区| 国产精品www| 国产又黄又粗又硬| 粉嫩一区二区三区在线看| 国产伦精品一区二区三区四区视频 | 波多野结依一区| 精品高清美女精品国产区| 国产中文字幕免费观看| 日本成人三级电影| 欧美人xxxx| 成人啪啪18免费游戏链接| 国产精品qvod| 一本色道久久88综合日韩精品| 成人信息集中地| 在线免费高清一区二区三区| 欧美亚洲日本网站| 一区二区三区黄色片| 国产91丝袜在线18| 久久久久久国产精品一区| 黄网在线免费| 亚洲免费在线视频| 亚洲 高清 成人 动漫| 九七电影院97理论片久久tvb| 日韩视频一区二区三区在线播放| av鲁丝一区鲁丝二区鲁丝三区| 欧美日韩激情在线一区二区三区| 久久视频免费观看| 国产超碰人人爽人人做人人爱| 免费精品视频在线| 国产一区二区三区黄| fc2在线中文字幕| 亚洲一级二级在线| 亚洲xxxx2d动漫1| 66精品视频在线观看| 亚洲天堂av综合网| 久久久美女视频| 美国十次了思思久久精品导航| 999在线观看免费大全电视剧| 久久伊伊香蕉| 亚洲午夜在线电影| 最新天堂中文在线| 亚洲欧美日本伦理| 久久91超碰青草是什么| 中文字幕+乱码+中文乱码91| 成人国产在线观看| 五月天男人天堂| 日韩久久一区二区三区| 精品国产污污免费网站入口| 岛国片在线免费观看| 国产毛片久久| 国产伦一区二区三区色一情| 久操视频在线免费播放| 在线观看成人免费视频| 中文字幕在线播放视频| 午夜精品亚洲| 91美女片黄在线观| 99re热久久这里只有精品34| 日韩欧美国产成人| 无码人妻精品一区二区三| 久久久久久久久久久妇女| 国产aⅴ夜夜欢一区二区三区 | 国产亚洲人成网站在线观看| 日韩黄色精品视频| 懂色一区二区三区免费观看| 久久视频免费在线| 95精品视频| 精品国产欧美一区二区三区成人| 看黄色一级大片| 久久久久久久久久久久久女国产乱| 日韩精品在线视频免费观看| 精品国产一区二区三区2021| 久久精品亚洲94久久精品| 在线观看免费观看在线| 欧美国产精品中文字幕| 国产成人无码av在线播放dvd| 天美av一区二区三区久久| 国模精品系列视频| 人妻一区二区三区| 亚洲成人av免费| 国产精品一区二区人妻喷水| 亚洲天堂男人| 国产精品一区二区欧美| 丁香花在线高清完整版视频| 亚洲精品一线二线三线无人区| 国产亚洲精品码| 成人动漫在线一区| 日韩欧美不卡在线| 亚洲自拍电影| 国产极品精品在线观看| 网友自拍视频在线| 91精品欧美综合在线观看最新 | www.成人三级视频| 爱情岛论坛亚洲品质自拍视频网站| 精品成a人在线观看| 中文字幕视频网| 欧美国产日韩精品免费观看| 九九热精品在线播放| 999精品在线| 国产精品初高中精品久久| 日本乱码一区二区三区不卡| 亚洲色图av在线| 91一区二区视频| 亚洲午夜在线电影| 亚洲av毛片基地| 国产一区二区精品久久99| 妞干网在线观看视频| 国产探花一区二区| 91亚洲精品一区| 欧美sm一区| 日韩一区二区欧美| 天天干天天操av| 欧美日韩一区小说| 久久精品国产av一区二区三区| 久久婷婷成人综合色| 午夜啪啪小视频| 国产欧美精品| 青青草原国产免费| 网曝91综合精品门事件在线| 国产日韩欧美夫妻视频在线观看| 成人在线网址| 日韩一区二区三区免费观看| 国产成人精品av久久| 欧美国产日韩a欧美在线观看 | 国产91综合一区在线观看| 国产精品网站免费| 国产探花在线精品一区二区| 91探花福利精品国产自产在线| 日本三级一区| www.日韩欧美| 免费观看a视频| 在线精品国精品国产尤物884a| 麻豆chinese极品少妇| 不卡一二三区首页| 尤蜜粉嫩av国产一区二区三区| 亚洲最大av| 超碰97人人在线| 国产盗摄一区二区| 精品久久久av| 青青免费在线视频| 欧美一区二区私人影院日本| 日韩av在线播| 国产精品久久久久久久岛一牛影视| 日本中文字幕有码| 青青草精品视频| 国产主播在线看| 亚洲欧美综合国产精品一区| 日本一区免费观看| av在线亚洲色图| 91香蕉电影院| 亚洲伦理影院| 欧美高清视频在线观看| 国产三级视频在线看| 亚洲精品xxxx| 精品久久久中文字幕人妻| 欧洲精品在线观看| 国产日产精品一区二区三区| 一区二区三区视频在线看| 中国美女乱淫免费看视频| 国产iv一区二区三区| 久久精品视频在线观看免费| 天堂成人免费av电影一区| 少妇人妻大乳在线视频| 亚洲国产一成人久久精品| 一区二区免费在线观看| 欧美极品在线观看| 国产精品日韩一区二区三区| 欧美aaa级| 国产美女精品视频| 久久99久久99精品免观看软件| 久久免费视频观看| 1769免费视频在线观看| 视频在线观看一区二区| 九色在线视频蝌蚪| 日韩经典一区二区三区| 天堂中文在线资源| 日韩免费视频一区二区| 97视频免费在线| 色婷婷久久一区二区三区麻豆| 中文字幕免费在线观看视频| 亚洲成人激情av| 国产亚洲成人av| 亚洲日本乱码在线观看| 1024手机在线观看你懂的| 久久蜜桃一区二区| 国产麻豆天美果冻无码视频| 久久日韩精品一区二区五区| 欧类av怡春院| www.欧美.com| 日韩黄色一区二区| 99精品久久只有精品| 日本黄色录像片| 99re这里只有精品首页| 性少妇bbw张开| 国产女同互慰高潮91漫画| 久久精品成人av| aaa欧美色吧激情视频| 3d动漫精品啪啪一区二区下载| 91亚洲国产成人精品一区二三| 久久久无码人妻精品无码| 不卡大黄网站免费看| 免费看黄色的视频| 国产蜜臀97一区二区三区| 最新中文字幕av| 国产精品色噜噜| 青草草在线视频| 五月天精品一区二区三区| 日本一级淫片免费放| 欧美亚洲自拍偷拍| 在线观看毛片av| 日韩视频一区二区三区| 免费福利在线观看| 这里只有精品在线播放| 黄页视频在线播放| 久久精品夜夜夜夜夜久久| 99色在线观看| 国产999视频| 精品国产乱码一区二区三区| 精品乱色一区二区中文字幕| 欧美欧美黄在线二区| 中文字幕日韩一区二区三区| 亚洲欧洲日韩| 日本午夜激情视频| 日本大胆欧美人术艺术动态| 亚洲欧美在线精品| jvid福利写真一区二区三区| 亚洲欧美va天堂人熟伦| 亚洲人成影院在线观看| caoporn国产| 欧美欧美午夜aⅴ在线观看| 精品毛片在线观看| 最近2019年手机中文字幕| 麻豆影视在线观看_| 性欧美长视频免费观看不卡| 台湾佬成人网| 成人国产精品一区| 奇米影视777在线欧美电影观看| 日韩精品一区二区三区四区五区| 香蕉久久网站| 日韩免费视频播放| 久久国产精品72免费观看| 精品久久久久一区二区| 亚洲欧美在线另类| 91porny在线| 91精品国产欧美一区二区| 欧美视频在线观看一区二区三区| 日韩亚洲第一页| а√天堂资源官网在线资源| 国产精品一区电影| 国产区精品区| 分分操这里只有精品| 极品少妇一区二区三区精品视频| 日韩精品无码一区二区三区久久久 | 91精品国偷自产在线电影| 人妻精品无码一区二区三区| 精品无人码麻豆乱码1区2区 | 久久综合九色综合欧美98| 国产午夜精品无码| 欧美精品粉嫩高潮一区二区| 日本国产在线| 欧美成人免费在线观看| 成人国产精品一区二区网站| 欧美一区二区在线视频观看| 天天射天天综合网| 一级做a免费视频| 国产日韩欧美综合在线| 国产在线观看成人| 精品电影一区二区三区| 影音先锋男人资源在线| 国产成人精品一区二区| 亚洲人成精品久久久 | 国产精品扒开腿做爽爽爽软件| 天天操精品视频| 国产精品美女一区二区在线观看| www.国产一区二区| 亚洲天堂男人天堂女人天堂| 麻豆国产在线| 国产在线播放一区二区| 亚洲综合电影一区二区三区| 亚洲麻豆一区二区三区| 亚洲永久精品国产| 好吊色在线观看| 久久久久久亚洲精品不卡| 亚洲无线观看| 国产69精品久久久久999小说| 国产91精品精华液一区二区三区 | 天堂在线中文字幕| 久久免费少妇高潮久久精品99| 日韩精品亚洲aⅴ在线影院| 青青草精品视频在线| 成人av手机在线观看| 黄色片网站在线免费观看| 日韩精品中文字幕在线| 自拍一区在线观看| 香蕉久久免费影视| 蜜臀av性久久久久av蜜臀妖精| 中文天堂资源在线| 日韩欧美www| 超级白嫩亚洲国产第一| 精品久久久久久一区| 美女脱光内衣内裤视频久久影院| 毛片aaaaaa| 欧美一区二区三区精品| 2020av在线| 欧美日韩三区四区| 日韩电影在线一区二区| 欧美黄色一级生活片| 欧美日韩免费视频| 国产探花视频在线观看| 国内精品视频在线播放| 久久精品成人| 一区二区在线观看免费视频| 精品国产区一区| 成人欧美大片| 特级黄色录像片| 成人动漫一区二区三区| 亚欧视频在线观看| 日韩在线激情视频| 一区二区网站| 亚洲一区二区三区四区五区xx| 亚洲情趣在线观看| 天堂在线资源8| 91久久精品在线| 亚洲东热激情|