精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

H100推理飆升8倍!英偉達官宣開源TensorRT-LLM,支持10+模型

人工智能 新聞
H100讓模型推理性能最高躍升8倍!英偉達最新開源軟件TensorRT-LLM,將徹底改變LLM推理現狀。

「GPU貧民」即將告別困境!

剛剛,英偉達發布了一款開源軟件TensorRT-LLM,能夠加速H100上大型語言模型的推理。

圖片

那么,具體能提升多少倍?

在添加了TensorRT-LLM及其一系列優化功能后(包括In-Flight批處理),模型總吞吐量提升8倍。

圖片

使用和不使用TensorRT-LLM的GPT-J-6B A100與H100的比較

另外,就拿Llama 2來說,相較于單獨使用A100,TensorRT-LLM可以將推理性能提高4.6倍。

圖片

使用和不使用TensorRT-LLM的Llama 2 70B、A100與H100的比較

網友表示,超強H100,再結合上TensorRT-LLM,無疑將徹底改變大型語言模型推理現狀!

圖片

TensorRT-LLM:大模型推理加速神器

當前,由于大模型有著巨大的參數規模,使得「部署和推理」難度和成本一直居高不下。

而英偉達開發的TensorRT-LLM,旨在通過GPU來顯著提高LLM吞吐量,并降低成本。

圖片

具體來說,TensorRT-LLM將TensorRT的深度學習編譯器、FasterTransformer的優化內核、預處理和后處理以及多 GPU/多節點通信,封裝在一個簡單的開源Python API中。

英偉達對FasterTransformer進行了進一步的增強,使其成為一個產品化的解決方案。

可見,TensorRT-LLM提供了一個易用、開源和模塊化的Python應用編程接口。

碼農們不需要深入的C++或CUDA專業知識,能夠部署、運行、調試各種大語言模型,還能獲得頂尖性能表現,以及快速定制化的功能。

圖片

根據英偉達官方博客,TensorRT-LLM通過四種方式優化了Nvidia GPU上的LLM推理性能。

首先,為當前10+大模型,引入TensorRT-LLM,讓開發者們能夠立即運行。

其次,TensorRT-LLM作為一個開源軟件庫,允許LLM在多個GPU和多個GPU服務器上同時進行推理。

這些服務器分別通過,英偉達的NVLink和InfiniBand互連連接。

第三,就是「In-flight批處理」,這是一種全新的調度技術,允許不同模型任務獨立于其他任務進入GPU和退出GPU。

最后,TensorRT-LLM經過優化,可以利用H100 Transformer Engine來降低模型推理時的內存占用和延遲。

接下來,具體看看TensorRT-LLM如何提升模型性能。

支持豐富LLM生態

TensorRT-LLM對開源模型生態提供了非常好的支持。

規模最大、最先進的語言模型,例如Meta推出的Llama 2-70B,需要多個GPU協同工作才能實時提供響應。

此前,如果要實現LLM推理的最佳性能,開發人員必須重寫AI模型,并將其手動拆分為多個片段,并在GPU之間協調執行。

圖片

TensorRT-LLM使用張量并行技術(tensor parallelism),將權重矩陣分配到各個設備上,從而簡化了這一過程,可以實現大規模高效推理。

每個模型可以在通過NVLink連接的多個GPU和多個服務器上并行運行,無需開發人員干預或模型更改。

隨著新模型和模型架構的推出,開發人員可以使用TensorRT-LLM中開源的最新NVIDIA AI內核(Kernal)來優化模型。

支持的內核融合(Kernal Fusion),包括最前沿的FlashAttention實現和用于GPT模型執行的上下文和生成階段的掩碼多頭注意力等。

此外,TensorRT-LLM還包括了目前流行的許多大語言模型的完全優化、可立即運行的版本。

其中包括Meta Llama 2、OpenAI GPT-2和GPT-3、Falcon、Mosaic MPT、BLOOM等10多個模型,所有這些模型都可以使用簡單易用的TensorRT-LLM Python API來調用。 

這些功能可幫助開發人員更快、更準確地搭建定制化的大語言模型,以滿足各行各業的不同需求。

In-flight批處理

現如今大型語言模型的用途極其廣泛。

一個模型可以同時用于多種看起來完全不同的任務——從聊天機器人中的簡單問答響應,到文檔摘要或長代碼塊的生成,工作負載是高度動態的,輸出大小需要滿足不同數量級任務的需求。

任務的多樣性可能會導致難以有效地批處理請求和進行高效并行執行,可能會導致某些請求比其他請求更早完成。

圖片

為了管理這些動態負載,TensorRT-LLM包含一種稱為「In-flight批處理」的優化調度技術。

它的核心原理是,大語言模型的整個文本生成過程可以分解為模型上的多次執行迭代。

通過in flight批處理,TensorRT-LLM運行時會立即從批處理中釋放出已完成的序列,而不是等待整個批處理完成后再繼續處理下一組請求。

在執行新請求時,上一批還未完成的其他請求仍在處理中。

In-flight批處理和額外的內核級優化可提高GPU使用率,可以使得H100上的LLM實際請求基準的吞吐量至少增加一倍。

使用FP 8的 H100 Transformer引擎

TensorRT-LLM還提供了一個名為H100 Transformer Engine的功能,能有效降低大模型推理時的內存消耗和延遲。

因為LLM包含數十億個模型權重和激活函數,通常用FP16或BF16值進行訓練和表示,每個值占用16位內存。

然而,在推理時,大多數模型可以使用量化(Quantization)技術以較低精度有效表示,例如8位甚至4位整數(INT8或 INT4)。 

量化(Quantization)是在不犧牲準確性的情況下降低模型權重和激活精度的過程。使用較低的精度意味著每個參數較小,并且模型在GPU內存中占用的空間較小。

這使得能夠使用相同的硬件對更大的模型進行推理,同時在執行過程中花費更少的時間在內存操作上。 

通過H100 Transformer Engine技術,配合TensorRT-LLM的H100 GPU使戶能夠輕松地將模型權重轉換為新的FP8格式,并能自動編譯模型以利用優化后的FP8內核。

而且這個過程不需要任何的代碼!H100引入的FP8數據格式使開發人員能夠量化他們的模型并從大幅度減少內存消耗,而且不會降低模型的準確性。

與INT8或INT4等其他數據格式相比,FP8量化保留了更高的精度,同時實現了最快的性能并,而且實現起來最為方便。

如何獲取TensorRT-LLM

TensorRT-LLM雖然還沒有正式發布,但是用戶現在已經可以進行搶先體驗了。

申請鏈接如下:

https://developer.nvidia.com/tensorrt-llm-early-access/join

英偉達也說會將TensorRT-LLM很快集成到NVIDIA NeMo框架中。

這個框架是英偉達前不久剛剛推出的AI Enterprise的一部分,為企業客戶提供了一個安全、穩定、可管理性極強的企業級AI軟件平臺。

開發人員和研究人員可以通過英偉達NGC上的NeMo框架或GitHub上的項目訪問TensorRT-LLM。

但是需要注意的是,用戶必須注冊英偉達開發者計劃才能申請搶先體驗版本。

網友熱議

Reddit上的網友對TensorRT-LLM的推出展開了激烈的討論。

難以想象專門針對LLM對硬件做出優化之后,效果將會有多大的提升。

但也有網友認為,這個東西的意義就是幫助老黃賣更多的H100。

不過有網友也不是很認同,他覺得Tensor RT對于本地部署SD的用戶也是有幫助的,所以只要有RTX GPU,以后應該都有可能在類似產品上獲益。

而從更加宏觀的角度,也許對于LLM來說,也會出現一系列的專門針對硬件級別的優化,甚至未來會出現專門針對LLM設計的硬件來提升LLM的性能,這種情況其實已經在很多流行的應用中出現過了,LLM也不會例外。


責任編輯:張燕妮 來源: 新智元
相關推薦

2024-02-01 08:34:30

大模型推理框架NVIDIA

2023-11-16 14:46:27

AIChat APIOpenAI

2024-10-22 09:17:07

2024-02-04 00:00:00

Triton格式TensorRT

2024-08-28 13:34:13

2023-09-14 13:23:00

AI芯片

2023-11-21 09:14:33

微軟Azure AI

2023-09-11 09:37:58

開源軟件套AI模型

2023-08-13 07:44:18

GPU模型英偉達

2023-06-14 12:08:51

2025-04-27 09:15:40

2023-12-19 13:32:00

模型數據

2023-03-22 10:09:26

AIChatGPT

2023-09-11 12:58:00

AI訓練

2024-04-10 09:10:27

Gaudi 3芯片英特爾

2023-08-09 17:19:54

服務器計算

2024-07-12 11:35:49

2024-12-05 13:50:00

AI大模型

2025-06-11 14:39:50

AILLMMistral

2024-09-05 14:10:00

AI計算
點贊
收藏

51CTO技術棧公眾號

欧美日本亚洲韩国国产| 亚洲影视资源| 久久久久久久av麻豆果冻| 国产精品18久久久久久首页狼| 日本美女xxx| 成人在线视频www| 午夜精品爽啪视频| 亚洲欧美日韩国产成人综合一二三区| 国产免费黄色大片| 国产精品一级| 欧美成人黑人xx视频免费观看| 黄色免费视频网站| 亚洲伦理网站| 欧美日韩在线第一页| 午夜啪啪免费视频| 免费在线黄色影片| 国产老女人精品毛片久久| 日本精品视频网站| 青青草手机视频在线观看| 精品国产乱码久久久久久蜜坠欲下 | 国产高清一区二区三区四区| 欧美高清一级片| 在线看日本不卡| 免费高清一区二区三区| av在线天堂| 成人精品电影在线观看| 国产精品视频永久免费播放| 国产稀缺真实呦乱在线| 一区二区三区在线电影| 一本大道久久加勒比香蕉| 99久久久无码国产精品性波多| 国产精品诱惑| 日本久久一区二区| 成人在线免费观看av| 欧洲中文在线| 亚洲精品久久久久久国产精华液| 少妇精品久久久久久久久久| 日韩黄色影片| av中文字幕亚洲| 成人h视频在线观看| 一级片一区二区三区| 久久久久看片| 啪一啪鲁一鲁2019在线视频| 五月天综合在线| 欧美日一区二区在线观看| 精品国产一区久久久| 久久精品三级视频| 欧美美女在线| 亚洲人成电影网站色www| 亚洲精品乱码久久| 极品国产人妖chinesets亚洲人妖| 91精品国产乱码久久蜜臀| 爱豆国产剧免费观看大全剧苏畅| 国产成人免费精品| 欧美视频精品在线| 国产精品一区二区小说| 国产毛片精品久久| 欧美人与z0zoxxxx视频| 性刺激的欧美三级视频| 电影在线观看一区二区| 欧美少妇一区二区| 欧美日韩久久婷婷| 视频一区视频二区欧美| 欧美xxxx老人做受| 又色又爽又黄18网站| 97品白浆高清久久久久久| 精品国产一区二区国模嫣然| 亚洲欧美高清在线| 欧美综合自拍| 亚洲美女av在线| 一级片手机在线观看| 亚洲都市激情| 中文字幕在线国产精品| 特一级黄色录像| 国产精品国码视频| 91高清视频在线免费观看| 少妇太紧太爽又黄又硬又爽| 翔田千里一区二区| 国产精品普通话| av片免费播放| www..com久久爱| 日本在线观看一区二区| 麻豆电影在线播放| 亚洲国产成人av| 欧美日韩第二页| 亚洲18在线| 亚洲大胆人体视频| 欧美福利第一页| 欧美精品一卡| 欧美在线观看视频| 91片黄在线观看喷潮| 国产98色在线|日韩| 欧美精品一区二区三区在线看午夜| 国产精品一级伦理| 一区二区三区四区亚洲| 欧美私人情侣网站| 国产精品高清一区二区| 亚洲第一免费播放区| 精品无码在线观看| 欧美午夜不卡| 国产精品久久久av| 日韩永久免费视频| 中文字幕在线一区免费| 日韩国产欧美亚洲| 99tv成人影院| 亚洲人成网站在线播| 精品人妻伦九区久久aaa片| 国产精品入口66mio| 91欧美精品午夜性色福利在线| 天天干天天舔天天射| 1024亚洲合集| 国产激情在线观看视频| 粉嫩久久久久久久极品| 久久九九热免费视频| 亚洲免费黄色网址| 国产99久久久精品| 一区二区日本伦理| 日本欧美日韩| 日韩精品黄色网| 欧美高清视频一区二区三区| 免费亚洲电影在线| 欧美成熟毛茸茸复古| 污污视频在线| 欧美高清视频不卡网| 免费看91的网站| 亚洲精品系列| 超碰在线97av| 黄网站在线免费| 欧美在线三级电影| 99久久久久久久久久| 1024日韩| 国产精品xxxx| 在线观看电影av| 91超碰这里只有精品国产| 无码一区二区三区在线| 久久免费国产| 久久久亚洲综合网站| bl在线肉h视频大尺度| 日韩精品一区二区三区视频播放 | 国产探花精品一区二区| 国产精品视频一二三| 成人性做爰aaa片免费看不忠| 欧美一级一片| 91成人天堂久久成人| 色香蕉在线视频| 午夜成人免费电影| 少妇一级淫片免费放播放| 黄色亚洲在线| 国产精品swag| 华人av在线| 日韩精品在线免费观看视频| 国产成人在线免费观看视频| av电影一区二区| 男人日女人下面视频| 精品国产一区二区三区不卡蜜臂 | 暖暖成人免费视频| 亚洲欧美视频在线| 无码一区二区三区| 日本一区二区三区久久久久久久久不| 久久精品99国产| 国产传媒欧美日韩成人精品大片| 日韩免费视频在线观看| 国产裸舞福利在线视频合集| 欧美午夜寂寞影院| 性生交大片免费全黄| 狠狠狠色丁香婷婷综合激情| 一本色道久久88亚洲精品综合| 综合激情网...| 亚洲97在线观看| 青青草视频免费在线观看| 色香蕉成人二区免费| 美国精品一区二区| 国产一区二区视频在线播放| 国产精品自拍合集| 欧洲亚洲视频| 国产美女扒开尿口久久久| 成人欧美在线| 日韩电影视频免费| 中文字幕欧美在线观看| 亚洲免费在线电影| 少妇一级淫片免费放播放| 日本在线不卡一区| 免费成人进口网站| 亚洲伊人春色| 91免费版黄色| 亚洲国产成人二区| 久久精品免费电影| 无套内谢的新婚少妇国语播放| 日本高清无吗v一区| 国产老头老太做爰视频| 波多野洁衣一区| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 婷婷综合伊人| 狼狼综合久久久久综合网| 亚洲欧美专区| 国产91av在线| 国产在线观看91| 国产手机视频精品| 国内老熟妇对白hdxxxx| 色综合久久99| 麻豆视频在线观看| 中文字幕欧美激情一区| 国产高清成人久久| 激情成人午夜视频| 免费激情视频在线观看| 欧美日韩综合| 中文字幕一区综合| 亚洲专区视频| 国产伦视频一区二区三区| 国产精品久久乐| 欧美精品xxx| 日本不卡在线| 亚洲天堂av网| 天天摸夜夜添狠狠添婷婷| 欧美丰满美乳xxx高潮www| 国产精品777777| 亚洲国产综合91精品麻豆| 日日操免费视频| 久久婷婷成人综合色| 国产清纯白嫩初高中在线观看性色| 日日夜夜精品视频天天综合网| 成人免费播放器| 午夜精品久久| 中国人体摄影一区二区三区| 一区二区三区韩国免费中文网站| 春色成人在线视频| 日韩色性视频| 国产精品视频免费在线| 男人最爱成人网| 欧美在线不卡区| 天堂电影一区| 韩国美女主播一区| ririsao久久精品一区| 麻豆国产精品va在线观看不卡 | 国产蜜臀av在线一区二区三区| 国产精品久久久久久久无码| 国产成人精品午夜视频免费| 午夜激情视频网| 国产精品一区二区x88av| 天天综合成人网| 久久成人18免费观看| 亚洲老女人av| 蜜桃av一区二区| 午夜视频在线网站| 精品一二三四区| 手机av在线网| 九色综合国产一区二区三区| 视频在线观看免费高清| 久久国产精品第一页| 中文字幕在线综合| 精品影院一区二区久久久| 亚洲欧美日韩综合网| 九九热在线视频观看这里只有精品| 日本一二区免费| 国产精品伊人色| 无码人妻aⅴ一区二区三区玉蒲团| 国产成人综合精品三级| 国产精品久久久久久在线观看| 成人激情综合网站| 特级西西人体wwwww| 久久综合久久综合九色| 中文字幕网站在线观看| 国产精品美女久久久久高潮| 无码人妻精品中文字幕| 一区二区三区日韩| 国产无遮挡免费视频| 欧美性xxxxx极品| 无码人妻黑人中文字幕| 欧美日韩亚洲综合| 99久久婷婷国产一区二区三区| 日韩精品一区二区三区在线播放 | 999久久欧美人妻一区二区| 国产精品第十页| 又粗又黑又大的吊av| 日韩中文字幕亚洲一区二区va在线 | av在线app| 97热精品视频官网| 成人免费毛片嘿嘿连载视频…| 成人中文字幕在线观看 | 免费看国产精品一二区视频| sdde在线播放一区二区| 在线观看一区二区三区三州| 国产精品av一区二区| 亚洲国产精品久久久久婷蜜芽| 老司机精品导航| 999热精品视频| 久久天天做天天爱综合色| av激情在线观看| 精品色蜜蜜精品视频在线观看| 中文字幕精品一区二| 欧美一区二区精品| 你懂的视频在线免费| 久久精品精品电影网| 欧美gay视频| 91久久久久久久一区二区| 久久视频在线观看| 伊人情人网综合| 99精品国产福利在线观看免费| 奇米影视四色在线| 成人黄色av网站在线| 黄色裸体一级片| 无码av免费一区二区三区试看 | 麻豆国产尤物av尤物在线观看| 色av成人天堂桃色av| 亚洲免费成人网| 视频在线观看一区二区| 麻豆蜜桃在线观看| 91精品综合久久| 日本电影一区二区| 国产h视频在线播放| 国产乱子伦视频一区二区三区| 国产精品扒开腿做爽爽| 亚洲一区在线观看免费观看电影高清 | 中文字幕制服丝袜| 中文字幕在线观看一区| 国产精品视频123| 精品久久久久久久久久久久包黑料 | 男女啊啊啊视频| 欧美一区二区视频观看视频| 大胆av不用播放器在线播放| 91国产精品电影| 99re6热只有精品免费观看| 亚洲第一页在线视频| 日韩高清在线电影| 91国模少妇一区二区三区| 亚洲成人免费av| 亚洲av无码乱码国产麻豆| 日韩视频―中文字幕| 久久久成人av毛片免费观看| 欧美1o一11sex性hdhd| 一本久道综合久久精品| 极品白嫩少妇无套内谢| 一区二区三区中文字幕| 国产又粗又猛又黄又爽无遮挡| 在线成人激情视频| 午夜av成人| 日韩精品一区二区三区外面| 亚洲中字黄色| av无码av天天av天天爽| 黄色精品一区二区| 亚洲av激情无码专区在线播放| 欧美精品videossex88| 波多野结衣一区二区三区免费视频| 经典三级在线视频| 国产在线国偷精品产拍免费yy| 激情五月激情综合| 91精品蜜臀在线一区尤物| 成人影院在线观看| 97碰碰视频| 亚洲视频福利| 看全色黄大色黄女片18| 黄色一区二区在线观看| 三级做a全过程在线观看| 日本精品视频在线播放| 精品国产乱码久久久| 玖玖爱视频在线| 亚洲欧美综合色| 精品人妻无码一区二区| 欧美日韩国产成人在线观看| 在线播放一区二区精品视频| 日韩一级片免费视频| 99久久综合色| 天天爽夜夜爽人人爽| 中文字幕日韩av电影| 国产精品视频一区二区三区综合| 97超碰在线视| 99精品一区二区三区| 日本一本在线观看| 日韩一级裸体免费视频| 欧美电影在线观看一区| 久久久久久久久久网| 久久久99久久| 国产精品天天操| 午夜精品蜜臀一区二区三区免费 | 国产成人啪午夜精品网站男同| 久久免费播放视频| 亚洲精选一区二区| 亚洲天堂网站| 三上悠亚久久精品| 中文幕一区二区三区久久蜜桃| 国产免费不卡视频| 51精品国产黑色丝袜高跟鞋| 精品午夜久久| 国产伦理在线观看| 色拍拍在线精品视频8848| 麻豆系列在线观看| 国产一区二区精品免费| 强制捆绑调教一区二区| 精品无码av在线| 国产一区二区三区免费视频| 年轻的保姆91精品| 噼里啪啦国语在线观看免费版高清版| 亚洲日本欧美天堂| 免费a在线观看| 999视频在线观看| 久久久国产亚洲精品| 欧美日韩在线观看成人| 国产视频欧美视频| 91精品短视频| 色乱码一区二区三区在线|