精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比A100性價比更高!FlightLLM讓大模型推理不再為性能和成本同時發愁

人工智能 新聞
近日,無問芯穹、清華大學和上海交通大學聯合提出了一種面向 FPGA 的大模型輕量化部署流程,首次在單塊 Xilinx U280 FPGA 上實現了 LLaMA2-7B 的高效推理。

大語言模型在端側的規模化應用對計算性能、能效比需求的“提拽式”牽引,在算法與芯片之間,撕開了一道充分的推理競爭場。

面對想象中的終端場景,基于 GPU 和 FPGA 的推理方案的應用潛力需要被重新審視。

近日,無問芯穹、清華大學和上海交通大學聯合提出了一種面向 FPGA 的大模型輕量化部署流程,首次在單塊 Xilinx U280 FPGA 上實現了 LLaMA2-7B 的高效推理。

第一作者為清華大學電子系博士及無問芯穹硬件負責人曾書霖,通訊作者為上海交通大學副教授、無問芯穹聯合創始人兼首席科學家戴國浩,清華大學電子工程系教授、系主任及無問芯穹發起人汪玉。

相關工作現已被可重構計算領域頂級會議 FPGA’24 接收。

論文鏈接:https://arxiv.org/pdf/2401.03868.pdf

回顧上一輪清華電子系相關工作被 FPGA 國際會議收錄的蹤跡,要追溯到 2016 年的 Going Deeper with Embedded FPGA Platform for Convolutional Neural Network 與 2017 年 ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA。

前者催化了深鑒科技的創立,后者被 FPGA 國際會議評為當年唯一的最佳論文,并為其特設了一個 Tutorial 環節「The Role of FPGAs in Machine Learning」,專門討論 FPGA 在機器學習領域所扮演角色的變化。

隨著 FPGA 在高性能計算領域的應用潛力被不斷挖掘,震動從學術界傳導到產業界,引發了一輪半導體領域的 FPGA 公司收購熱。

在幾乎所有可能對未來世界產生重大影響的產、研趨勢中,高性能計算都處于關鍵位置。雖然設備的核心計算部件仍是 CPU 和 GPU ,但在一個人工智能算法不斷進步、新標準不斷涌現的時代里,加速這些日新月異的算法推理工作至關重要。

在軟硬件協同優化趨勢下,FPGA 在靈活構建高效的大模型推理系統中將發揮越來越重要的作用。它被認為是通往 5G 通信、數據中心、無人駕駛等諸多千億美元級別市場的鑰匙。

被 FPGA’24 接收的新成果名為 FlightLLM。在單 batch 場景下相比在同等工藝 V100S GPU 上使用 vLLM 推理框架和 SmoothQuant 量化庫,FlightLLM 可實現 6.0 倍的能效比提升和 1.8 倍的性價比提升。

圖片

放眼未來 1 至 2 年,大模型可能將在代碼補全、實時聊天機器人、售后支持等延時敏感應用場景中落地。在這些場景中,延時低、功耗小對于用戶的交互體驗至關重要。

然而,目前大模型的計算量和存儲量相比傳統神經網絡呈現數量級增加,這導致其推理速度和能效很難滿足這些需要快速反饋、能耗敏感場景的需求。

為解決上述問題,行業內通常采用如稀疏化、量化的方法來壓縮大模型。但是 GPU 硬件平臺僅能支持部分粗粒度的模型壓縮方法,對于定制化的模型壓縮方法的計算效率很低。

作者認為,FPGA 具有低成本、可配置、低功耗的特性,可成為加速大模型推理的潛在解決方案。但要想用好,仍需要解決以下挑戰:

圖片


  • 計算效率低下:大模型中靈活的稀疏模式(例如塊稀疏、N:M 稀疏等)導致計算效率低下。
  • 內存帶寬利用率低:大模型的 decode 階段反復從片外存儲器中讀寫細粒度的數據,導致較低的帶寬利用率(29%-43%)。
  • 編譯開銷大:大模型的動態稀疏模式和可變輸入長度構成了一個龐大的指令空間。例如,為 2048 種輸入 token 長度生成指令將導致在 FPGA 上約 TB 量級的存儲開銷。

FlightLLM 的核心思想是利用 FPGA 上特定的資源(如 DSP48 和異構存儲層次結構)來解決大模型的計算和存儲開銷問題。

圖片

 FlightLLM的整體架構。

盡管在理論上,稀疏可以為大模型推理帶來性能提升,但它們不能直接在現有硬件架構上實現。在基于 Transformer 的大模型中,大多采用稀疏注意力和剪枝等稀疏化方法來加速推理。

然而,稀疏化所生成的稀疏矩陣,其密度和稀疏模式并不確定。這給硬件設計帶來了很大的挑戰,特別是對于 FPGA 這種基于固定 DSP48 乘法單元的架構。此前的工作引入了大量額外的硬件架構來支持稀疏計算,但這會導致硬件資源顯著增加。根據估算,需要多消耗近 5 倍的硬件資源。

(a) 統一矩陣處理引擎(Matrix Processing Engine, MPE),可靈活支持(b)矩陣-矩陣乘(Matrix-Matrix multiplication, MMMult)和(c)矩陣-向量乘(Matrix-Vector multiplication, MVMult)計算模式。(d)每個MPE由多個基于稀疏DSP48鏈的向量處理引擎(Vector Processing Engine, VPE)組成。

為此,FlightLLM 采用了軟硬件協同設計來克服低計算效率的挑戰。研究者設計了統一的矩陣處理引擎(MPE),以處理與矩陣計算相關的所有操作(見上圖)。

此前的工作均通過級聯 DSP 來充分利用 DSP48 的硬件資源來減少硬件開銷。然而,由于級聯鏈的路徑是固定的,因此完全級聯的 DSP 架構對稀疏計算不友好。

FlightLLM 在這一問題上提出了針對性的解決方案。FlightLLM 利用 FPGA 上的 DSP48 計算單元,設計了一個可配置的稀疏 DSP 鏈。稀疏 DSP 鏈支持多種的稀疏模式,其計算效率(即運行時 DSP 利用率)提升了 1.6 倍。

此外,在解碼階段,作者發現大模型推理的主要效率限制來自于頻繁訪問片外存儲器的小數據量激活向量。

(a)大模型推理階段的注意力層/線性層與非線性激活操作(MISC)的算子融合實現;全片上解碼在(b)預取(Prefill)階段和(c)解碼(Decode)階段的示意圖:利用算子融合和FPGA的高片上存儲,使得大模型推理解碼階段的激活值無須寫到片外。

為了減少激活向量的片外存儲器訪問,解決訪存帶寬利用率低的挑戰,FlightLLM 使用了算子融合技術,將解碼階段每次推斷中的計算進行融合,提出了 always-on-chip decode 的數據流。通過混合精度量化和算子融合的設計,將 decode 階段的激活值最大程度在片上緩存中復用。

最后,由于大模型每次推理過程 token 長度都會增加,因此需要不同的指令。而大模型有大量計算和存儲需求,即使使用粗粒度指令,指令數量仍然非常龐大。

圖片

通過在不同輸入 token 長度下推理性能的測量,作者觀察到 prefill 和 decode 的延時和輸入 token 長度之間的關系存在著 「階梯」增長的特征,并且 prefill 階段延時隨輸入 token 長度增加得更快。

這是因為 prefill 階段是計算瓶頸,計算量隨 token 長度顯著增加;而 decode 階段是訪存瓶頸,因此延時增加不明顯。階梯狀增長的原因則主要是粗粒度指令集。由于矩陣 - 矩陣乘指令的輸出并行度是 128,矩陣 - 向量乘的輸出并行度是 16,因此 prefill 和 decode 的 「階梯」 的寬度分別為 128 和 16。

基于這些發現,FlightLLM 提出了一種 token 長度自適應的編譯方法,通過復用 prefill 階段和 decode 階段的指令來減少編譯指令的存儲開銷,進而對每個 「階梯」輸入 token 長度的指令分組,以 「階梯」 寬度復用指令序列。這種設計顯著減少了指令的總存儲開銷。

目前,作者已在 Xilinx Alveo U280 FPGA(16nm)上實現了 FlightLLM。在 OPT-6.7B 和 LLaMA2-7B 上的實驗結果表明,FlightLLM 的端到端延遲優于 NVIDIA V100S GPU。

圖片

此外,FlightLLM(基于 U280 FPGA 和 VHK158 FPGA)在能效上超過了 NVIDIA V100S 和 A100 GPU,分別提高了 6.0× 和 4.2×,在性價比上提高了 1.8× 和 1.5×。

更多詳細細節,請參閱論文原文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-22 09:32:13

引擎模型

2024-07-08 13:04:01

2023-08-13 07:44:18

GPU模型英偉達

2025-02-12 09:20:12

2017-04-06 13:40:43

JavaScriptThisWeb

2024-05-15 09:41:22

樂觀鎖編程

2023-01-05 09:33:37

視覺模型訓練

2025-06-23 10:08:22

2009-10-22 16:32:10

布線系統短鏈路問題

2025-03-14 11:56:52

2023-02-13 09:32:37

模型訓練

2021-01-05 22:46:59

Wi-Fi5G網絡

2024-02-01 12:43:16

模型數據

2014-11-20 09:13:00

思科
點贊
收藏

51CTO技術棧公眾號

香蕉综合视频| 99er精品视频| 国产午夜精品久久久久久久| 国产精品久久久久久久天堂 | av在线播放不卡| 国产97色在线|日韩| 四虎地址8848| 精品资源在线| 欧美精品日韩精品| 六月丁香激情网| 日韩在线资源| 99re8在线精品视频免费播放| 国产精品成人一区| 国产在线观看免费视频今夜| 精品在线播放| 日韩免费一区二区三区在线播放| 成人在线看视频| 宅男在线观看免费高清网站| 91蜜桃免费观看视频| 亚洲free嫩bbb| 免费黄色片视频| 国产精品激情| 久久精品一区中文字幕| 中文人妻一区二区三区| 丰满少妇一区| 色综合久久综合网97色综合| 久久久天堂国产精品| jizz在线免费观看| 91视频观看视频| 成人自拍爱视频| 在线亚洲欧美日韩| 久久五月激情| 欧美插天视频在线播放| 久久国产柳州莫菁门| 国产精品qvod| 欧美成人综合网站| 思思久久精品视频| 婷婷午夜社区一区| 欧美日韩精品在线| 800av在线免费观看| 国产精品一卡二卡三卡| 中文久久乱码一区二区| 欧美日韩大片一区二区三区 | 国产一区二区三区精品欧美日韩一区二区三区 | 中文字幕人妻一区二区三区在线视频| 伊人精品久久| 日韩免费成人网| 日韩成人av免费| 国产91欧美| 欧美在线观看一区| 日韩无套无码精品| 精品国产第一福利网站| 欧美日韩亚洲91| 777久久久精品一区二区三区| 俄罗斯一级**毛片在线播放 | 一区二区三区日韩视频| 日本天堂在线观看| 国产精品国模大尺度视频| 午夜视频久久久| 成年人视频网站在线| www成人在线观看| 免费日韩av电影| 日本a一级在线免费播放| 99精品国产91久久久久久| 国产精品青青草| 少妇av一区二区| 99久久99久久综合| 欧美不卡三区| 成人一区二区不卡免费| 国产精品欧美久久久久无广告| 夜夜爽99久久国产综合精品女不卡| 粉嫩一区二区三区国产精品| 国产精品福利一区| 欧美日韩dvd| 97人人在线视频| 狠狠躁夜夜躁人人爽天天天天97| 东京热加勒比无码少妇| 国产日韩另类视频一区| 欧美日韩一区 二区 三区 久久精品| 少妇网站在线观看| 欧美日韩黄色| 亚洲国内精品视频| 中文字幕av久久爽一区| 香蕉综合视频| 91福利视频网| 中文字幕一区二区人妻痴汉电车| 国产一区二区三区香蕉| 国产伦精品一区二区三区在线| 香蕉国产在线视频| 国产日韩欧美精品在线| 精品国产三级a∨在线| free性欧美| 欧美日韩久久久久| 日韩欧美国产片| 动漫av一区| 在线观看日韩av| 免费在线一区二区三区| 久久久水蜜桃av免费网站| 国产精品色婷婷视频| 精品久久在线观看| 久久蜜臀中文字幕| 亚洲激情免费视频| 亚洲最新无码中文字幕久久| 欧美日韩国产高清一区二区 | 欧美国产在线电影| 亚洲不卡在线视频| 国产精品99久久久久久久女警| 神马久久久久久久久久| 色在线视频观看| 色88888久久久久久影院按摩| 色播五月综合网| 盗摄牛牛av影视一区二区| 伊人久久久久久久久久久| 毛片a片免费观看| 日本网站在线观看一区二区三区| 3d动漫啪啪精品一区二区免费 | 精品国产免费一区二区三区 | 高清欧美一区二区三区| 欧美成人精品网站| av在线不卡免费看| 性做爰过程免费播放| 美女福利一区二区| 精品国产亚洲在线| 国产稀缺精品盗摄盗拍| 日韩国产精品久久久久久亚洲| 国产精品国产三级国产专区53 | 2019中文字幕在线| 国产富婆一级全黄大片| 国产精品视频一二三| 浮妇高潮喷白浆视频| 日本在线成人| 久久精品国产清自在天天线| 人人草在线观看| 91视频国产资源| 国产中文字幕二区| 在线一区二区三区视频| 久久国产加勒比精品无码| 这里只有精品免费视频| 久久女同精品一区二区| 国产精品后入内射日本在线观看| 午夜精品在线| 欧美成人午夜免费视在线看片| 一二三四区在线| 欧美国产日韩a欧美在线观看| 亚洲乱码中文字幕久久孕妇黑人| 国产成人夜色高潮福利影视| 欧美日韩国产va另类| av免费在线观看不卡| 91国语精品自产拍在线观看性色 | 91在线亚洲| 亚洲精品小视频| 国产剧情在线视频| 91丨porny丨户外露出| 乱妇乱女熟妇熟女网站| 欧美黄色录像| 91精品国产高清久久久久久久久| 欧美综合视频在线| 红桃av永久久久| 亚洲自拍偷拍精品| 日韩视频一区| 免费av一区二区三区| 色婷婷综合久久久中字幕精品久久| 国产丝袜精品视频| 小泽玛利亚一区二区三区视频| 国产欧美日韩久久| 夜夜夜夜夜夜操| 国产一区久久| 精品综合在线| 亚洲天堂免费电影| 一区二区三区日韩在线| 一级做a爰片久久毛片16| 国产www视频在线观看| 欧美日韩五月天| 2025国产精品自拍| 粉嫩aⅴ一区二区三区四区五区| 国产玉足脚交久久欧美| 美女网站色精品尤物极品姐弟| 555www成人网| 岛国大片在线观看| 7777精品伊人久久久大香线蕉超级流畅 | 亚洲人成网在线播放| 亚洲精品国产欧美在线观看| 国产精品大尺度| 国产精品一区二区在线免费观看| 最新日韩av| 四虎一区二区| 日韩三级网址| 日韩免费在线播放| 浪潮av一区| 日韩av影院在线观看| 超碰在线97观看| 一区二区三区成人在线视频| 日韩av一二区| 国模娜娜一区二区三区| 久久精品国产精品亚洲色婷婷| 国产欧美高清视频在线| 91在线视频免费| 国产在线88av| 中文字幕亚洲二区| 三级在线观看网站| 欧美日韩国产成人在线91| 国产一级片免费看| 国产精品无圣光一区二区| 91成人在线观看喷潮蘑菇| 久久久亚洲一区| 大西瓜av在线| 欧美亚洲高清| 久久国产日韩欧美| 91视频亚洲| 国产成人精品av在线| 色黄网站在线观看| 中文字幕精品久久久久| 污污的视频网站在线观看| 91精品国产全国免费观看| 日本韩国欧美中文字幕| 亚洲精品你懂的| 无码h肉动漫在线观看| 99a精品视频在线观看| 国产精品99久久久久久久久| 欧美理论片在线播放| 中文字幕视频在线免费欧美日韩综合在线看| 后入内射欧美99二区视频| 欧美日韩久久不卡| 国产中文字幕视频| 亚洲午夜成aⅴ人片| 永久久久久久久| 国产精品人成在线观看免费| www.超碰97| 成人av午夜影院| 4438x全国最大成人| 精品一区二区三区在线播放| 毛片一区二区三区四区| 一本久道综合久久精品| www.国产二区| 中文字幕一区二区三区乱码图片 | 国产精品亚洲自拍| 性欧美1819sex性高清| 性欧美亚洲xxxx乳在线观看| 50度灰在线| 欧美成人全部免费| 在线观看男女av免费网址| 久久精品青青大伊人av| 69视频在线| 日韩在线精品视频| 美女写真理伦片在线看| 日韩在线视频线视频免费网站| 草碰在线视频| 色偷偷亚洲男人天堂| 天天在线视频色| 自拍亚洲一区欧美另类| 中文字幕在线免费| 日韩中文字幕av| shkd中文字幕久久在线观看| 国产亚洲精品日韩| av网站无病毒在线| 神马久久桃色视频| 超碰在线最新| 欧美精品videossex性护士| 欧美卡一卡二| 97国产精品免费视频| 欧美aa在线| 日韩av电影国产| 成人黄色在线| 91中文在线视频| 2023国产精华国产精品| 国产一区再线| 久久99国内| 亚洲砖区区免费| 一级欧洲+日本+国产| 成人免费a级片| 亚洲一区视频| 亚洲一区在线不卡| 国产精品羞羞答答xxdd| 日韩精品一区二区三区高清免费| 99久久伊人网影院| 亚洲区自拍偷拍| 亚洲品质自拍视频网站| 日本一级黄色大片| 日本精品一区二区三区四区的功能| 中文字幕男人天堂| 欧美成人国产一区二区| 三级在线播放| 久久伊人精品一区二区三区| 久久在线播放| 欧美日韩一级视频| 国产视频在线观看免费| 精品美女在线播放| 国产小视频在线观看| 久久精品视频一| 国产在线88av| 国产日本欧美视频| 国产欧美一区二区三区米奇| 欧美亚洲爱爱另类综合| 亚洲人体av| 茄子视频成人免费观看| 激情综合一区二区三区| 北岛玲一区二区| 国产精品国产自产拍高清av王其| 久久免费视频99| 欧美性猛交xxxx乱大交退制版 | 老司机精品久久| 91蝌蚪视频在线| 久久久青草青青国产亚洲免观| 希岛爱理中文字幕| 色婷婷久久久亚洲一区二区三区| 国产伦精品一区二区三区免.费 | 国内视频精品| 日日噜噜夜夜狠狠| 91热门视频在线观看| 波多野结衣不卡视频| 欧美午夜影院一区| 无码精品黑人一区二区三区 | 久久99日本精品| 五月开心播播网| 亚洲精品美腿丝袜| 亚洲色成人www永久网站| 亚洲第一页中文字幕| 免费网站免费进入在线| 国产999精品| 丁香婷婷成人| 国产精品国三级国产av| 国内精品伊人久久久久影院对白| 成人免费av片| 亚洲成国产人片在线观看| 国产欧美一级片| 色噜噜狠狠色综合网图区| 丝袜美腿一区| 欧美人xxxxx| 国产精品入口66mio| zjzjzjzjzj亚洲女人| 亚洲欧美韩国综合色| 中文字幕在线观看精品| 亚洲欧美中文在线视频| 亚洲十八**毛片| 精品乱子伦一区二区三区| 激情欧美一区二区三区| 日韩精品xxx| 伊人色综合久久天天人手人婷| 91影院在线播放| 中文字幕最新精品| 国产第一亚洲| 亚洲精品第一区二区三区| 日本欧美一区二区在线观看| 国产jjizz一区二区三区视频| 日韩欧美在线网址| 男同在线观看| 欧洲美女免费图片一区| 校花撩起jk露出白色内裤国产精品| 僵尸世界大战2 在线播放| 成人性色生活片| 国产污视频在线看| 亚洲精品美女视频| 欧美特大特白屁股xxxx| 欧美日韩在线精品一区二区三区| 六月婷婷一区| 永久免费毛片在线观看| 欧美日韩亚洲综合一区二区三区| 午夜在线视频| 亚洲iv一区二区三区| 欧美视频在线观看| 少妇激情一区二区三区视频| 精品国产精品自拍| 邻居大乳一区二区三区| 国产精品久久视频| 999久久久精品国产| 日本r级电影在线观看| 亚洲大片一区二区三区| 亚洲av成人精品日韩在线播放| 秋霞av国产精品一区| 日本电影一区二区| 亚洲天堂一区二区在线观看| 亚洲午夜精品在线| 十九岁完整版在线观看好看云免费| 热草久综合在线| 国产精品麻豆久久| 欧美丰满熟妇bbb久久久| 懂色av一区二区三区| av免费在线一区二区三区| 2022国产精品| 羞羞答答国产精品www一本| 粉嫩精品久久99综合一区| 91精品国产综合久久久久久久| 黄色在线看片| 日本一区二区三区四区在线观看| 久久99国产精品免费| 99免费在线观看| 中文字幕欧美日韩在线| 最新精品在线| 毛葺葺老太做受视频| 亚洲男同1069视频| 天堂在线观看视频| 国产精品视频内| 激情偷拍久久| 日本成人精品视频| 亚洲国产日韩一区| 亚洲欧美综合久久久久久v动漫| 精品久久久久久无码中文野结衣| 久久久www免费人成精品| 性欧美一区二区三区| 国产精品白丝jk喷水视频一区 |