精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

中國團隊首次奪魁!無問芯穹FlightVGM獲FPGA'25最佳論文,峰值算力超GPU21倍

人工智能 新聞
在大模型部署成本爭議甚囂塵上的產業背景下,以 FPGA、ASIC 等靈活可編程硬件和專用任務集成電路來提升硬件運行效率,或將成為大模型落地效率提升與成本降低的最關鍵一環。

國際可重構計算領域頂級會議 ——FPGA 2025 在落幕之時傳來消息,今年的最佳論文頒發給了無問芯穹和上交、清華共同提出的視頻生成大模型推理 IP 工作 FlightVGM,這是 FPGA 會議首次將該獎項授予完全由中國大陸科研團隊主導的研究工作,同時也是亞太國家團隊首次獲此殊榮。

這項工作首次在 FPGA 上實現了視頻生成模型(Video Generation Models, VGMs)的高效推理,也是該團隊繼去年在 FPGA 上加速大語言模型 FlightLLM(FPGA’24)后的最新系列工作。與 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上實現了 1.30 倍的性能提升與 4.49 倍的能效提升(峰值算力差距超過 21 倍)。

論文鏈接:https://dl.acm.org/doi/10.1145/3706628.3708864

論文第一作者劉軍是上海交通大學博士生,共同一作曾書霖是清華大學博士后,通訊作者是汪玉和戴國浩。汪玉是 IEEE Fellow、清華大學電子工程系教授、系主任和無問芯穹發起人,戴國浩是上海交通大學副教授、無問芯穹聯合創始人兼首席科學家。

上一輪清華電子系相關工作被 FPGA 國際會議收錄應追溯到 2016 年的 Going Deeper with Embedded FPGA Platform for Convolutional Neural Network 與 2017 年 ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA。前者催化了深鑒科技的創立,后者被 FPGA 國際會議評為當年唯一的最佳論文,隨后深鑒科技于 2018 年被可編程芯片廠商賽靈思以 3 億美元收購。

在大模型部署成本爭議甚囂塵上的產業背景下,以 FPGA、ASIC 等靈活可編程硬件和專用任務集成電路來提升硬件運行效率,或將成為大模型落地效率提升與成本降低的最關鍵一環。2024 年,無問芯穹曾以大語言模型定制推理 IP FlightLLM 被 FPGA 高評價錄取,今年再次以 VGM 模型定制推理 IP FlightVGM 拿下最佳論文獎,都是在通過創新硬件架構提升效率。據悉,這一系列研究成果現已被集成到無問芯穹自研大模型推理 IP LPU(Large-model Processing Unit)之中,并已與合作伙伴開展合作驗證。

下面是論文的核心內容解讀。

背景

在視頻生成領域,擴散 Transformer(DiT)逐漸成為一種重要的框架。DiT 模型通過一個擴散過程生成視頻,它將噪聲圖像逐步恢復為清晰的視頻幀,從而展現了強大的生成能力。最初,DiT 被提出是為了探索在大規模數據處理中的可擴展性,隨著技術的不斷發展,DiT 的架構也不斷被優化,逐步提高了生成視頻的質量和分辨率,使得生成的視頻更加清晰、精細。盡管如此,這種方法的計算需求非常高,尤其是在生成高分辨率和較長時長的視頻時,所需的計算量和內存消耗大幅增加,因此如何提升生成效率并優化計算過程,成為該領域的關鍵問題之一。

核心見解:從視頻壓縮到視頻生成

視頻壓縮技術(如 H.264、H.265)通過離散余弦變換(DCT)等技術,識別并消除視頻幀間和幀內的冗余信息,從而實現高達 1000 倍的壓縮率。這一思想的核心在于,視頻數據在時間和空間維度上存在大量重復模式,例如相鄰幀之間的背景幾乎不變,或同一幀內的紋理具有高度相似性。通過檢測并跳過這些冗余信息,壓縮算法能夠顯著減少數據量,同時保持視頻質量。

FlightVGM 創新性地將這一思想引入視頻生成模型的加速中。視頻生成模型(VGMs)在推理過程中同樣表現出顯著的時空冗余性。例如,相鄰幀之間的 Token 在語義上高度相似,而同一幀內的不同區域也可能共享相同的視覺特征。然而,現有 GPU 架構無法充分利用這種冗余性。FPGA 雖然具備稀疏計算的優勢,但其峰值算力遠低于 GPU,且其計算單元(例如 V80 的 DSP58)的傳統設計無法動態適配混合精度需求,限制了其在視頻生成加速中的應用。FlightVGM 通過以下三項技術,解決上述挑戰:

1.“時間 - 空間” 激活值在線稀疏化方法:基于視頻壓縮中的相似性檢測思想,FlightVGM 設計了幀間和幀內的冗余激活稀疏機制。通過余弦相似度計算,動態跳過相似部分計算,顯著降低了計算負載。

2.“浮點 - 定點” 混合精度 DSP58 拓展架構:借鑒視頻壓縮中的分塊處理思想,FlightVGM 對視頻生成模型的不同模塊進行精度分層處理。關鍵模塊(如注意力機制)保留 FP16 精度,非關鍵模塊(如線性層)量化至 INT8,最大化硬件利用率。

3.“動態 - 靜態” 自適應調度策略:針對激活值在線稀疏化導致的負載不均衡問題,FlightVGM 針對實際工作負載自適應調整不同操作負載的執行順序,從而提高計算利用率。

技術要點

“時間 - 空間” 激活值在線稀疏方法

我們提出了一種 “時間 - 空間” 激活值在線稀疏化方法,同時考慮了幀間和幀內的相似性。激活稀疏化的核心思想是:如果兩個 token 之間具有高度相似性,則可以只計算其中一個 token,并將結果共享給另一個 token。具體來說,輸入激活是一個 3 維張量,由 tokenizer 從噪聲視頻中處理得到。因此,輸入激活可以表示為,其中 F 表示幀數,T 表示每幀的 token 數,d 表示隱藏維度。為了簡便起見,我們用 () 來表示第 1 幀的第 1 個 token。對于輸入激活,我們使用來表示參考向量和輸入向量。我們使用余弦相似度作為度量標準。

激活稀疏化包含兩個步驟:幀間稀疏化和幀內稀疏化。

1. 幀間稀疏化:我們將輸入激活分為 G 個連續的組,并選擇中間幀作為參考幀。剩余幀的 token 與參考幀的 token 逐一計算相似度,若超過閾值,則使用參考幀的 token 計算結果替代當前 token。

2. 幀內稀疏化:我們將每幀的 token 分為 K 個塊,選擇中間 token 作為參考 token,計算其他 token 與參考 token 的相似度,若超過閾值則用參考 token 替代計算。如果某 token 已在幀間稀疏化中被裁剪,其相似度為 0。

從計算角度來看,相似度計算需要進行一次內積和兩次模長計算,因此其計算量為 3d,其中 d 為隱藏維度。以一個線性操作為例,假設輸入激活的大小為,權重矩陣 W 的大小為,則原始操作的計算量為。對于稀疏操作,考慮幀間和幀內稀疏化帶來的額外計算,假設稀疏度為 s,則稀疏操作的總計算量為:

由于原始計算量包含了 d 的二次項,而稀疏化帶來的額外計算只是 d 的線性項(典型值 d=1152),因此稀疏化引入的額外開銷幾乎可以忽略不計。

“浮點 - 定點” 混合精度 DSP58 拓展架構

AMD V80 FPGA 配備了硬件 IP DSP58,支持多種計算模式,如標量、向量和浮點配置。然而,由于這些配置之間無法在運行時進行動態切換,這與視頻生成模型對數據的混合精度的需求存在沖突,導致我們無法充分利用 DSP58 的計算潛力。

為了解決這一問題,我們提出了基于 DSP58 的創新性 FP16-INT8 混合精度硬件架構 ——DSP-Expansion (DSP-E)。該架構允許在運行時配置,支持兩個 FP16 乘加單元(MAC)或四個 INT8 乘加單元。我們的核心思路是通過引入額外的乘法器來解決當一個 DSP58 執行兩個 FP16 分數乘法時的數據混淆問題,這些乘法器在 INT8 模式下也可以復用。在 FP16 模式下,DSP58 執行兩個 MAC 的分數乘法,并通過減去 INT8 乘法器的結果來獲得正確的中間計算結果。中間結果的指數部分通過 INT 加法器計算,并通過指數對齊和調整單元對齊小數點位置,最終通過加法、歸一化和四舍五入得到最終結果。在 INT8 模式下,DSP-E 通過復用 DSP58、兩個 INT8 乘法器和兩個 INT 加法器,最大化計算性能。通過將相關數據輸入到不同的端口,額外的邏輯單元可以復用硬件資源,從而有效地提高了計算吞吐量。

為了在計算精度和硬件資源的約束下實現最大吞吐量,我們提出了一個異構的 DSP58 陣列設計,以適應不同的計算需求。我們根據不同設計的資源消耗(包括 DSP、LUT、REG、RAM 等)進行評估,并通過資源約束來確保最優計算性能。此外,我們還考慮了 INT8 與 FP16 計算性能的比值,以衡量計算能力的提升。

實驗結果

算法評估

與基準模型相比,FlightVGM 對于模型精度的影響幾乎可以忽略(僅平均損失為 0.008),而使用全 INT8 量化時,平均損失為 0.042。同時,在實際視頻生成效果上,FlightVGM 生成的視頻與原始模型仍有較好的保持。

性能評估

對于 NVIDIA 3090 GPU,在 FP16 精度下,AMD V80 FPGA 的峰值算力差距超過了 21 倍。然而,基于 V80 FPGA 實現的 FlightVGM 仍在性能和能效上超過了 GPU。這是因為 FlightVGM 充分利用了 VGM 固有的稀疏相似性和混合精度數據分布特性,并通過軟硬件協同開辟了 “算法 - 軟件 - 硬件” 的全新優化空間并成功在其中找到了一個足夠好的解。而 GPU 由于硬件架構的限制,難以達到相同的加速效果,且缺乏稀疏化和定制化計算數據流優化的支持。

展望和未來工作

隨著 VGM 計算需求的增長,FlightVGM 展示了如何通過 FPGA 的軟硬件協同創新,實現更高能效的文生視頻大模型推理。未來,通過探索 AIE(AI Engine)+ HBM(High Bandwidth Memory)的全新 FPGA 架構,FPGA 有望為視頻生成任務提供更高效的計算支持,成為未來計算平臺的重要選擇。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-01-23 12:30:00

2024-01-10 17:13:42

模型數據

2024-11-08 15:00:00

AI模型

2020-06-24 14:00:10

富岳奪魁

2017-11-17 09:34:00

2025-08-01 09:14:00

2023-11-10 12:53:35

論文AI

2022-08-29 14:44:09

特斯拉芯片

2018-07-20 09:01:39

2020-07-03 15:19:04

AI 數據人工智能

2013-01-10 16:32:20

用友

2019-05-15 10:42:26

超算芯片計算機
點贊
收藏

51CTO技術棧公眾號

日韩激情视频在线| 婷婷开心激情综合| 97久久精品人人澡人人爽| 亚洲美女自拍视频| 男人天堂成人在线| 快射av在线播放一区| 国内外成人在线| 性欧美激情精品| 91成人精品一区二区| 精品一区91| 色呦呦日韩精品| 4444亚洲人成无码网在线观看| 风流老熟女一区二区三区| 三级不卡在线观看| 欧美成aaa人片在线观看蜜臀| 三级黄色片网站| 人人精品久久| 丁香五六月婷婷久久激情| 艳色歌舞团一区二区三区| 欧洲成人一区二区三区| 美女视频免费一区| 欧美孕妇毛茸茸xxxx| 色老板免费视频| 国产成人av| 日韩精品一区在线| 91亚洲免费视频| 男人久久天堂| 一区二区三区中文在线观看| 婷婷久久青草热一区二区| 好吊视频一区二区三区| 六月婷婷色综合| 日韩美女中文字幕| www.youjizz.com亚洲| 欧美电影一区| 亚洲视频免费一区| 99re久久精品国产| 中文字幕亚洲在线观看 | 中文字幕av网站| aa亚洲婷婷| 欧美国产在线视频| 在线观看亚洲网站| 欧美视频网址| 亚洲人成电影网站色www| 奇米777第四色| 日韩免费成人| 这里只有精品电影| 色呦色呦色精品| 成人看片毛片免费播放器| 日韩欧美在线字幕| 大陆极品少妇内射aaaaa| 欧美v亚洲v| 亚洲免费在线看| 综合久久国产| 免费网站成人| 中文字幕一区二区5566日韩| 一本一道久久a久久综合精品 | 国产美女免费看| 久久er99精品| 成人国内精品久久久久一区| 中文字幕在线观看你懂的| 日本美女一区二区三区视频| 国产91色在线|免| www.com亚洲| 玖玖在线精品| 国产精品美女999| 亚洲熟妇无码久久精品| 久久精品国产亚洲aⅴ| 国产一区二区色| 国产精品视频一二区| 国产一区在线视频| 97超级在线观看免费高清完整版电视剧| 国产精品色综合| 国产成人亚洲综合a∨猫咪| 99久久99| 亚洲av电影一区| 久久精品视频在线看| 午夜免费电影一区在线观看| 老司机精品影院| 亚洲欧美区自拍先锋| 17c丨国产丨精品视频| 啊啊啊久久久| 色天天综合久久久久综合片| 色悠悠久久综合网| 久久久久久久久成人| 日韩免费高清视频| 国产熟妇搡bbbb搡bbbb| 日韩不卡一区| 久久99青青精品免费观看| 日韩精品一区二区在线播放| 久久久久久久波多野高潮日日| 国产精品视频网址| 性中国古装videossex| 99久久久久免费精品国产| 日韩欧美在线一区二区| www.久久ai| 精品久久久久久久久久| 亚洲最大综合网| 日韩中文字幕视频网| 亚洲精品视频网上网址在线观看| 毛片久久久久久| 精品动漫3d一区二区三区免费| 欧洲美女7788成人免费视频| 国产精品熟女久久久久久| 99久久国产免费看| 一区二区三区四区欧美| 丁香影院在线| 欧美日韩国产电影| 激情综合丁香五月| 亚洲先锋影音| 国产成人亚洲综合91精品| a级片免费视频| 日本一区二区三区高清不卡| 水蜜桃色314在线观看| 懂色aⅴ精品一区二区三区| 亚洲精品在线网站| 亚洲人做受高潮| 一本综合久久| 亚洲综合精品伊人久久| 成人性爱视频在线观看| 亚洲超碰97人人做人人爱| 色呦色呦色精品| 国产中文字幕一区二区三区| 久久久久久中文字幕| 国产精品一区二区av白丝下载| 99精品视频在线播放观看| 97在线免费视频观看| 国产极品一区| 亚洲精品久久久久久下一站| 青青草原免费观看| 久久99久久精品欧美| 欧美一区观看| 天堂中文最新版在线中文| 日韩精品一区二区三区中文精品| 国产91在线播放九色| 久久国产毛片| 久久一区二区三区av| 91福利在线尤物| 欧美电影精品一区二区| 艳妇荡乳欲伦69影片| 精品综合免费视频观看| 日韩欧美一区二区三区四区 | 色婷婷av一区二区三区软件| 中文文字幕文字幕高清| 综合激情视频| 亚洲已满18点击进入在线看片| 在线激情网站| 欧美性色欧美a在线播放| 精品少妇人妻一区二区黑料社区| 国产精品婷婷| 国内精品视频免费| 免费v片在线观看| 亚洲精品美女视频| 特一级黄色大片| av资源网一区| 国产在线青青草| 亚洲免费成人av在线| 欧美一区二区三区免费观看 | 91丨porny丨国产| 亚洲熟妇国产熟妇肥婆| 久久电影在线| 欧美中文在线观看| 国产区在线视频| 欧美视频你懂的| 99热99这里只有精品| 国产精品自拍网站| 少妇久久久久久被弄到高潮| 亚洲精品观看| 97香蕉超级碰碰久久免费软件| 天天综合网在线观看| 色拍拍在线精品视频8848| 日韩毛片无码永久免费看| 久久国产生活片100| 日日噜噜夜夜狠狠久久丁香五月| 深夜激情久久| 欧美一区二三区| 国产高清视频免费最新在线| 欧美精品自拍偷拍| 欧美日韩在线观看成人| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 黄色片网站免费在线观看| 亚洲一区在线观看视频| 可以直接看的无码av| 免费成人你懂的| 天堂av在线中文| 美女福利一区| 国产精品欧美久久久| 91麻豆免费在线视频| 日韩精品视频在线| 亚洲网站免费观看| 亚洲成国产人片在线观看| 91视频免费观看网站| 久久成人羞羞网站| 免费视频爱爱太爽了| 国产91精品对白在线播放| 91夜夜未满十八勿入爽爽影院 | 中文字幕第九页| 天堂午夜影视日韩欧美一区二区| 最近看过的日韩成人| 米奇精品关键词| 国产精品丝袜久久久久久高清| 欧美亚洲系列| 自拍偷拍亚洲区| 欧美一级淫片aaaaaa| 欧美日韩一区视频| 午夜影院在线看| 成人免费在线视频观看| 香蕉视频黄色在线观看| 激情综合五月婷婷| 人妻少妇被粗大爽9797pw| 伊人久久大香线| 亚洲国产一区二区三区在线| 久久精品福利| 国产一区私人高清影院| 一个人www视频在线免费观看| 久久色免费在线视频| 黄色小视频在线观看| 亚洲成人av在线| 国产精品高潮呻吟久久久| 色诱视频网站一区| 日本一区二区不卡在线| 亚洲视频综合在线| 国产免费嫩草影院| 久久亚洲精品国产精品紫薇| 不许穿内裤随时挨c调教h苏绵| 美女一区二区三区在线观看| 可以免费观看av毛片| 好吊一区二区三区| 97超碰免费观看| 日本不卡高清| 神马影院一区二区| 你懂的一区二区三区| 黑人中文字幕一区二区三区| 九九九九九九精品任你躁| 国产日韩综合一区二区性色av| 成人在线视频播放| 欧美中在线观看| 美女高潮在线观看| 91精品国产免费久久久久久 | 国产乱淫av片| 国产精品996| 亚洲一区二区中文字幕在线观看| 麻豆91精品91久久久的内涵| 午夜国产一区二区三区| 人人精品人人爱| 另类小说第一页| 日本怡春院一区二区| 日韩精品一区二区三区不卡| 久久看片网站| 免费激情视频在线观看| 日韩精品一级二级| 亚洲黄色a v| 免费成人在线网站| 深爱五月综合网| 国产曰批免费观看久久久| 国产精品无码自拍| 成人性视频免费网站| 尤物网站在线观看| 91视频你懂的| 日本二区在线观看| 中文字幕二三区不卡| 日本福利片在线观看| 亚洲免费观看高清| 日韩 国产 在线| 色综合久久久久| 中文字幕男人天堂| 日韩一区二区在线观看| 韩国中文字幕hd久久精品| 日韩黄色高清视频| 成人精品福利| 欧美精品情趣视频| 日韩精品美女| 国产精品老女人精品视频| 免费精品一区二区三区在线观看| 97人人干人人| 日韩黄色网络| 亚洲制服中文| 亚洲电影av| 亚洲欧美激情网| 国产精品资源网| 成人免费av片| 亚洲天堂免费在线观看视频| 国产一级视频在线播放| 狠狠躁夜夜躁人人爽天天天天97| 中文在线a天堂| 日韩女优av电影在线观看| 偷拍25位美女撒尿视频在线观看| 在线观看91久久久久久| 青青青国内视频在线观看软件| 91av在线国产| 少妇高潮一区二区三区99| 国产精品.com| 精品美女在线视频| 亚洲国产精品无码观看久久| 日日摸夜夜添夜夜添国产精品 | xxxxxhd亚洲人hd| 日本不卡一区| 欧美视频亚洲视频| 国产一区二区在线免费播放| 国产91精品欧美| 国产又粗又长又硬| 精品久久久久久久久久久| 91久久久久久久久久久久| 亚洲精品国产品国语在线| 免费黄色在线| 日本精品久久久| 日韩中文字幕视频网| 亚洲福利av| 国产手机视频一区二区| 中文字幕一二三| 中文欧美字幕免费| 91av在线免费视频| 日韩精品一区二区三区蜜臀| av影片在线看| 日本欧美精品在线| 国产乱论精品| 欧美做受777cos| 日本欧美一区二区三区乱码| 三叶草欧洲码在线| 一区二区三区欧美久久| 亚洲综合精品国产一区二区三区| 亚洲精品一区二区三区不| 欧美人动性xxxxz0oz| 成人精品aaaa网站| 成人午夜av| 久久久久久香蕉| 99精品欧美一区二区三区综合在线| 成人观看免费视频| 91精品欧美一区二区三区综合在 | 国产精品少妇在线视频| 成人国产免费视频| 久草视频中文在线| 日韩三级电影网址| 黄色av免费在线| 成人在线视频网站| 91欧美国产| 天天干天天操天天做| 国产精品久久久久四虎| 一级黄色片视频| 在线精品高清中文字幕| av在线不卡精品| 日韩精品久久一区二区三区| 日日夜夜免费精品视频| 蜜桃无码一区二区三区| 欧美性xxxxxx| 国产尤物视频在线| 国产成人综合av| 国产精品一区二区三区av麻 | 亚洲一级免费视频| 欧美一区 二区 三区| 久久久久久草| 美女网站久久| 污污视频网站在线免费观看| 欧美日韩你懂的| 欧美被日视频| 亚洲一区制服诱惑| 欧美a级一区| 美女久久久久久久久| 五月天亚洲婷婷| 欧美777四色影视在线| 日本欧美在线视频| 欧美亚洲国产激情| 日本人69视频| 一区二区高清免费观看影视大全 | 成人激情小说网站| xxxx.国产| 色哟哟亚洲精品一区二区| 亚洲高清国产拍精品26u| 91免费版看片| 99精品桃花视频在线观看| 成人免费毛片视频| 日韩综合视频在线观看| 视频一区中文字幕精品| 波多野结衣乳巨码无在线| 国产丝袜美腿一区二区三区| 91禁在线观看| 欧美激情a在线| 亚洲精品动态| 中文字幕在线观看日| 亚洲成人av中文| 国产剧情在线观看| 亚洲xxxxx| 欧美亚洲网站| 成人涩涩小片视频日本| 亚洲国产高潮在线观看| 日韩高清不卡| 99在线免费视频观看| 久久精品一区八戒影视| 国产草草影院ccyycom| 26uuu久久噜噜噜噜| 91一区二区三区四区| 亚洲日本久久久| 欧美日韩三级一区| a'aaa级片在线观看| 亚洲国产精品久久久久久女王| 国产成人一区在线| 成人午夜精品视频| 久久久女人电视剧免费播放下载| 欧美一级淫片| www.啪啪.com| 欧美精品在线视频|