精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充

發布于 2024-10-10 15:45
瀏覽
0收藏

本文提出了mllm-NPU,這是第一個有效利用設備上神經處理單元(NPU)卸載的LLM推理系統。mllm-NPU的主要設計目標是減少預填充延遲和能耗。它針對主流的僅解碼器的變壓器架構的LLM(例如LlaMA、GPT等)。關鍵思想是最大限度地在移動NPU上執行預填充,以加速整數計算,同時保持在CPU/GPU上執行必要的浮點操作以保持準確性。為了克服上述挑戰并提高NPU卸載效率,mllm-NPU在三個層面上重構了提示和模型:(1)在提示層面:mllm-NPU將可變長度的提示分割成多個固定大小的塊,同時保持數據依賴性;(2)在張量層面:mllm-NPU識別并提取重要的異常值以在CPU/GPU上運行;(3)在塊層面:mllm-NPU根據硬件親和性和對準確性的敏感度將變壓器塊調度到CPU/GPU和NPU。

??https://arxiv.org/pdf/2407.05858??


LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

mllm-NPU系統設計概述

mllm-NPU是一個創新的大型語言模型(LLM)推理系統,專為移動設備上的神經處理單元(NPU)優化。該系統的主要設計目標是減少預填充(prefill)階段的延遲和能耗,同時保持推理精度。mllm-NPU通過在算法和系統設計上的協同優化,有效地解決了LLM架構與現代NPU設計之間的語義差異。


mllm-NPU的工作流程包括準備階段和執行階段。在準備階段,mllm-NPU使用增強的張量級量化算法將LLM量化為W8A8格式,并生成固定長度的分塊共享圖,以高效處理變長提示。在執行階段,mllm-NPU將接收到的提示分割成固定大小的塊,并按照因果關系處理這些塊。這些塊圖會根據它們的數據格式被分割成子圖,并根據硬件親和性和精度敏感性在CPU/GPU和NPU之間進行調度。

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區


三大創新技術詳解

1. 分塊共享圖

mllm-NPU通過引入分塊共享圖來應對動態提示長度的挑戰。這種方法基于對LLM操作符的兩種分類:靜態操作符和動態操作符。靜態操作符如線性層和層歸一化,可以跨不同塊共享;而動態操作符如注意力機制,依賴于塊長度和序列,不能共享。通過這種方式,mllm-NPU將LLM分解為多個子圖,共享子圖一次構建和優化,非共享子圖則針對不同塊單獨構建。這種方法顯著減少了內存開銷,并提高了可擴展性。

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

2. 影子離群值執行

為了在不犧牲LLM精度的前提下實現NPU友好的張量級激活量化,mllm-NPU采用了影子離群值執行技術。該技術在運行時將具有離群值的激活通道提取到一個更緊湊的張量中,在CPU上執行,并將結果合并回NPU上的原始操作符結果中。這種設計不僅解決了離群值的問題,還優化了內存使用,并減少了CPU和NPU之間的同步開銷。

3. 無序子圖執行

mllm-NPU采用無序子圖執行策略來優化執行效率。通過在塊和子圖級別進行分區后,LLM子圖可以不按塊序列順序執行。這種策略顯著擴大了調度空間,最小化了由于CPU/GPU浮點操作引起的執行泡沫。mllm-NPU利用在線啟發式算法,在保證正確性的前提下,動態選擇執行順序,從而最大化NPU的利用率并最小化CPU/GPU的工作負載影響。

實現與評估

1. 實現

mllm-NPU的實現涉及多個關鍵技術,包括分塊共享圖、陰影異常執行和亂序子圖執行。這些技術共同優化了移動NPU的加載效率,顯著提高了預填充速度和能效。

  • 分塊共享圖:通過將變長提示分解為多個固定大小的塊,并為每個塊構建預優化的計算圖,mllm-NPU顯著減少了圖構建和優化的時間。此外,通過共享不依賴于塊序列的靜態運算符,減少了內存占用,提高了擴展性。
  • 陰影異常執行:為了在不犧牲精度的情況下實現對NPU友好的張量激活量化,mllm-NPU采用了陰影異常執行技術。通過在CPU上并行處理稀疏的異常激活通道,mllm-NPU能夠在保持NPU計算效率的同時,減少由于異常值引起的量化誤差。LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區
  • 亂序子圖執行:mllm-NPU通過亂序執行子圖來優化計算流程,減少由于CPU/GPU上的浮點運算導致的執行泡沫。這種策略擴大了調度空間,使得可以更靈活地管理各個子圖的執行順序,從而最大化NPU的利用率和減少總體執行時間。

LLM新巔峰||北大提出mllm-NPU,賦能1000字/秒的設備端LLM預填充-AI.x社區

2. 評估

mllm-NPU的性能通過與多個基線系統的比較得到驗證。實驗結果顯示,無論是在預填充速度、能耗還是端到端推理延遲方面,mllm-NPU都顯著優于現有技術。

  • 預填充性能:在1024個令牌的提示長度下,mllm-NPU在Xiaomi 14設備上的預填充速度比使用CPU的llama.cpp快18.17-38.4倍,比使用GPU的TFLite快1.27-2.34倍。
  • 能耗:在Redmi K60 Pro設備上,mllm-NPU在1024令牌提示長度下的能耗比使用CPU的llama.cpp低35.63-59.52倍,比使用GPU的TFLite低1.85-4.32倍。
  • 端到端性能:在實際的移動應用場景中,mllm-NPU在端到端推理延遲上也展現出了優越性,特別是在UI自動化和自動電子郵件回復的任務中,mllm-NPU的表現遠超其他基線系統。

性能分析

mllm-NPU的性能優勢主要源于其創新的設計和優化策略。通過在移動NPU上最大化整數運算的執行,同時在CPU/GPU上處理必要的浮點運算,mllm-NPU不僅提高了執行速度,還降低了能耗。

  • 內存消耗:盡管mllm-NPU引入了額外的內存開銷(主要是由于陰影異常執行技術),但這一開銷相對較小,僅占總內存的一小部分。這得益于其高效的內存管理策略,如分塊共享圖技術,有效減少了不必要的內存占用。
  • 精度保持:mllm-NPU在保持高效NPU執行的同時,幾乎不損失推理精度。通過動態處理異常值位置,mllm-NPU能夠在元素級別上提供比傳統量化方法更高的精度,從而保證了模型的輸出質量。
  • 系統兼容性:mllm-NPU支持標準的LLM格式,并可以與現有的解碼引擎兼容,使其能夠靈活地集成到各種移動設備和應用中。此外,mllm-NPU的設計允許與其他算法級優化技術結合使用,進一步提升性能。

總之,mllm-NPU通過一系列創新技術,顯著提高了移動設備上大型語言模型的推理性能,為實現高效、低能耗的移動設備端LLM推理提供了有效解決方案。

準確性與內存消耗

1. 準確性保持

mllm-NPU系統在實現高效的NPU卸載的同時,保持了較高的準確性。與FP16相比,準確性損失不到1%,這在實際應用中是可接受的。這得益于其創新的技術,如影子離群值執行(shadow outlier execution),它允許在CPU上以浮點精度處理離群值,從而保持了高準確性。此外,mllm-NPU與其他基線模型相比,在保持準確性的同時,顯著提高了執行效率。

2. 內存消耗

盡管mllm-NPU引入了一些額外的內存開銷,例如為離群值執行加載的浮點權重,但這些開銷相對較小,僅占總內存的0.6%至1%。此外,通過共享圖(chunk-sharing graph)技術,mllm-NPU顯著減少了內存需求,因為它允許在不同的執行塊之間共享靜態操作符。這種方法不僅減少了內存占用,還提高了內存使用的效率。

本文轉載自 ??AI論文解讀??,作者:柏企

收藏
回復
舉報
回復
相關推薦
黄色美女视频在线观看| 国产美女永久免费| 国产成人一区| 欧美电影在线免费观看| 粉嫩av一区二区三区天美传媒| 国产综合视频在线| 免费看欧美女人艹b| 九九久久久久99精品| 性欧美丰满熟妇xxxx性仙踪林| 91国拍精品国产粉嫩亚洲一区| 亚洲精品国产精华液| 久久综合九色99| 国产精品久久久久久免费| 精品动漫3d一区二区三区免费版| 亚洲三级黄色在线观看| 性生活一级大片| 国产麻豆久久| 婷婷亚洲久悠悠色悠在线播放| 无遮挡亚洲一区| 日本xxxx人| 国产综合一区二区| 日韩暖暖在线视频| 久久精品国产亚洲av高清色欲| av在线不卡顿| 亚洲精品影视在线观看| 欧美一级大片免费看| 日韩欧美精品一区二区综合视频| 婷婷国产v国产偷v亚洲高清| 性做爰过程免费播放| 东凛在线观看| 久久色.com| 国产自产精品| www香蕉视频| 国产自产2019最新不卡| 国产玖玖精品视频| 69av视频在线观看| 一本色道精品久久一区二区三区 | av在线free| 中文字幕不卡三区| 欧美日韩在线播放一区二区| 亚洲AV无码成人片在线观看| 久久99日本精品| 国产精品欧美日韩久久| 亚洲天堂视频在线播放| 久久精品日韩欧美| 欧美亚州一区二区三区| 久久不卡免费视频| 亚洲精品视频啊美女在线直播| 欧美伦理91i| 免费成年人视频在线观看| 91视频一区| 最好看的2019年中文视频| 亚洲人成人无码网www国产 | 视频一区二区三区免费观看| 天堂影院在线| 久久蜜桃av一区精品变态类天堂 | 欧美手机在线| 在线观看久久久久久| 三上悠亚ssⅰn939无码播放| 精品在线播放| 中文字幕不卡在线视频极品| 日本人亚洲人jjzzjjz| 日韩av有码| 精品国产一区二区三区四区在线观看| 性少妇xx生活| 91精品在线观看国产| 久久的精品视频| 九九热只有精品| 一本久道久久久| 国产97免费视| 国产又粗又长又黄| 国产超碰在线一区| 久久99精品久久久久久水蜜桃| 日本成人一区| 国产精品视频yy9299一区| 一区二区三区四区视频在线观看| caoporn免费在线视频| 亚洲国产精品麻豆| av无码精品一区二区三区| 欧美国产视频| 亚洲大胆美女视频| 国产又黄又粗的视频| 艳女tv在线观看国产一区| 久久久久久国产精品三级玉女聊斋| 国产无套粉嫩白浆内谢| 日韩极品在线观看| 2022国产精品| 狠狠狠综合7777久夜色撩人| **性色生活片久久毛片| 欧美日韩性生活片| 欧美在线se| 亚洲精品wwwww| 日韩在线一卡二卡| 亚洲福利电影| 国产精品美女主播| 欧美一级淫片免费视频魅影视频| 久久久天堂av| www.国产在线视频| 国产一区二区精品调教| 亚洲高清色综合| 性少妇xx生活| 亚洲欧美日韩综合国产aⅴ| 国产综合香蕉五月婷在线| 日韩专区第一页| 中文字幕亚洲视频| 亚洲欧洲日产国码无码久久99 | 99精品热视频只有精品10| 国产精品免费一区豆花| 色婷婷视频在线| 成人欧美一区二区三区黑人麻豆| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | 欧美日韩午夜视频| 小嫩嫩精品导航| 97人人模人人爽视频一区二区| 国产在线91| 午夜精品久久久久久久久久| 亚洲视频一二三四| 国产欧美一区| 国产91精品久| 日本免费一区视频| 亚洲在线中文字幕| 精品国产乱码久久久久久1区二区| 欧美日韩一本| 欧美黑人性视频| 亚洲一区中文字幕永久在线| 久久亚洲精华国产精华液| 精品国产av无码一区二区三区| 日韩一区二区三区四区五区| 国产一区二区三区精品久久久| 国产精品99精品无码视| 国产精品中文字幕一区二区三区| 午夜精品视频在线观看一区二区| 中文字幕在线视频网站| 日韩电影免费观看在线观看| 久久久久无码国产精品| 国产二区国产一区在线观看| 一区二区日本伦理| 国产电影一区二区三区爱妃记| 日韩久久午夜影院| 成人午夜视频在线播放| 99久久精品99国产精品| 色综合久久久久无码专区| 菁菁伊人国产精品| 78m国产成人精品视频| 日本高清视频www| 亚洲国产欧美在线| 日本黄色录像片| 亚洲日韩视频| 久久综合狠狠综合久久综青草 | 欧美精品三区| 亚洲最大av在线| 天堂av最新在线| 精品国产乱码久久| 日韩久久久久久久久| 99精品偷自拍| 欧美精品第三页| 成人3d动漫在线观看| 成人福利免费观看| 在线观看三级视频| 亚洲精品一区二区三区精华液| 久草视频精品在线| 久久综合视频网| 在线观看高清免费视频| 色喇叭免费久久综合| 亚洲综合中文字幕在线| 爱草tv视频在线观看992| 亚洲欧美国产高清va在线播| 国产无遮挡又黄又爽又色视频| 国产色产综合产在线视频| 婷婷免费在线观看| 欧美jjzz| 久久久久久久有限公司| 日本成人福利| 色综合视频一区中文字幕| 人妻视频一区二区三区| 在线观看日韩av先锋影音电影院| 任我爽在线视频| 成人一级黄色片| 国产黄色特级片| 91精品久久久久久久蜜月| 国产一区二区高清视频| 向日葵视频成人app网址| 日韩中文字幕网| 欧美视频久久久| 欧美日韩中文一区| 久久久一二三区| 国产欧美视频一区二区三区| 国产黄色一区二区三区| 性高湖久久久久久久久| 中文字幕一区二区三区四区五区| 国产一区二区在线视频你懂的| 日韩女在线观看| 午夜伦理大片视频在线观看| 亚洲男人天堂手机在线| 国产免费久久久| 日韩欧美在线视频免费观看| 人妻久久一区二区| 国产亚洲福利社区一区| 中文在线字幕观看| 麻豆免费看一区二区三区| 成人一区二区免费视频| 99精品电影| 蜜桃导航-精品导航| 99综合久久| 国产精品国产亚洲伊人久久| 成人超碰在线| 中文字幕日韩在线视频| 神马久久高清| 精品国内二区三区| 国产又粗又大又爽| 91国产免费观看| 日本一区二区欧美| 亚洲欧美另类图片小说| 变态另类ts人妖一区二区| 成人成人成人在线视频| 成人三级做爰av| 久久精品国产精品亚洲综合| 99蜜桃臀久久久欧美精品网站| 欧美另类亚洲| youjizz.com亚洲| 国产一区二区电影在线观看| 久久精品午夜一区二区福利| 成人直播在线观看| 成人欧美一区二区三区黑人孕妇 | 久久精品人人做人人爽电影| 精品一区二区三区中文字幕在线| 国产精品久久久久久网站| 在线观看特色大片免费视频| 久久久久中文字幕2018| 亚洲电影视频在线| 成人444kkkk在线观看| 免费在线观看av网站| 日韩在线视频观看| 在线免费观看黄| 亚洲天堂av综合网| 韩国三级在线观看久| 日韩精品视频三区| 四虎精品成人免费网站| 亚洲韩国日本中文字幕| 少妇无码一区二区三区| 精品va天堂亚洲国产| 亚洲精品18在线观看| 精品伦理精品一区| 丰满人妻熟女aⅴ一区| 欧美www视频| 亚洲精品无amm毛片| 精品美女一区二区三区| 国产 日韩 欧美 精品| 精品国产露脸精彩对白 | 久久国际精品| 99久久伊人精品影院| 99a精品视频在线观看| 精品国产乱码久久久久久108| 日韩高清影视在线观看| 秋霞毛片久久久久久久久| heyzo久久| 五月天综合婷婷| 最新精品国产| av在线播放天堂| 亚洲制服少妇| 日日噜噜噜噜久久久精品毛片| 麻豆精品在线视频| 青青草精品在线| 波波电影院一区二区三区| 国产精品无码永久免费不卡| 国产欧美一区二区精品秋霞影院| 91免费在线看片| 一区二区三区色| 中日韩黄色大片| 欧美性生活久久| 国产视频在线一区| 亚洲成人av在线播放| 免费观看成年在线视频网站| 日韩中文字幕不卡视频| 色av手机在线| 日韩女优人人人人射在线视频| 日本成人在线网站| 国产美女精品久久久| 国产日产精品一区二区三区四区的观看方式 | 国产99久久| 性做爰过程免费播放| 国产精品久久久久久模特| 日韩高清第一页| k8久久久一区二区三区| 婷婷综合在线视频| 亚洲妇女屁股眼交7| 少妇一级淫片日本| 精品国产91洋老外米糕| 91福利在线视频| 午夜精品在线视频| 日韩黄色三级| 久久久久久久久久久一区| 91精品国产91久久久久久密臀| 成人免费观看cn| 蜜乳av一区二区| 国产人妻黑人一区二区三区| 国产精品三级av在线播放| 日本熟妇毛耸耸xxxxxx| 欧美绝品在线观看成人午夜影视| 亚洲av成人精品一区二区三区在线播放| 中文字幕日韩精品在线| 97久久人人超碰caoprom| 成人国产精品久久久久久亚洲| 亚洲理论电影片| 国产精品无码免费专区午夜| 日韩1区2区日韩1区2区| 精品中文字幕在线播放| 亚洲欧美成人一区二区三区| 日本黄色中文字幕| 亚洲国产小视频在线观看| 精品麻豆一区二区三区| 国产成人综合亚洲| 日韩av网站在线免费观看| 少妇久久久久久被弄到高潮| 麻豆高清免费国产一区| 欧美激情aaa| 午夜不卡av在线| 蜜臀久久99精品久久久| 欧美成人在线影院| 91精品网站在线观看| 日韩精品第一页| 久久av最新网址| 国产 中文 字幕 日韩 在线| 亚洲制服欧美中文字幕中文字幕| 国产美女自慰在线观看| 最近的2019中文字幕免费一页| 91精品影视| 乱色588欧美| 国产精品久久久久久久久久妞妞| 蜜臀aⅴ国产精品久久久国产老师| 亚洲视频在线观看一区| 最近国语视频在线观看免费播放| 亚洲欧美精品一区| 亚洲人体影院| 欧美午夜欧美| 久久久人人人| 91网站免费视频| 91久久线看在观草草青青| 精品视频二区| 国产精品第一视频| 日韩亚洲一区在线| 午夜免费看毛片| 日韩一区欧美一区| 国产ts变态重口人妖hd| 久久这里只有精品99| 年轻的保姆91精品| 日韩精品一区二区在线视频| 福利视频网站一区二区三区| 久久久久久久久精| 精品久久久久一区| 女厕盗摄一区二区三区| 精品九九九九| 日韩精品电影在线| 精品少妇一区二区三区密爱| 制服.丝袜.亚洲.另类.中文| 最新国产在线拍揄自揄视频| 成人一区二区在线| 国产欧美日韩综合一区在线播放 | 亚洲人妖av一区二区| www.日韩在线观看| 久久人人97超碰精品888| 一区二区美女| 三上悠亚在线一区二区| 亚洲三级久久久| 日韩永久免费视频| 日本精品久久久久久久| 日韩理论电影大全| 色婷婷一区二区三区在线观看| 亚洲大片在线观看| 欧美日韩影视| 国产色婷婷国产综合在线理论片a| 五月久久久综合一区二区小说| 麻豆tv在线观看| 日韩欧美精品免费在线| 秋霞成人影院| 国产亚洲情侣一区二区无| 日韩在线播放一区二区| www.xxxx日本| 亚洲精品一区中文| 免费成人高清在线视频| a级免费在线观看| av日韩在线网站| 在线观看亚洲国产| 欧美激情第三页| 欧美一区三区| 成人午夜精品无码区| 欧美午夜理伦三级在线观看| 久久亚洲资源| 色噜噜狠狠色综合网| 国产成人激情av| 亚洲高清在线看| 久久久久久久国产精品| 日韩精品免费一区二区三区| 国产欧美视频一区| 欧美三片在线视频观看| 大香伊人中文字幕精品| 亚洲一区二区三区色| 2020日本不卡一区二区视频| 精品人妻伦一区二区三区久久| 国产精品大陆在线观看|