精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

手機流暢運行470億大模型:上交大發布LLM手機推理框架PowerInfer-2,提速29倍

人工智能 新聞
即使是蘋果,目前也需要與OpenAI合作,通過將云端GPT-4o大模型嵌入到操作系統中來提供能力更強的服務。

蘋果一出手,在手機等移動設備上部署大模型不可避免地成為行業關注焦點。

然而,目前在移動設備上運行的模型相對較小(蘋果的是3B,谷歌的是2B),并且消耗大量內存,這在很大程度上限制了其應用場景。

即使是蘋果,目前也需要與OpenAI合作,通過將云端GPT-4o大模型嵌入到操作系統中來提供能力更強的服務。

這樣一來,蘋果的混合方案引起了非常多關于數據隱私的討論和爭議,甚至馬斯克都下場討論。

如果蘋果在操作系統層面集成OpenAI,那么蘋果設備將被禁止在我的公司使用。這是不可接受的安全違規行為。

圖片

既然終端側本地部署大模型的方案既讓手機用戶享受到AI強大的智能,又能保護好自己的隱私安全,為什么蘋果還要冒著侵犯隱私的風險選擇聯手OpenAI采用云端大模型呢?主要挑戰有兩點:

  • 手機內存不夠大:按照大模型的Scaling Law法則,模型參數越大,能力對應的也就越強,這就意味著能力更強的模型對內存的要求越高。
  • 手機算力不夠強:即使勉強把通過量化等手段把模型塞進手機了,推理速度也慢,適合的應用場景也就非常有限了。

為了解決上述挑戰,上海交大IPADS實驗室推出了面向手機的大模型推理引擎(目前論文已在arxiv公開)PowerInfer-2.0。

圖片

PowerInfer-2.0能夠在內存有限的智能手機上實現快速推理,讓Mixtral 47B模型在手機上達到11 tokens/s的速度。

與熱門開源推理框架llama.cpp相比,PowerInfer-2.0的推理加速比平均達到25倍,最高達29倍

為了充分釋放出PowerInfer-2.0框架的最大潛力,上海交大團隊還提出了配套的大模型優化技術Turbo Sparse,相關論文近期也上傳了arxiv,并且已經在業內引起關注。

圖片

另外值得一提的是,去年底上海交大團隊提出了針對PC場景的快速推理框架PowerInfer-1.0,在4090等消費級顯卡的硬件上,實現了比llama.cpp高達11倍的推理加速,曾連續三天登頂GitHub趨勢榜,5天獲得了5k的GitHub star,目前已達到7.1k star。

圖片

相比PC,手機的內存和算力受到的約束更多,那么這次的PowerInfer-2.0是如何針對手機場景加速大模型推理呢?

動態神經元緩存

首先,針對手機運行內存(DRAM)不足的問題,PowerInfer-2.0利用了稀疏模型推理時的一個特點:每次只需要激活一小部分神經元,即“稀疏激活”。沒有被激活的神經元即使不參與AI模型的推理計算,也不會對模型的輸出質量造成影響。

稀疏激活為降低模型推理的內存使用創造了新的機會。為了充分利用稀疏激活的特性,PowerInfer-2.0把整個神經網絡中的神經元分成了冷、熱兩種,并在內存中基于LRU策略維護了一個神經元緩存池。

近期頻繁激活的”熱神經元”被放置在運行內存中,而“冷神經元”只有在被預測激活的時候,才會被拉進內存,大幅降低了內存使用量。

圖片

其實冷熱神經元分類,是繼承自PowerInfer-1.0已有的做法。

而在去年12月,蘋果在面向端側的大語言模型推理方案“LLM in a Flash”中提出了和神經元緩存類似的“滑動窗口”技術。但這些工作主要針對的都是PC環境,直接遷移到手機環境,還會遇到新的難題。

首先手機平臺的硬件條件遠不及PC,無論是算力、內存總量還是存儲帶寬,都與PC存在較大差距。

其次,手機硬件平臺存在CPU、GPU、NPU三種異構的計算單元,十分復雜。各大硬件平臺宣發時都會強調一個總算力,實際上是把CPU、GPU、NPU提供的算力加起來。然而真正跑起大模型來,能不能高效利用各種異構算力還是個問題。

以神經元簇為粒度的異構計算

針對這一點,PowerInfer-2.0進一步把粗粒度的大矩陣計算分解成細粒度的“神經元簇”。

每個神經元簇可以包含若干個參與計算的神經元。對于不同的處理器,會根據處理器的特性來動態決定劃分出來的神經元簇的大小。

例如,NPU擅長于做大矩陣的計算,那么可以把所有神經元合并成一個大的神經元簇,一起交給NPU計算,這樣就可以充分利用NPU的計算能力。而在使用CPU時,可以拆出多個細粒度的神經元簇,分發給多個CPU核心一起計算。

具體而言,PowerInfer-2.0為模型推理的預填充階段(Prefill)解碼階段(Decoding)分別設計了兩套神經元簇的劃分方案:

預填充階段會一次性輸入很多token,基本上絕大部分神經元都會被激活,因此選擇使用大神經元簇交給NPU計算。CPU此時也沒有閑著,在后臺為NPU執行反量化模型權重的操作。

解碼階段每次只有一個token,具有較高的稀疏性,因此更加適合劃分成若干細粒度的神經元簇,交給CPU靈活調度和執行計算。

圖片

神經元簇這一概念除了能夠更好的適應手機的異構計算環境,還能天然地支持計算與存儲I/O的流水線并行執行。

PowerInfer-2.0提出了分段神經元緩存和神經元簇級的流水線技術,在一個神經元簇等待I/O的同時,可以及時地把另一個已經準備好的神經元簇調度到處理器上進行計算,從而充分隱藏了I/O的延遲。

同時,這種基于神經元簇的流水線打破了傳統推理引擎中逐矩陣計算的方式,可以允許來自不同參數矩陣的神經元簇交錯執行,達到最高的并行效率。

圖片

I/O加載神經元的速度對于模型推理也至關重要。

分段緩存會針對不同的權重類型采取不同策略(如注意力權重、預測器權重、前饋網絡權重)采取不同的緩存策略,提高緩存命中率,減少不必要的磁盤 I/O

緩存還會使用LRU替換算法動態更新每個神經元的實際冷熱情況,確保緩存中放著的都是最熱的神經元。此外PowerInfer-2.0還針對手機UFS 4.0存儲的性能特點,設計了專門的模型存儲格式,提高讀取性能。

最后再來看一下實測成績,使用一加12和一加Ace 2兩款測試手機,在內存受限的情況下,PowerInfer-2.0的預填充速度都顯著高于llama.cpp與LLM in a Flash(簡稱“LLMFlash”)

圖片

解碼階段同樣是PowerInfer-2.0占據很大優勢。特別是對于Mixtral 47B這樣的大模型,也能在手機上跑出11.68 tokens/s的速度:

圖片

而對于Mistral 7B這種可以放進手機運行內存的模型,PowerInfer-2.0可以節約40%內存的情況下,達到與llama.cpp和MLC-LLM同水平甚至更快的解碼速度:

圖片

PowerInfer-2.0是一個模型-系統協同設計的方案,也就是需要模型中可預測稀疏性的配合。

如何以低成本的形式調整模型以適配PowerInfer-2.0框架,也是一個重大挑戰。

低成本高質量地大幅提升模型稀疏性

傳統簡單的ReLU稀疏化會給模型原本的能力造成不小的影響。

為了克服這個問題,上海交大IPADS聯合清華和上海人工智能實驗室提出一個低成本地稀疏化方法,不僅大幅提升模型的稀疏性,還能保持住模型原本的能力!

圖片

首先,論文深入分析了模型稀疏化中的問題:

  • 在類LLaMA模型中中簡單引入ReLU,雖然能引入一定程度的稀疏性,但稀疏度仍然有限。
  • 稀疏化過程由于訓練語料的不足和訓練token的不足導致模型精度下降的問題。

為了提升模型的稀疏度,論文在ReLU基礎上提出dReLU激活函數,采用替換原有激活函數后繼續預訓練的方式增加模型稀疏性。

將SwiGLU替換為dReLU一方面直觀地提高了輸出值中的零元素比例,另一方面能更有效地在稀疏化的過程中復用原本模型訓練完成的gate和up矩陣權重。

圖片
圖片

為了克服模型能力下降的問題,團隊收集了包括網頁、代碼和數學數據集在內的多樣化繼續訓練語料庫。高質量、多樣化的訓練數據有助于模型在稀疏化后更好地保持和提升性能。

最后,團隊訓練了2個TurboSparse大模型進行驗證,分別是8x7B和7B的大模型。得益于高質量的繼續訓練語料,TurboSparse系列模型模型的精度甚至還能反超原版模型(具體見表6)。

圖片

而在稀疏度方面效果也非常顯著。相比于原本的Mixtral模型需要激活13B參數量,TurboSparse-Mixtral只需要激活4.3B的參數量,激活的參數量是原本模型的三分之一。

圖片

而關于稀疏化過程的成本問題,TurboSparse論文中介紹,改造過程中模型需要繼續訓練150B tokens,相比于預訓練(假設3T tokens)還不到5%,說明其成本是很低的。

讓技術加速走出實驗室

從推理框架和改造模型兩個角度出發,上海交大團隊的成果實現了大語言模型在手機等資源受限場景下的快速推理。

而且這套方案的潛力不止于手機,未來在車載設備、智能家居等方向還有更多應用前景。

最后再正式介紹一下團隊。上海交通大學并行與分布式系統研究所(簡稱IPADS),由陳海波教授領導,現有13名教師,100多名學生。

IPADS長期從事計算機系統的研究,近10年在權威榜單CSRankings的Operating Systems領域排名全球前二,僅次于MIT;上海交大也是排名前十中唯一上榜的亞洲高校。

圖片

目前,上海交大IPADS已經在Huggingface上開放了稀疏化的模型權重。在未來,如果PowerInfer-2.0能夠與手機廠商進一步緊密合作,相信可以加速相關技術走出實驗室,落地到各種真實場景。

PowerInfer-2論文:https://arxiv.org/abs/2406.06282
TurboSparse論文:https://arxiv.org/abs/2406.05955
模型權重:https://huggingface.co/PowerInfer/TurboSparse-Mixtral

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-05-30 14:17:00

模型推理

2024-02-01 08:34:30

大模型推理框架NVIDIA

2023-12-11 15:40:32

PyTorch代碼大模型

2024-10-09 13:42:29

2024-09-09 08:31:15

2023-09-25 12:17:36

AI模型

2023-07-05 14:01:50

AI技術

2023-12-13 12:55:39

模型數據

2025-07-28 09:06:00

2024-02-02 21:42:41

2024-06-18 14:01:17

2024-08-09 12:48:35

2023-05-23 14:06:53

微軟研究

2023-09-12 14:45:18

2025-09-12 09:03:00

2025-04-29 09:13:00

2024-10-22 09:17:07

2024-06-24 18:17:07

2024-09-13 06:32:25

2025-08-18 08:40:00

模型AI算法
點贊
收藏

51CTO技術棧公眾號

欧美精品成人一区二区三区四区| 97精品国产露脸对白| www亚洲欧美| 国产一级片中文字幕| av网站大全在线| 波波电影院一区二区三区| 2019中文字幕在线| 911国产在线| 国产伦乱精品| 欧美午夜理伦三级在线观看| 日本三级福利片| 日本黄色大片视频| 奇米色一区二区| 欧美成人免费在线视频| 蜜臀av一区二区三区有限公司| 日本在线中文字幕一区二区三区| 亚洲欧美成aⅴ人在线观看| 国产一区二区视频在线免费观看| 中文在线字幕av| 亚洲激情二区| 啊v视频在线一区二区三区| 少妇熟女视频一区二区三区 | 日韩激情综合| 韩曰欧美视频免费观看| japanese在线视频| 欧美日韩国产中文字幕在线| 国产一区二区三区国产| 国产成人精品一区| 日本视频www| 国产大片一区| 亚洲人午夜精品免费| 男人女人拔萝卜视频| 精品三区视频| 欧美日韩一区二区三区在线免费观看| 午夜啪啪免费视频| 精品亚洲综合| 99久久99久久精品免费观看| 91丝袜美腿美女视频网站| 在线免费观看av网址| 我不卡影院28| 中文字幕一区电影| 性高潮久久久久久久| 国产96在线亚洲| 日韩欧美国产综合在线一区二区三区| 亚洲黄色小视频在线观看| 涩涩视频网站在线观看| 亚洲五月六月丁香激情| 佐佐木明希av| 三级外国片在线观看视频| 国产亚洲精久久久久久| 欧美极品一区| 欧美777四色影视在线| 成人三级在线视频| 国产chinese精品一区二区| 国产一区二区在线不卡| 毛片av一区二区| 国产精品极品尤物在线观看 | 欧美日韩精品中文字幕| 黄色激情在线视频| 岛国毛片av在线| 亚洲成人综合在线| 成人免费在线网| 波多野一区二区| 午夜亚洲福利老司机| 欧美一级欧美一级| a√中文在线观看| 午夜av一区二区| 亚洲乱码中文字幕久久孕妇黑人| av成人 com a| 欧美日韩亚洲一区二区| 欧美成人精品欧美一级乱| 色老太综合网| 欧美日韩久久久一区| 在线黄色免费看| 清纯唯美激情亚洲| 亚洲精品在线三区| 久久久久久久无码| 国产精品三级| 深夜福利日韩在线看| 久久福利免费视频| 激情久久综合| 欧美一级片免费在线| 日韩电影在线观看一区二区| 青青草97国产精品免费观看 | 久久女同性恋中文字幕| 日本高清一区| 黄色的网站在线观看| 一级特黄大欧美久久久| 久操网在线观看| 男人最爱成人网| 欧美精品在线观看播放| 97超碰人人看| 亚洲丝袜美腿一区| www.亚洲成人| 日本熟妇毛耸耸xxxxxx| 老鸭窝91久久精品色噜噜导演| 国产精品久久久久久久久粉嫩av| 国产女人爽到高潮a毛片| 成人国产电影网| 日韩国产欧美精品| 国精一区二区三区| 欧美在线播放高清精品| 99国产精品免费视频| 亚洲毛片免费看| 操91在线视频| 亚洲欧美自拍视频| 国产麻豆精品在线观看| 国语精品中文字幕| 午夜在线观看视频| 偷窥少妇高潮呻吟av久久免费 | 国产精品一区二区免费不卡 | 欧美一级免费看| 国产又黄又爽视频| 久久久亚洲精品一区二区三区| 中文字幕中文字幕在线中一区高清| 不卡的av影片| 欧美日韩情趣电影| 亚洲蜜桃精久久久久久久久久久久| 色琪琪久久se色| 69av在线视频| 国产aⅴ爽av久久久久成人| 国产亚洲美州欧州综合国| 男人天堂av片| 99精品视频在线免费播放| 日韩电影第一页| 免费一级片在线观看| 美女视频网站久久| 人禽交欧美网站免费| 国产又色又爽又黄刺激在线视频| 欧美日韩一区二区三区不卡| 亚洲色图14p| 一区二区视频欧美| 51国偷自产一区二区三区| 精品视频三区| 亚洲6080在线| 国产视频精品视频| 亚洲91久久| 国产精品在线看| 你懂的视频在线观看| 亚洲一区二区三区中文字幕| 久久久久久久久久久久久久久国产| 久久91成人| 51精品国产黑色丝袜高跟鞋| 国产福利第一页| 亚洲欧美一区二区久久| 免费成年人高清视频| 精品久久影视| 日本最新高清不卡中文字幕| 天天色综合av| 午夜精品一区二区三区三上悠亚 | 日韩久久中文字幕| 暴力调教一区二区三区| 69sex久久精品国产麻豆| 警花av一区二区三区| 久久综合电影一区| 99久久精品日本一区二区免费| 国产精品久久二区二区| 亚洲一级免费在线观看| 青青草国产成人a∨下载安卓| 国产高清视频一区三区| 成人在线观看免费| 欧美日韩在线电影| 成人高潮免费视频| 国产一区 二区 三区一级| 国产精品久久成人免费观看| 成人av在线播放| 欧美成人激情视频免费观看| 性少妇videosexfreexxx片| 一区二区三区在线视频观看58| 国产男女无遮挡猛进猛出| 综合天堂久久久久久久| 成人三级在线| 竹内纱里奈兽皇系列在线观看 | 亚洲一区二区中文| 在线不卡日本v二区707| 精品福利视频一区二区三区| 亚洲黄色三级视频| 久久精品日产第一区二区三区高清版| 国产精品igao| 91av精品| 极品尤物一区二区三区| 91精品影视| 久久精品国产亚洲一区二区| 精品久久久免费视频| 亚洲成人免费在线观看| 女~淫辱の触手3d动漫| 美腿丝袜在线亚洲一区| 毛片av在线播放| 亚洲资源网你懂的| 国产日韩综合一区二区性色av| 色yeye免费人成网站在线观看| 日韩av网址在线观看| 中文字幕一区二区三区免费看| 一区二区三区在线观看动漫| 三级电影在线看| 激情综合网av| 无码精品a∨在线观看中文| 日韩一区二区中文| 国产亚洲欧美一区二区| 亚洲第一会所001| 欧美大秀在线观看| 第三区美女视频在线| 日韩一区二区免费电影| 手机在线看片1024| 亚洲精品欧美激情| 日韩精品电影一区二区| 国产乱码精品1区2区3区| 红桃av在线播放| 欧美日韩国产成人精品| 日韩欧美一区二区三区久久婷婷| 日韩精品中文字幕一区二区| 国产精品高清免费在线观看| 成全电影大全在线观看| 在线国产精品视频| 无码精品人妻一区二区三区影院 | 好吊色在线观看| 欧美三级在线看| 亚洲日本韩国在线| 尤物av一区二区| 特级西西人体高清大胆| 91视频免费观看| 欧美xxxxx少妇| 精品一区二区三区免费毛片爱| 91视频最新入口| 欧美黄色精品| 亚洲免费视频播放| 日韩在线综合| 日韩一区免费观看| 亚洲综合福利| 精品乱码一区二区三区| 日韩精品一级| 91在线视频成人| 欧美日韩视频免费看| 日本高清久久天堂| 国产精品vvv| 欧美精品久久久久a| 黄色网址在线免费播放| 自拍偷拍亚洲欧美| 草碰在线视频| 一二美女精品欧洲| 国产精品麻豆一区二区三区| 日韩高清av在线| 在线观看xxx| 亚洲国产精品人人爽夜夜爽| 亚洲AV无码一区二区三区性 | 欧美孕妇与黑人孕交| 羞羞污视频在线观看| 久久人人爽亚洲精品天堂| 亚洲精品传媒| 日韩在线观看你懂的| 91在线不卡| 最新中文字幕亚洲| 成人在线免费公开观看视频| 在线电影中文日韩| 91ph在线| 久久五月天色综合| sm国产在线调教视频| 久久国产精品视频| 任你弄在线视频免费观看| 欧美日韩爱爱视频| av福利导福航大全在线| 午夜精品久久久久久99热软件| 波多野结衣久久| 91精品国产高清久久久久久久久| 成入视频在线观看| 日本一区二区不卡| 欧美黄色a视频| 91免费看片网站| 视频二区欧美| 国产欧美日韩视频一区二区三区| а√中文在线天堂精品| 国产一区在线免费观看| 中文字幕亚洲影视| 亚洲高清在线播放| 影音先锋日韩精品| 久久视频这里有精品| 亚洲欧美日韩一区在线观看| 成年人免费大片| 久久99精品久久只有精品| 一区二区三区人妻| 99久久99久久综合| 久久视频一区二区三区| 一区二区三区小说| 久久夜色精品国产噜噜亚洲av| 欧美性大战xxxxx久久久| 国产强伦人妻毛片| 亚洲精品理论电影| 日本中文字幕在线观看| 欧美激情视频给我| 国模视频一区| 97超碰资源| 一道本一区二区三区| 一区二区欧美日韩| 亚洲精品系列| 亚洲综合欧美在线| 成人97人人超碰人人99| 美女av免费看| 亚洲成人综合视频| 一区二区视频免费| 亚洲大胆人体在线| 亚洲成人三级| 国产91精品久| 精品国产亚洲一区二区三区大结局| 国外成人在线视频网站| 日韩三级在线| 久久久亚洲精品无码| 久久国产夜色精品鲁鲁99| 亚洲图片综合网| ●精品国产综合乱码久久久久| www.av麻豆| 69成人精品免费视频| 男同在线观看| 久久久久久久久久久免费| 国产综合色在线观看| 国产区日韩欧美| 亚洲字幕久久| 在线免费av播放| 26uuu久久天堂性欧美| 国产1区2区3区4区| 欧美日韩亚州综合| 女人偷人在线视频| 久久久久久久国产| 警花av一区二区三区| 亚洲精品二区| 鲁大师影院一区二区三区| 亚洲天堂av网站| 一区二区三区在线视频免费| 91 中文字幕| 在线播放精品一区二区三区| 绿色成人影院| 精品1区2区| 激情久久久久久久| 性生活一级大片| 亚洲欧美日韩国产中文在线| 中文天堂在线视频| 在线亚洲欧美视频| 亚洲成av在线| 青青成人在线| 日本三级亚洲精品| 强伦人妻一区二区三区| 午夜精品久久久久久| 空姐吹箫视频大全| 欧美激情免费看| 都市激情亚洲| 免费不卡av在线| 成人国产精品免费观看动漫| 精品无码人妻一区二区三区品| 日韩欧美美女一区二区三区| 亚洲色图美国十次| 高清视频一区二区三区| 欧美久色视频| 插我舔内射18免费视频| 午夜精品久久久久久久久| 亚洲免费国产视频| 欧美精品xxx| 久久电影在线| 黄色动漫网站入口| 久久精品一区二区三区不卡牛牛| 亚洲日本视频在线观看| 亚洲欧美日韩综合| 美女色狠狠久久| 一区二区三区日韩视频| 激情综合色播激情啊| 婷婷在线精品视频| 精品成人一区二区三区四区| 高清在线视频不卡| 欧美精品欧美精品| 日韩国产在线观看一区| 在线观看免费黄色网址| 91精品国产综合久久久久久久久久| 黄色片免费在线观看| 国产精品一区二区你懂得| 国产精品美女| www.黄色在线| 欧美一卡二卡三卡| 激情黄产视频在线免费观看| 久久99精品久久久久久水蜜桃 | gai在线观看免费高清| 亚洲精品欧美激情| 天堂а在线中文在线无限看推荐| 欧美亚洲成人xxx| 日韩专区精品| 日本一级大毛片a一| 日韩欧美国产免费播放| 日韩av中文| 亚洲国产精品一区二区www在线| 久久久全国免费视频| 日韩成人在线视频| 福利精品在线| av在线com| 久久婷婷一区二区三区| 夜夜嗨av禁果av粉嫩avhd| 欧美另类极品videosbest最新版本 | 亚洲人被黑人高潮完整版| 成人午夜免费在线观看| 奇门遁甲1982国语版免费观看高清| 欧美精品系列| 日本精品一二三区| 91国产丝袜在线播放| 午夜伦理大片视频在线观看|