精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

把MLA和稀疏激活帶到端側!港科大廣州和倫敦大學學院團隊聯合發布軟硬協同設計的邊緣語言模型PLM

人工智能 新聞
學術界在大規模模型結構實驗方面面臨諸多挑戰,而堅持從頭預訓練的團隊更是少之又少。

本文由 PLM 團隊撰寫,PLM 團隊是由香港科技大學(廣州)的校長倪明選教授,倫敦大學學院(UCL)AI 中心汪軍教授,香港科技大學(廣州)信息樞紐院長陳雷教授聯合指導。第一作者鄧程是香港科技大學(廣州)的研究助理,研究方向為端側大模型和高效模型推理;參與成員包括中科院自動化所的孫羅洋博士,曾勇程博士,姜紀文碩士,UCL 吳昕鍵,港科大廣州的博士生肖慶發和趙文欣,港科大的博士后王嘉川以及香港理工的助理教授(研究)李昊洋。通訊作者為鄧程博士,陳雷教授和汪軍教授。

在大模型「卷參數」的浪潮中,一個亟待解決的課題始終存在:如何讓百億級能力的 AI 跑進手機、嵌入設備、實現萬物互聯?內存墻、算力墻、I/O 墻這三座邊緣設備的「大山」令許多大模型鎩羽而歸。

近日,香港科技大學(廣州)倪明選校長和陳雷教授聯合 UCL 汪軍教授團隊以及中科院自動化所團隊聯合提出 PLM(Peripheral Language Model),通過算法 - 系統協同設計,選擇了適合邊緣設備的模型架構。

PLM 是首個結合 MLA 注意力機制與 ReLU2 激活 FFN 的架構。評估結果表明,PLM 的表現優于現有在公開數據上訓練的小型語言模型,性能接近利用 18T tokens 訓練的 Qwen2.5-1.5B 模型,同時保持最低激活參數數量。

其中,PLM 在通用知識理解(ARC)、數學(GSM8K)任務中表現出色,在代碼能力評測(HumanEval)基準上更是以 64.6 分位居榜首。

圖片

  • 項目論文:https://arxiv.org/abs/2503.12167
  • 項目網站:https://www.project-plm.com
  • 項目地址:https://github.com/plm-team/PLM
  • 模型地址:Hugging Face: https://huggingface.co/PLM-Team

團隊還將模型適配至多種邊緣設備,在 Snapdragon 等芯片上展現出優于同層數模型的吞吐優勢。PLM 團隊不僅開源模型權重,還提供了從架構設計到部署的完整技術報告,并計劃逐步開源訓練數據集及相關代碼腳本。

圖片

剖析 PLM:1+1 能否大于 2?

圖片

核心模塊一:Multi-head Latent Attention(MLA)—— 把 KV 緩存壓縮到極致

PLM 采用了 Deepseek 提出的 MLA(Multi-Head Latent Attention)注意力機制,并首次將其應用于 2B 參數以下的模型中。為適應端側系統的需求,PLM 對 Deepseek 的 MLA 進行了適度優化,去除了訓練階段用于降低成本的 Q 矩陣壓縮過程,同時保留了 KV 矩陣的 512 維度。此外,PLM 通過解耦的位置編碼機制,確保了模型對長程依賴信息的有效捕捉。

核心模塊二:平方 ReLU 激活 —— 讓計算「稀疏化」

PLM 通過去除門控機制簡化了前饋神經網絡,從而有效降低了計算復雜度和內存消耗。傳統 SwiGLU 激活函數導致 MLP 層計算密集,而 PLM 采用了 ReLU2 作為替代。ReLU2 是一種在性能和稀疏性之間實現最優平衡的激活函數,特別適合稀疏計算場景。其定義如下:

圖片

這個設計使得 MLP 層激活稀疏度達到 90.9%,整體計算量減少 26%。此外,從硬件角度出發,零值激活能夠觸發指令級優化。這一設計理念成功地將模型與系統的聯合優化整合到大語言模型架構中。

訓練策略:充分利用開源數據

三階段鍛造 PLM-1.8B

PLM 團隊精心設計了一條訓練流水線,僅使用未精細設計與配比的 2.48B 預訓練數據,PLM 性能就達到企業級水平。所有訓練數據均來自開源社區。

圖片

預訓練

圖片

第一階段累計約 1.65T 的 Token。這個階段中,學習率是屬于預熱和穩定的階段,模型的 Loss 也在 2.3 附近有收斂趨勢。第二階段累計約 550B 的 Token。在這個階段,模型的 Loss 隨著學習的衰減快速下降。第三階段累計約 280B 的 Token。

這個階段里,保持第二階段的最小學習率訓練,模型進行最后的高質量知識吸收,直到 loss 逐漸收斂。整個預訓練中,始終保持中英數據比例 5:2。  

圖片

SFT 階段

監督微調數據遵循「由淺入深」的數據準備方法,以漸進的方式進行監督微調過程。PLM 的 SFT 訓練分為基本指令微調和高難度指令微調。下面是各個階段的提升效果。

圖片

強化學習階段

PLM 在偏好訓練階段沿用了團隊先前提出的 ARIES 訓練方法,以解決經過一般的對齊學習會經多輪自我改進后,性能會顯著下降的問題。

圖片

性能實測:真的可以

PLM 采用獨特的模型架構,對比的基線模型涵蓋了當前最先進的 2B 參數量級模型,具體對比如下。 

圖片

實驗表明,PLM 表現頗具競爭力,平均分(57.29)位列第三,僅次于 Qwen2.5-1.5B(59.25)和 Yulan-Mini-2.4B(57.51)。PLM-1.8B 在 HumanEval 中獲得了所有模型中的最高分,在 ARC-C、ARC-E、MBPP 和 BoolQ 中排名第二,略遜于行業領先的 Qwen2.5-1.5B,需指出的是,Qwen 系列使用了 18T 閉源語料庫。

另一方面,與 Yulan-Mini-2.4B 相比,PLM-1.8B 在編碼和邏輯推理任務中旗鼓相當。此外,PLM 僅包含 1.8B 參數和 32 層(Yulan-Mini 為 56 層),推理延遲會較低。綜上所述,PLM-1.8B 在基本知識理解、編碼和簡單推理任務中表現強勁且可靠,是一款值得關注的模型。

圖片

場景實測:從服務器到樹莓派,全場景通吃

除了基本的模型能力評估,PLM 團隊還在在 5 類硬件平臺完成部署驗證,并給出了實際的吞吐量數據。

圖片

文章全面評估了不同硬件平臺和量化級別的各種邊緣大小 LLM 的推理延遲,包括高性能 GPU(NVIDIA A10、Orin NX)、Apple 的 M3 芯片、Qualcomm 的 Snapdragon 8 Gen 3 和 BCM2712 等嵌入式系統。

評估數據揭示了幾個顯著特征:MLA 的確增加了計算量,ReLU2 的確可以提升模型推理速度,模型層數會顯著影響端側設備上推理的速度。

PLM 團隊的實驗表明,這些關鍵點恰好觸及了端側計算中最需要關注的內存、算力和 I/O 三個核心維度。PLM 團隊通過模型與硬件的協同設計,在這一領域展現了其獨特的優勢。

算法層面,PLM 做到了稀疏性與低秩的平衡:MLA 壓縮 KV 緩存,ReLU2 激活削減計算,二者互補突破內存 - 算力瓶頸。系統層面,PLM 深度適配 TVM、llama.cpp 等框架,實現高效的量化與編譯優化。

理解 PLM 的 MLA 和稀疏激活

在實際探索中,MLA 的引入會顯著增加計算量。然而,PLM 通過舍棄 Q 矩陣的低秩壓縮來降低推理計算復雜度,并結合稀疏激活函數,成功避免了 MiniCPM3 在預填充或解碼階段的低效問題,從而在特定場景中展現出明顯優勢。

圖片


PLM 團隊在較長文本序列上評估了其模型性能,結果表明,當序列長度達到一定閾值后,PLM 的表現優于同深度的 GQA 模型 Fox。

因此,盡管 MLA 增加了計算負載,其對緩存利用率、推理效率和內存消耗的優化,使得 PLM 在邊緣設備上展現出高效、低延遲的性能,為實際應用提供了顯著優勢。

再來看 PLM 的稀疏化設計,在邊緣模型中展現出了更高的普適性與高效性。從系統角度來看,零計算已被高度優化,使得稀疏化在邊緣設備上的部署帶來顯著性能提升。

此外,由于邊緣設備的計算資源有限,模型通常無法完全加載到 GPU 或 RAM,需要 OffLoad 到緩存甚至存儲中。在此情況下,深度學習模型可采用分層加載,將當前所需參數調入計算單元。

因此,最小化每層計算量至關重要。PLM 通過 KV 緩存存儲與稀疏激活減少計算開銷,有效緩解該問題。

PLM 團隊實驗驗證了推理所需的最小參數量。他們對所有模型進行相同稀疏化(即將激活函數后的最小值設為 0),并測試保持建模性能(困惑度下降 1)所需的最少參數量(如下圖)。

圖片

具體而言,PLM 團隊繪制了稀疏率(0~1)與困惑度差異的關系圖,以分析神經激活減少的性能成本。不同模型的曲線揭示了各自對稀疏度的敏感性。理論上的「理想點」—— 完全稀疏且困惑度不增加 —— 是無法實現的,因為 MLP 層完全停用將損害模型質量。

圖片

在此背景下,PLM 展現出顯著優勢,僅需激活 74.3% 參數,MLP 稀疏率達 90.9%,遠低于同等規模模型,推理所需參數量最低。

PLM 團隊已全面開放資源,為社區提供了一個小型且易于使用的 MLA 模型,使科研工作者能夠在消費級顯卡上開展對 MLA 的研究。同時,PLM 為端側應用廠商提供了一個高性能的端側模型,拓寬了選擇范圍,并支持基于 PLM 稀疏激活架構的高效模型部署與開發。

結語

學術界在大規模模型結構實驗方面面臨諸多挑戰,而堅持從頭預訓練的團隊更是少之又少。PLM 團隊在計算資源有限和數據質量參差不齊的情況下,始終堅信開源社區提供的數據和技術能夠為學術界的持續探索提供強大支持。

未來,PLM 團隊將繼續致力于探索適用于邊緣設備的大模型,訓練更具創新性的架構,并實現更高效的邊緣設備部署。PLM 團隊認為,未來的語言模型不應僅僅是參數的堆砌,而應是效率與智能的精密平衡。PLM的探索,正是向著這一理想邁出的關鍵一步。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-14 13:40:00

2024-10-08 15:20:00

AI安全

2024-06-24 08:25:00

2025-07-04 08:47:00

大模型AI信息

2024-11-29 14:10:00

神經網絡AI

2025-03-19 09:10:00

2023-12-26 12:12:01

模型訓練

2025-05-26 09:16:00

2017-11-28 11:34:29

深度學習樹搜索二元處理機制

2022-04-12 15:05:22

機器人研究人工智能

2024-07-10 12:38:22

2025-01-02 13:41:53

2025-05-06 15:32:23

模型AI測試

2025-09-15 14:50:03

AI機器人開發

2023-12-07 06:52:54

AI化學

2020-08-06 09:51:38

人工智能犯罪技術

2022-01-17 17:34:38

人工智能機器學習技術

2024-11-04 10:20:00

模型數據

2025-06-30 08:51:00

2021-03-22 10:05:03

算法可視化大數據
點贊
收藏

51CTO技術棧公眾號

欧美老女人第四色| 欧美捆绑视频| 可以在线观看的av| 国内精品400部情侣激情| 婷婷av一区二区三区| 欧美日韩一区二区免费视频| 800av在线播放| 亚洲毛片在线观看.| 国产精品偷拍| 精品婷婷色一区二区三区蜜桃| 中文字幕日韩一区二区不卡| 欧美富婆性猛交| 日韩影视高清在线观看| 黄www在线观看| 欧洲人成人精品| 午夜精品一区二区三| 最近2019中文字幕mv免费看| 一区福利视频| 久久国产高清视频| 日韩成人在线播放| 久久久男人天堂| 久久精品国产99国产精品澳门| 日本乱理伦在线| http;//www.99re视频| 亚洲三级毛片| 成人免费av片| www.久久色.com| 欧美1级2级| 天天综合成人网| 美女性感视频久久| 无码视频在线观看| 97视频色精品| 成人精品gif动图一区| 一路向西2在线观看| 亚洲国产精华液网站w| 精品区在线观看| 亚洲一区二区精品在线观看| 一本色道88久久加勒比精品| 制服丝袜在线第一页| 欧美日韩综合在线| 国产精品一区二区三区av| 一个色的综合| 91精品国产综合久久久蜜臀图片| 一级久久久久久| 亚洲偷熟乱区亚洲香蕉av| 精品无人区麻豆乱码久久久| 欧美激情啊啊啊| 国产91精品一区二区麻豆亚洲| 尤物在线免费视频| 精品久久人人做人人爰| 好看的中文字幕在线播放| 自拍偷拍激情视频| 亚洲国产免费av| 97精品中文字幕| 免费黄色激情视频| 亚洲激情第一区| 欧美综合视频在线| 欧美国产一区二区在线| 欧美系列亚洲系列| 日韩精品一区国产| 六十路息与子猛烈交尾| 成人中文字幕+乱码+中文字幕| 成人福利视频网站| 亚洲欧美校园春色| 男人天堂av网| 欧美一区二区在线视频观看| 午夜欧美视频在线观看 | 精品无人乱码一区二区三区的优势| 日本视频一区二区三区| 熟妇无码乱子成人精品| 一区二区理论电影在线观看| 成人在线爆射| 国产中文字幕久久| 亚洲淫片在线视频| 天天色图综合网| 午夜精品国产| 美女网站在线看| 国产三级第一页| 97香蕉久久夜色精品国产| 成熟亚洲日本毛茸茸凸凹| 欧美日韩电影免费看| aaa在线视频| 一区二区三区国产福利| 日韩女优视频免费观看| 999视频精品| 在线激情免费视频| 99免费视频观看| 欧美久久久久久蜜桃| 蜜桃免费网站一区二区三区| 高清不卡一区| 国产永久免费高清在线观看视频| www.天天射.com| 夜夜嗨av一区二区三区中文字幕| 亚洲一区二区三区四区电影| 日韩精品手机在线| 特色特色大片在线| 日韩免费在线播放| 国产日韩三级在线| 国产精品婷婷| 123区在线| 国产精品老熟女一区二区| 国产成年人在线观看| 日韩欧美精品三级| 成人黄色大片在线观看| 欧美1区2区3| 在线一区日本视频| 国产精品影音先锋| av在线免费播放网站| 波多野结衣一区二区三区四区| 国内精品国产三级国产aⅴ久| 国产麻豆欧美日韩一区| av久久网站| www.av成人| 色综合久久88| 欧美亚洲精品一区| 狠狠色综合色综合网络| 91伦理视频在线观看| 青青草偷拍视频| 91国视频在线| 亚洲精品久久久久国产| 日韩三级不卡| 免费观看日批视频| 久草免费资源站| 国产成人小视频在线观看| 久久精品一区二区三区不卡| 久久精品日产第一区二区 | 亚洲精品影视| 亚洲四虎影院| 萌白酱视频在线| 国产一区二区三区精彩视频 | 欧美精品自拍偷拍动漫精品| 99a精品视频在线观看| 国产又大又硬又粗| 久久久久久99| 欧美资源在线观看| 一区二区三区四区亚洲| 久久99久久精品| 亚洲影视一区| 免费av一区| 午夜精品福利影院| 丁香花在线高清完整版视频| 成年人视频在线免费看| 蜜桃日韩视频| 日韩色在线观看| 亚洲男人天堂网站| 亚洲国产视频直播| 污片在线免费观看| 高清乱码免费看污| japanese在线播放| 992tv在线成人免费观看| 91国偷自产一区二区使用方法| 成人免费视频视频在线观看免费 | 999国产精品视频| 四虎国产精品永远| 日韩欧美一区二区三区久久婷婷| www.久久久久| 亚洲成人激情图| 777亚洲妇女| 最新69国产成人精品视频免费| 国产免费成人在线视频| 欧美 亚欧 日韩视频在线 | 精品一区二区三区国产| 日产精品99久久久久久| 国外成人性视频| 性欧美在线看片a免费观看| 亚洲日韩第一页| 高清不卡在线观看av| 国产一区二区三区在线观看免费视频 | 黄色免费网址大全| 日韩欧美一区二区三区久久婷婷| 国产精品久久久久久久久粉嫩av| 亚洲日穴在线视频| 岛国在线视频免费看| 男人天堂资源网| 37p粉嫩大胆色噜噜噜| 一本久道中文无码字幕av| 久久国产精品免费一区| 国产伦精品一区二区三毛| 国产成人午夜视频网址| 国产一区二区在线免费| 欧美另类在线观看| 久久精品亚洲国产| 欧美极品美女视频网站在线观看免费| 久久伊人色综合| 91啪亚洲精品| 免费成人av资源网| 午夜一级久久| 韩国三级一区| 午夜剧场免费看| 日韩欧美亚洲v片| 久久久久se| 欧美亚州在线观看| 蜜桃传媒视频麻豆第一区免费观看 | 无码国产色欲xxxx视频| 牛牛精品在线| 久9re热视频这里只有精品| 国产精品扒开腿做爽爽爽软件| 日本美女在线中文版| 国产精品日韩无码| 成人在线免费观看| 成黄免费在线| 动漫一区在线| 日韩福利在线视频| 中文字幕免费高清| 日韩人妻无码精品久久久不卡| 狠狠干视频网站| 特级西西人体4444xxxx| 日韩网红少妇无码视频香港| 国产成人愉拍精品久久| 日韩专区第一页| 久久综合偷偷噜噜噜色| 里番精品3d一二三区| 丝袜久久网站| 日本精品在线观看| 蜜桃在线一区| 欧美自拍一区| 欧美丝袜一区| 久久精品一区二区三区中文字幕| 日本一区二区免费在线| 欧美精品日韩综合在线| 国产午夜精品理论片a级探花| 亚洲久久久久久久久久| xxx欧美精品| 久久久久成人黄色影片| 国产91露脸合集magnet| 国产精品美女久久久久久久久| 亚洲午夜激情av| 欧美无乱码久久久免费午夜一区 | 丰满少妇一级片| 91欧美在线视频| 人人网欧美视频| 国产一区美女| 成人动漫精品一区二区| 国产成人免费视频网站高清观看视频| 26uuu亚洲综合色| 亚洲午夜精品网| 一区二区三区久久精品| 蜜臀av一级做a爰片久久| 国产欧美激情| 亚洲一级二级在线| 日韩电影中文字幕av| 韩国三级日本三级少妇99| 国产一二三四区在线观看| 性一交一黄一片| 天天爽夜夜爽夜夜爽精品| 嫩草研究院在线| 你懂得影院夜精品a| 99久久亚洲精品蜜臀| 久久久精品网| 99精品国产视频| 欧美日韩免费在线观看| 日韩一区二区在线观看| 亚洲香蕉成人av网站在线观看| 国产+人+亚洲| 欧美精品亚洲二区| 色偷偷噜噜噜亚洲男人的天堂| 不卡av在线播放| 国产99久久精品一区二区| 欧美人与物videos另类| 国产尤物av一区二区三区| 欧美性猛交乱大交| 日韩精品成人在线| 精产国品自在线www| 玖玖爱在线精品视频| av官网在线观看| 国产日产一区二区三区| 一区二区三区短视频| 精品一区二区三区四区五区| 欧美日韩一区二区国产| 久久精品一区二区三区av | 亚洲人xxxx| 亚洲第一区在线| 国产区精品在线观看| 亚洲欧美一区二区原创| 精品久久久久久亚洲| 色av中文字幕一区| 欧美成人小视频| 亚洲欧洲一区二区| 亚洲理论片在线观看| 亚洲国产精品久久久久久久| 粉嫩一区二区三区| 在线欧美亚洲| 精品一区在线看| 欧美日本国产一区| 最近2019中文字幕大全第二页| 国产在线精品一区免费香蕉| 午夜影院福利社| 中文在线观看免费网站| 亚洲欧美国产高清va在线播放| 国产99re66在线视频| 三区四区不卡| 国产欧美日韩精品一区| 亚洲精品videossex少妇| 亚洲xxx自由成熟| 蜜臀av午夜一区二区三区| 国产一级特黄视频| 91精品久久久久久久久久久| 亚洲视频视频在线| 国产欧美一区二区视频| 美女网站免费观看视频| 免费看的黄色录像| 欧美777四色影视在线| 看全色黄大色大片免费久久久| 国产乱码精品一品二品| 91精品福利在线一区二区三区| 欧美久久久久久久久久| 国产精品欧美日韩久久| 久久久久久久中文| 欧美一区二区三区不卡视频| 四虎4545www精品视频| 丝袜脚交一区二区| 在线国产亚洲欧美| 成人欧美一区二区三区黑人| 国产综合第一页| 日本乱人伦a精品| 一区二区冒白浆视频| 中国一级片在线观看| av免费不卡国产观看| 日韩精品一卡二卡三卡四卡无卡| 久久日文中文字幕乱码| 国产乱码字幕精品高清av| 欧美xxxxxxxxx| 欧美日韩一区二区三区免费| 偷拍夫妻性生活| 黄色免费网站在线观看| 亚洲国产第一| 在线精品国精品国产尤物884a| 国产精品久久久久久久一区探花| 成人午夜视频在线观看免费| www.亚洲激情| 一区二区三区四区视频免费观看| 91丨porny丨户外露出| 久久视频免费观看| 国产二区视频在线| 91视频免费进入| 在线免费黄色网| 欧洲成人一区二区三区| 日韩在线理论| 欧美视频在线观看免费| 亚洲一区影音先锋| 日韩中文字幕在线看| 国产91对白刺激露脸在线观看| 午夜精品久久久久久久96蜜桃 | 亚洲青青一区| 91小视频免费看| 中文日韩电影网站| 99久久99久久精品| 色丁香婷婷综合久久| 99国产精品久久久久久久成人热| 久久精品国产精品| 中国老女人av| 九九热在线视频播放| 污污视频在线免费| 丁香花电影在线观看完整版| 中文字幕亚洲在| 久热精品视频在线免费观看| 欧美成人免费高清视频| 国产黄色大片网站| 中文字幕一区二区三三| 天天综合色天天综合| 国精产品99永久一区一区| 日本亚洲欧美在线| 精品国产影院| 欧美日韩一区二区三区在线免费观看| 成人高h视频在线| 国产网址在线观看| 在线观看欧美| 国产精品久久久久影院老司| 日本精品一区二区三区在线| 亚洲第一色av| jizz在线观看视频| 亚洲日本免费| 色伦专区97中文字幕| 无码一区二区精品| 农村妇女一区二区| 在线视频一区二区三| 青青草原亚洲| 中文字幕永久在线| 一本色道久久综合一区| 精品呦交小u女在线| 欧美激情伊人电影| 激情六月天婷婷| 午夜小视频免费| av在线一区二区三区| 欧美亚洲国产日本| 欧美国产综合视频| 国产第一页在线播放| 中文有码一区| 精品国精品自拍自在线| 日本在线xxx| av在线官网| 国产亚洲综合在线| 国内精品久久国产| www亚洲视频| 91久久夜色精品国产按摩| 日韩一区二区三区观看| 15—17女人毛片| 伊人久久在线| 色噜噜狠狠色综合中国| 美女av免费在线观看|