精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

百元級硬件流暢運行百億參數大模型!上交&本智激活開源端側原生大模型

人工智能 新聞
今天,上海交通大學IPADS研究所、上海交通大學人工智能學院聯合初創公司本智激活(Zenergize AI),在HuggingFace開源了端側原生大模型SmallThinker。

AI的下一個戰場,不在云端,而在你的口袋里。

iPhone、華為、三星、小米、OPPO等各大手機廠商幾乎都在將大模型塞進手機,端側AI已然成為兵家必爭之地。

背后的邏輯清晰而堅定:最懂你的AI,必須能安全地訪問你的個人數據——郵件、照片、日程,而這一切的前提,就是將計算留在本地,將隱私還給用戶。

然而,想讓AI在本地流暢運行,遠比想象的要難得多。最好的證據,莫過于財力雄厚、軟硬一體的蘋果,其雄心勃勃的Apple Intelligence計劃也未能如期而至,核心AI功能不得不推遲到明年。

這無疑向整個行業釋放了一個清晰的信號:端側AI,是一塊難啃的硬骨頭。

正當全球科技巨頭在端側AI的道路上艱難探索時,一股產學研深度融合的新興力量,給出了獨有的解決路線。

今天,上海交通大學IPADS研究所、上海交通大學人工智能學院聯合初創公司本智激活(Zenergize AI),在HuggingFace開源了端側原生大模型SmallThinker。

該系列模型采用為端側算力、內存、存儲特性而原生設計的模型架構,并從零開始預訓練,具體包含兩個尺寸的稀疏模型,分別是SmallThinker-4B-A0.6B和SmallThinker-21B-A3B,模型也已開源,鏈接如下。

  • https://huggingface.co/PowerInfer/SmallThinker-21BA3B-Instruct
  • https://huggingface.co/PowerInfer/SmallThinker-4BA0.6B-Instruct

其顯著特征,就是用端側CPU即可快速推理,不再依賴高端GPU。其中,4B模型在1GB峰值內存下的推理速度達到驚人的19.41 tokens/s。

而更令人矚目的是,21B旗艦稀疏模型,在一塊百元級的國產RK3588開發板上,實現了相較于同等能力的主流模型(Qwen-14B)高達21倍的推理加速,將同類解決方案遠遠甩在身后。

SmallThinker:端側原生大模型

主流大模型,從出生起就是為云端成千上萬TOPS算力、TB級顯存的GPU集群“量身定制”的。想把它們塞進算力、內存等都不到云端5%的端側設備,傳統方法只有“壓縮”。

這就好比讓一個“博士生”模型,通過蒸餾、量化等手段,強行“降智”,最終變成一個只會簡單問答的“小學生”,犧牲了太多智能。

是否存在一種不做“模型降智”,而是一步到位的選擇?

為了實現這一目標,SmallThinker系列針對端側的弱算力、小內存、慢存儲,設計了創新的大模型架構,并從零開始預訓練,實現了與端側硬件的“精巧匹配”。

圖片

具體來說,這一端側原生的大模型架構主要擁有三大核心技術特性:

第一,端側算力原生的雙層稀疏架構,稀疏度提升5倍。

傳統的MoE(混合專家模型)只在專家層面是稀疏的。而SmallThinker在此基礎上,增加了專家內部的神經元稀疏。

這就好比,模型不僅能精準調用最相關的專家知識,還能只激活專家知識庫里最核心的部分,避免“復述全部所學”,對端側算力的要求大大降低。

圖片

第二,端側存儲原生的專家路由前置,顯著隱藏IO開銷。 

在內存資源受限的端側,通常模型權重不能完全放置在內存里,需要在推理過程中動態從慢速存儲(比如SSD、UFS等)加載模型專家權重,而在這個過程中,端側的慢速I/O會嚴重影響推理速度。

傳統方案是算完注意力,再計算路由,最后排隊等待加載專家。

而SmallThinker在模型架構中就原生提供了機制,幫助預判需要哪個專家,在進行注意力計算的同時,就去異步加載專家。

做到了“邊檢查邊傳喚”,將I/O等待時間隱藏在注意力計算的過程中。

圖片

第三,端側內存原生的混合稀疏注意力,KV緩存占用下降76%。 

針對長文本場景,SmallThinker設計了“略讀”+“精讀”的混合注意力機制。它使用滑動窗口注意力(Sliding Window)進行高效的“略讀”,同時保留全局注意力的能力進行“精讀”。

兩種方式組合,在處理16K文本時,相比傳統GQA機制,KV緩存占用降低76%,讓端側設備也能輕松處理長文檔

圖片

生態兼容性與極致性能:SmallThinker與PowerInfer的完美結合

一個真正優秀的開源模型,不僅自身要強大,更要擁抱廣闊的開放生態。SmallThinker模型系列在設計上充分考慮了開發者的使用習慣,能夠無縫兼容HuggingFace Transformers、vLLM、SGLang、llama.cpp、KTransformers等一系列主流推理框架。

在硬件適配上,它實現了對英特爾、英偉達、高通等主流芯片,甚至已經可以在國產鴻蒙操作系統上進行推理。這種開箱即用的靈活性,極大地降低了開發者的使用門檻。

而要體驗SmallThinker最極致的端側加速與內存優化效果,則需要使用團隊為其量身打造的端側原生Infra——PowerInfer(https://github.com/SJTU-IPADS/PowerInfer/blob/main/smallthinker/README.md)。

PowerInfer是團隊于2023年12月開源的業界首個稀疏大模型端側推理框架,發布后迅速獲得全球開發者的高度關注,目前GitHub星標已達8.2K,并曾連續兩天蟬聯GitHub全球項目趨勢榜第一。

它能夠深度激活SmallThinker原創的雙層稀疏架構,在推理時只調用必要的專家及神經元,并能在不影響推理速度的情況下降低內存占用。

它就像是為SmallThinker這臺“F1賽車”專門打造的引擎,為開發者提供了一套從模型到部署、真正完整的全棧優化解決方案。

SmallThinker模型智力與推理性能兼具

理論再好,也要看療效。SmallThinker團隊交出的,是一份模型能力與端側推理性能兼備的答卷。

為了真正實現“端側原生”,團隊從零開始預訓練,基于高質量數據語料,訓練了兩種規模的模型:

  • SmallThinker-4B-A0.6B:基于2.5T Tokens數據預訓練,擁有40億參數,激活6億參數,主打極速響應。
  • SmallThinker-21B-A3B:基于7.5T Tokens數據預訓練,擁有210億參數,激活30億參數,主打旗艦性能。它能夠在百元級RK3588上流暢部署,全內存情況下的CPU推理速度也能達到10.84 tokens/s。

口說無憑,評測見真章。

在MMLU、GPQA等多個權威評測基準上,SmallThinker的智力水平均超越了同尺寸甚至更大尺寸的開源模型,充分證明了其“原生”架構設計的優越性。

圖片

而在更關鍵的實際運行性能上,當SmallThinker與PowerInfer結合時,其在內存約束場景下的優勢盡顯。團隊在旗艦移動平臺和個人電腦PC上,對業界主流模型進行了正面硬剛。

場景一: 手機極限內存瓶頸 (1GB RAM)

在主流手機上,SmallThinker-4B-A0.6B模型的Q4量化版本,在僅調用4個CPU核心的情況下,推理速度便高達79 tokens/s。

而在對模型架構與推理框架構成終極考驗的極限內存瓶頸(1GB)場景下,SmallThinker的優勢則體現得淋漓盡致;4B模型依然跑出了19.91 tokens/s的流暢速度。

作為對比,Qwen3-1.7B模型速度僅為1.07 tokens/s,幾乎無法正常使用。

近19倍的性能差距,充分證明了SmallThinker在極端資源受限環境下的卓越運行能力。這不僅是一次技術的勝利,更是將高端AI平民化的關鍵一步。

場景二: 主流PC配置(8GB RAM)

當內存放寬到旗艦PC的8GB時,SmallThinker的架構優勢依然顯著。

SmallThinker-21B-A3B的4核CPU(Intel i9 14990K)推理速度達到20.30 tokens/s,而Qwen3-30B-A3B的4核CPU速度為 10.11 tokens/s,加速比達到2倍。

未來展望:不止于此,通往端側原生智能

在這訓練過程中,團隊發現;即使在如此龐大的數據投喂之后,模型的loss曲線仍在穩步下降,仍未達到飽和。

未來,團隊會圍繞兩條路線演進。

第一條路線,繼續Scaling:更大更強。

既然模型尚未“吃飽”,那么最直接的路徑就是——繼續投喂。

團隊的下一步計劃,將繼續遵循被驗證有效的Scaling Law,利用更多的高質量Tokens進行進一步訓練。進一步壓榨模型潛力,在知識儲備、邏輯推理和代碼生成等核心能力上,將SmallThinker推向新的高度,打造出更強大的端側基礎模型。

第二條路線,打造“個人賈維斯”:從模型到可信賴的智能體。

如果說Scaling Law是讓模型變得更“博學”,那么團隊的終極野心,則是打造一個真正屬于每個人的“賈維斯式”智能體。

這個智能體的獨特之處在于,它完全運行在你的個人設備上,能夠安全、完整地理解你的全部數字生命——從郵件、日程,到聊天記錄和相冊。正是在這片獨一無二的私有數據土壤之上,才能生長出“千人千面”、真正懂你的可信賴AI。

相信未來,隨著端側原生AI能力的不斷進步,未來的AI能力就會像今天的水和空氣一樣,主動融入我們每個人的日常工作和生活,提供安全私密、成本低廉、充滿智慧的AI體驗。

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-08-20 07:52:56

語言模型參數PaLM

2023-12-01 12:31:22

AI模型

2024-02-02 21:42:41

2025-08-27 16:05:39

2025-07-08 03:22:00

大模型參數AI

2023-10-31 17:26:09

2025-09-24 03:00:00

2024-09-10 12:11:18

2025-04-30 16:48:07

2024-08-07 13:00:00

2024-11-06 09:47:00

2023-09-19 21:09:18

百度人工智能

2024-06-03 08:30:00

點贊
收藏

51CTO技術棧公眾號

日韩一级特黄毛片| 国产精品精品一区二区三区午夜版 | 一区二区三区欧美亚洲| 91精品国产99久久久久久红楼 | 五月婷婷综合在线观看| 亚洲日本网址| 国产精品久久久久三级| 国产成人看片| 中文字幕日日夜夜| 国产综合激情| 伊人成人开心激情综合网| 日韩欧美中文在线视频| 2019中文字幕在线电影免费 | 久久国产精品高清| 亚洲中文字幕在线一区| 国模 一区 二区 三区| 亚洲色图在线观看| 亚洲精品成人无码毛片| av在线不卡精品| 亚洲一区二区三区在线看| 日本免费高清不卡| 黄色福利在线观看| 久久99精品久久久久久国产越南| 久久久久五月天| 成人精品一二三区| 理论片一区二区在线| 欧美日韩国产中文| 日av中文字幕| 国产三级伦理在线| 18成人在线视频| 欧美一二三区| 污污网站免费在线观看| 国产一区二区免费看| 国产ts一区二区| 四虎成人精品永久免费av| 999久久久免费精品国产| 日韩电影中文字幕av| 男人操女人下面视频| 日本精品在线一区| 色老头久久综合| 男人靠女人免费视频网站| 午夜成年人在线免费视频| 中文一区二区在线观看| 欧美日韩亚洲一区二区三区在线观看 | 欧美视频三区在线播放| 欧美精品一区免费| 草草在线视频| 亚洲电影在线播放| 国风产精品一区二区| 毛片在线播放a| 国产精品免费免费| 视频一区国产精品| av网站在线免费观看| 久久先锋影音av鲁色资源网| 国产日韩欧美综合精品| 国产综合视频在线| 国产不卡视频一区| 国产v亚洲v天堂无码| 精品国产免费无码久久久| 狠狠色狠狠色综合| 92裸体在线视频网站| 国产精品人人妻人人爽| 老鸭窝一区二区久久精品| 国产精品吴梦梦| 在线不卡免费视频| 久久激情综合网| 国产综合在线观看视频| 国产又黄又爽视频| 国产成人一区二区精品非洲| 69174成人网| 亚洲AV无码一区二区三区少妇| 国产激情一区二区三区| 国产精品jizz视频| 神宫寺奈绪一区二区三区| 99久久精品免费看| 青娱乐一区二区| www日韩tube| 亚洲三级在线免费观看| 成年丰满熟妇午夜免费视频 | 天天插天天干天天操| 91在线精品一区二区| 日韩av一级大片| 老司机精品视频在线观看6| 亚洲精品少妇30p| 男女超爽视频免费播放| 自拍网站在线观看| 欧美日韩一区在线| 免费观看一区二区三区| 欧美亚洲大陆| 日韩中文字幕视频| 美女视频黄免费| 久久精品九九| 成人免费看黄网站| 视频二区在线观看| 中文字幕欧美日韩一区| 久久久99精品视频| av日韩电影| 91精品国产高清一区二区三区 | 一区二区在线观看不卡| 无码播放一区二区三区| 日本久久一区| 日韩av在线影院| 男人晚上看的视频| 一本久久综合| 91精品久久久久久久久久入口 | 日本午夜免费一区二区| 亚洲精品在线观| 免费91在线观看| 亚洲精品1区2区| 91精品免费视频| 日本v片在线免费观看| 久久精品福利| 亚洲色图av在线| 久久高清免费视频| 九色综合狠狠综合久久| 精品国产综合区久久久久久| 午夜免费播放观看在线视频| 午夜免费久久看| 91pony九色| 国产欧美日韩精品一区二区免费| 欧美日韩成人在线视频| 亚洲天天综合网| 久久在线观看免费| 成年人网站国产| 日韩三级成人| 国产亚洲欧美日韩一区二区| 豆国产97在线 | 亚洲| 精品在线播放免费| 欧美一级爱爱| www.成人影院| 日韩精品免费看| 中文字幕一区二区三区手机版 | 久久久久久久久久久国产精品| 91精品秘密在线观看| 国产精品电影网站| 日韩美女一级视频| 午夜精品成人在线| 少妇熟女视频一区二区三区| 国产精品7m凸凹视频分类| 国产成人精品最新| 欧美香蕉爽爽人人爽| 午夜不卡av在线| 日本wwwwwww| 午夜久久影院| 亚洲一区二区三区视频播放| av播放在线观看| 欧美午夜电影一区| 微拍福利一区二区| 日韩高清不卡一区二区三区| 激情视频在线观看一区二区三区| 国产丝袜在线播放| 亚洲国产成人久久综合一区| 国产无遮挡免费视频| 国产91露脸合集magnet| avav在线播放| 白嫩白嫩国产精品| 欧美精品久久久久久久免费观看| 国产夫绿帽单男3p精品视频| 一区二区三区中文字幕电影| av天堂一区二区| 亚洲国产高清一区二区三区| 久久av免费一区| 欧美18av| 日韩小视频在线| 国产99久久九九精品无码免费| 一区二区三区鲁丝不卡| 人妻av一区二区| 久久国产欧美| 久久久国产精华液999999| 国产美女亚洲精品7777| 高清欧美一区二区三区| 丝袜视频国产在线播放| 欧美日韩午夜剧场| 五月激情四射婷婷| 国产精品一区在线| 无罩大乳的熟妇正在播放| 国产免费av一区二区三区| 91久久精品美女| 草草视频在线| 色噜噜狠狠狠综合曰曰曰88av| 国产成人精品白浆久久69| 亚洲一区二区高清| 欧美图片第一页| 蜜桃视频在线观看一区| 日本大片免费看| 久久99视频| 亚洲综合色av| 中日韩脚交footjobhd| 伊人成人开心激情综合网| 亚洲网站免费观看| 亚洲成人动漫av| 美女被到爽高潮视频| 卡一卡二国产精品| 中文字幕超清在线免费观看| 一区二区三区国产好| 91禁国产网站| 第一页在线观看| 在线电影国产精品| 日本三级中文字幕| 国产欧美日韩视频一区二区| 99精品999| 99精品视频免费观看| 日本一区二区久久精品| 日韩美女在线| 性欧美xxxx交| 暖暖日本在线观看| 亚洲福利视频专区| 国产精品高清无码| 亚洲自拍偷拍麻豆| 91激情视频在线观看| 国产一区二区毛片| 久草青青在线观看| 欧美一区二区三区久久精品| 欧日韩一区二区三区| 国产精品视频一区二区三区综合 | 精品一区二区在线看| 成人短视频在线看| 国产在线日韩精品| 成人av资源网| 九色成人搞黄网站| 欧美成人四级hd版| 在线观看免费版| 亚洲精品国产精品国自产在线| 中文字幕一区二区三区波野结| 亚洲一区在线观看视频| 91成人在线免费视频| 91在线观看下载| 亚洲一区二区偷拍| 老妇喷水一区二区三区| 黄色一级片黄色| 欧美在线资源| 亚洲春色在线视频| 日韩av三区| 亚洲最大的成人网| 伊人久久一区| 国产精品91久久久久久| 精精国产xxxx视频在线中文版| 国产亚洲一级高清| 国产精品秘入口| 日韩经典一区二区三区| 精品毛片一区二区三区| 欧美日韩在线播放一区| 亚洲视频在线观看免费视频| 欧美性猛交xxxx免费看久久久| 国产小视频在线观看免费| 国产精品久久影院| 性生交大片免费全黄| 久久精品日产第一区二区三区高清版| 蜜桃色一区二区三区| 国产在线一区二区综合免费视频| 爱爱爱爱免费视频| 欧美a级一区二区| 黄色a级片免费| 一区二区福利| 国产精品亚洲a| 男人的天堂亚洲| 91猫先生在线| 青娱乐精品在线视频| 国产综合免费视频| 国产精品婷婷| 男人操女人免费软件| 日韩电影在线免费看| 中文字幕无码不卡免费视频| 亚洲一区图片| 超碰97人人射妻| 麻豆久久一区二区| 国产精品自拍视频在线| 美女性感视频久久| 亚洲一区二区三区四区精品| 国产米奇在线777精品观看| 一区二区在线播放视频| 日本不卡的三区四区五区| 日本老熟妇毛茸茸| 男女性色大片免费观看一区二区| xxxx一级片| 国产一区亚洲一区| 少妇欧美激情一区二区三区| 国产精品一区二区果冻传媒| 黄色在线免费播放| 丁香婷婷综合五月| a天堂视频在线观看| 中文一区在线播放| 欧美黑人性猛交xxx| 亚洲永久精品大片| 狠狠人妻久久久久久| 色香色香欲天天天影视综合网| 欧美一区二区三区网站| 欧美日韩午夜在线视频| 国产99久一区二区三区a片| 亚洲精品一区二区三区香蕉| 日本大臀精品| 深夜福利日韩在线看| www免费视频观看在线| 久久久久久高潮国产精品视| 日日夜夜天天综合| 亚洲影院高清在线| 国产主播性色av福利精品一区| 日韩国产精品一区二区三区| 99久久.com| 成年人网站国产| 日韩电影在线一区二区| 天天躁日日躁狠狠躁av麻豆男男| 国产色婷婷亚洲99精品小说| 一级片一级片一级片| 日韩欧美高清在线视频| 国产又粗又猛又爽又黄的| 亚洲成av人影院在线观看| 久草视频在线看| 久久视频免费在线播放| 理论不卡电影大全神| 欧美一级高清免费| 亚洲精选av| 色一情一乱一伦一区二区三欧美| 亚洲综合色站| 中文久久久久久| 成人在线一区二区三区| 日本性高潮视频| 欧美日韩亚洲一区二区三区| 国产精品-色哟哟| 亚洲精品丝袜日韩| caoporm免费视频在线| 欧美在线性视频| 婷婷久久免费视频| 欧美精品一区二区视频| 欧美国产91| 欧美一级特黄aaa| 国产女人aaa级久久久级 | 一区二区三区精品在线| 欧美黄色一级大片| 亚洲精品97久久| 50度灰在线| 国产精品男女猛烈高潮激情| 欧美美女啪啪| 国产欧美精品aaaaaa片| 精品一区免费av| av在线网站观看| 欧美视频一区二区三区…| 国内精品久久久久久久久久 | 欧美少妇性生活视频| av电影一区二区| 久久久美女视频| 91精品国产乱| 影音先锋男人资源在线| 国产精品自拍小视频| 国产一区二区三区四区二区| 缅甸午夜性猛交xxxx| 99国产精品久久久久| 久久中文字幕无码| 日韩一级高清毛片| 天堂8中文在线| 亚洲999一在线观看www| 97精品在线| 国产裸体视频网站| 亚洲精品成人在线| 国产亲伦免费视频播放| 色综合久综合久久综合久鬼88 | 亚洲欧美日韩精品一区二区| aaa黄色大片| 亚洲亚洲精品在线观看| 日韩一卡二卡在线| 国语自产偷拍精品视频偷| 超碰成人在线免费| 无码精品a∨在线观看中文| 91小视频在线观看| 91国产丝袜播放在线| 亚洲视频第一页| 欧美free嫩15| 免费观看国产成人| 免费成人在线观看视频| 国产白丝一区二区三区| 在线免费观看日韩欧美| 日本不卡三区| 亚洲www视频| 亚洲小说欧美另类社区| 成人欧美精品一区二区| 午夜久久久久久久久久一区二区| 欧美在线一卡| 国产精品小说在线| 911久久香蕉国产线看观看| 久草视频福利在线| 岛国av一区二区三区| 伦理片一区二区三区| 91嫩草在线视频| 一区在线视频观看| 亚洲欧美日韩偷拍| 欧美日韩国产经典色站一区二区三区| 日本中文字幕在线看| 国内精品久久久久久久果冻传媒| 国产亚洲毛片在线| 永久免费av无码网站性色av| 日韩欧美色电影| 黄毛片在线观看| 亚洲mv在线看| 成人av手机在线观看| 99精品人妻国产毛片| 综合136福利视频在线| 大陆精大陆国产国语精品| 欧美日韩激情视频在线观看 | 婷婷色中文字幕| 亚洲护士老师的毛茸茸最新章节|