如何在移動端運行Gemma 3n？

作者：布加迪 2025-08-08 08:07:48

Gemma 3n是谷歌Gemma 開放模型系列的成員之一，它旨在在智能手機等資源匱乏的設備上順暢運行。Gemma 3n擁有約30億個參數，兼顧性能與效率，是智能助手、文本處理等設備端AI任務的理想之選。

譯者 | 布加迪

審校 | 重樓

有沒有想過，你的口袋里也能裝下一個強大的AI助手？它不僅僅是一個應用程序，更是一個先進智能、可配置、私密且高性能的AI語言模型？不妨認識一下Gemma 3n。這不僅僅是另一種科技潮流，而是將高性能語言模型徑直放在你的手機上。無論你是在列車上構思博客創意、在旅途中翻譯信息，還是僅僅想探索AI的未來，Gemma 3n 都能為你帶來極其簡單、極其愉悅的體驗。不妨逐步了解如何在你的移動設備上發揮AI的魔力。

什么是Gemma 3n？

Gemma 3n性能與基準測試

Gemma 3n專為在低資源設備上實現速度和效率而設計，是谷歌開放式大語言模型家族的最新成員，專為移動設備、平板電腦及其他邊緣硬件設計。以下是對其實際性能和基準測試的簡要評估：

模型大小和系統要求

模型大小：E2B（50億個參數，有效內存20億）和 E4B（80億個參數，有效內存40 億）。
RAM 要求：E2B僅需2GB RAM即可運行，E4B僅需3GB RAM即可運行——完全在大多數現代智能手機和平板電腦的能力范圍之內。

速度與延遲

響應速度：生成首次響應的速度比以往的設備端模型快1.5倍，在最新的移動處理器上吞吐量通常為60到70個token/秒。
啟動與推理：首個token生成時間短至 0.3 秒，使聊天和助手應用程序能夠提供迅速響應的體驗。

基準測試分數

LMArena排行榜：E4B是首個得分超過1300分的10B以下參數模型，在各種任務中的表現均優于類似大小的本地模型。
MMLU分數：Gemma 3n E4B得分約48.8%（代表扎實的推理能力和常識）。
智能指數：E4B 約為28，在10B以下參數規模的所有本地模型中頗具競爭力。

質量與效率創新

量化：支持4位和8位量化版本，質量損失降至最低，可在僅配備2-3GB RAM的設備上運行。
多模態：E4B模型可在設備端處理文本、圖像、音頻甚至短視頻，包含高達32000個 token 的上下文窗口（遠高于同級別的大多數競爭對手）。
優化：充分利用多種技術，比如逐層嵌入（PLE）和參數選擇性激活，并使用MatFormer來最大化速度、最小化RAM占用資源，并在占用空間較小的情況下生成高質量的輸出。

Gemma 3n 在移動端的優勢是什么？

隱私：一切都在本地運行，因此你的數據將得到保密。
速度：設備端處理意味著更快的響應時間。
無需互聯網：即使在沒有互聯網連接的情況下，移動端也能提供許多功能。
定制：將Gemma 3n與你想要的移動應用程序或工作流程結合使用。

先決條件

一部現代智能手機（安卓或iOS），有足夠的存儲空間，至少6GB RAM 以提升性能。對安裝和使用移動應用程序有一番基本的了解。

在移動設備上運行Gemma 3n的逐步指南

第1步：選擇合適的應用程序或框架

許多應用程序和框架支持在移動設備上運行比如Gemma 3n等大語言模型，包括：

LM Studio：一款流行的應用程序，可通過簡單的界面在本地運行模型。
Mlc Chat（MLC LLM）：一款開源應用程序，可在安卓和iOS上進行本地LLM推理。
Ollama Mobile：如果它支持你的平臺。
自定義應用程序：某些應用程序允許你加載和打開模型（比如適用于移動設備的Hugging Face Transformers 應用程序）。

第2步：下載Gemma 3n模型

你可以在Hugging Face等模型庫中搜索“Gemma 3n”找到它，也可以在谷歌上搜索，直接查找谷歌的AI模型版本。

注意：請務必選擇適面向移動設備的量化版本（比如4 位或 8 位），以節省空間和內存。

第3步：將模型導入到你的移動應用程序

現在啟動你的LLM應用程序（比如LM Studio、Mlc Chat）。
點擊“導入”或“添加模型”按鈕。
然后瀏覽到你下載的Gemma 3n 模型文件，并將其導入。

注意：該應用程序可能會引導你完成額外的優化或量化，以確保移動端正常運行。

第4步：設置模型首選項

配置選項以兼顧性能與準確度（量化程度越低，速度越快；量化程度越高，輸出效果越好，速度越慢）。如果需要，可以創建提示模板、對話風格和集成等。

第5步：現在，我們可以開始使用Gemma 3n了。

使用聊天或提示界面與模型進行交流。你可以根據自己的喜好，隨意提問、生成文本或將其用作寫作/編程助手。

獲得最佳效果的建議

關閉后臺程序以回收系統資源。
使用最新版本的應用程序，以獲得最佳性能。
根據你的需求，調整設置以找到性能與質量之間可接受的平衡點。

可能的用途

起草私密電子郵件和消息。
實時翻譯和摘要。
為開發者提供設備端代碼輔助。
隨時隨地集思廣益、撰寫故事或博客內容。

結語

在移動設備上使用Gemma 3n時，即可在口袋中體驗先進人工智能的無限可能，同時又不損害隱私和便捷性。無論你是略帶好奇心的AI技術普通用戶，還是尋求提升工作效率的忙碌專業人士，亦或是熱衷于實驗的開發者，Gemma 3n都可以為你提供探索和個性化技術的各種機會。Gemma 3n擁有眾多創新途徑，讓你無需連接互聯網即可發現簡化活動、激發新見解和建立聯系的新方法。立馬試用，了解AI如何助力你的日常生活，隨時隨地享受樂趣！

原文標題：How to Run Gemma 3n on your Mobile?，作者：Soumil Jain

責任編輯：姜華來源： 51CTO內容精選