精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Google Gemma 3:性能“炸裂”還是榜單優化?

發布于 2025-3-27 07:18
瀏覽
0收藏

一、背景

最近幾天 Google 發布了最新的 Gemma 3 系列開源模型,迅速成為業界熱議的焦點,其中,Gemma 3 27B IT 模型尤為引人注目。如下圖所示為 Google 廣泛宣傳的 Gemma 3 27B IT 模型在 Chatbot Arena Leaderboard  [1]上的表現,以 27B 的參數量,不僅超越了更大參數量的 DeepSeek V3(實際激活參數量差不多),并且接近頂尖的 DeepSeek R1。事實上性能真的這么“炸裂”嗎?還是面向 Chatbot Arena 的優化?值得注意的是,Chatbot Arena 的排名基于用戶盲測投票,容易受到寫作風格、響應速度以及特定用戶群體偏好的影響——例如,用戶往往更青睞反應迅速、語言自然且能靈活應對多樣化問題的模型。因此,這一榜單未必能全面反映模型的真實能力。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

事實上,當前大模型評測體系的混亂已是不爭的事實:測試基準五花八門切缺乏不一致,許多基準與實際業務需求脫節,數據污染與過擬合問題更是屢見不鮮。這使得挑選一個真正實用的模型變得很有挑戰性,用戶不得不在真實場景中要反復試錯,浪費大量人力與算力資源。很期待未來有一些更全面、更權威的基準。同時,也真的期待有一個 30B 左右規模的 Dense 模型,在性能上全面媲美 DeepSeek R1,將無疑是開源社區和實際應用的一大福音。本文將簡要探討 Gemma 3 27B IT 模型的技術亮點與潛在局限。

相關工作可以參考我們之前的文章:

二、Gemma 3 模型

2.1 概覽

如下圖 Table 1 所示,Gemma 3 總共包含 4 個模型:

  • 1B 為純 LLM 模型,4B、12B 和 27B 為多模態模型
  • 1B 使用 2T Token 預訓練;4B 使用 4T Token;12B 和 27B 使用 14T Token(PS:目前看 14T - 15T Token 基本成為標配)。
  • 現在 32K 序列長度預訓練,然后擴展到 128K 的序列長度
  • 支持 140 種語言
  • 支持 Function Call 和結構化輸出
  • 總詞表大小為 262K,相對而言,常見的開源模型的詞表通常是 128K 左右。
  • Vision Encoder 相同,都是 SigLIP 417M,輸入分辨率為 896x896
  • Pan & Scan(P&S):如果圖像比較大,則會采用無重疊的切分,然后分別 Resize 到 896x896(PS:這個也是非常常規的手段)。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

對應的論文:Gemma 3 Technical Report [2]

對應的模型:google/gemma-3-27b-it at main [3]

2.2 模型結構

現在 LLM 處理的序列越來越長,為了降低 KV Cache 存儲空間以及 Attention 的計算復雜度,最近一段時間很多模型都采用“混合模型”優化方案:

  • MiniMax 01:采用 Linear Attention 和 Softmax Attention 混合方案。為了彌補 Linear Attention 長距離序列建模能力不足的問題,每隔 M 層會采用一個標準的 Full Softmax Attention。
  • Hunyuan Turbo S:采用 Mamba + Full Softmax Attention + MoE 的方式,Mamba 作用和 Linear Attention 類似。
  • Gemma 3 27B:GQA + 5:1 交錯的 local/global layers。其中的 5:1 交錯是指:5 層為滑動窗口 Attention,1 層為 Full Softmax Attention,交錯排列。

如下圖配置所示為其中 LLM 的具體配置,可以看出,總共 62 層;GQA 中 Attention Head 與 KV Head 的比例為 2:1;滑動窗口的大小為 1024。也就是只要序列長度大于 1024,就可以節約 KV Cache 空間以及 Attention 計算量。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

PS:除了上述的混合模型外,最近 Inception Labs 的 Mercury [10] 模型也很值得關注。其不是使用傳統的基于自回歸的 Transformer 模型,而是采用了類似圖像、視頻生成中常用的擴散模型,從噪聲開始逐步優化整個文本序列,而不是逐個生成 token。雖然其在各種基準測試上還無法達到第一梯隊,但是在速度和成本效率上具有非常明顯的優勢,在個別場景上可能也是個不錯的選擇。如下圖所示為其在個別任務上的精度以及吞吐數據:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

2.3 量化

除了模型結構的創新外,量化也是降低存儲空間需求、提升處理速度的有效手段。Gemma 3 中,作者除了提供原始模型外,還提供了不同量化精度的量化版本,這些模型都是采用量化感知訓練(Quantization Aware Training, QAT)方法,通過少量 Step(通常是 5000)微調而來。如下圖所示為 32K 序列長度時不同精度下的顯存開銷,FP8 精度時總的顯存開銷也只有 46GB:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

2.4 消融實驗

即使滑動窗口層(Local)與標準 Transformer 層(Global)的比例為 7:1,損失依然很小,作者采用了 5:1。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

滑動窗口大小為 1024 時幾乎無損,但是小于 1024 時損失開始變大:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

更小的滑動窗口,更大的 Local:Global,可以有效降低 KV Cache 開銷:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

如下圖 Table 7 所示,作者也進一步評估了不同圖像分辨率對于視覺任務的影響。可以看出,較大的分辨率能明顯提升在視覺基準上的性能:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

三、評估

3.1 概覽

如下圖 Table 6 所示,作者僅提供了與自家 Gemini 和 Gemma 模型的比較,而未提供更多開源模型的結果(PS:聲稱是無法保持公平性??)。因此,我們從一些比較可信的數據源收集到一些 DeepSeek 的基準數據以作對比:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

如下圖所示為 Grok 3 的 DeepSearch 收集到的部分數據:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.2 MMLU-Pro

參考:MMLU-Pro Leaderboard - a Hugging Face Space by TIGER-Lab [4]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.3 LiveCodeBench

參考:

  • Introducing Gemini 2.0: our new AI model for the agentic era [5]
  • Gemini 2.0 is now available to everyone [6]
  • LiveCodeBench Leaderboard [7]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.4 GPQA Diamond

參考:LLM Leaderboard 2025 [8]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.5 FACTS Grounding

這個看著是 Google 自己的榜單:https://www.kaggle.com/facts-leaderboard/leaderboard [9]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.6 評估細節

雖然說 Google 在宣傳上有點雞賊,但是其一般都會比較準確列出基準評估的細節,比如采用的 n-shot 配置,是否使用 CoT 等等,如下圖 Table 19 所示:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

四、參考鏈接

  1. ???https://huggingface.co/spaces/lmarena-ai/chatbot-arena-leaderboard???
  2. ???https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf???
  3. ???https://huggingface.co/google/gemma-3-27b-it/tree/main???
  4. ???https://huggingface.co/spaces/TIGER-Lab/MMLU-Pro???
  5. ???https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/???
  6. ???https://blog.google/technology/google-deepmind/gemini-model-updates-february-2025/???
  7. ???https://livecodebench.github.io/leaderboard.html???
  8. ???https://www.vellum.ai/llm-leaderboard???
  9. ???https://www.kaggle.com/facts-leaderboard/leaderboard???
  10. ???https://www.inceptionlabs.ai/news????

 

本文轉載自??AI閑談??,作者:AI閑談

收藏
回復
舉報
回復
相關推薦
精品无码人妻少妇久久久久久| 香蕉久久免费影视| 精品在线视频观看| 六月丁香久久丫| 一本一本大道香蕉久在线精品| 日本成人黄色| 国产精品视频在线观看免费 | 毛片在线不卡| 国产精品18久久久久久久久| 51色欧美片视频在线观看| 久久久久久久毛片| 久久久久九九精品影院| 欧美性高潮在线| 只有这里有精品| 欧美18xxxxx| 国产专区欧美精品| 欧美在线观看网站| 五月天丁香激情| 九九热爱视频精品视频| 欧美一区二区福利在线| 黄色一级大片在线观看| 成人无遮挡免费网站视频在线观看| 成人毛片老司机大片| 国产日韩欧美另类| 国产在线观看黄色| 欧美日韩三级| 日韩性生活视频| 国产精品久久久久久久无码| 日韩成人精品一区二区三区| 午夜成人免费电影| 国产精品8888| 麻豆tv免费在线观看| 成人久久视频在线观看| 亚洲一区二区三区视频播放| 中文无码av一区二区三区| av不卡在线看| 久久久久久亚洲精品不卡| 国产美女高潮视频| 波多野结衣在线播放一区| 日韩av最新在线观看| 亚洲乱妇老熟女爽到高潮的片| 国产一区二区三区四区五区3d| 欧美日韩国产丝袜另类| 欧美一级视频在线播放| av小次郎在线| 亚洲色图在线视频| 一区二区三区视频| 午夜国产福利在线| 国产日本欧美一区二区| 国产日韩二区| 婷婷五月综合久久中文字幕| 国产黄人亚洲片| 999热视频| 99热这里精品| 国产乱理伦片在线观看夜一区| 国产精品日韩av| 久久精品偷拍视频| 日本sm残虐另类| 国产精品男人的天堂| 日本成人一级片| 日韩精品午夜视频| 国产精品人成电影在线观看| 中文字幕欧美人妻精品| 日本成人在线电影网| 国产精品日韩电影| 亚洲天堂手机版| 久久99精品一区二区三区三区| 国产精品揄拍一区二区| 免费视频网站在线观看入口| 日产欧产美韩系列久久99| 国产99视频精品免视看7| 午夜精品免费观看| 蜜桃视频在线一区| 91免费国产网站| 亚洲精华国产精华精华液网站| 处破女av一区二区| 蜜桃视频在线观看91| 国产大学生校花援交在线播放| 中文av一区二区| 一区中文字幕在线观看| 麻豆蜜桃在线| 欧美性猛交xxxx黑人| 美女少妇一区二区| 精品国模一区二区三区欧美| 精品国产乱码久久| 精品久久久久久中文字幕人妻最新| 国产影视一区| 美乳少妇欧美精品| 久久高清免费视频| 青青国产91久久久久久| 91手机视频在线观看| 国产成人手机在线| 久久精品视频一区二区| 伊人情人网综合| а√在线天堂官网| 欧美日韩一区在线观看| 国产ts在线观看| 国产a久久精品一区二区三区| 日韩最新中文字幕电影免费看| 久久久美女视频| 日韩黄色一级片| 91黄色国产视频| 精品一二三区视频| 亚洲精品视频一区二区| 国产亚洲天堂网| 国产一区二区| 一区二区欧美在线| 久久精品久久国产| 另类成人小视频在线| 国产精品日韩一区二区| 91九色在线porn| 激情亚洲一区二区三区四区| 久久撸在线视频| 欧美激情久久久久久久久久久| 色一区av在线| 日韩手机在线视频| 成人黄页在线观看| 强伦女教师2:伦理在线观看| 自拍偷拍亚洲视频| 欧美成人乱码一区二区三区| 欧美成人另类视频| 午夜在线视频观看日韩17c| 91九色精品视频| seseavlu视频在线| 欧美日在线观看| 欧美图片自拍偷拍| 中国精品18videos性欧美| 国产精品99久久久久久久久| 国产成人手机在线| 一二三四区精品视频| 日本黄色福利视频| 色综合狠狠操| 国产精品成人在线| 黄色免费在线播放| 色偷偷久久一区二区三区| 制服丝袜在线第一页| 综合精品久久| 亚洲精品日产aⅴ| 欧美另类极品| 欧美喷潮久久久xxxxx| 妺妺窝人体色WWW精品| 国产日韩免费| 极品校花啪啪激情久久| 成全电影大全在线观看| 欧美不卡一区二区三区四区| 精品自拍偷拍视频| 国产一区二区调教| 综合网五月天| 精品视频在线观看网站| 久久伊人精品一区二区三区| 在线观看免费视频a| 国产精品欧美经典| 在线观看日本www| 91精品一区二区三区综合在线爱 | 久久婷婷五月综合色丁香| 在线观看久久久久久| 一级久久久久久| 国产精品污www在线观看| www.精品在线| 亚洲精品成人影院| av免费观看久久| 色呦呦在线免费观看| 精品国产伦一区二区三区观看方式| 欧美人与禽zozzo禽性配| 福利一区福利二区| 国产精品久久中文字幕| 香蕉视频一区二区三区| 国产成人一区二区三区| www亚洲人| 欧美一区日韩一区| 精品在线视频免费观看| 91日韩在线专区| 欧美精品aaaa| 88国产精品视频一区二区三区| 国产成人免费电影| 中文字幕在线视频久| 国产亚洲免费的视频看| 国产一区二区在线不卡| 一区二区三区国产精品| 岛国精品资源网站| 免费高清视频精品| av 日韩 人妻 黑人 综合 无码| 精品久久ai| 国产精品男女猛烈高潮激情| 伊人电影在线观看| 日韩电影在线观看永久视频免费网站| 免费无码国产精品| 亚洲人精品一区| 真人bbbbbbbbb毛片| 免费一级片91| 美女扒开大腿让男人桶| 国产日韩欧美一区二区三区| 国产欧美日韩丝袜精品一区| 欧美bbbxxxxx| 亚洲一二在线观看| 亚洲精品福利网站| 欧美这里有精品| 久久久久成人精品无码| 国产天堂亚洲国产碰碰| 丰满少妇一区二区三区专区| 一本色道久久综合亚洲精品不卡| 色一情一乱一伦一区二区三欧美| 日本精品视频| 国产国产精品人在线视| 免费在线国产视频| 中文日韩在线视频| 日韩在线视频免费| 欧美丰满嫩嫩电影| 91午夜精品亚洲一区二区三区| 亚洲欧美另类综合偷拍| 黄色短视频在线观看| 国产麻豆一精品一av一免费 | 日本va欧美va精品发布| 国产妇女馒头高清泬20p多| 日韩免费视频| 欧美福利一区二区三区| av毛片精品| 成人在线一区二区| 欧美xxxx做受欧美护士| 久久久久国色av免费观看性色| av福利精品| 亚洲精品中文字幕av| 国产综合视频在线| 91精品国产色综合久久不卡蜜臀| 无码一区二区三区| 五月婷婷色综合| 欧美黄色一级网站| 亚洲三级在线播放| www.xx日本| 国产视频一区二区在线| 亚洲天堂成人av| 成人午夜碰碰视频| 女女调教被c哭捆绑喷水百合| 麻豆免费精品视频| 激情 小说 亚洲 图片: 伦| 校园春色综合网| 日本福利视频在线| 亚洲二区精品| 97超碰在线人人| 国语自产精品视频在线看8查询8| 中文字幕欧美日韩一区二区三区| 欧美日韩黑人| 亚洲欧美成人一区| 欧美日韩一二三四| 日韩av免费电影| 狠狠操综合网| 日本不卡一区| 精品久久久久久久久久久下田| 久久99精品久久久久久秒播放器| av不卡一区二区| 国产一区二区视频在线免费观看| 91精品导航| 国产精品一 二 三| 麻豆精品少妇| 免费国产一区二区| 精品国产乱码久久久久久蜜坠欲下 | 亚洲精品日韩精品| 色综合久久一区二区三区| 亚洲资源在线网| 在线电影一区二区| 和岳每晚弄的高潮嗷嗷叫视频| 亚洲黄色高清| 欧美色图另类小说| 日韩电影在线观看一区| 国产一二三四在线视频| 蓝色福利精品导航| 久久精品视频在线观看免费| 国产美女一区二区| 亚洲av熟女高潮一区二区| 91视频在线看| 亚洲色图欧美色| 亚洲人被黑人高潮完整版| 久久精品99国产精| 天天色图综合网| 国产精品国产精品国产| 91精品国产综合久久精品麻豆| www.com欧美| 日韩av一区在线观看| 风间由美一区| 欧美激情国产日韩精品一区18| 17videosex性欧美| 日韩av手机在线观看| 久久久久伊人| 精品国产乱码久久久久久久软件 | 国产一区二区三区免费观看| 折磨小男生性器羞耻的故事| 91麻豆免费在线观看| а天堂中文在线资源| 亚洲一区二区三区四区的| 神马久久久久久久| 欧美大胆一级视频| 国产九九在线| 欧美激情精品久久久久久久变态| 日本久久免费| 91九色蝌蚪成人| 视频一区欧美| 91成人综合网| 麻豆91在线观看| 一级特黄a大片免费| 国产精品久久久久三级| 欧美videossex极品| 在线综合亚洲欧美在线视频| 日本精品一二区| www.亚洲男人天堂| 周于希免费高清在线观看| 亚洲free性xxxx护士白浆| 九九热线有精品视频99| 屁屁影院ccyy国产第一页| 青青草91视频| 免费无码一区二区三区| 亚洲欧美日韩国产综合| 欧美a视频在线观看| 日韩精品一区国产麻豆| 在线看黄色av| 日韩美女免费线视频| 91嫩草精品| av不卡在线免费观看| 久久婷婷麻豆| 你懂得在线视频| 一区二区三区四区亚洲| 91精品国产乱码久久| 亚洲男人天堂古典| 9999在线视频| www.久久久| 一区二区中文| 中文字幕 日韩 欧美| 国产婷婷色一区二区三区| 亚洲第一在线播放| 欧美不卡一区二区| 手机电影在线观看| 国产中文字幕亚洲| 日韩黄色大片| 日本女优爱爱视频| 久久久另类综合| 国产伦精品一区二区三区视频网站| 精品国偷自产国产一区| av网站网址在线观看| 成人在线视频福利| 久久国产影院| 一道本在线免费视频| 亚洲国产高清不卡| 做爰无遮挡三级| 亚洲三级黄色在线观看| 亚洲精品一区| 久久大香伊蕉在人线观看热2| 亚洲婷婷免费| 亚洲一级Av无码毛片久久精品| 亚洲激情图片一区| 肥臀熟女一区二区三区| 欧美激情xxxx| 狼人精品一区二区三区在线| 国产妇女馒头高清泬20p多| 99久久免费视频.com| 天堂网一区二区三区| 日韩精品在线播放| 天堂久久午夜av| 亚洲精美视频| 国产最新精品精品你懂的| 一区二区成人免费视频| 在线成人午夜影院| 日本孕妇大胆孕交无码| 国产精华一区| 免费日韩视频| 2019男人天堂| 欧美高清视频在线高清观看mv色露露十八 | 国产精品66部| 欧美人妻精品一区二区三区| 337p日本欧洲亚洲大胆精品| 密臀av在线播放| 日韩少妇中文字幕| 激情都市一区二区| 久久精品国产av一区二区三区| 亚洲国产97在线精品一区| 希岛爱理一区二区三区av高清| 日韩尤物视频| 国产伦精一区二区三区| 日本三级片在线观看| 亚洲午夜精品久久久久久性色| 久久亚洲人体| 久久久久久久9| 久久精品一区二区三区不卡| 91久久久久国产一区二区| 欧美精品videossex性护士| 婷婷亚洲成人| 激情五月婷婷基地| 午夜精品视频在线观看| 最新97超碰在线| 国产不卡一区二区在线观看| 亚洲一区激情| 亚洲不卡在线播放| 日韩国产中文字幕| www.成人在线.com| 夫妻免费无码v看片| 一区视频在线播放| 亚洲aⅴ乱码精品成人区| 国产一区视频在线| 免费精品视频| 日韩精品一区二区亚洲av性色| 日韩av资源在线播放| 国产精品久久免费视频|