精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLaMA 4來了 | 千呼萬喚始出來,猶抱琵琶半遮面 | 不盡如人意 精華

發(fā)布于 2025-4-7 00:04
瀏覽
0收藏

開源世界的期待與漣漪 

人工智能的浪潮奔涌向前,Meta的Llama系列一直扮演著特殊的角色。回想Llama 2的橫空出世和開源姿態(tài),極大地降低了高性能大模型的門檻,在全球范圍內(nèi)點(diǎn)燃了研究和應(yīng)用的熱情,催生了無數(shù)創(chuàng)新,其影響力至今仍在激蕩。相較之下,Llama 3的發(fā)布雖然帶來了性能提升,但在社區(qū)看來,似乎少了些 Llama 2那樣的顛覆性震撼,更像是一次穩(wěn)健但略顯保守的迭代。

在這樣的背景下,Llama 4的發(fā)布承載了社區(qū)極高的期待。4月6日大周末的,Llama 4發(fā)布了。然而,在看完Meta的官方博文文章后,我總體感覺是“千呼萬喚始出來,猶抱琵琶半遮面”。那么它帶來了什么?社區(qū)反響如何?它是否達(dá)到了人們的預(yù)期?我們深入看下。

Llama 4 :Meta的宏偉藍(lán)圖 

Meta 的官方博文描繪了一個(gè)名為“Llama 4 牧群”(Llama 4 herd)的宏大計(jì)劃,首批推出了三位成員,旨在開啟“原生多模態(tài) AI 創(chuàng)新”的新紀(jì)元:

LLaMA 4來了 | 千呼萬喚始出來,猶抱琵琶半遮面 | 不盡如人意-AI.x社區(qū)

  1. Llama 4 Scout (偵察兵):
  • 定位: 高效、針對特定場景優(yōu)化的模型。
  • 參數(shù): 17B (十億) 激活參數(shù),16 個(gè)專家(Experts),總參數(shù) 109B。
  • 亮點(diǎn):
  • 原生多模態(tài): 支持文本、圖像、視頻(幀)輸入。
  • 業(yè)界領(lǐng)先的 10M (千萬) Token 上下文窗口: 這是最引人注目的數(shù)字之一。
  • 高效推理: 據(jù)稱可在單個(gè) NVIDIA H100 GPU 上運(yùn)行(Int4 量化)。
  • 性能: 在同級(jí)別模型中表現(xiàn)優(yōu)異,超越 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。
  1. Llama 4 Maverick (特立獨(dú)行者):
  • 定位: 通用、高性能的多模態(tài)模型。
  • 參數(shù): 17B 激活參數(shù),128 個(gè)專家,總參數(shù) 400B。
  • 亮點(diǎn):
  • 原生多模態(tài): 同樣具備強(qiáng)大的多模態(tài)處理能力。
  • 1M (百萬) Token 上下文窗口。
  • 性能: 號(hào)稱在同級(jí)別中擊敗 GPT-4o 和 Gemini 2.0 Flash,并在編碼和推理方面與 DeepSeek v3.1 競爭。
  • 成本效益: 對比 Llama 3.3 70B,以更低成本提供高質(zhì)量輸出。
  1. Llama 4 Behemoth (巨獸):
  • 定位: 最強(qiáng)大的“教師模型”,用于知識(shí)蒸餾。
  • 參數(shù): 288B 激活參數(shù),16 個(gè)專家,總參數(shù)接近2T (兩萬億)
  • 亮點(diǎn):
  • 頂尖性能: 在 STEM 基準(zhǔn)測試(如 MATH-500, GPQA Diamond)上超越 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。
  • 多模態(tài)能力。
  • 狀態(tài): 預(yù)覽階段,尚未發(fā)布,仍在訓(xùn)練中。

核心技術(shù)看點(diǎn) 

  • 原生多模態(tài) (Native Multimodality):Llama 4 從底層設(shè)計(jì)就考慮了多模態(tài)融合,采用“早期融合”(Early Fusion)策略,將文本和視覺 Token 無縫集成到統(tǒng)一的模型骨干中,支持聯(lián)合預(yù)訓(xùn)練。這與之前模型外掛視覺模塊的方式有所不同。
  • 混合專家模型 (MoE - Mixture of Experts):Scout 和 Maverick 都采用了 MoE 架構(gòu)。這種架構(gòu)在訓(xùn)練和推理時(shí)只激活總參數(shù)的一部分(由“路由器”決定將 Token 發(fā)往哪些“專家”),從而在給定計(jì)算預(yù)算下實(shí)現(xiàn)更高的效率和模型質(zhì)量。Maverick 使用了多達(dá) 128 個(gè)專家,這是一個(gè)相當(dāng)大的規(guī)模。
  • 超長上下文窗口:Scout 的 10M Token 上下文是其宣傳的重點(diǎn)。Meta 提到這得益于一種名為iRoPE(interleaved Rotary Position Embeddings)的架構(gòu)創(chuàng)新,結(jié)合了交錯(cuò)注意力層和旋轉(zhuǎn)位置編碼,并輔以推理時(shí)注意力溫度縮放(inference time temperature scaling)來增強(qiáng)長度泛化能力。
  • 訓(xùn)練優(yōu)化:使用 FP8 精度訓(xùn)練以提高效率,訓(xùn)練數(shù)據(jù)量超過 30 萬億 Token(包含文本、圖像、視頻),是 Llama 3 的兩倍以上。還引入了名為 MetaP 的新技術(shù)來優(yōu)化超參數(shù)設(shè)置。
  • 知識(shí)蒸餾:Scout 和 Maverick 的高性能部分歸功于從 Behemoth 模型進(jìn)行的知識(shí)蒸餾(Codistillation),這使得小型模型能夠繼承大型教師模型的“智慧”。

社區(qū)反饋:光環(huán)之下的陰影 

Meta 的發(fā)布引發(fā)了社區(qū)的熱烈討論,但并非一片贊歌:

  • 10M 上下文窗口的“虛幻”:這是被集中火力攻擊的一點(diǎn)。Meta自己的博文明確寫道:“Llama 4 Scout is both pre-trained and post-trained with a256K context length”。這意味著,雖然模型可以通過iRoPE等技術(shù)在推理時(shí)嘗試 處理更長的上下文(如 Needle-in-a-Haystack 測試所示),但它并沒有在千萬級(jí)別的真實(shí)長序列上進(jìn)行過訓(xùn)練。超過256K Token,輸出質(zhì)量很可能大幅下降,因?yàn)槟P腿狈μ幚砣绱碎L距離復(fù)雜依賴關(guān)系的訓(xùn)練經(jīng)驗(yàn)。這使得 10M 的宣傳數(shù)字更像是一個(gè)理論上限或特定任務(wù)(如信息檢索)的表現(xiàn),而非通用的長文本理解和生成能力。不少人認(rèn)為這是一種營銷上的“取巧”。
    另外,很多模型宣稱支持超長上下文窗口,并用“大海撈針”實(shí)驗(yàn)來測試,但技術(shù)上大家普遍認(rèn)為“大海撈針”實(shí)驗(yàn)不能充分驗(yàn)證大模型能夠充分的理解、引用、推理整個(gè)上下文中信息。 ( https://fiction.live/stories/Fiction-liveBench-Mar-25-2025/oQdzQvKHw8JyXbN87 )這篇文章設(shè)計(jì)了Fiction.LiveBench長上下文基準(zhǔn)測試。從12個(gè)復(fù)雜故事生成測試集,考查模型對角色變化、邏輯預(yù)測及信息區(qū)分的理解。相比“大海撈針”類的搜索測試,它更注重故事深層理解。
    比如:在《神雕俠侶》小說中,在一個(gè)場景中“楊過被郭芙砍斷一只手臂”,劇情發(fā)展很長后,有一個(gè)場景是“楊過單臂懷抱小龍女”。這兩個(gè)場景在小說中可能相差很多個(gè)章節(jié),那么如果我們問大模型:楊過為什么單臂懷抱小龍女?能夠很好處理長下文的大模型應(yīng)該能夠根據(jù)之前很遠(yuǎn)的章節(jié)中的”被砍斷一只手臂”的場景推理出來。 Fiction.LiveBench測試顯示,就算當(dāng)前第一梯隊(duì)大模型在短上下文(1k)通過,長上下文(8k)失敗的案例比比皆是【參考下面的表格,可以看到各個(gè)大模型在上下文窗口長度增長時(shí),性能在幾句的下降】。所以LLaMA 4宣稱的10M長下文窗口,可能會(huì)有“虛幻“。LLaMA 4來了 | 千呼萬喚始出來,猶抱琵琶半遮面 | 不盡如人意-AI.x社區(qū)
  • 基準(zhǔn)測試的意義:“書呆子的占星術(shù)”?Yuchen Jin 的評(píng)論雖帶有戲謔(“Benchmarks? they are just astrology for nerds. Vibes only.”),卻也反映了社區(qū)對基準(zhǔn)測試局限性的普遍認(rèn)知。Andriy Burkov 也提到,包括 Elo 評(píng)分在內(nèi)的基準(zhǔn)可以通過微調(diào)來“刷分”,使其看起來接近頂部。實(shí)際應(yīng)用中的表現(xiàn)(“vibe check” 或在用戶自己的問題上測試)可能與基準(zhǔn)得分存在偏差,尤其是在幻覺(hallucination)等問題上,新模型可能并未比2023年的模型有質(zhì)的飛躍。
  • 推理能力的缺失?Martin Bowling 點(diǎn)出了一個(gè)潛在的短板:Llama 4的發(fā)布似乎并未特別強(qiáng)調(diào)或展示其在復(fù)雜推理 (reasoning)能力上的突破。Burkov甚至稱其為“非推理模型”(non-reasoning model),認(rèn)為即使有 30T 訓(xùn)練數(shù)據(jù)和 2T 參數(shù),也無法讓它超越那些更小的、但具備更強(qiáng)推理能力的模型。Bowling 覺得沒有在這次發(fā)布中加入一個(gè)“推理器”(reasoner)很奇怪,認(rèn)為本可以通過 GRPO 等技術(shù)輕松實(shí)現(xiàn)。

不盡如人意,但仍是重要一步 

綜合來看,Llama 4的發(fā)布是一次復(fù)雜且充滿矛盾的事件。

亮點(diǎn)不容忽視:

  • 它確實(shí)是 Meta 在開源多模態(tài)模型領(lǐng)域邁出的重要一步,原生多模態(tài)架構(gòu)值得肯定。
  • MoE 架構(gòu)的應(yīng)用顯示了Meta在模型效率和規(guī)模化方面的持續(xù)探索。
  • Scout和 Maverick在各自參數(shù)級(jí)別上展現(xiàn)了強(qiáng)大的競爭力,為開發(fā)者提供了新的、高性能的開源選擇。
  • 堅(jiān)持開源本身就是對社區(qū)的巨大貢獻(xiàn)。

失望與疑慮也真實(shí)存在:

  • 10M上下文的宣傳與實(shí)際訓(xùn)練深度之間的差距,可能影響社區(qū)信任。
  • 高達(dá)2T參數(shù)的 Behemoth 未能在綜合能力上展現(xiàn)絕對統(tǒng)治力,并處于“預(yù)覽”狀態(tài),讓“巨獸”的震撼打了折扣。
  • 在社區(qū)日益關(guān)注的復(fù)雜推理能力上,Llama 4似乎沒有帶來驚喜。
  • 對基準(zhǔn)測試的依賴和潛在的“刷分”可能,使得對其真實(shí)能力的評(píng)估更加困難。

總體來說,Llama 4并沒有完全滿足社區(qū)對“革命性”突破的期待,它更像是一次雄心勃勃的技術(shù)探索,但部分成果的成熟度和實(shí)用性仍有待檢驗(yàn)。Meta可能確實(shí)在技術(shù)上取得了進(jìn)展,但在溝通和預(yù)期管理上,或許有些操之過急或過于樂觀。

“猶抱琵琶半遮面”的 Behemoth 何時(shí)能完全展露真容?Meta是否會(huì)推出專注于推理的后續(xù)模型?超長上下文的承諾能否在實(shí)際應(yīng)用中兌現(xiàn)?這些都是 Llama 4留給我們的懸念。

本文轉(zhuǎn)載自???后向傳播???,作者: 張發(fā)恩

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
91成人抖音| 你懂的视频在线免费| 亚洲一区色图| 亚洲大胆人体av| 热久久精品免费视频| 五月天婷婷在线视频| 成人免费高清在线| 国产精品电影网站| 久久精品久久国产| 欧美激情欧美| 亚洲乱码一区二区| 午夜不卡福利视频| av日韩亚洲| 一区二区三区精密机械公司| 欧美一区二区福利| 风流老熟女一区二区三区| 日本少妇一区二区| 26uuu日韩精品一区二区| 日本在线观看网址| 在线一级成人| 精品国产3级a| 国内自拍第二页| 日韩成人亚洲| 精品久久久久久中文字幕| 国产成人精品免费看在线播放| 外国精品视频在线观看 | 9国产精品视频| 日韩亚洲欧美中文在线| 亚洲av片不卡无码久久| 超碰在线成人| 日韩欧美不卡在线观看视频| 孩娇小videos精品| 亚洲最新无码中文字幕久久| 亚洲在线视频一区| 波多野结衣三级在线| 成人在线播放视频| 久久综合久久鬼色中文字| 成人蜜桃视频| 国产aⅴ爽av久久久久成人| 日本在线播放一区二区三区| 69av成年福利视频| 精品一区二区三区四| 欧美一区二区三区久久精品茉莉花| 亚洲四色影视在线观看| 日韩av在线看免费观看| 琪琪久久久久日韩精品| 亚洲风情亚aⅴ在线发布| 国产黄色一区二区三区| 久久久91麻豆精品国产一区| 欧美日韩三级在线| 国产aaaaa毛片| 在线一区视频观看| 欧美丝袜丝交足nylons图片| 无码人妻丰满熟妇区毛片| 天堂av在线网| 色拍拍在线精品视频8848| 97超碰青青草| xx欧美视频| 日本韩国一区二区| 五月天婷婷激情视频| 成人在线高清| 欧美二区乱c少妇| 999久久久精品视频| 成人在线视频www| 日韩一二在线观看| 娇妻高潮浓精白浆xxⅹ| 国产精品tv| 日韩久久免费电影| 人人妻人人澡人人爽| 精品欧美久久| zzjj国产精品一区二区| 外国一级黄色片| 亚洲人体大胆视频| 欧洲午夜精品久久久| 日本黄色中文字幕| 精品在线观看视频| 91久久久一线二线三线品牌| 国产18精品乱码免费看| 99精品久久99久久久久| 日韩久久久久久久| 久热国产在线| 午夜精品久久久久久久99樱桃| 奇米精品一区二区三区| 亚洲a∨精品一区二区三区导航| 欧美三级韩国三级日本一级| 在线观看你懂的视频| 欧美一区二区三区红桃小说| 亚洲美女福利视频网站| 日韩在线一卡二卡| 亚洲国产欧美国产综合一区| 国产精品成人久久久久| 国产情侣激情自拍| 久久影音资源网| 正在播放一区| 日韩欧美精品一区二区三区| 欧美视频一区二区三区| 久久久久久久穴| 欧美在线免费看视频| 九九精品视频在线观看| www.com国产| 国产精品资源在线看| 久久久久一区二区三区| 超碰porn在线| 在线日韩av片| 久久精品aⅴ无码中文字字幕重口| 国产真实有声精品录音| 欧美激情国产精品| 中文字幕视频免费观看| 99国产精品久久久久久久久久久| 宅男av一区二区三区| 欧美人体一区二区三区| 精品日产卡一卡二卡麻豆| 国产探花视频在线播放| 国产欧美丝祙| caoporen国产精品| 亚洲欧美视频一区二区| 日韩欧美中文在线| 怡红院一区二区| 天天久久综合| 国产精品电影网站| 你懂的视频在线免费| 亚洲不卡在线观看| 日本特黄在线观看| 久久精品影视| 国产精品欧美日韩一区二区| 天堂在线观看免费视频| 亚洲人成小说网站色在线| 91欧美视频在线| 国产精品中文字幕亚洲欧美| 欧美在线视频观看| 蜜桃av中文字幕| 一区二区三区中文字幕精品精品| 日韩中文字幕a| 精品视频网站| 国产精品美女主播在线观看纯欲| 日本视频在线观看一区二区三区| 午夜影院在线观看欧美| 亚洲成a人片在线www| 欧美精品偷拍| 91成人免费在线观看| av理论在线观看| 91精品国产福利在线观看 | 天天插天天干天天操| 一区二区三区蜜桃| 4438x全国最大成人| 欧美欧美天天天天操| 99精品99久久久久久宅男| 国产福利视频在线| 欧美一级高清大全免费观看| 久久久久亚洲av无码专区体验| 狠狠色狠狠色综合系列| 18视频在线观看娇喘| 九九99久久精品在免费线bt| 毛片精品免费在线观看| www.五月婷婷| 亚洲成精国产精品女| www.com日本| 一本色道久久综合亚洲精品高清 | 欧美日本一区二区视频在线观看| 亚洲自拍偷拍视频| 秋霞在线午夜| 亚洲精品久久7777777| 日日夜夜综合网| 久久久久久黄色| 在线观看国产中文字幕| 欧美99在线视频观看| 国内外成人免费视频| 涩涩日韩在线| 神马久久久久| 91久久国产最好的精华液| 亚洲色图欧美色| 久久99国产精品成人| 欧美日韩dvd| 国产丝袜一区| 国产精品88a∨| 免费a级在线播放| 精品国产三级a在线观看| 婷婷激情五月网| 国产精品激情偷乱一区二区∴| www.偷拍.com| 亚洲综合另类| 欧美少妇一级片| 欧美三级电影在线| 国产精品影院在线观看| 亚洲第一图区| 亚洲欧美日韩一区在线| 国产乱淫片视频| 欧美日韩在线看| 懂色av蜜臀av粉嫩av永久| 成人自拍视频在线观看| 欧美一级黄色影院| 午夜精品久久| 日本高清久久一区二区三区| 日本少妇精品亚洲第一区| 日韩美女视频免费看| 91精品久久| 一区二区三区视频免费| 欧美亚洲精品在线观看| 欧美日韩亚洲综合| 黄色片免费观看视频| 亚洲免费在线观看视频| 国产高潮呻吟久久| 成人性生交大片免费| 亚洲高清免费在线观看| 国产日韩欧美一区| 国产911在线观看| 欧美理论在线播放| 国产精品加勒比| 麻豆久久久久| 日本aⅴ大伊香蕉精品视频| 久久99亚洲网美利坚合众国| 最近日韩中文字幕中文| 毛片在线免费| 亚洲国产免费av| 国产高潮在线观看| 欧美日韩国产美| 波多野结衣高清在线| 亚洲 欧美综合在线网络| 国产精品xxx视频| 国产成人精品电影久久久| 日本不卡视频一区二区| 日韩欧美一区二区在线视频| 自拍偷拍第八页| 色一区在线观看| 在线观看精品国产| 亚洲国产三级在线| 国内偷拍精品视频| 国产精品区一区二区三区| 久久亚洲国产成人| 国产精品久久久久久久妇| 亚洲人成小说网站色在线 | 日韩a在线播放| 亚洲承认在线| www.射射射| 国内精品福利| 青青青在线观看视频| 66视频精品| 一道本在线观看视频| 99久久婷婷| 在线国产伦理一区| 亚洲精品va| a级网站在线观看| 最新国产精品| 9色porny| 日韩亚洲国产欧美| 亚洲熟妇av日韩熟妇在线| 怡红院精品视频在线观看极品| 黄色一级大片免费| 亚洲天堂激情| 男人添女人荫蒂免费视频| 精品动漫av| 99精品人妻少妇一区二区| 午夜在线一区二区| 免费激情视频在线观看| 日韩电影免费一区| 岛国毛片在线播放| 国产最新精品免费| 免费观看黄网站| 国产91高潮流白浆在线麻豆| 国产高潮失禁喷水爽到抽搐| 不卡高清视频专区| 久久精品国产亚洲av麻豆| 国产日韩成人精品| 国产探花在线视频| 亚洲综合色网站| 国产性猛交╳xxx乱大交| 在线精品视频免费观看| 国产精品久久欧美久久一区| 欧美成人精品二区三区99精品| 色婷婷中文字幕| 亚洲丝袜一区在线| 99福利在线| 91sa在线看| 欧美日韩在线精品一区二区三区激情综合 | 久久伊人蜜桃av一区二区| 在线观看国产精品一区| 中文字幕一区二区5566日韩| 久久精品99久久久久久| 色哟哟一区二区| 国产精品女人久久久| 亚洲成年人在线| 国产在线视频网址| 大胆人体色综合| 亚洲国产福利| 亚洲一区亚洲二区亚洲三区| 久久香蕉精品香蕉| 亚洲高清视频一区二区| 欧美三区在线| 精品久久久久av| 国产精品乡下勾搭老头1| 免费无码一区二区三区| 国产精品久久夜| 天堂中文在线网| 91精品国产麻豆| 国产高清一级毛片在线不卡| 精品综合久久久久久97| 中文另类视频| 精品国产一区二区三区四区精华 | 国产自产在线视频| 蜜臀av性久久久久蜜臀aⅴ四虎| 91亚洲一线产区二线产区| 中文字幕av不卡| 国产午夜在线播放| 欧美一区二区黄色| 成人高清网站| 8050国产精品久久久久久| 国产精品xnxxcom| 日韩精品在在线一区二区中文| 亚洲视频综合| 国产精欧美一区二区三区白种人| 久久在线免费观看| 久久99久久98精品免观看软件| 欧美手机在线视频| 手机福利在线| 国内精品久久久久| 成人亚洲精品| 婷婷久久青草热一区二区| 在线亚洲一区| 中文字幕视频观看| 一区二区三区四区在线免费观看 | 黑人精品欧美一区二区蜜桃| 日本xxx在线播放| 亚洲6080在线| 欧美一区二不卡视频| 久久成人人人人精品欧| 婷婷激情成人| 亚洲精品日韩精品| 日韩国产精品91| 白白色免费视频| 狠狠躁夜夜躁人人躁婷婷91| 免费a视频在线观看| 欧美激情第三页| 538任你躁精品视频网免费| 国产一区一区三区| 国产一区二区在线视频| www成人啪啪18软件| 欧美日韩中文字幕一区| 触手亚洲一区二区三区| 国产脚交av在线一区二区| 制服丝袜日韩| 日本www.色| 亚洲国产激情av| 一区二区美女视频| www国产亚洲精品久久网站| 亚洲香蕉久久| 欧美日韩亚洲国产成人| 国产又黄又大久久| 国产大学生自拍| 日韩免费一区二区| 青草在线视频| 国产主播一区二区三区四区| 国产欧美短视频| 91精品人妻一区二区三区| 日本韩国精品一区二区在线观看| 可以直接在线观看的av| 国产精品视频导航| 希岛爱理av一区二区三区| 五月天婷婷在线观看视频| 亚洲精品免费看| 亚洲第一页综合| 国产91成人video| jiujiure精品视频播放| 中文字幕成人在线视频| 亚洲另类色综合网站| 少妇高潮一区二区三区69| 日本精品久久中文字幕佐佐木| 精品产国自在拍| 久久精品久久99| 婷婷中文字幕一区三区| 日漫免费在线观看网站| 国产精品视频久| 国产主播精品| 中文字幕在线看高清电影| 欧美精品一二三| 55av亚洲| 亚洲成人精品电影在线观看| 国产乱人伦精品一区二区在线观看 | 国产精品成人a在线观看| 久久发布国产伦子伦精品| 精品欧美激情精品一区| 永久免费av在线| 国产伦理久久久| 麻豆91在线播放| 麻豆一区二区三区精品视频| 亚洲人成在线观看网站高清| 一区二区三区日本视频| 日本欧美黄色片| 亚洲欧洲美洲综合色网| 五月色婷婷综合| 91欧美精品午夜性色福利在线| 亚洲伦伦在线| 国产小视频你懂的| 亚洲国产高清高潮精品美女| 国产美女久久| 少妇高潮喷水在线观看| 国产精品国产自产拍高清av王其 | 久久久久久免费看| 国产精品久久久久一区| 天堂成人在线视频| 亚洲精品免费av|