精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM省錢大測評!48塊GH200,首個百億級參數(shù)量實(shí)證

人工智能 新聞
EfficientLLM項(xiàng)目聚焦LLM效率,提出三軸分類法和六大指標(biāo),實(shí)驗(yàn)包攬全架構(gòu)、多模態(tài)、微調(diào)技術(shù),可為研究人員提供效率與性能平衡的參考。

近年來,大型語言模型(LLM)如GPT系列取得了革命性進(jìn)展,在自然語言處理、內(nèi)容創(chuàng)作、多語言翻譯乃至科學(xué)研究等眾多領(lǐng)域展現(xiàn)出驚人能力。

然而,模型參數(shù)量(如DeepseekR1的671B參數(shù))和上下文窗口的急劇膨脹,帶來了巨大的計(jì)算力(GPT-3訓(xùn)練約需3640Petaflop/s-days)、能源消耗和資金投入(GPT-3訓(xùn)練成本估計(jì)超460萬美元)。

高昂的成本已成為制約LLM進(jìn)一步發(fā)展和廣泛應(yīng)用的關(guān)鍵瓶頸。

EfficientLLM項(xiàng)目應(yīng)「效率測評」需求而生,也是首個針對LLM效率技術(shù)進(jìn)行端到端、百億級參數(shù)規(guī)模的系統(tǒng)性實(shí)證研究。

圖片

項(xiàng)目詳情:https://dlyuangod.github.io/EfficientLLM/

模型庫:https://huggingface.co/Tyrannosaurus/EfficientLLM

研究人員在配備了48塊GH200和8塊H200 GPU的生產(chǎn)級集群上執(zhí)行效率測評,確保了對真實(shí)世界中LLM性能與能耗權(quán)衡的精確測量。

EfficientLLM的核心目標(biāo)是為學(xué)術(shù)界和工業(yè)界的研發(fā)人員提供一個清晰、數(shù)據(jù)驅(qū)動的導(dǎo)航圖,幫助研究人員在下一代基礎(chǔ)模型的「效率-性能」復(fù)雜地貌中找到最佳路徑。

圖片

EfficientLLM的三維評測框架與核心指標(biāo)

研究人員創(chuàng)新性地提出了一個統(tǒng)一的三軸分類法來系統(tǒng)評估LLM效率,覆蓋模型生命周期的關(guān)鍵階段:

架構(gòu)預(yù)訓(xùn)練(Architecture Pretraining)

此部分專注于為模型設(shè)計(jì)者和研究者在構(gòu)建新型LLM架構(gòu)時,提供關(guān)于計(jì)算資源和能源成本預(yù)算的精確分析,并深入評估了多種高效注意力機(jī)制變體(如多查詢注意力MQA、分組查詢注意力GQA、多頭潛在注意力MLA、原生稀疏注意力NSA)以及稀疏混合專家模型(MoE)的效率表現(xiàn)。

微調(diào)(Fine-tuning)

針對需要將預(yù)訓(xùn)練基礎(chǔ)模型適配到特定下游任務(wù)或?qū)I(yè)領(lǐng)域的實(shí)踐者,研究人員提供了參數(shù)高效微調(diào)(PEFT)方法的效率基準(zhǔn)。評估涵蓋了LoRA、RSLORA、DoRA等主流PEFT技術(shù)。

位寬量化(Bit-width Quantization)

面向模型部署工程師,研究人員評估了如何通過模型壓縮技術(shù)(特別是無需重訓(xùn)即可直接部署的訓(xùn)練后量化方法,如int4和float16)有效降低服務(wù)成本和推理延遲。

評估指標(biāo)

為全面刻畫效率,EfficientLLM還引入了六個相互正交的細(xì)粒度評估指標(biāo):

1. 平均內(nèi)存利用率(Average-Memory-Utilization,AMU)

2. 峰值計(jì)算利用率(Peak-Compute-Utilization,PCU)

3. 平均延遲(Average-Latency,AL)

4. 平均吞吐量(Average-Throughput,AT)

5. 平均能耗(Average-Energy-Consumption,AEC)

6. 模型壓縮率(Model-Compression-Rate,MCR)這些指標(biāo)共同捕捉了硬件飽和度、延遲與吞吐量的平衡,以及碳排放成本等關(guān)鍵因素。

基準(zhǔn)測試涵蓋了超過100個「模型-技術(shù)」組合,納入從0.5B到72B參數(shù)規(guī)模的多種LLM。

圖片

EfficientLLM的三大核心洞見

效率優(yōu)化是「沒有免費(fèi)午餐」的量化權(quán)衡(Efficiency Involves Quantifiable Trade-offs)

百余項(xiàng)實(shí)驗(yàn)清晰地表明,不存在一種能在所有維度上都達(dá)到最優(yōu)的通用效率技術(shù)。

每一種被評估的方法,在提升至少一個效率指標(biāo)的同時,幾乎總會在其他某個或某些指標(biāo)上有所妥協(xié)。

圖片

以稀疏混合專家模型(MoE)為例,能有效降低推理時的FLOPs(浮點(diǎn)運(yùn)算次數(shù))并提升下游任務(wù)的準(zhǔn)確率,但其代價是峰值顯存需求增加約40%(因?yàn)樾枰鎯λ袑<揖W(wǎng)絡(luò)的參數(shù))。

int4量化技術(shù)則展現(xiàn)了另一面:可以將模型的內(nèi)存占用和能耗降低高達(dá)3.9倍,模型壓縮率表現(xiàn)優(yōu)異,但根據(jù)實(shí)測數(shù)據(jù),通常伴隨著約3-5%的任務(wù)平均得分下降。

最優(yōu)效率策略高度依賴于具體任務(wù)和模型規(guī)模(Optima are Task- and Scale-Dependent)

效率的「最優(yōu)解」并非一成不變,而是高度依賴于應(yīng)用場景、模型規(guī)模和硬件環(huán)境。

高效注意力機(jī)制:在架構(gòu)預(yù)訓(xùn)練階段,對于內(nèi)存資源極度受限的設(shè)備(如端側(cè)推理),MQA(多查詢注意力)因其共享鍵值頭設(shè)計(jì),展現(xiàn)出最佳的內(nèi)存占用和延遲特性。

而當(dāng)追求極致的語言生成質(zhì)量時(以困惑度PPL為衡量標(biāo)準(zhǔn)),MLA(多頭潛在注意力)則表現(xiàn)更優(yōu)。若目標(biāo)是最低能耗部署,NSA(原生稀疏注意力)則是首選。

圖片

PEFT方法的規(guī)模效應(yīng):在微調(diào)階段,對于1B到3B參數(shù)規(guī)模的較小模型,LoRA及其變體(如DoRA,統(tǒng)稱LoRA-plus)在特定的內(nèi)存約束下能達(dá)到最低的性能損失(即最佳的任務(wù)表現(xiàn))。

然而,當(dāng)模型規(guī)模擴(kuò)展到14B參數(shù)以上時,RSLORA在效率上反超LoRA,展現(xiàn)出更低的延遲和功耗。

對于超大規(guī)模模型的微調(diào),參數(shù)凍結(jié)(僅更新部分層或組件)策略雖然可能犧牲少量任務(wù)精度,但能提供最佳的端到端微調(diào)延遲。

量化精度選擇:在推理階段,測試(涵蓋Llama-3,DeepSeek,Qwen等1.5B至34B模型)表明,int4訓(xùn)練后量化能顯著提升資源效率。

內(nèi)存占用減少接近理論上的4倍,吞吐量(每秒處理詞元數(shù))在內(nèi)存受限條件下可提升三倍,而平均任務(wù)性能得分僅有小幅下降(例如DeepSeek-R1-Distill-Qwen-14B的平均分從bf16的0.4719降至int4的0.4361)。

在16位浮點(diǎn)格式中,bfloat16在Hopper架構(gòu)GPU(GH200/H200)上,相較于float16,始終在平均延遲和能耗方面表現(xiàn)更優(yōu),這得益于現(xiàn)代NVIDIA GPU對bfloat16運(yùn)算的原生硬件加速。

LLM效率技術(shù)可廣泛遷移至跨模態(tài)模型(Broad ApplicabilityAcrossModalities)

研究人員將EfficientLLM的評估框架成功擴(kuò)展到了大型視覺模型(LVMs)和視覺語言模型(VLMs),如Stable Diffusion3.5、Wan2.1和Qwen2.5-VL等。

圖片

實(shí)驗(yàn)結(jié)果令人鼓舞:在LLM上得到驗(yàn)證的效率技術(shù),如MQA/GQA等高效注意力機(jī)制,能夠有效地遷移并改進(jìn)LVM的生成質(zhì)量(以FID分?jǐn)?shù)為衡量標(biāo)準(zhǔn));PEFT方法同樣在LVM和VLM上取得了良好的性能-效率權(quán)衡,表明針對LLM的效率優(yōu)化研究成果具有更廣泛的適用性。

開放共享,賦能未來

研究人員即將開源完整的評估流程代碼以及排行榜,在為全球的學(xué)術(shù)研究者和企業(yè)工程師在探索下一代基礎(chǔ)模型的效率與性能平衡時,提供一個堅(jiān)實(shí)的、可復(fù)現(xiàn)的、值得信賴的「指南針」。

研究成果可以為從業(yè)者提供基于嚴(yán)謹(jǐn)實(shí)證數(shù)據(jù)的可操作建議,幫助研究人員在具體的任務(wù)需求和資源限制下,做出更明智、更高效的模型和技術(shù)選型決策,而不是僅僅依賴?yán)碚撏蒲莼蛴邢薜慕?jīng)驗(yàn)。

LLM的效率優(yōu)化是一個持續(xù)演進(jìn)的系統(tǒng)工程,EfficientLLM的探索也僅是其中的一部分,諸如訓(xùn)練基礎(chǔ)設(shè)施優(yōu)化、基于強(qiáng)化學(xué)習(xí)的訓(xùn)練后對齊、測試時擴(kuò)展策略等重要議題,開發(fā)團(tuán)隊(duì)計(jì)劃在未來進(jìn)行深入研究。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-05-29 15:57:41

新型AI超級計(jì)算機(jī)NVIDIA

2023-09-01 15:22:49

人工智能數(shù)據(jù)

2023-11-14 13:39:57

2024-02-05 13:37:35

AI數(shù)據(jù)

2024-05-22 08:36:30

2023-08-09 17:19:54

服務(wù)器計(jì)算

2024-11-05 11:14:05

2025-07-28 09:06:00

2025-05-14 00:55:00

英偉達(dá)命名規(guī)則體系

2018-12-17 09:02:25

百億大表維度查詢

2023-07-08 23:20:41

2025-02-27 13:45:00

2022-06-25 21:17:15

人工智能訓(xùn)練

2025-01-24 15:09:43

2016-01-25 13:42:24

云之家

2025-10-16 08:59:00

2023-07-03 14:49:39

2023-09-19 21:09:18

百度人工智能

2022-12-27 13:36:09

2014-12-01 17:04:44

外包服務(wù)IT桌面
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

成人在线观看黄| 精品乱色一区二区中文字幕| 一本一本久久a久久| 精品三级久久久| 亚洲成av人片在www色猫咪| 久久狠狠久久综合桃花| 日韩乱码一区二区三区| 欧美+日本+国产+在线a∨观看| 精品99一区二区三区| 日韩有码免费视频| 黄色免费在线看| 成人激情文学综合网| 国产成人精品一区二区在线| 中文字幕观看av| 美女视频亚洲色图| 欧美日韩免费观看一区三区| 欧美中日韩在线| 91在线品视觉盛宴免费| 成人精品国产福利| 国产日韩精品电影| 国产一级精品视频| 综合一区二区三区| 精品偷拍一区二区三区在线看| 日本中文字幕影院| 亚洲精品中文字幕| 一区二区三区在线播| 日韩亚洲欧美精品| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻av无码一区二区三区 | 欧美日韩国产在线| 波多野结衣三级在线| 极品白浆推特女神在线观看 | 精品久久久久久亚洲精品| 亚洲综合欧美日韩| 精品三级久久久久久久电影聊斋| 国产成人免费在线观看不卡| 国产精品第二页| 久久久久99精品成人片我成大片| 你懂的网址国产 欧美| 综合网中文字幕| 成人免费毛片糖心| 久久综合五月婷婷| 精品国一区二区三区| 久久人人爽av| 丁香婷婷久久| 欧美三级资源在线| 黄色免费网址大全| 春暖花开亚洲一区二区三区| 福利视频一区二区| 日韩国产欧美亚洲| 91精品国产黑色瑜伽裤| 亚洲综合一二三区| 91亚洲精品国产| a在线免费观看| 亚洲精品高清在线观看| ijzzijzzij亚洲大全| 日韩毛片久久久| 国产精品久久久久aaaa樱花| 日本精品一区二区三区高清 久久| 五月天婷婷社区| 久久影音资源网| 免费影院在线观看一区| 三区在线观看| 久久久久久毛片| 日韩免费电影一区二区| xxxxx日韩| 中文字幕一区二区三区不卡在线| 亚洲三区在线| 很黄的网站在线观看| 亚洲美女少妇撒尿| 日韩成人手机在线| 国产精品原创| 色综合网站在线| 亚洲精品怡红院| 国产免费区一区二区三视频免费| 日韩午夜电影在线观看| 动漫美女无遮挡免费| 日韩最新在线| 在线观看亚洲视频| 丝袜美腿小色网| 伊人蜜桃色噜噜激情综合| 91chinesevideo永久地址| 精品人妻一区二区三区免费看 | 4p变态网欧美系列| 国语对白做受69按摩| 蜜桃精品在线观看| 3d动漫精品啪啪一区二区三区免费 | 欧美制服丝袜第一页| 午夜国产福利在线观看| 视频在线一区| 日韩精品久久久久久福利| 日韩一级av毛片| 91精品亚洲| 性欧美在线看片a免费观看| 久久久免费高清视频| 麻豆国产精品视频| 国产福利不卡| 国产高清免费av在线| 亚洲天堂a在线| 99在线精品免费视频| 欧美韩国亚洲| 欧美成人a在线| 中文字幕免费高清| 欧美日韩一区二区高清| 国产成人在线一区二区| 国产日韩欧美一区二区东京热 | caopen在线视频| 狠狠色狠狠色综合日日五| 婷婷激情四射五月天| 综合中文字幕| 这里只有精品视频在线| 国产福利久久久| 久久精品久久综合| 精品国产乱码久久久久久蜜柚| av资源网站在线观看| 亚洲成av人影院| 亚洲妇熟xx妇色黄蜜桃| 欧美**vk| 久久久久久久久久久免费| 国产精品sm调教免费专区| 成人v精品蜜桃久久一区| 亚洲国产欧美日韩| 高清在线视频不卡| 欧美一区二区三区视频| 国产又大又粗又爽的毛片| 欧美亚洲不卡| 成人乱色短篇合集| 狠狠狠综合7777久夜色撩人| 亚洲午夜在线视频| 欧美又黄又嫩大片a级| 精品国产乱码久久久久久果冻传媒| 九九视频直播综合网| 中日精品一色哟哟| 久久久久亚洲综合| 欧美色图色综合| 中文字幕一区图| 九九视频直播综合网| 97国产成人无码精品久久久| 国产无遮挡一区二区三区毛片日本| 大胆欧美熟妇xx| vam成人资源在线观看| 一区二区三区天堂av| 欧美一区二区三区四| 丁香激情综合国产| 成人免费a级片| 一区三区自拍| 欧美激情精品久久久久久黑人| 国产三级视频在线播放| ●精品国产综合乱码久久久久| 青青草精品视频在线观看| 亚洲专区视频| 日韩免费在线视频| 国产二区在线播放| 色丁香久综合在线久综合在线观看 | 日本高清不卡一区二区三区视频| 精品中文视频在线| 天堂中文在线网| 91在线porny国产在线看| 久激情内射婷内射蜜桃| 久久亚洲黄色| 日本国产高清不卡| 国产www.大片在线| 欧美丝袜自拍制服另类| 亚洲 欧美 国产 另类| 看片网站欧美日韩| 四虎4hu永久免费入口| 免费一级欧美片在线观看网站| 欧美老女人xx| 婷婷综合激情网| 色婷婷av一区二区三区大白胸| 免费毛片视频网站| 久久国产婷婷国产香蕉| 这里只有精品66| 亚洲精品一区国产| 81精品国产乱码久久久久久| 男人久久精品| 91麻豆精品国产91| 久久免费公开视频| 91原创在线视频| 色噜噜狠狠永久免费| 中文字幕一区二区三区乱码图片| 成人黄色片视频网站| 在线中文字幕播放| 中文精品99久久国产香蕉| 国产男男gay网站| 亚洲国产日韩一级| 国产美女免费无遮挡| 免费人成精品欧美精品| japanese在线播放| 网友自拍区视频精品| 国产精品偷伦一区二区| 日本片在线观看| 亚洲欧美www| 国产日韩欧美视频在线观看| 福利一区视频在线观看| 国产成人av免费在线观看| 成人教育av在线| 在线观看国产一级片| 91久久黄色| 亚洲色图自拍| 四虎5151久久欧美毛片| 成人黄色av播放免费| 涩涩视频网站在线观看| 久久久久北条麻妃免费看| 天堂av在线7| 91精品在线一区二区| 国产一级片毛片| 亚洲欧美一区二区三区国产精品| 欧美深性狂猛ⅹxxx深喉 | 911久久香蕉国产线看观看| 国产欧美日韩亚洲| 欧美a一级片| 91成人在线播放| 国产乱色在线观看| 亚洲视频在线观看免费| 免费观看a视频| 欧美一级在线免费| 欧美男人天堂网| 五月激情六月综合| 五月天av网站| 国产精品久久久久四虎| 国产精品jizz| av一区二区久久| 日本性生活一级片| 韩国视频一区二区| 亚洲欧美在线精品| 久久久久久婷| 黄色动漫在线免费看| 国产一区二区三区四区三区四 | 午夜天堂精品久久久久| 五月天久久综合网| 妖精视频一区二区三区免费观看| 超碰在线97av| 99热这里有精品| 国产主播喷水一区二区| 欧美日韩五区| 欧美一级大片视频| 一级毛片久久久| 2019中文字幕在线观看| av丝袜在线| 久久久视频在线| 成人超碰在线| 性欧美在线看片a免费观看| 黄页在线观看免费| 久久久久久久久久久人体| 深夜国产在线播放| 欧美成人高清视频| 欧美人与性动交α欧美精品济南到| 视频直播国产精品| 日本福利在线| 久久久999精品| 国产视频一区二区| 久久国产精品电影| 青草av在线| 欧美高清在线观看| 538视频在线| 青青精品视频播放| 五月激情久久| 国产欧美在线观看| 高清不卡一区| 成人黄色片视频网站| 狼人天天伊人久久| 美女黄毛**国产精品啪啪| 久久99高清| 午夜精品一区二区三区在线观看| 久久裸体网站| 第九区2中文字幕| 尹人成人综合网| aⅴ在线免费观看| 男女视频一区二区| 国内自拍第二页| 成人av午夜电影| caopeng视频| 自拍视频在线观看一区二区| 久久久91视频| 欧美性猛交xxxx乱大交| 成人黄色激情视频| 3atv一区二区三区| 秋霞视频一区二区| 国产一级揄自揄精品视频| 日本中文在线观看| 欧美激情在线观看视频| 久久sese| 亚洲free嫩bbb| 日韩欧美四区| 伊人久久大香线蕉成人综合网| 欧美日韩福利| 波多野结衣天堂| 国产另类ts人妖一区二区| 免费无码一区二区三区| 欧美激情中文字幕一区二区| 成人免费精品动漫网站| 亚洲不卡av一区二区三区| 国语对白做受69按摩| 精品国产免费人成电影在线观看四季| 欧美3p视频在线观看| 欧美成人h版在线观看| 另类激情视频| 99re视频在线观看| 欧美一级本道电影免费专区| 国内自拍中文字幕| 日韩精品一级中文字幕精品视频免费观看 | 欧美大片拔萝卜| 国产高清美女一级毛片久久| 久久久女女女女999久久| 日韩毛片一区| 国产日韩欧美亚洲一区| 欧美高清视频手机在在线| 阿v天堂2017| 国产不卡视频在线观看| www中文在线| 欧美三级免费观看| 精品久久人妻av中文字幕| 亚洲视频在线视频| 美足av综合网| 成人久久久久久| 精品国产一区二区三区小蝌蚪 | 日产国产欧美视频一区精品| 激情综合激情五月| 亚洲视频免费看| 国产精品xxxxxx| 亚洲人成电影网站色xx| 999福利在线视频| 北条麻妃高清一区| 亚洲成人国产| 91精品无人成人www| 国产婷婷精品av在线| 在线观看亚洲天堂| 精品奇米国产一区二区三区| 黄色大片在线播放| 成人av番号网| 日韩在线观看| 在线观看免费成人av| 久久久国产精品午夜一区ai换脸| 日本一区二区欧美| 欧美成人一区二区三区| 国产成人l区| 91精品视频一区| 午夜欧美在线| 午夜激情影院在线观看| 国产精品久久一级| 中文字幕激情视频| 在线观看中文字幕亚洲| 91精品国产经典在线观看| 欧洲视频一区二区三区| 老司机精品导航| 精品无码国产污污污免费网站| 欧美视频精品一区| 欧美女同网站| 国产精品第一区| 日韩精品一卡| 91日韩精品视频| 亚洲男人天堂av网| www.av黄色| 久久久久久这里只有精品| 51精品国产| 欧美视频在线观看网站 | 日本性高潮视频| 在线观看视频一区二区欧美日韩| 成人免费在线电影| 国产精品自产拍在线观| 亚洲一区 二区 三区| 中国老熟女重囗味hdxx| 亚洲一区二区三区四区五区黄 | 在线欧美激情| 男女裸体影院高潮| 成人网在线播放| 最新中文字幕一区| 日韩中文字幕视频在线观看| 亚洲精品tv| 成人在线国产视频| 久久麻豆一区二区| 这里只有精品6| 欧美国产乱视频| 香蕉国产成人午夜av影院| 一区二区三区韩国| 一区二区三区视频在线观看| 色wwwwww| 国产精品入口免费视频一| 2023国产精品久久久精品双| 荫蒂被男人添免费视频| 91黄色小视频| 在线播放免费av| 欧美午夜免费| 国产精品白丝jk黑袜喷水| 在线观看亚洲欧美| 久久久国产精品x99av| 狠狠久久伊人| 日本人69视频| 好吊成人免视频| 久久综合之合合综合久久| 九色视频成人porny| 久久成人免费日本黄色| 国产真实乱人偷精品视频| 国产亚洲一区精品| 大桥未久女教师av一区二区| 青青视频在线播放| 亚洲免费观看高清完整版在线| 青青视频在线观| 99国产精品久久久久老师| 奇米影视7777精品一区二区|