精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師 原創(chuàng)

發(fā)布于 2025-3-27 09:30
瀏覽
0收藏

Picovoice首席執(zhí)行官Alireza Kenarsari指出,“picoLLM是Picovoice 深度學(xué)習(xí)研究人員和量產(chǎn)工程師共同努力的成果。前者研究出X 位量化算法,而后者構(gòu)建了跨平臺(tái)的LLM 推理引擎。目的還是在于將LLM遍及到任何設(shè)備且將控制權(quán)交還給企業(yè)”。

picoLLM Inference可以免費(fèi)使用,沒(méi)有任何使用限制。無(wú)論是在概念驗(yàn)證上工作,還是為數(shù)百萬(wàn)用戶提供服務(wù)。只需幾行代碼即可部署。


注:其余的產(chǎn)品線有非商用免費(fèi)版,也有收費(fèi)版


1.認(rèn)識(shí)量化(Quantization)

大模型有個(gè)基本的指標(biāo)就是模型參數(shù)規(guī)模,客觀而言參數(shù)規(guī)模越大,效果越佳,但是所需的內(nèi)存越多。例如,要部署 7.7GB 大小的Mistral 7B,需要GPU的VRAM大小要超過(guò)8GB才能在GPU完全加載。因此意味著運(yùn)行更大規(guī)模的模型將需要具有更大規(guī)格的硬件,從而增加成本。

量化是一種壓縮技術(shù),將高精度值映射到低精度值。對(duì)于任意的大模型,這意味著它們的權(quán)重和激活精度會(huì)被調(diào)整,肯定會(huì)對(duì)影響模型的能力。在實(shí)際的運(yùn)用過(guò)程中發(fā)現(xiàn),某些情況下雖然明顯的減低精度,然而卻又能獲得和原來(lái)不相上下的結(jié)果。

量化通過(guò)降低內(nèi)存帶寬需求和提高緩存利用率來(lái)提高性能,不同精度級(jí)別的量化過(guò)程能夠更多的設(shè)備上運(yùn)行大模型。

LLMs通常使用全精度(float32)或半精度(float16)的浮點(diǎn)數(shù)進(jìn)行訓(xùn)練。一個(gè)float16有16位,即2個(gè)字節(jié)。因此在 FP16上訓(xùn)練參數(shù)規(guī)模為1B的大模型則至少需要2GB的內(nèi)存,這還不包括訓(xùn)練過(guò)程中的優(yōu)化器內(nèi)存、激活內(nèi)存和梯度內(nèi)存。

量化其實(shí)就是想找到一種方法,將FP32權(quán)重的值的范圍([最小值,最大值])表示為較低精度的值,例如FP16甚至INT4(整數(shù) 4 位)的數(shù)據(jù)類型。典型的情況是從FP32到INT8。

下圖為一個(gè)具體的例子,將FP16格式的數(shù)組量化為INT8的過(guò)程,當(dāng)然最后可以從INT8再次還原為FP16。這樣一來(lái)原來(lái)模型的存儲(chǔ)大小就被有效的降低了。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

其實(shí)換個(gè)思路來(lái)講,就是將數(shù)軸進(jìn)行壓縮。這里的難題在于如何的量化才能降低存儲(chǔ)開(kāi)銷,但是又能表達(dá)出原來(lái)的意思。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

目前有不少的量化思路,均勻量化是模型量化中常用的一種技術(shù),用于降低深度學(xué)習(xí)模型中權(quán)重和激活的精度。在量化過(guò)程中將值的范圍劃分為固定數(shù)量的等距區(qū)間,然后將每個(gè)值映射到最近區(qū)間的中心。此過(guò)程有助于減少表示每個(gè)值所需的位數(shù)。

與更復(fù)雜的量化技術(shù)相比,均勻量化的主要優(yōu)勢(shì)之一是其簡(jiǎn)單易用。然而,均勻量化可能并不總是能捕捉到數(shù)據(jù)分布的細(xì)微差別。想象一下原始參數(shù)的取值在[3.5,  3.9],若都被量化到4,的確會(huì)導(dǎo)致潛在的信息丟失和性能下降。

另一方面,非均勻量化允許量化步距不均勻分布,從而能更準(zhǔn)確和更靈活。量化過(guò)程由離散量化水平 (Xi) 和相應(yīng)的量化步驟 (?i) 定義。當(dāng)實(shí)數(shù)落在特定的量化步驟范圍 (?i, ?i+1) 內(nèi)時(shí),量化器將其分配到相應(yīng)的量化級(jí)別 (Xi)。非均勻量化方法(如對(duì)數(shù)分布)側(cè)重于以指數(shù)而不是線性方式調(diào)整量化步驟和水平,這可以通過(guò)有效捕獲重要值區(qū)域來(lái)提高準(zhǔn)確性。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)


左圖為對(duì)稱量化,右圖為非對(duì)稱量化

2.微調(diào)中的量化

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)



左圖為QAT,右圖為PTQ,兩者的區(qū)別在于量化的位置。



PTQ是一種流行的技術(shù),模型參數(shù)(通常以FP32等高精度格式存儲(chǔ))被轉(zhuǎn)換為較低位精度的INT8。此轉(zhuǎn)換過(guò)程允許在計(jì)算資源有限的硬件(如移動(dòng)設(shè)備和嵌入式系統(tǒng))上更高效地部署模型。PTQ 可以應(yīng)用于神經(jīng)網(wǎng)絡(luò)的權(quán)重和激活,從而減小模型大小并提高推理速度,而不會(huì)顯著降低準(zhǔn)確性。

QAT具有在部署期間將應(yīng)用的量化效應(yīng)的意識(shí)。當(dāng)對(duì)訓(xùn)練模型進(jìn)行量化時(shí),可能會(huì)導(dǎo)致模型參數(shù)出現(xiàn)擾動(dòng),從而可能導(dǎo)致模型偏離訓(xùn)練期間以浮點(diǎn)精度實(shí)現(xiàn)的收斂點(diǎn)。

為了解決這個(gè)問(wèn)題,QAT使用量化參數(shù)重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,使模型能夠收斂到損失減少的點(diǎn)。在QAT期間,在浮點(diǎn)對(duì)量化模型執(zhí)行正向和后向傳遞,而模型參數(shù)在每次梯度更新后進(jìn)行量化,類似于預(yù)測(cè)梯度下降。在浮點(diǎn)權(quán)重更新后執(zhí)行投影對(duì)于防止零梯度或高誤差梯度至關(guān)重要,尤其是在低精度場(chǎng)景中。

在QAT的反向傳播過(guò)程中,處理不可微分的量化算子是一個(gè)挑戰(zhàn)。一種常用方法是使用直通估計(jì)器 (STE) 通過(guò)將量化算子視為恒等函數(shù)來(lái)近似量化算子的梯度。

3.picoLLM

picoLLM Compression是Picovoice內(nèi)部開(kāi)發(fā)的一種新型大型語(yǔ)言模型量化算法。給定一個(gè)特定于任務(wù)的成本函數(shù),picoLLM Compression 會(huì)自動(dòng)學(xué)習(xí)跨權(quán)重和權(quán)重內(nèi)LLM的最佳位分配策略。而目前現(xiàn)有技術(shù)方案都是固定分配。

picoLLM提供了一個(gè)全面的開(kāi)源基準(zhǔn)測(cè)試結(jié)果,例如下圖,當(dāng)應(yīng)用于 Llama-3-8b ,picoLLM在2、3和 4位的量化設(shè)置下在MMLU的評(píng)測(cè)分?jǐn)?shù)中,將采用GPTQ算法的正確率下降消滅于無(wú)形之中。隨著量化位數(shù)的下降,幾乎保持堅(jiān)挺。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

現(xiàn)有方法依賴于跨模型權(quán)重的固定位分配。但是,picoLLM 在量化過(guò)程中學(xué)習(xí)最優(yōu)分配。每個(gè)模型最理想的量化位數(shù)取決于自身的架構(gòu)和壓縮比。例如,下面的三張圖顯示了壓縮比為 3、5 和 7 時(shí) Llama-2-7b不同組件之間的位最佳分布:

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

在MMLU (5-shot)任務(wù)上采用picoLLM的效果對(duì)比。

AI架構(gòu)系列:picoLLM 大模型的量化魔術(shù)師-AI.x社區(qū)

PicoLLM 框架支持Gemma、Llama、Mistral、Mixtral和Phi系列模型,并在Windows、macOS 和Linux上跨平臺(tái)運(yùn)行(包括Raspberry Pi 4和 5 上的Raspberry Pi OS)以及 Android 和 iOS。下次將詳細(xì)地介紹內(nèi)在原理。

本文轉(zhuǎn)載自??魯班模錘??,作者:魯班模錘

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-3-27 09:31:25修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
成人网ww555视频免费看| 成人精品国产免费网站| 亚洲一二区视频| 成人在线观看网址| 中文字幕成人av| а√天堂资源官网在线资源| 杨幂毛片午夜性生毛片 | 色久综合一二码| 国产原创一区| 国产亚洲欧美精品久久久www | 日本在线视频网| 国产永久免费网站| 欧美中文字幕一区二区三区| 国产精品片aa在线观看| 亚洲精品国产欧美在线观看| 一级全黄肉体裸体全过程| 欧美v日韩v国产v| 天堂在线一区二区| a视频在线免费看| 三级视频网站在线观看| 国产精品偷伦免费视频观看的| 亚洲精品国产精华液| 久久91麻豆精品一区| 99热这里只有精品在线观看| 免费av网址在线| 久久99精品久久久久久琪琪| 欧美极品另类videosde| 免费成人蒂法| 99久久精品日本一区二区免费 | 岛国片av在线| 中文在线观看免费视频| 国产精品pans私拍| 1000部国产精品成人观看| 高清一区二区中文字幕| 欧美成人一区二区三区高清| 国产精品国产一区二区| 黑人欧美xxxx| 亚洲中无吗在线| 国产黄在线看| av2014天堂网| 亚洲va电影大全| 在线视频国内自拍亚洲视频| 亚洲大黄网站| 国产三线在线| 欧日韩不卡视频| 激情小说综合网| 7777精品伊人久久久大香线蕉超级流畅 | 欧美日韩一区二区三区免费看| 极品av少妇一区二区| 在线视频1区2区| av网在线播放| 蜜桃传媒视频第一区入口在线看| 亚洲第一精品福利| 国产成人一级电影| 亚洲精品高潮| 丰满人妻一区二区三区免费视频| 午夜一区二区视频| 成人黄色av网站| 欧美丰满美乳xxx高潮www| 美女视频第一区二区三区免费观看网站| 极品在线视频| 欧美日韩a v| 亚洲国产精品三区| 91在线视频导航| 欧美mv和日韩mv国产网站| 粉嫩久久99精品久久久久久夜| 久久伊人久久| 亚洲第一成人av| 国产十八熟妇av成人一区| 久久精品中文字幕一区二区三区 | 国产欧美自拍视频| 午夜精品国产精品大乳美女| 黑丝美女久久久| 看电视剧不卡顿的网站| 日韩区欧美区| 国产中文字幕在线看| 男女做暖暖视频| 亚洲中文字幕无码不卡电影| 亚洲字幕一区二区| 亚洲视频在线观看视频| 亚洲欧美另类综合偷拍| 丝袜诱惑亚洲看片| 成人av综合网| free性欧美hd另类精品| 在线精品免费视| a级一a一级在线观看| 在线播放 亚洲| 欧美亚洲第一页| 精品国产乱码久久久久久免费| 中文字幕高清一区| 久久激情婷婷| 精品少妇3p| 擼擼色在线看观看免费| 国产乱色精品成人免费视频| 91l九色lporny| 国产免费黄色av| 精品一区在线播放| 国产69精品久久久久99| 欧美成人女星排名| 亚洲精品国产精品乱码不99| 韩国成人在线视频| 91综合在线| 国产高清亚洲| 中文字幕有码在线视频| 国产高潮流白浆喷水视频| 久久久久麻豆v国产| 污污网站在线观看视频| 亚洲精品中字| 亚洲永久免费观看| 欧美激情在线观看| 精品国产乱码久久| 色婷婷久久99综合精品jk白丝 | 日本欧美在线视频| 国产小视频91| 欧美精品 国产精品| 一级女性全黄久久生活片免费| 国产福利精品导航| 亚洲青涩在线| 北条麻妃国产九九九精品小说| 经典三级一区二区| а√中文在线8| 天堂在线中文网| 日韩精品久久久久久免费| 国精产品一区一区| 人妻av一区二区| www.亚洲高清| 美女日批免费视频| 亚洲图色在线| 久久涩涩网站| dy888夜精品国产专区| 欧美一区二三区| 精品综合久久久久久97| 国产亚洲精品久久| 欧美成人一级视频| 69堂成人精品免费视频| 欧美日韩亚洲视频| 亚洲精品国产精品乱码不99| 日本一区二区三区高清不卡| 99久久久无码国产精品| 风流少妇一区二区| 黄页视频在线91| 美女一区二区视频| 丝袜诱惑亚洲看片| 国产一区二区三区的电影| 亚洲手机视频| 欧美婷婷在线| 日韩视频二区| 亚洲精品日本| 国产精品综合| 99精品99| 爽好多水快深点欧美视频| 国产精品嫩草99av在线| 亚洲一区一卡| 久久综合亚州| 久久av资源站| 国产麻豆午夜三级精品| 久久精品999| 国产精品888| 成人精品小蝌蚪| 不卡av电影在线播放| 久久久噜噜噜久噜久久综合| 国产午夜一区二区三区| 国产精品情趣视频| 一区二区高清视频在线观看| 亚洲永久精品大片| 欧美视频在线视频| 欧美亚洲禁片免费| 91精品国产入口| 精品亚洲一区二区三区在线观看| 夜夜嗨av一区二区三区四区| 中文字幕视频在线免费欧美日韩综合在线看 | 自拍偷自拍亚洲精品播放| 亚洲免费三区一区二区| 亚洲成av人片在线| 欧美日韩久久久| 精品无人国产偷自产在线| 日韩亚洲欧美成人| 91精品国产亚洲| 成人免费看黄网站| 蜜桃传媒一区二区| www.xxx麻豆| 亚洲激情在线观看视频| 中国免费黄色片| 成人欧美一区二区三区黑人一| 久久久久久久久久免费视频 | 91精品秘密在线观看| 夜夜嗨一区二区| 国产成人免费视频| 国产精品第四页| 色综合网站在线| 亚洲精品国产精品国自产在线 | a级片在线观看免费| 中文字幕网址在线| 男女视频在线观看| bl在线肉h视频大尺度| 亚洲日本视频在线| 91成人免费| 国产一区二区在线看| 国产精品天美传媒| 欧美在线看片a免费观看| 亚洲人成电影在线| 国产精品成人观看视频国产奇米| 久久久久久艹| 好男人www社区| 国产福利在线导航| 亚洲在线精品视频| 在线观看h网| baoyu135国产精品免费| 日韩午夜电影免费看| 欧美日韩在线播放视频| 久草精品在线观看| 伊人性伊人情综合网| 日韩精品在线免费观看| 国产精品成人免费电影| 一级黄色录像免费看| 95视频在线观看| 91久久国产综合久久91| 免费的黄网站在线观看| a级日韩大片| 日本欧美一区二区三区乱码 | 91久久精品美女| 久久综合久久网| 亚洲第一综合网| www.国产视频| 蜜臀国产一区| 欧美天天在线| 亚洲欧美综合在线精品| 精品国产成人系列| 国产精品看片资源| 日本中文字幕网址| 可以免费看av的网址| 肉丝一区二区| 亚洲伊人影院| 久久99精品久久久久久久久久久久| 一区二区三区四区视频精品免费| 一本大道亚洲视频| 日本在线观看不卡| aaaaaav| 五月天婷婷社区| 免费观看在线一区二区三区| 久久综合图片| 91国偷自产一区二区使用方法| 欧美激情亚洲精品| 精品91一区二区三区| 中文字幕乱码av| 触手亚洲一区二区三区| 欧美人与牛zoz0性行为| 久久久久成人黄色影片| 日韩电影免费观看在线观看| 97超级在线观看免费高清完整版电视剧| 99热这里只有精品在线播放| 中文字幕av片| 青草综合视频| 国产麻豆精品一区二区| 91精品国产综合久久久久久漫画| 成人黄色激情网| 91人妻一区二区三区| 91丨porny丨在线中文 | 欧美精品三级在线| 国产福利电影一区二区三区| 日韩精品一区二区三区在线| 国产精品免费一区二区三区四区| xxxxwww一片| 欧美精品少妇| 成人直播大秀| 亚洲精品v日韩精品| 久久久久久久久久久人体 | 国产一区二区中文字幕免费看| 亚洲永久无码7777kkk| 国产乱视频在线观看| 2023国产精品久久久精品双| 一区二区三区在线高清| 欧美亚洲国产精品| 超碰人人草人人| 亚洲日本中文字幕在线| 欧美日韩国产高清电影| 亚洲一区二区中文在线| 国产精品美女久久久久久免费| 免费人成视频在线播放| 成人性爱视频在线观看| 极品少妇一区二区三区| 8v天堂国产在线一区二区| y111111国产精品久久婷婷| 538精品视频| 一区二区三区电影大全| 国产精一区二区三区| 这里只有视频精品| 91视频 -- 69xx| 精品久久久久中文慕人妻| 欧美电影《睫毛膏》| 色拍拍在线精品视频8848| 国产不卡一区二区三区在线观看| 很污很黄的网站| 久久爱.com| 国产日本欧美一区二区| 日本精品免费观看| 欧美精品欧美极品欧美激情| 999福利在线视频| 成人免费视频免费观看| 久久91亚洲精品中文字幕奶水| 玖玖爱视频在线| 黄色av免费在线| 国产精品中文有码| 欧美理论电影在线播放| 日本黄色大片在线观看| 免费影视亚洲| 97久久精品人人做人人爽| 77777亚洲午夜久久多人| yjizz视频| 日韩欧美另类一区二区| 国产欧美精品一区二区三区四区| 国产精自产拍久久久久久| 久久精品日韩无码| 国产厕拍一区| 日本韩国精品在线| 青少年xxxxx性开放hg| 国内爆初菊对白视频| 午夜影院日韩| 久久精品中文字幕一区| 免费啪视频在线观看| 深夜成人福利| 一区二区三区产品免费精品久久75| 国产三区精品| 91尤物国产福利在线观看| 欧美三级特黄| 亚洲性线免费观看视频成熟| 先锋资源在线视频| 色8久久影院午夜场| 洋洋成人永久网站入口| 青娱乐国产91| 老牛影视av牛牛影视av| 麻豆国产精品官网| 欧美在线观看日本一区| 全程偷拍露脸中年夫妇| heyzo久久| 亚洲欧美国产另类| 岛国av免费观看| 深夜激情久久| 51精品视频一区二区三区| 欧美成人黄色网址| 在线观看爽视频| 欧美日韩国产精品一区二区不卡中文| 91麻豆天美传媒在线| 天堂地址在线www| 久久网站最新地址| 久久精品ww人人做人人爽| 99riav国产| 国产精品一区二区x88av| 成人免费看片视频| 国产伦精品一区二区三区视频痴汉 | 欧美日韩中字| 中文字幕久久久| heyzo国产| 成人va天堂| 欧美美女一区二区三区| 亚洲这里只有精品| 亚洲久草在线| 精品久久久久久久人人人人传媒 | 四虎精品永久免费| 91精品国产综合久久久久| 国产成人av片| 日韩美女国产精品| 亚洲欧美成人精品| 青青草自拍偷拍| 欧美日韩a区| 日韩美女免费视频| 一级特黄aaa| av动漫一区二区| 一区二区免费电影| 国产免费拔擦拔擦8x在线播放 | 日本精品一区二区| 秋霞午夜理伦电影在线观看| 亚洲午夜视频在线观看| 国产精品wwwww| 日本一区二区三区播放| 国产亚洲欧洲高清一区| 黄色在线观看免费| 日韩电影在线免费看| 国产一区二区免费在线观看| 99视频在线观看地址| 亚洲成人激情自拍| 欧美色图校园春色| jlzzjlzz亚洲女人| 8090成年在线看片午夜| 精品欧美在线观看| 国产精品日韩成人| 日本免费观看网站| 欧美人妖在线| 欧美亚洲国产日本| 欧美 日韩 综合| 亚洲免费视频中文字幕| 男人的天堂最新网址| 欧洲grand老妇人| 日本欧美国产在线| 欧美色18zzzzxxxxx| 午夜精品久久久久久不卡8050| 成年人看片网站| 中文字幕亚洲精品乱码| 成人国产一区二区| av在线加勒比|