精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟

人工智能 新聞
在極大規模下,稀疏激活模型有可能達到與密集模型相當的性能,為設計和訓練大規模稀疏激活模型提供了一個有用的參考。

只需激活60%的參數,就能實現與全激活稠密模型相當的性能。

微軟亞洲研究院的一項新研究,實現了模型的完全稀疏激活,讓推理成本大幅下降。

而且適用范圍廣泛,無論是從頭訓練、繼續訓練還是微調,都能提供有效支持。

圖片

該方法名為Q-Sparse在神經元級別上實現了模型稀疏化,相比于其他方式粒度更細,在相同推理開銷下,無論性能還是稀疏率都更好。

名稱之中,Q指的是量化(Quantization),意味著它除了普通模型之外,也兼容量化技術,適用于各種量化方式的模型。

作者進一步表示,如果把Q-Sparse與模型量化技術結合,還可以實現更大程度的降本增效。

另外在研究Q-Sparse的同時,團隊也對參數規模、稀疏率和模型性能三者之間的關系進行了深入探尋,并發現了適用于模型推理優化的“Scaling Law”

有網友認為,這項技術確實不錯,而且比ReLU要更好。

圖片

還有人開啟了許愿模式,表示如果(AMD的)ROCm能比英偉達更快支持這項技術就好了。

圖片

用Top-K函數實現稀疏化

Q-Sparse所做的最核心的操作,是對輸入的張量應用Top-K稀疏化函數

具體來說,Transformer架構在注意力層和前饋層中都使用nn.Linear線性層(矩陣乘法)進行投影,可以表示為Y=X·W^T。(其中X就是輸入張量,W代表其權重,Y為輸出張量)

Q-Sparse中,對于一個輸入激活張量X,首先會計算其絕對值|X|并進行排序,找出其中絕對值最大的K個元素

這里的K是預先設定的超參數,決定了稀疏化的程度。

之后Q-Sparse會創建一個與X形狀相同的二進制掩碼張量M,對于一系列|X|中絕對值最大的K個元素對應的位置,將M中的相應位置設置為1,其余位置設置為0。

接著,將輸入張量X與掩碼張量M進行Hadamard積(逐元素相乘)運算,就得到了稀疏化的張量X_sparse

在前向傳播過程中,稀疏化后的張量X_sparse將代替原始的輸入張量X參與后續的計算(如矩陣乘法)

由于X_sparse中大部分元素已經被設置為零,因此可以顯著減少計算量和內存帶寬需求。

圖片

在反向傳播過程中,Q-Sparse使用了直通估計器(Straight-Through Estimator,STE)來計算Top-K函數的梯度。

傳統的訓練方式中,通常需要計算損失函數對網絡參數的梯度,并使用梯度下降法更新參數以最小化損失。

但當網絡中存在量化、Top-K等一些不可微的操作時,梯度的計算就會遇到問題,因為這些操作的輸出對輸入的梯度在大多數點上都是0,導致梯度無法有效傳播。

STE通過直接將梯度傳遞給稀疏化之前的張量,避免了梯度消失的問題。

一般的反向傳播中,損失函數L對x的梯度?L/?x=?L/?y??y/?x,但由于不可微分無法直接計算。

STE的解決方案是只計算損失函數對稀疏化張量y的梯度,然后將其直接復制給原始張量x,也就是直接將?L/?y作為?L/?x的估計。

圖片

△有/無STE時的梯度比較

對于前饋層,Q-Sparse使用平方ReLU函數代替常規的ReLU激活函數,平方運算可以進一步提高激活的稀疏性(⊙表示Hadamard積)

圖片

另外,為了適配量化模型,Q-Sparse在應用Top-K稀疏化之前,會先對輸入張量進行量化,以確保稀疏化操作與量化表示兼容,其函數表示如下:

圖片

其中,ε是一個小常數,用于避免出現分母為零的情況。

特別的,對于1-bit量化的權重,Q-Sparse使用以下量化函數,其中α是權重張量W的平均絕對值。

圖片

60%激活參數達到相同效果

對比實驗表明,無論是稀疏率還是模型表現,Q-Sparse都顯著優于此前的ReLU方法。

圖片

針對Q-Sparse的具體效果,作者對其在從頭訓練、繼續訓練和微調三項任務上的性能進行了評估。

從頭訓練實驗使用的模型為Llama,結果在700M和7B模型上,使用70% top-K(即40%的整體稀疏率)的Q-Sparse可以達到與密集baseline相當的訓練損失。

圖片

繼續訓練的目的是將稠密模型稀疏化,這里的實驗對象是Mistral-7B。

結果,在激活參數為2.9B和3.8B的情況下,模型在ARC、MMLU等數據集中的得分均未發生明顯下降。

圖片

微調實驗中,對于Qwen-7B和Mistral-7B兩種模型,Q-Sparse顯示出了與繼續訓練相似的結果,用60%左右的激活參數實現了與密集模型十分接近的表現。

圖片

這些結果意味著,在相同的性能下,與密集模型相比,稀疏激活模型在推理過程中可以顯著減少激活參數,進而降低消耗FLOPS的數量。

對于量化模型,團隊在自研的BitNet b1.58模型上應用了Q-Sparse,并在多個數據集上進行了訓練和評估。

可以看到,在700M和7B兩種規模下,使用Q-Sparse的量化模型的收斂速度和最終損失函數值與未使用Q-Sparse的量化模型(BitNet b1.58)相當。

這說明Q-Sparse可以無縫集成到量化模型中,而不會顯著影響模型的訓練和收斂。

據此作者認為,將Q-Sparse與量化技術相結合,可以進一步提高大語言模型在推理階段的效率。

圖片

發現推理優化新“Scaling Law”

除了測評這些模型采取稀疏激活時的表現,作者也對模型性能、規模和稀疏率三者之間的關系進行了探究,并有了一些新的發現。

稀疏激活模型的性能縮放定律: 作者發現,與密集模型類似,稀疏激活模型的性能也遵循一個冪律縮放關系。

具體來說,給定稀疏率S,模型在收斂時的損失函數值L(N,S)可以用以下公式近似:

圖片

其中,N是模型參數的數量;E是一個常數,表示模型在無限大時的損失;A(S)是一個與稀疏率S有關的縮放因子。

這個縮放定律表明,稀疏激活模型的性能隨著模型規模的增大而提高,但提高的速度會逐漸變慢

圖片

同時作者發現,模型的性能也會受到稀疏率的影響。

在參數規模與性能之間關系的部分提到,A(S)是一個與稀疏率S有關的縮放因子,可以用以下公式近似:

圖片

其中B和C是常數,β是一個控制指數衰減速度的參數。

這個公式表明,當稀疏率S增大(模型變得更稀疏)時,意味著更高的稀疏率會導致性能的下降,下降的速度是指數級的。

圖片

基于上述發現,作者得出了一個推理最優的稀疏率S*,能在預算(推理時的浮點操作數)一定時,實現模型損失函數值的最小化。

對于全精度(FP32)模型,最優稀疏率約為45.58%;而低精度(如1.58-bit)模型的最優稀疏率則更高,約為61.25%。

圖片

作者觀察到,隨著模型規模的增大,稀疏激活模型與密集模型之間的性能差距逐漸縮小。

這可以從縮放定律中得到解釋:當模型規模N趨于無窮大時,稀疏激活模型的損失函數值趨于L(∞,S)=E,而密集模型的損失函數值趨于L(∞,0)=E。

這意味著,在極大規模下,稀疏激活模型有可能達到與密集模型相當的性能,為設計和訓練大規模稀疏激活模型提供了一個有用的參考。

論文地址:https://arxiv.org/abs/2407.10969

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-25 08:00:00

2024-05-07 09:33:03

模型手機

2024-06-03 10:43:34

2024-07-23 10:20:57

2025-02-27 13:45:00

2023-03-14 13:45:14

模型AI

2024-08-13 15:40:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2024-03-18 07:01:42

2025-03-17 12:13:26

AI模型生成

2025-08-14 10:25:11

2025-10-28 15:40:01

AI模型訓練

2025-02-17 12:30:00

2025-07-21 09:07:00

模型訓練視頻

2023-12-17 13:07:11

訓練數據

2024-02-19 14:09:00

模型Eagle 7BRNN

2024-07-17 13:40:01

2023-10-13 19:58:33

Mistral7B模型

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2023-06-28 21:47:54

點贊
收藏

51CTO技術棧公眾號

国产做a爰片久久毛片| 日本免费精品| 国产精品久久久久久久岛一牛影视| 国产精品91久久久久久| 国产中文字幕久久| 国产精品男女| 欧美日韩国产综合一区二区| 超碰人人爱人人| 日本一区高清| 国产在线播精品第三| 国模叶桐国产精品一区| 91精品国产综合久久婷婷香蕉| 国产精品久久久久久av福利| 免费在线黄色网| 丝袜连裤袜欧美激情日韩| 欧美三级电影在线观看| 久久综合久久久久| 天堂中文а√在线| 91免费精品国自产拍在线不卡| 国产欧美在线播放| 狠狠人妻久久久久久| 欧美精品91| 搡老女人一区二区三区视频tv| 亚洲啪av永久无码精品放毛片| 99久久精品一区二区成人| 亚洲大片精品永久免费| 天天干天天操天天干天天操| 国产在线高清| 91在线观看下载| 国产高清自拍一区| 99久久久无码国产精品免费| 毛片av一区二区| 欧美最猛性xxxxx免费| 欧美人妻一区二区| 在线电影一区二区| www.日韩免费| 国产一区二区三区视频播放| 国产欧美日韩影院| 亚洲人成电影在线| 五月婷婷综合在线观看| 欧美a一欧美| 亚洲第一免费播放区| av影片在线播放| 免费一级欧美在线大片| 91精品国产综合久久精品| 手机av在线网| 亚洲精品无播放器在线播放| 色欧美88888久久久久久影院| 自拍另类欧美| 91xxx在线观看| 久久日一线二线三线suv| 北条麻妃高清一区| 国产强伦人妻毛片| 久久电影网站中文字幕| 亚洲永久精品大片| 中文字幕九色91在线| 亚洲一区二区中文字幕在线观看| 校园春色亚洲色图| 日韩欧美亚洲国产一区| 亚洲人成无码网站久久99热国产| 在线视频观看国产| 亚洲特级片在线| 一区二区三区欧美在线| 成人免费在线观看| 中文字幕av一区二区三区高 | av大片免费在线观看| 亚洲精品成人无限看| 久久精品成人欧美大片| 日本高清黄色片| 精品美女久久久| 中文字幕欧美专区| 欧美性生交大片| 国产精品久久久乱弄 | 欧美日韩高清一区二区不卡| 污色网站在线观看| www.久久草.com| 777a∨成人精品桃花网| 一级黄色高清视频| 99国产精品久久一区二区三区| 欧美不卡一区二区| 黄色免费看视频| 国产精品白浆| 亚洲国产精品久久| 91l九色lporny| 久久在线播放| 欧美成人免费观看| 久久网免费视频| 亚洲青涩在线| 热99在线视频| 91在线公开视频| 国产乱码精品一品二品| 国产免费一区二区三区| 天天色棕合合合合合合合| 久久综合网色—综合色88| 欧美精品亚洲精品| 69av亚洲| 亚洲欧美日韩国产综合在线| 欧美羞羞免费网站| 日本视频一区二区不卡| 日韩免费啪啪| 亚洲成人免费av| 无码人妻丰满熟妇区毛片| 欧美啪啪网站| 精品国产乱码久久久久久夜甘婷婷| 91丝袜在线观看| 欧美日韩国产一区二区三区不卡| 日韩一区二区在线视频| 日产欧产va高清| 日本不卡中文字幕| yy111111少妇影院日韩夜片| 国产乱理伦片a级在线观看| 樱桃视频在线观看一区| 成人久久久久久久久| 精品国产三区在线| 国产亚洲精品久久久久久| 欧美日韩中文字幕在线观看| 久久精品国产清高在天天线| 亚洲一区二区自拍| 毛片免费在线| 成人免费在线播放视频| 国产精品裸体瑜伽视频| 日韩色性视频| 亚洲精品视频免费在线观看| 黄色香蕉视频在线观看| 男女精品网站| av在线不卡观看| 国产在线一在线二| 午夜亚洲国产au精品一区二区| 亚洲欧美在线精品| 奇米色欧美一区二区三区| 久久99精品久久久久久噜噜| 中文字幕在线播| 国产成人亚洲精品狼色在线| 亚洲国产婷婷香蕉久久久久久99 | 日韩伦理一区二区| 亚洲精品99999| 动漫性做爰视频| 蜜臀精品一区二区三区在线观看 | 国产精品系列视频| 亚洲国产高清在线观看| 亚洲三级理论片| 精品久久久噜噜噜噜久久图片 | 成人在线直播| 欧美日韩一卡二卡三卡| 我和岳m愉情xxxⅹ视频| 欧美亚韩一区| 国产欧美日韩高清| av在线电影观看| 在线视频中文字幕一区二区| 风间由美一二三区av片| 99热在线精品观看| 国产乱码精品一区二区三区不卡| av免费在线免费| 91精品国产综合久久精品图片| 娇妻被老王脔到高潮失禁视频| 亚洲欧美日本视频在线观看| 国产欧美日本在线| 成人av福利| 欧美tk—视频vk| 国产一级片网址| 懂色av一区二区三区蜜臀| 在线观看污视频| 精品久久国产一区| 色一情一乱一区二区| 国产又粗又黄又爽| 亚洲免费观看在线视频| 人妻精油按摩bd高清中文字幕| 99久久.com| 亚洲va久久久噜噜噜| 国产最新在线| 日韩精品一区二区三区中文精品| 私库av在线播放| 懂色av中文字幕一区二区三区| 国产传媒久久久| 国内精品偷拍| 91成人性视频| 全色精品综合影院| 欧美日韩大陆在线| 校园春色 亚洲| 夫妻av一区二区| 自拍日韩亚洲一区在线| 九一亚洲精品| 成人xxxx视频| 四虎亚洲成人| 精品视频偷偷看在线观看| 国产成人无码专区| 亚洲视频一区二区免费在线观看| 黄色aaaaaa| 亚洲尤物精选| 国产精品久久看| 中文字幕av久久| 亚洲国产一区二区三区网站| 992tv成人免费影院| 九色在线视频蝌蚪| 91精品国产综合久久蜜臀| 久操免费在线视频| 91蜜桃免费观看视频| 国产又大又黄又粗又爽| 综合久久综合| 国产伦精品一区二区三区免| 自拍在线观看| 久久视频在线观看免费| 少妇高潮一区二区三区99小说| 日本高清成人免费播放| 好吊日在线视频| 久久久综合精品| 亚洲男人天堂av在线| 在线播放不卡| 一区二区不卡在线视频 午夜欧美不卡'| 精品一区二区三区在线观看视频| 97色在线观看免费视频| 国产福利小视频在线观看| 精品国产伦一区二区三区免费| 中文字幕高清在线免费播放| 一区二区三区四区精品在线视频| 日本高清www| 国产iv一区二区三区| 热久久精品免费视频| 亚洲香蕉网站| 一区二区三区在线视频111| 女人抽搐喷水高潮国产精品| 川上优av一区二区线观看| av丝袜在线| www.亚洲免费视频| 裸体xxxx视频在线| 精品国产一区二区三区不卡 | 无码一区二区三区视频| 久久久久久国产精品免费免费| 精品一区二区三区视频在线播放| 国产成一区二区| 在线天堂新版最新版在线8| 久久国产精品久久久久| 阿v免费在线观看| 亚洲精品短视频| 国产三级伦理片| 欧美日韩国产区一| 最新中文字幕在线观看视频| 好吊成人免视频| 久久久精品99| 一区二区三区四区视频精品免费| av免费播放网站| 久久精品论坛| 欧美绝品在线观看成人午夜影视 | 亚洲伊人色欲综合网| 成年人免费视频播放| 国产色综合一区| 中文字幕一区二区三区人妻| 99久久久久久| 日本一区二区在线观看视频| 粉嫩高潮美女一区二区三区| xxxx国产视频| 国产资源在线一区| wwwwwxxxx日本| 国产乱国产乱300精品| 污网站在线免费| 久久99精品久久只有精品| 手机看片一级片| 毛片av一区二区| 国产又黄又猛的视频| 久久成人免费网| av中文字幕网址| 国产在线不卡一卡二卡三卡四卡| 天天综合天天添夜夜添狠狠添| 美女视频黄久久| 亚洲色欲综合一区二区三区| 久久国产高清| 日本免费观看网站| 激情欧美一区二区三区在线观看| 日本美女视频一区| 国产高清成人在线| wwwxx日本| 久久综合999| 91成人精品一区二区| 中文字幕亚洲综合久久菠萝蜜| 成年人午夜剧场| 亚洲综合在线视频| 久久久久久免费观看| 日本久久精品电影| 在线观看国产精品视频| 69精品人人人人| 精品国产乱码一区二区三| 精品国产在天天线2019| 香港一级纯黄大片| 在线观看欧美视频| 福利视频在线看| 色偷偷88888欧美精品久久久| 快射av在线播放一区| 欧美黄色片免费观看| 高清精品在线| 国产精品久久久久久久一区探花 | 粉嫩av懂色av蜜臀av分享| 久久久三级国产网站| 成人涩涩小片视频日本| 图片区小说区国产精品视频| 无码人妻精品一区二区蜜桃色欲| 精品污污网站免费看| 国产又粗又猛又爽又黄的视频一 | 成年人免费在线播放| 美女精品自拍一二三四| 国产chinesehd精品露脸| 99久久精品免费看国产| 任我爽在线视频| 亚洲国产综合91精品麻豆| 国产视频1区2区| 日韩丝袜美女视频| 每日更新av在线播放| 色综合导航网站| 99re66热这里只有精品4| 91九色国产视频| 猛男gaygay欧美视频| 免费cad大片在线观看| 日韩经典中文字幕一区| 在线观看免费视频国产| 国产精品无人区| 国产性猛交╳xxx乱大交| 欧美群妇大交群中文字幕| 欧美一区二区公司| 日韩一区二区久久久| 午夜精品成人av| 国产厕所精品在线观看| 欧美一区二区三区高清视频| www.av中文字幕| 国产麻豆精品在线| 国产又粗又硬视频| 激情懂色av一区av二区av| 在线观看免费高清视频| 精品国产青草久久久久福利| 黄色网页在线播放| 国产精品十八以下禁看| 欧美xxxx在线| 国产一级做a爰片久久毛片男| 美女视频黄a大片欧美| 国产精品高清无码在线观看| 亚洲精品日韩综合观看成人91| 69视频免费看| 亚洲欧洲黄色网| www.超碰在线| 国产精品日韩欧美一区二区三区| 成人免费在线播放| 少妇人妻无码专区视频| 高清在线成人网| 999精品在线视频| 日韩午夜在线影院| bt在线麻豆视频| 国产一区视频在线| 日韩大片在线播放| 无码日韩人妻精品久久蜜桃| 99re在线精品| 亚洲黄色三级视频| 亚洲第一视频在线观看| 黄色小说在线播放| 国产不卡一区二区在线观看| 欧美国产三级| 国产一级二级av| 亚洲在线视频网站| 亚洲爆乳无码一区二区三区| 欧美黄色免费网站| 国产精品毛片视频| 国产资源在线视频| 91免费国产视频网站| 少妇太紧太爽又黄又硬又爽| 国产视频久久久久久久| 全球最大av网站久久| 亚洲国产精品综合| 极品销魂美女一区二区三区| 中文字幕亚洲一区二区三区| а√在线中文在线新版| 国产原创精品| 狠狠入ady亚洲精品| 一级性生活大片| 欧美午夜精品免费| 日韩三级影院| 亚洲自拍偷拍福利| 亚洲精品社区| 爱爱免费小视频| 欧美手机在线视频| 韩国av网站在线| 国产精品国产精品国产专区不卡| 日韩午夜黄色| 久久国产柳州莫菁门| 3751色影院一区二区三区| 亚洲www色| 久久精品人成| 秋霞电影网一区二区| 久青草免费视频| 亚洲精品中文字幕女同| 免费高清视频在线一区| 青青草原网站在线观看| 成人手机电影网| 中文字幕视频在线播放| 欧美国产精品日韩| 亚洲图片久久| 欧美一级特黄aaa| 亚洲成a人在线观看| av男人的天堂在线| 国产精品我不卡| 人人精品人人爱| 免费一级全黄少妇性色生活片| 亚洲欧洲第一视频| www.久久爱.com|