精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MobileLLM:“苗條”的模型比較好! 原創(chuàng) 精華

發(fā)布于 2024-11-28 15:03
瀏覽
0收藏

?1.MobileLLM

Meta AI研究人員推出了MobileLLM,從arXiv論文時(shí)間上看2月份發(fā)布的,但是在六月底又更新了一版。MobileLLM利用四種先進(jìn)技術(shù),包括帶有SwiGLU的FFN、深度和薄架構(gòu)、嵌入共享和GQA,構(gòu)建了一個(gè)強(qiáng)大的基線小型LLM,MobileLLM。它是專為智能手機(jī)和其他資源受限的設(shè)備而設(shè)計(jì)。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

研究人員將其訓(xùn)練出的MobileLLM 125M/350M和參數(shù)量相當(dāng)?shù)腟tate of the Art(SOTA)模型如Cerebras、OPT、BLOOM等進(jìn)行對(duì)話標(biāo)桿測(cè)試。

在零樣本(zero-shot)測(cè)試中MobileLLM 125M/350M比SOTA模型的平均準(zhǔn)確率高出2.7%/4.3%。使用權(quán)重共享方法訓(xùn)練出的MobileLLM 125M/350M版本,名為MobileLLM LS,還可以將準(zhǔn)確率分別再向上提升0.7%及0.8%。

模型具體的特點(diǎn)在于:

  • 采取「深而精簡(jiǎn)」(deep- and-thin)的模型架構(gòu)更能以極高效能萃取抽象知識(shí)
  • 利用先進(jìn)的權(quán)重共享技術(shù),包括嵌入共享、分組查詢注意力和塊權(quán)重共享,在存儲(chǔ)受限的場(chǎng)景中實(shí)現(xiàn)了權(quán)重利用率的顯著的提高。

2.苗條架構(gòu)

大模型領(lǐng)域有一種普遍觀點(diǎn),Transformer模型的性能主要取決于參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)集的大小和訓(xùn)練迭代次數(shù)。這種觀點(diǎn)認(rèn)為,架構(gòu)設(shè)計(jì)對(duì)Transformer模型的性能影響微乎其微。

但是本次實(shí)驗(yàn)研究表明,對(duì)于較小的模型,為了提高性能,更深比廣泛更為重要。下面的研究涉及 19 個(gè)模型的訓(xùn)練,其中包括 9個(gè)具有~125M個(gè)參數(shù)的模型和10個(gè)具有~350M個(gè)參數(shù)的模型。每個(gè)模型的設(shè)計(jì)大小相似,但深度和寬度有所不同。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

上圖對(duì)八個(gè)零樣本常識(shí)推理任務(wù)以及問(wèn)答和閱讀理解基準(zhǔn)進(jìn)行了實(shí)驗(yàn)。研究結(jié)果一致表明,更深更薄的模型優(yōu)于更淺更寬的模型。

黑色部分是最佳表現(xiàn),可以看到基本上層數(shù)都較深。同時(shí)可以觀察到更深的網(wǎng)絡(luò)在大多數(shù)零樣本推理任務(wù)中的卓越性能,包括 ARC-easy、ARC-challenge、PIQA、HellaSwag、OBQA、WinoGrande,尤其是在TQA和RACE數(shù)據(jù)集上更加明顯。

<劃重點(diǎn)!>對(duì)于大小約為 125M的transformer 模型,具有30層甚至42層的模型的性能明顯優(yōu)于具有12層的模型。要知道之前大多數(shù)的125M模型的層數(shù)都限制為12!!

此時(shí)細(xì)心的讀者會(huì)發(fā)現(xiàn)第一行是升序,第二行是降序,第二行就是每個(gè)Transormer塊中的頭數(shù)<溫習(xí)點(diǎn)>。當(dāng)模型的層數(shù)增加的時(shí)候,頭數(shù)一直在降低,也就是所謂的深而精簡(jiǎn)!

研究人員最初設(shè)計(jì)用于減少LLM中的鍵值緩存大小的GQA,也可以有效減少小型LM中鍵值頭的冗余。GQA可以看作是權(quán)重重用的另一種權(quán)重共享形式,其中鍵值頭的數(shù)量是查詢頭的1/n,并且kv頭在計(jì)算注意分?jǐn)?shù)和與查詢一起輸出時(shí)重復(fù)n次。

上表的結(jié)果表明,使用16個(gè)查詢頭可產(chǎn)生最佳結(jié)果。將kv-heads的數(shù)量從16個(gè)減少到4個(gè),可使125M模型的準(zhǔn)確率相當(dāng),而350M模型的準(zhǔn)確率僅下降0.2個(gè)百分點(diǎn),模型大小減少了近10%。通過(guò)采用分組查詢注意機(jī)制 (GQA),同時(shí)增加嵌入維度以保持模型大小,125M的準(zhǔn)確率進(jìn)一步提高了0.4個(gè)百分點(diǎn),表明GQA是進(jìn)一步挖掘小模型潛力的有利方法。

3.共享技術(shù)

Topic1 嵌入共享:

在1B以下的自然語(yǔ)言模型中,嵌入層構(gòu)成了參數(shù)數(shù)量的很大一部分。例如,Embedding<溫習(xí)點(diǎn)>的維度為 512,詞匯量為32k,輸入和輸出嵌入層就需要16M參數(shù)。這些嵌入層合在一起占125M參數(shù)模型總參數(shù)的20%以上。在大語(yǔ)言模型中,這一比例被稀釋了,例如輸入和輸出嵌入僅占LLaMA-7B模型總參數(shù)數(shù)量3.7%,在 LLaMA-70B模型中僅占0.7%。

LLM 模型中的輸入嵌入將詞匯表中的token ID映射到相應(yīng)的token嵌入,維度為 (vocab_size, embedding_dim)。相反,輸出全連接層?<溫習(xí)點(diǎn)>將嵌入維度映射回詞匯表中的logits預(yù)測(cè)<溫習(xí)點(diǎn)>,權(quán)重大小為 (vocab_size, embedding_dim)。通過(guò)共享嵌入,將“輸入-中間-輸出”的兩個(gè)轉(zhuǎn)化矩陣參數(shù)共用,從而產(chǎn)生更高效、更緊湊的模型架構(gòu)。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

本次研究在30層125M模型上進(jìn)行了實(shí)驗(yàn)。上面的統(tǒng)計(jì)證明共享輸入和輸出嵌入可將參數(shù)數(shù)量減少16M,約占總參數(shù)的11.8%,平均準(zhǔn)確率下降0.2個(gè)百分點(diǎn)。這時(shí)候通過(guò)重新分配已保存的參數(shù)以添加更多層,可以輕松恢復(fù)邊際準(zhǔn)確率下降。與原始 135M模型相比,將深度增加到32層可使準(zhǔn)確率提高 0.4 個(gè)百分點(diǎn),同時(shí)仍保持 10M更少的參數(shù)。在有限的資源預(yù)算下,嵌入共享是一種有價(jià)值的技術(shù),可以最大限度地提高權(quán)重利用率并優(yōu)化模型性能。

Topic 2 層共享:

關(guān)于層深度與寬度影響的發(fā)現(xiàn)表明,對(duì)于小型 Transformer 模型來(lái)說(shuō),更深的層是有利的。這促使我們研究層共享作為一種增加隱藏層數(shù)量而無(wú)需額外模型存儲(chǔ)成本的策略。這種方法在模型大小是主要制約因素的設(shè)備上場(chǎng)景中特別有用。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

上圖(a)代表沒有層共享的基線模型;(b)相鄰塊之間的共享;(c) 重復(fù)全部共享;(d) 反向共享。這里每個(gè)塊就是Transformer塊,包含多頭自注意力 (MHSA) 和前饋網(wǎng)絡(luò) (FFN)。

bcd說(shuō)白了就是按照特殊規(guī)律,相同顏色的塊共同擁有相同的參數(shù)。雖然c策略的共享性能略高,但b策略可以最好地利用緩存,因?yàn)楣蚕頇?quán)重可以保留在緩存中并立即計(jì)算兩次。

實(shí)驗(yàn)結(jié)果表明,只需復(fù)制Transformer塊即可提高準(zhǔn)確度,而無(wú)需進(jìn)行架構(gòu)修改或擴(kuò)大模型大小。通過(guò)實(shí)驗(yàn)研究了三種不同的權(quán)重共享策略的效果如下表:<從上往下分別為abcd四種策略!>

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

結(jié)果表明,重復(fù)層共享策略C產(chǎn)生最佳性能。但是考慮到硬件內(nèi)存層次結(jié)構(gòu)<溫習(xí)點(diǎn)>,用于計(jì)算的SRAM通常限制在20MB左右。這個(gè)容量通常只足以容納一個(gè) Transformer 塊。因此,b策略可以避免在SRAM和DRAM之間反復(fù)傳輸權(quán)重,從而提高自回歸推理的整體執(zhí)行速度。因此在模型設(shè)計(jì)中選擇了B策略,并將采用這個(gè)策略的模型稱呼為MobileLLM-LS。

4.消融和性能

本次也進(jìn)行了消融研究,消融(Ablataion)就是,一個(gè)全新模型M引入N種優(yōu)化的方法。為了搞清楚哪種方法對(duì)于M的提升最大,于是就在基礎(chǔ)模型上面單獨(dú)添加這項(xiàng)技能進(jìn)行對(duì)比測(cè)試,也就是下圖的+號(hào)的由來(lái))。會(huì)發(fā)現(xiàn)layer-share和GQA的影響力還是挺大的。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

按照上面的優(yōu)化策略進(jìn)行模型層數(shù)的堆疊,繼續(xù)將小的模型擴(kuò)大到1.5B然后,在各項(xiàng)基準(zhǔn)的評(píng)測(cè)下,性能還是不輸給同量級(jí)的競(jìng)爭(zhēng)對(duì)手。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

MobileLLM家族

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

MobileLLM到目前為止還沒公開使用,但Meta已經(jīng)開源了預(yù)訓(xùn)練代碼,允許其他研究人員在他們的工作基礎(chǔ)上進(jìn)行開發(fā)。小模型技術(shù)(尤其是移動(dòng)手機(jī)小模型)的發(fā)展會(huì)打開個(gè)人設(shè)備人工智能服務(wù)的便利性。

本文轉(zhuǎn)載自??魯班模錘??,作者: 龐德公 ????



?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产在线拍揄自揄拍| 国内外成人激情视频| 国产高清在线免费| 亚洲高清久久| 国产网站欧美日韩免费精品在线观看 | 中文字幕福利视频| 国产人妻精品一区二区三| 国产第100页| 国产精品迅雷| 国产精品久久久久久久浪潮网站 | 亚洲爽爆av| 成人精品视频一区二区三区尤物| 91黑丝高跟在线| 久久久精品成人| 91麻豆精品激情在线观看最新| 色婷婷精品久久二区二区蜜臀av| 艳母动漫在线观看| 亚洲欧美日韩成人在线| 精品无人区卡一卡二卡三乱码免费卡 | 日本国产一区二区| 日b视频免费观看| 成a人片在线观看www视频| 精品影院一区二区久久久| 性金发美女69hd大尺寸| 亚洲综合久久av一区二区三区| 欧美激情15p| 欧美一二三四在线| 爱情岛论坛vip永久入口| 电影k8一区二区三区久久| 国产精品女主播av| 欧美国产一区二区在线| 性生活三级视频| 麻豆国产欧美日韩综合精品二区| 欧美一级高清免费| 久久综合激情网| 天天综合久久| www.99久久热国产日韩欧美.com | 国产精品麻豆欧美日韩ww| 国内成+人亚洲| 亚洲乱色熟女一区二区三区| 久久国产日韩欧美精品| 国产不卡精品视男人的天堂| 免费黄色网址在线| 99在线观看免费视频精品观看| 久久精品2019中文字幕| 亚洲图片第一页| 红桃成人av在线播放| 精品香蕉在线观看视频一| 又黄又爽的网站| 99久久免费精品国产72精品九九| 欧美一级欧美三级| 亚洲高清视频免费| 国产不卡精品| 欧美一级欧美三级在线观看 | 免费观看日批视频| 久久先锋影音| 日本sm极度另类视频| 欧美精品一二三四区| 久久精品欧洲| 国产精品88a∨| 中国一级特黄视频| 蜜桃一区二区三区四区| 成人精品在线视频| 国产精品久久久久久69| 极品少妇一区二区三区精品视频| 91久久久国产精品| 国产按摩一区二区三区| 国产传媒一区在线| 成人av影视在线| 日韩有码第一页| 99精品国产视频| 日本一区视频在线观看免费| 阿v免费在线观看| 中文字幕日韩av资源站| 国产人妻互换一区二区| 1769免费视频在线观看| 亚洲成人av在线电影| 2022亚洲天堂| 台湾成人免费视频| 8x8x8国产精品| 老司机午夜免费福利| 丝袜美腿综合| 色琪琪综合男人的天堂aⅴ视频| 成人黄色短视频| 国内自拍一区| 日本久久久久亚洲中字幕| 中文字幕一区二区三区人妻四季| 国产乱妇无码大片在线观看| 成人av播放| 精品1区2区在线观看| 国产ts在线播放| 91精品动漫在线观看| 国语对白做受69| 伊人免费在线观看| 成人久久视频在线观看| 亚洲国产欧美日韩| 欧洲在线视频| 欧美色图第一页| 无码成人精品区在线观看| 精品日韩免费| 韩剧1988免费观看全集| 中文字幕在线观看1| 国产99久久精品| 水蜜桃一区二区三区| 影音先锋中文在线视频| 91成人看片片| 无码av免费精品一区二区三区| 蜜桃精品噜噜噜成人av| 精品中文字幕视频| 国产一级片免费视频| 国产激情精品久久久第一区二区| 欧美日韩国产三区| 欧美6一10sex性hd| 欧美日韩黄色一区二区| 黄色a一级视频| 欧美国产91| 国产精品亚发布| 午夜激情小视频| 一区二区三区四区亚洲| 午夜激情av在线| 妖精视频一区二区三区| 色综合天天狠天天透天天伊人| 在线免费一区二区| 91在线小视频| 黄色激情在线视频| 日韩欧美高清一区二区三区| 中文字幕在线亚洲| 蜜臀精品一区二区三区| 成人av先锋影音| 一区二区三区四区免费观看| 国产一区高清| 国产亚洲欧洲黄色| 狠狠人妻久久久久久综合| 成人午夜激情片| 草草草视频在线观看| 成人av在线播放| 色久欧美在线视频观看| 国产免费a视频| 久久精品欧美一区二区三区不卡| 日本人体一区二区| 亚洲大奶少妇| 久久69精品久久久久久久电影好 | 国产成人免费视| 最新欧美日韩亚洲| 久久天天久久| 中文字幕av一区二区三区谷原希美| 成人在线免费看视频| 91小视频免费观看| 久久国产成人精品国产成人亚洲| 精品少妇3p| 韩国三级电影久久久久久| 日日夜夜精品免费| 欧美日韩精品在线视频| 国产麻豆天美果冻无码视频| 国产精品人人爽人人做我的可爱| 久久爱av电影| 超碰一区二区| 一本色道久久88综合亚洲精品ⅰ| 国产主播第一页| 国产精品女人毛片| 深爱五月综合网| 欧美视频日韩| 精品日韩电影| 最新日韩一区| 俺去亚洲欧洲欧美日韩| 99久久免费国产精精品| 一区二区在线观看不卡| 亚洲av永久无码精品| 国产一区二区三区久久| 日韩精品久久一区| 91麻豆精品| 欧美精品福利在线| 视频福利在线| 欧美日韩视频在线观看一区二区三区| 午夜三级在线观看| 成人中文字幕电影| 国产精品欧美激情在线观看| 日韩电影免费在线观看| 99精彩视频在线观看免费| 黄在线观看免费网站ktv| 亚洲日韩欧美视频| jizz中国少妇| 高潮白浆女日韩av免费看| 日本爱爱爱视频| 国产在线视频精品一区| 日本中文字幕亚洲| av资源久久| 99视频免费观看| 亚洲成a人片| 欧美精品在线免费| 青青国产在线| 欧美一区二区大片| 日韩不卡在线播放| 亚洲欧洲av色图| 欧美 变态 另类 人妖| 九色porny丨国产精品| 无码人妻丰满熟妇区96| 国产精品99一区二区三| 久久99九九| 国产精品欧美一区二区三区不卡 | 久久亚洲精品小早川怜子| 一区二区三区网址| 亚洲久久视频| 亚洲精品偷拍视频| 蜜桃成人av| 国产精品一区二区你懂得| yy6080久久伦理一区二区| 久久久久久成人| 午夜视频成人| 亚洲人成网站色ww在线| 丰满肥臀噗嗤啊x99av| 欧美图区在线视频| 中文字幕亚洲高清| 亚洲激情五月婷婷| 91免费在线看片| 99精品国产热久久91蜜凸| 精品无码av一区二区三区不卡| 日本va欧美va精品发布| 国产青青在线视频| 欧美一区精品| 亚洲国产日韩综合一区| 国产传媒欧美日韩成人精品大片| 国产高清自拍99| 国产精品免费精品自在线观看| 国产精品久久久久国产a级| jizzjizz中国精品麻豆| 九色精品美女在线| 黄网页在线观看| 日韩在线一区二区三区免费视频| 日韩porn| 亚洲精选一区二区| 无码精品人妻一区二区| 精品日韩欧美在线| 国产人妻精品一区二区三区| 欧美猛男gaygay网站| 在线观看国产精品视频| 欧美亚洲国产bt| 青青国产在线视频| 在线观看欧美日本| 日本丰满少妇做爰爽爽| 色老综合老女人久久久| 6080午夜伦理| 一本一道波多野结衣一区二区| 精品无码人妻一区二区三区| 一区二区欧美国产| 美女毛片在线观看| 亚洲电影第三页| 国产乱码久久久久久| 亚洲超碰97人人做人人爱| 久久这里只有精品免费| 黄色精品在线看| 中文字幕亚洲高清| 色噜噜夜夜夜综合网| 羞羞色院91蜜桃| 欧美日韩精品电影| 国产av精国产传媒| 欧美大胆一级视频| 欧美自拍偷拍一区二区| 亚洲激情在线观看| 欧美中文在线| 在线亚洲欧美视频| 国产精品剧情| 欧美日韩福利视频| 极品在线视频| 国产精品国模在线| 国产欧美日韩电影| 91手机在线观看| 日韩mv欧美mv国产网站| 欧美日韩亚洲在线| 三区四区不卡| 国产 欧美 日本| 国产精品免费看| 91精品无人成人www| 精品一二三四区| 久久久久久久无码| 亚洲国产精品二十页| 中文字幕在线观看成人| 香港成人在线视频| 中文字幕+乱码+中文乱码91| 日韩欧美资源站| 四虎在线观看| 91美女在线观看| 精品久久久久久国产91| 欧美疯狂做受xxxx高潮| 黄色成人在线看| 特级西西444www高清大视频| 久久伊人影院| 国产欧美日韩麻豆91| 欧美精品国产精品日韩精品| 波多结衣在线观看| 好男人www在线视频| 精品无人乱码一区二区三区| 一区二区三区美女| 精品少妇久久久久久888优播| 午夜视频一区在线观看| 男操女视频网站| 精品免费99久久| av男人的天堂在线| 久久久久久久久中文字幕| 91精品影视| 国产精品亚洲综合| 日韩欧美自拍| 无码人妻丰满熟妇区96| 国产精品综合一区二区三区| 久久丫精品忘忧草西安产品| 亚洲一区二区成人在线观看| 伊人22222| 亚洲精选中文字幕| 日本aa在线| 国产欧美日韩中文字幕在线| 神马香蕉久久| 国产在线视频在线| 国内久久精品视频| 性猛交娇小69hd| 欧美日韩国产精品| 亚洲免费成人在线| 久久人人爽人人爽爽久久| 蜜桃视频成人m3u8| 精品国产_亚洲人成在线| 欧美1区视频| 亚洲精品手机在线观看| 久久精品日产第一区二区三区高清版| 国产精品99re| 日韩你懂的在线播放| 欧美激情午夜| 国产精品一区=区| 欧美日韩激情| 50路60路老熟妇啪啪| 97久久人人超碰| 男人的天堂一区| 亚洲国产精品嫩草影院久久| 在线中文字幕-区二区三区四区| 国产美女久久精品| 日本成人小视频| 亚洲国产精品三区| 国产日本亚洲高清| 国产一级一级国产| 亚洲韩国青草视频| av最新在线| 精品久久精品久久| 中文久久精品| 久久午夜夜伦鲁鲁片| 亚洲.国产.中文慕字在线| 黄色av小说在线观看| 午夜伦理精品一区| 欧美丝袜足交| 免费日韩中文字幕| 久久免费偷拍视频| 无码人妻精品一区二| 一区二区三区视频在线| 国产精品久久亚洲不卡| 亚洲乱码一区二区三区| 久久精品99国产国产精| 在线观看亚洲网站| 日韩亚洲欧美高清| www在线观看黄色| 另类欧美小说| 免费成人你懂的| 波多野结衣家庭教师| 日韩美女一区二区三区| av今日在线| 日本亚洲自拍| 国产在线精品一区在线观看麻豆| 欧洲猛交xxxx乱大交3| 精品电影一区二区三区| 性感女国产在线| 日韩在线三级| 国产九色精品成人porny| 日韩高清精品免费观看| 亚洲视频在线观看免费| 亚洲综合伊人| 欧美视频在线观看视频| 久久精品免费在线观看| 亚洲综合五月天婷婷丁香| 色综合久综合久久综合久鬼88| 亚洲盗摄视频| 午夜视频在线网站| 亚洲一区二区美女| 国产主播福利在线| 91九色单男在线观看| 激情一区二区| 日韩av片在线| 日韩精品在线网站| 吉吉日韩欧美| 在线观看18视频网站| 91麻豆高清视频| 国产女人18毛片18精品| 国内精品小视频在线观看| 成人影院在线| www国产视频| 在线播放欧美女士性生活| 草草在线观看| 超碰免费在线公开| 97国产一区二区| 国产剧情久久久| 欧美一区视频在线| 综合久久久久| 五月婷婷欧美激情| 欧美精品一区男女天堂| 久久福利在线|