精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

150B token從頭訓練,普林斯頓Meta發布完全可微MoE架構Lory

人工智能 新聞
前幾天,普林斯頓大學聯合Meta在arXiv上發表了他們最新的研究成果——Lory模型,論文提出構建完全可微的MoE模型,是一種預訓練自回歸語言模型的新方法。

不同于大多數模型使用字母縮略起名,論文作者在腳注中解釋道,Lory是一種羽毛有彩虹顏色的鸚鵡,和「軟MoE」的精神非常相似。

圖片

論文的作者團隊也可以稱之為「明星陣容」。

圖片論文地址:https://arxiv.org/abs/2405.03133

主要作者之一陳丹琦是普林斯頓大學計算機科學系的助理教授,也是普林斯頓NLP小組共同領導人之一。她本科畢業于清華大學姚班,2018年在斯坦福大學獲得博士學位,導師是大名鼎鼎的Christopher Manning。

斯坦福教授、NLP領域泰斗Dan Jurafsky曾這樣評價她:「她在發現重要的研究問題上很有品位。她已經對該領域產生了非凡的影響,并且她的影響只會越來越大。」

圖片

Mike Lewis是Meta AI的一名研究科學家,他領導了Meta剛發布的大語言模型Llama 3的預訓練工作。

圖片

他此前曾發表過多項有影響力的研究成果,包括Bart、Roberta、top-k采樣等。

本文的第一作者是普林斯頓大學五年級博士生鐘澤軒,導師是陳丹琪教授。

圖片

鐘澤軒碩士畢業于伊利諾伊大學香檳分校,本科畢業于北京大學計算機系,曾在Meta AI和微軟亞洲研究院實習,這項研究就是他在Meta實習期間完成的。

發布后,論文作者也在推特上提供了全文解讀。

圖片

引入的關鍵技術包含兩個方面,一是用因果分段路由策略取代token級別的路由,可以在保持語言模型自回歸屬性的同時實現高效的專家合并。

二是提出了基于相似性的數據批處理方法,如果僅僅是把隨機選擇的文本拼接在一起訓練會導致低水平的專家模型,而將相似的文本進行分組可以使模型更加專業化。

圖片

基于這些方法,作者使用150B token的數據從頭訓練了一系列的Lory模型,活躍參數有0.3B和1.5B兩個級別,含有最多32個專家。

與稠密模型相比,Lory的訓練過程更為高效,可以用少2.5倍的步數實現相同的損失值。

研究團隊使用上下文學習的方法評估Lory的能力,發現模型在常識推理、閱讀理解、閉卷問答、文本分類等下游任務上都取得了很好的效果。

可以觀察到,使用更多專家可以改進模型的表現。

相比目前MoE領域的SOTA模型Expert Choice(EC),Lory模型也表現出了有競爭力的性能。

2023年12月,一家名為Mistral AI的法國創業公司發布了一款性能媲美甚至優于GPT-3.5和Llama 2 70B的模型Mixtral 8x7B。

Mixtral使用了一種稀疏的MoE網絡,不僅表現出了強大的性能,而且十分高效,推理速度相比Llama 2 70B提高了6倍,于是讓MoE得到了開源社區的廣泛關注。

甚至有人猜測,GPT-4可能也使用了MoE技術實現了超過一萬億參數的超大模型。

對于Transformer架構的語言模型,MoE主要有兩個元素:

一是使用參數更為稀疏的MoE層代替密集的前饋網絡層(FFN),其中每個專家都是一個獨立的神經網絡,甚至可以是MoE本身,從而形成層級式的MoE結構。

二是使用門控網絡或路由機制決定token被發送到哪個專家,其中token的路由機制是決定MoE模型表現的關鍵點。

因果分段路由

雖然MoE的這種機制有助于高效擴展模型規模,但訓練路由網絡的過程會引入離散化、不可微的學習目標。2023年發布的SMEAR模型就已經開始探索解決方案,使用專家合并方法構建完全可微的MoE模型。

論文地址:https://arxiv.org/abs/2306.03745

然而,SMEAR使用的方法是將所有專家進行軟合并,取其加權平均值,這適用于文本分類任務,但很難應用到自回歸語言模型上。

于是,作者提出了使用分段路由的方法,對每一段語句而非每個token進行專家合并,有效減少了合并操作的數量。

如果僅僅使用當前語段進行路由,很可能導致語言模型遺漏跨語段的信息,所以論文提出采用類似于自回歸的因果分段路由。

在為當前語段合并專家時,需要考慮前一個語段的信息,從而決定每個專家的路由權重。

消融實驗的結果也證明,與因果分段路由的策略相比,單純使用前綴進行路由會導致語言模型性能降低。

基于相似性的數據批處理

預訓練語言模型的標準做法是將數據集中的文檔隨機拼接在一起,構造出固定長度的訓練樣本。

對于MoE模型而言,這種方法存在問題,相鄰段的token可能來自非常不同且毫不相關的文檔,可能會損害專家模型的專業化程度。

因此,受到ICLR 2024中一篇論文的啟發,作者在Lory中采用了類似的技術,依次連接相似的文檔來構造訓練樣本,使專家模型更「專注」地研究不同的領域或主題。

論文地址:https://arxiv.org/abs/2310.10638

實驗表明,無論是隨機批處理還是基于相似度批處理,Lory模型的效果都優于稠密模型,但使用基于相似度的方法可以得到更大的loss提升。

責任編輯:張燕妮 來源: 新智元
相關推薦

2012-08-02 16:18:10

普林斯頓結構哈佛結構架構

2025-05-06 00:45:00

2011-04-22 10:14:34

無線網絡DHCPAndroid

2022-07-26 09:56:48

模型AI

2025-07-18 09:55:11

2025-06-18 16:42:15

視頻生成AI模型

2024-11-12 13:40:00

2020-12-02 10:05:26

AI 數據人工智能

2023-11-17 23:05:18

數據模型

2023-09-12 14:45:18

2021-11-09 09:52:57

神經網絡AI算法

2024-10-28 22:14:05

2023-12-05 13:25:00

數據訓練

2025-09-25 09:02:00

MetaAI模型

2023-06-19 09:36:16

AI矩陣

2025-07-18 07:07:00

人工智能AIAI模型

2023-10-23 13:23:03

數據訓練

2023-05-22 15:17:02

谷歌AI

2025-02-13 08:30:00

2024-02-19 00:15:39

模型數據
點贊
收藏

51CTO技術棧公眾號

久久久久成人网站| 国产精品999.| 成年人视频网站在线| 日韩成人伦理电影在线观看| 色七七影院综合| 中文国产在线观看| 涩涩视频在线| 国产精品久久一卡二卡| 翡翠波斯猫1977年美国| 国产91精品一区| 亚洲国产精品成人| 精品亚洲一区二区三区| 天天干天天av| 91精品产国品一二三产区| 中文字幕一区在线观看| 久久精品国产美女| 国产精品无码免费播放| 午夜亚洲伦理| 九九热精品视频国产| 国产成人无码精品久久二区三| 亚洲国产天堂| 精品女同一区二区三区在线播放 | 这里只有久久精品视频| 中文字幕一区二区三三| 亚洲人成电影网站色xx| 亚洲熟女一区二区三区| 久久人体av| 欧美日韩美女在线| 国产成人亚洲综合无码| av在线播放网| 久久亚洲精华国产精华液 | 日韩美女视频19| 日本一区视频在线观看| 天天操天天操天天| 成人亚洲精品久久久久软件| 国产欧洲精品视频| 看黄色一级大片| 在线视频亚洲| 欧美精品久久久久a| 黄色录像免费观看| 久久影视一区| 一区二区三区高清国产| 玖玖爱在线观看| 精品国模一区二区三区欧美 | 一区二区欧美精品| 在线观看国产一区| 98在线视频| 国产欧美精品区一区二区三区 | 国产在线播放av| 91亚洲国产成人精品一区二三| 波多野结衣精品久久| 国产欧美日韩成人| 国内久久婷婷综合| 国产欧美一区二区| 一区二区 亚洲| 免费av网站大全久久| 国产成人涩涩涩视频在线观看| 91精品国产综合久久久蜜臀九色| 日韩视频不卡| 国产69久久精品成人| 日韩精品成人一区| 亚洲中午字幕| 国产精品999999| 波多野结衣家庭主妇| 喷白浆一区二区| 国产精品久久久久久久久久三级 | 日韩亚洲欧美中文三级| 成人免费黄色av| 久久免费精品| 精品国产露脸精彩对白| 黑丝av在线播放| 美女精品一区最新中文字幕一区二区三区 | 日韩欧美亚洲天堂| 竹内纱里奈兽皇系列在线观看| 欧美性xxxxx| 丝袜制服一区二区三区| 农村妇女一区二区| 日韩一区二区精品| 给我免费观看片在线电影的| 久久99精品久久久久久园产越南| 中文一区二区视频| 久久免费公开视频| 媚黑女一区二区| 国产一区视频在线| 高h放荡受浪受bl| 久久美女高清视频 | 国内激情久久| 欧美一级视频一区二区| 波多野结衣视频在线看| 狠狠久久亚洲欧美| 国产欧美综合精品一区二区| 国产天堂素人系列在线视频| 日韩毛片精品高清免费| 永久免费网站视频在线观看| 欧美freesex黑人又粗又大| 欧美午夜免费电影| 中文写幕一区二区三区免费观成熟| 成午夜精品一区二区三区软件| 亚洲乱码国产乱码精品精| 999精品视频在线观看播放| 亚洲三级影院| 成人高清视频观看www| 天天操天天射天天舔| 国产精品美女一区二区三区| r级无码视频在线观看| 亚洲四虎影院| 亚洲大尺度美女在线| 男人天堂资源网| 99精品免费视频| 91亚洲国产精品| 免费在线黄色网址| 一区二区高清免费观看影视大全 | 国产成人亚洲综合a∨婷婷| 麻豆亚洲一区| 免费影视亚洲| 欧美日韩三级视频| 成年人网站免费看| 欧美日韩爆操| 成人性生交大片免费看视频直播| 日韩黄色影片| 亚洲电影一级黄| 国内自拍第二页| 欧美男gay| 亚州国产精品久久久| 国产福利免费视频| 国产精品免费免费| 九色porny91| 日韩动漫一区| 午夜精品久久久久久久99热| 91资源在线视频| 欧美国产精品v| 久章草在线视频| 日韩高清一级| 欧美一区二区三区四区在线| 好吊视频一区二区三区| 亚洲欧美色图小说| 亚洲久久中文字幕| 热久久天天拍国产| 日本亚洲欧洲色| 亚洲三区在线播放| 丁香五六月婷婷久久激情| 日本不卡视频一区| 伊人久久大香线蕉综合热线| 亚洲尤物视频网| 麻豆网在线观看| 欧美日韩成人综合| 中国美女黄色一级片| 奇米亚洲午夜久久精品| 性欧美大战久久久久久久免费观看| 亚洲精品中文字幕| 亚洲另类图片色| 男人天堂视频在线| 国产精品系列在线| 日韩中文字幕a| 天天揉久久久久亚洲精品| 成人午夜黄色影院| 午夜成年人在线免费视频| 日韩欧美一级在线播放| 久久综合亚洲色hezyo国产| 国产不卡视频在线播放| 免费特级黄色片| 国产亚洲成av人片在线观黄桃| 欧美成在线视频| 亚洲精品喷潮一区二区三区| 午夜精品在线视频一区| 97人妻天天摸天天爽天天| 噜噜噜在线观看免费视频日韩| 蜜桃传媒视频第一区入口在线看| 外国成人直播| 最近2019好看的中文字幕免费| 91美女精品网站| 亚洲黄色尤物视频| 国产chinese中国hdxxxx| 国产欧美一区二区色老头| 欧美性大战久久久久| 国语自产精品视频在线看抢先版结局| 亚洲美女免费精品视频在线观看| 夜夜躁日日躁狠狠久久av| 日韩美女视频19| 黄色性生活一级片| 日本欧美韩国一区三区| 50度灰在线观看| 在线观看欧美理论a影院| 国产精品女人网站| 欧美24videosex性欧美| 亚洲欧美变态国产另类| 国产乱人乱偷精品视频| 亚洲成人免费看| 欧美成人另类视频| 国产成人亚洲综合色影视| 国模杨依粉嫩蝴蝶150p| 亚洲欧美综合久久久| 久久精品日产第一区二区三区| 91福利精品在线观看| 欧美福利视频网站| 国产高清自拍视频在线观看| 欧美一级免费观看| 91video| 亚洲日本电影在线| 精品中文字幕在线播放| 黄色小说综合网站| 精品99在线视频| 亚洲成人一区| 欧美日韩综合久久| 999久久久精品一区二区| 国产精品美女av| bl视频在线免费观看| 色yeye香蕉凹凸一区二区av| 色婷婷av一区二区三区之e本道| 色久综合一二码| 日本中文字幕免费| 亚洲欧美日韩中文播放| 国产精品免费无码| 99久久综合色| 97超碰人人看| 精品制服美女丁香| 欧美成人黑人猛交| 国产亚洲精品自拍| 成人小视频在线观看免费| 久久福利综合| 欧美日韩亚洲一区二区三区四区| 中文字幕日韩高清在线| 成人福利在线观看| 亚洲精品555| 欧美在线中文字幕| av资源中文在线天堂| 色综合天天综合网国产成人网| 免费大片黄在线| 中文字幕日韩在线观看| 久蕉在线视频| 国产偷亚洲偷欧美偷精品| 亚洲精品网站在线| 欧美一区二区不卡视频| 国产尤物视频在线观看| 在线观看不卡视频| 日韩不卡高清视频| 91久久精品一区二区三区| 国产情侣自拍av| 天天综合色天天| 日本a在线观看| 亚洲国产另类av| 久久久精品人妻一区二区三区四| 亚洲日本在线a| 欧美风情第一页| 亚洲欧洲日产国码二区| 秋霞欧美一区二区三区视频免费| 国产精品三级av| 免费黄色国产视频| 中文字幕在线观看不卡| 一级片一级片一级片| 亚洲欧洲精品一区二区三区不卡| 国产精品麻豆免费版现看视频| 亚洲国产精品av| 香蕉成人在线视频| 综合欧美亚洲日本| 欧美丰满艳妇bbwbbw| 亚洲综合免费观看高清完整版在线 | 三级黄色片播放| 粉嫩一区二区三区在线看| www.四虎在线| 91蜜桃婷婷狠狠久久综合9色| 欧美 日本 国产| 国产亚洲综合在线| 成人无码精品1区2区3区免费看 | 日韩精品一区二区在线视频| 欧美午夜不卡| koreanbj精品视频一区| 三级一区在线视频先锋| 激情 小说 亚洲 图片: 伦| 精品一区二区三区免费| 女人扒开双腿让男人捅| av欧美精品.com| b站大片免费直播| 国产精品久久久久桃色tv| www.av成人| 亚洲va国产va欧美va观看| 一级片视频在线观看| 欧美三级中文字幕在线观看| av男人天堂av| 精品亚洲aⅴ在线观看| 在线观看免费版| 欧美极品少妇xxxxⅹ裸体艺术 | 97超碰在线免费观看| 亚洲国产激情av| 久久久久久久国产精品毛片| 欧美日在线观看| 一区二区视频网站| 日韩精品中文字幕一区二区三区| 国产又爽又黄网站亚洲视频123| 一区二区成人精品| 午夜小视频福利在线观看| 欧洲精品毛片网站| 国产精久久久| 老牛影视免费一区二区| 亚洲国产老妈| www国产黄色| 国产一区视频在线看| 国产又黄又粗又猛又爽的视频| 国产精品毛片久久久久久久| 久久网一区二区| 欧美午夜精品一区| 天天操天天干天天舔| 久久久国产视频91| 成人免费无遮挡| 成人高清在线观看| 日韩精品一卡| 成人在线免费在线观看| 国产精品一区专区| 国产精久久一区二区三区| 亚洲一区二区三区精品在线| 中文字幕乱码人妻无码久久 | 91精彩视频在线观看| 久久久久久香蕉网| 中文字幕综合| 日韩精品久久久毛片一区二区| 欧美日本一区| 免费在线观看毛片网站| 成人av网站在线观看免费| 亚洲人与黑人屁股眼交| 色噜噜狠狠成人中文综合| 人成网站在线观看| 久久69精品久久久久久国产越南| 97人人做人人爽香蕉精品| 久久偷窥视频| 91久久综合| 黄色av电影网站| 亚洲精品自拍动漫在线| 一级特黄色大片| 永久免费毛片在线播放不卡| 最新欧美色图| 免费看成人片| 毛片一区二区| 大地资源二中文在线影视观看| 亚洲午夜日本在线观看| 精品国产亚洲一区二区麻豆| 久久精品视频免费播放| 日韩成人综合网| 在线视频不卡国产| 理论片日本一区| 婷婷丁香综合网| 欧美日韩另类一区| 天堂资源在线中文| 国产精品观看在线亚洲人成网| 欧美人妖在线| 亚洲视频在线观看一区二区三区| 久久久久久久久久久99999| www五月天com| 亚洲视频在线视频| 欧美free嫩15| 午夜精品亚洲一区二区三区嫩草| 日韩av中文在线观看| 亚洲一二三精品| 欧美丝袜丝交足nylons图片| fc2在线中文字幕| 国产欧美婷婷中文| 欧美黄色免费| 丰满岳乱妇一区二区| 五月天欧美精品| 日本国产在线| 国产精品久久久久久久久免费看| 日韩综合在线| 日韩精品视频网址| 午夜精品福利一区二区蜜股av| 天堂中文在线看| 国产精品成人一区二区| 日韩av在线中文字幕| 中文字幕1234区| 亚洲午夜三级在线| 蜜桃视频在线观看网站| 国产精品一区专区欧美日韩| 91精品99| 理论片大全免费理伦片| 色丁香久综合在线久综合在线观看| 触手亚洲一区二区三区| 成人做爽爽免费视频| 在线看片日韩| 日本二区在线观看| 欧美一区二区久久| 香蕉伊大人中文在线观看| 欧美一二三区| 国产一区二区免费在线| 91在线看视频| 自拍偷拍亚洲在线| xvideos.蜜桃一区二区| 国产精品视频一区二区三区四区五区| 国产欧美日韩视频在线观看| 99re只有精品| 欧美亚洲成人免费| 午夜精品毛片| 菠萝菠萝蜜网站| 91精品国产色综合久久| 欧美xxxxxx| 天天操天天干天天玩| 久久久九九九九| 亚洲第一黄色片| 国产精品美女免费看| 国产精品va| 黄色香蕉视频在线观看| 亚洲欧美日韩天堂| 911精品国产|