精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為什么最新的LLM使用混合專家(MoE)架構(gòu)

譯文 精選
人工智能
本文詳細介紹了混合專家 (MoE)架構(gòu),該架構(gòu)通過混合或融合不同的“專家”模型共同解決特定的問題。

譯者 | 李睿

審校 | 重樓

專業(yè)化的必要性

醫(yī)院有很多具有不同專長的專家和醫(yī)生,他們擅長解決各自領(lǐng)域內(nèi)的醫(yī)療難題。外科醫(yī)生、心臟病專家、兒科醫(yī)生等各類專家緊密合作,為患者提供了全面而個性化的醫(yī)療護理服務。同樣,人們也可以將這一合作模式應用于人工智能領(lǐng)域。

人工智能中的混合專家(MoE)架構(gòu)被定義為不同“專家”模型的混合或融合,能夠共同處理或響應復雜的數(shù)據(jù)輸入。當涉及到人工智能時,MoE模型中的每個專家都專門研究一個更宏大的問題——就像每位醫(yī)生都專門在其醫(yī)學領(lǐng)域內(nèi)深耕一樣。這樣的設計提高了效率,并增強了系統(tǒng)的有效性和準確性。

Mistral AI提供的開源基礎(chǔ)大型語言模型(LLM)可以與OpenAI相媲美。并且已經(jīng)在Mixtral 8x7B模型中使用MoE架構(gòu),是一種尖端的大型語言模型(LLM)形式的革命性突破。以下將深入探討Mistral AI的Mixtral為什么在其他基礎(chǔ)LLM中脫穎而出,以及當前的LLM現(xiàn)在采用MoE架構(gòu)的原因,并突出其速度、大小和準確性。

升級LLM的常用方法

為了更好地理解MoE架構(gòu)如何增強LLM,本文將討論提高LLM效率的常用方法。人工智能從業(yè)者和開發(fā)人員通過增加參數(shù)、調(diào)整架構(gòu)或微調(diào)來增強模型。

·增加參數(shù):通過提供更多信息并對其進行解釋,模型學習和表示復雜模式的能力得到了提高。這可能會導致過擬合和幻覺,需要從人類反饋中進行廣泛的強化學習(RLHF)。

  • 調(diào)整架構(gòu):引入新的層或模塊可以適應不斷增加的參數(shù)數(shù)量,并提高特定任務的性能。然而,對底層架構(gòu)的更改很難實現(xiàn)。
  • 微調(diào):預先訓練的模型可以根據(jù)特定數(shù)據(jù)或通過遷移學習進行微調(diào),允許現(xiàn)有的LLM處理新的任務或領(lǐng)域,而無需從頭開始。這是最簡單的方法,并且不需要對模型進行重大更改。

什么是MoE架構(gòu)?

混合專家(MoE)架構(gòu)是一種神經(jīng)網(wǎng)絡設計,通過為每個輸入動態(tài)激活稱為“專家”的專用網(wǎng)絡子集來提高效率和性能。門控網(wǎng)絡決定激活哪些專家導致稀疏激活和減少計算成本。MoE架構(gòu)由兩個關(guān)鍵組件組成:門控網(wǎng)絡和專家網(wǎng)絡。以下進行分析:

從本質(zhì)上來說,MoE架構(gòu)的功能就像一個高效的交通系統(tǒng),根據(jù)實時情況和期望的目的地,將每輛車(或在這種情況下是數(shù)據(jù))導向最佳路線。每個任務都被路由到最合適的專門處理該特定任務的專家或子模型。這種動態(tài)路由確保為每個任務使用最有能力的資源,從而提高模型的整體效率和有效性。MoE架構(gòu)利用了三種方法來提高模型的保真度。

(1)通過多個專家完成任務,MoE通過為每個專家添加更多參數(shù)來增加模型的參數(shù)大小。

(2)MoE改變了經(jīng)典的神經(jīng)網(wǎng)絡架構(gòu),它包含了一個門控網(wǎng)絡,以確定哪些專家被用于指定的任務。

(3)每個人工智能模型都有一定程度的微調(diào),因此MoE中的每個專家都經(jīng)過微調(diào),以達到傳統(tǒng)模型無法利用的額外調(diào)整層的預期效果。

MoE門控網(wǎng)絡

門控網(wǎng)絡在MoE模型中充當決策者或控制器。它評估傳入的任務,并確定哪個專家適合處理這些任務。這一決策通常基于學習權(quán)值,隨著時間的推移,通過訓練進行調(diào)整,進一步提高其與專家匹配任務的能力。門控網(wǎng)絡可以采用各種策略,從概率方法(將軟任務分配給多個專家)到確定性方法(將每個任務路由到單個專家)。

MoE專家

MoE模型中的每個專家代表一個較小的神經(jīng)網(wǎng)絡、機器學習模型或針對問題域的特定子集優(yōu)化的LLM。例如,在Mistral中,不同的專家可能專注于理解某些語言、方言,甚至是查詢類型。專業(yè)化確保每個專家都精通自己的領(lǐng)域,當結(jié)合其他專家的貢獻時,將在廣泛的任務上實現(xiàn)卓越的性能。

MoE損失函數(shù)

雖然損失函數(shù)不被視為是MoE架構(gòu)的主要組成部分,但它在模型的未來性能中起著關(guān)鍵作用,因為它被設計用于優(yōu)化單個專家和門控網(wǎng)絡。

它通常結(jié)合每個專家計算的損失,這些損失由門控網(wǎng)絡分配給他們的概率或重要性進行加權(quán)。這有助于在調(diào)整門控網(wǎng)絡以提高路由準確性的同時,對專家的特定任務進行微調(diào)。

從始至終的MoE流程

現(xiàn)在總結(jié)MoE整個流程,并添加更多細節(jié)。

以下是對路由過程從始至終如何工作的總結(jié)解釋:

  • 輸入處理:輸入數(shù)據(jù)的初始處理;主要是在LLM案例中的提示。
  • 特征提?。恨D(zhuǎn)換原始輸入進行分析。
  • 門控網(wǎng)絡評估:通過概率或權(quán)重評估專家的適用性。
  • 加權(quán)路由:根據(jù)計算的權(quán)重分配輸入;在這里,已經(jīng)完成最合適的LLM流程的選擇。在某些情況下,選擇多個LLM來回答單個輸入。
  • 任務執(zhí)行:處理每個專家分配的輸入。
  • 整合專家輸出:將各個專家的結(jié)果結(jié)合起來,形成最終輸出。
  • 反饋和適應:使用性能反饋來改進模型。
  • 迭代優(yōu)化:不斷優(yōu)化路線和模型參數(shù)。

使用MoE架構(gòu)的流行模型

OpenAI的GPT-4和GPT-40

GPT-4和GPT-40支持ChatGPT的高級版本。這些多模態(tài)模型利用MoE來攝取不同的源媒體,例如圖像、文本和語音。有傳言稱,GPT-4有8個專家,每個專家擁有2200億個參數(shù),整個模型的參數(shù)總數(shù)超過1.7萬億個。

Mistral AI的Mixtral 8x7b

Mistral AI 提供了非常強大的開源 AI 模型,并表示他們的 Mixtral 模型是一個 sMoE 模型或稀疏多專家混合模型,以較小的封裝形式提供。Mixtral 8x7b總共有467億個參數(shù),但每個令牌只使用129億個參數(shù),因此以這個成本處理輸入和輸出。他們的MoE模型一直優(yōu)于Llama2 (70B)和GPT-3.5 (175B),同時運行成本更低。

MoE的好處以及是首選架構(gòu)的原因

最終,MoE架構(gòu)的主要目標是呈現(xiàn)復雜機器學習任務處理方式的范式轉(zhuǎn)變。它提供了獨特的優(yōu)勢,并在幾個方面展示了其優(yōu)于傳統(tǒng)模式的優(yōu)勢。

增強的模型可擴展性

  • 每個專家負責任務的一部分,因此通過增加專家來擴展不會導致計算需求的成比例增加。
  • 這種模塊化方法可以處理更大、更多樣化的數(shù)據(jù)集,并促進并行處理,加快操作速度。例如,將圖像識別模型添加到基于文本的模型中可以集成額外的LLM專家來解釋圖像,同時仍然能夠輸出文本。
  • 多功能性允許模型在不同類型的數(shù)據(jù)輸入中擴展其功能。

提高效率和靈活性

  • MoE模型非常高效,與傳統(tǒng)架構(gòu)使用所有參數(shù)不同,MoE模型只有選擇地只讓必要的專家參與特定的輸入。
  • 該架構(gòu)減少了每次推理的計算負荷,允許模型適應不同的數(shù)據(jù)類型和專門的任務。

專業(yè)化和準確性

  • MoE系統(tǒng)中的每個專家都可以針對整體問題的特定方面進行微調(diào),從而在這些領(lǐng)域獲得更高的專業(yè)知識和準確性。
  • 像這樣的專業(yè)化在醫(yī)學成像或財務預測等領(lǐng)域很有幫助,在這些領(lǐng)域,精確度是關(guān)鍵。
  • MoE可以在范圍狹窄的領(lǐng)域產(chǎn)生更好的結(jié)果,因為它有細致入微的理解,詳細的知識,以及在專門任務上優(yōu)于通才模型的能力。

MoE架構(gòu)的缺點

雖然MoE架構(gòu)提供了顯著的優(yōu)勢,但它也帶來了可能影響其采用和有效性的挑戰(zhàn)。

  • 模型復雜性:管理多個神經(jīng)網(wǎng)絡專家和用于引導流量的門控網(wǎng)絡使MoE的開發(fā)和運營成本具有挑戰(zhàn)性。
  • 訓練穩(wěn)定性:門控網(wǎng)絡和專家之間的相互作用引入了不可預測的動態(tài),阻礙了實現(xiàn)統(tǒng)一的學習率,需要廣泛的超參數(shù)調(diào)整。
  • 不平衡:讓專家閑置是對MoE模型的糟糕優(yōu)化,將資源花費在不使用的專家身上或過于依賴某些專家。平衡工作負載分布和調(diào)優(yōu)有效門對于高性能MoE AI至關(guān)重要。

應該注意的是,隨著MoE架構(gòu)的改進,上述缺點通常會隨著時間的推移而減少。

專業(yè)化塑造的未來

反思MoE方法及其與人類的相似之處,可以看到,正如專業(yè)團隊比一般勞動力取得更多成就一樣,專業(yè)模型在人工智能模型中的表現(xiàn)也優(yōu)于單一模型。優(yōu)先考慮多樣性和專業(yè)知識可以將大規(guī)模問題的復雜性轉(zhuǎn)化為專家可以有效解決的可管理部分。

當展望未來時,需要考慮專業(yè)系統(tǒng)在推進其他技術(shù)方面的更廣泛影響。MoE的原則可以影響醫(yī)療保健、金融和自治系統(tǒng)等行業(yè)的發(fā)展,促進更高效、更準確的解決方案。

MoE的旅程才剛剛開始,其持續(xù)發(fā)展有望推動人工智能及其他領(lǐng)域的進一步創(chuàng)新。隨著高性能硬件的不斷發(fā)展,這種專家AI的混合體可以在人們的智能手機中運行,將提供更智能的體驗,但首先需要有人去訓練它們。

原文標題:Why the Newest LLMs Use a MoE (Mixture of Experts) Architecture,作者:Kevin Vu

責任編輯:姜華 來源: 51CTO內(nèi)容精選
相關(guān)推薦

2024-01-10 16:01:28

2025-02-17 03:00:00

LLMsMoELLM

2025-05-30 09:06:00

2024-07-26 11:40:33

2024-02-22 09:27:22

AI數(shù)據(jù)

2024-03-11 07:40:00

開源AGI

2024-01-10 17:37:17

概率token模型

2025-08-12 08:55:00

AI模型數(shù)據(jù)

2025-10-11 09:20:13

2024-01-22 09:02:00

AI訓練

2025-06-09 09:41:25

2024-11-11 13:24:02

2025-02-03 14:17:27

2025-03-11 00:35:00

DeepSeektoC業(yè)務

2023-12-11 09:23:00

AI模型

2024-06-06 09:18:48

2025-03-05 09:50:00

2019-04-28 11:38:39

IT云架構(gòu)混合IT私有云
點贊
收藏

51CTO技術(shù)棧公眾號

日韩视频在线免费| 日韩欧美国产高清91| 91麻豆蜜桃| 国产一级二级毛片| 美女呻吟一区| 色88888久久久久久影院野外| 色噜噜一区二区| 99在线无码精品入口| 国产精品视区| 精品国产区一区二区三区在线观看| 免费看三级黄色片| 都市激情亚洲综合| 亚洲视频在线一区二区| 九色91国产| 国产精品呻吟久久| 亚洲视频成人| 久久国产精品99国产精| 99re久久精品国产| 国产不卡精品在线| 日本韩国欧美国产| av日韩一区二区三区| 成人高清免费观看mv| 国产精一区二区三区| 日本国产精品视频| 久久久国产精品黄毛片| 日韩理论在线| 国产视频在线观看一区二区| 欧美体内she精高潮| 电影一区二区三| 亚洲成人福利片| 欧美xxxx吸乳| 91精彩在线视频| 久久日韩精品一区二区五区| 91精品久久久久久久久中文字幕 | 国产精选久久久| 免费在线观看成人av| 欧美人成在线视频| 国产福利视频网站| 日韩精品第一区| 亚洲午夜精品久久久久久性色| 亚洲美女精品视频| 国产一区一区| 欧美久久免费观看| 波多野结衣家庭教师视频| 国内小视频在线看| 怡红院av一区二区三区| 大桥未久一区二区| 婷婷视频在线| 国产精品家庭影院| 亚洲精品国产精品久久| 国产免费av在线| 久久综合久久综合九色| 久久国产欧美精品| 亚洲av成人精品日韩在线播放| 国产不卡视频一区| 97人人干人人| 亚洲AV无码乱码国产精品牛牛| 国产麻豆一精品一av一免费| 91久久久久久久| 国产精品系列视频| 国产精品一区二区久激情瑜伽| 国产欧美精品日韩| 97人妻精品一区二区三区动漫 | 日韩美女视频在线观看| www成人在线| 亚洲资源av| 国产成人一区二区| 最新中文字幕免费| 黄一区二区三区| 91久久中文字幕| av网站在线观看免费| 国产精品中文字幕日韩精品| 成人在线观看av| 人妻丰满熟妇av无码区hd| 91在线视频观看| 欧美日韩综合久久| 午夜在线视频| 亚洲一区日韩精品中文字幕| 国产日本在线播放| 奇米777日韩| 欧美日韩夫妻久久| 国产精品熟妇一区二区三区四区 | 日韩欧美在线1卡| 在线观看一区二区三区四区| 亚洲婷婷伊人| 日韩最新中文字幕电影免费看| 欧美激情图片小说| 在线亚洲成人| 国产精品香蕉在线观看| www.av导航| 久久人人97超碰com| 亚洲乱码一区二区三区| 手机av在线播放| 欧美小视频在线观看| 国产精品人人爽人人爽| 欧美另类中文字幕| 日韩高清有码在线| 色哟哟一一国产精品| 亚洲人妖在线| 人体精品一二三区| 精品国产黄色片| 久久午夜电影网| 97超碰人人爱| 伊人久久国产| 51精品秘密在线观看| 中文字幕乱码在线| 99九九热只有国产精品| 91精品国产高清自在线看超| 亚洲字幕av一区二区三区四区| 国产69精品久久777的优势| 日本公妇乱淫免费视频一区三区| 成人短视频在线观看| 色综合网站在线| 国产免费无码一区二区| 欧美独立站高清久久| 97香蕉久久超级碰碰高清版| 国产精品天天操| 欧美高清在线一区二区| 波多野结衣之无限发射| 精品国产一区二区三区性色av| 亚洲日韩中文字幕在线播放| 99免费在线观看| 国产一区免费电影| 亚洲va韩国va欧美va精四季| 末成年女av片一区二区下载| 日韩一区二区三| 国产白丝一区二区三区| 久久精品综合| 国产在线一区二| 日本色护士高潮视频在线观看 | 亚洲人成网站色在线观看| 99精品视频播放| 精品久久ai| 欧美日本高清一区| 国产女18毛片多18精品| 国产精品日韩精品欧美在线 | 另类中文字幕网| 欧美一卡2卡3卡4卡无卡免费观看水多多| 中文字幕中文字幕在线十八区 | 天堂在线观看免费视频| 一区二区三区免费看视频| 五月激情五月婷婷| 欧美午夜精彩| 国产精品久久久久免费a∨大胸| 全部免费毛片在线播放网站| 精品福利免费观看| 久久久午夜精品福利内容| 国产精品二区影院| 51精品国产人成在线观看| 国产原厂视频在线观看| 91精品国产综合久久久久久| 在线日韩国产网站| 国产在线视频精品一区| 亚洲成人动漫在线| 美女精品久久| 久久久久国产一区二区三区| 性色av蜜臀av| 亚洲国产综合人成综合网站| 欧美图片自拍偷拍| 亚洲高清二区| 久久99欧美| 超碰一区二区| 一区二区三区动漫| 亚洲专区第一页| 亚洲视频一二三区| 亚洲 自拍 另类 欧美 丝袜| 亚洲狠狠婷婷| 久久一区免费| 成人国产精品| 久久精品这里热有精品| www日本高清| 精品久久久久久久久久| 中文字幕 自拍| 久久国产欧美日韩精品| 青青草综合在线| 极品尤物一区| 日韩免费不卡av| 亚洲天天影视| 欧美成人三级在线| 国产性xxxx高清| 国产日韩亚洲欧美综合| 在线观看日本www| 亚洲经典在线看| 欧美精品七区| 国产精品一区二区精品| 国语对白做受69| 高清av电影在线观看| 日韩亚洲欧美一区二区三区| 亚洲黄色三级视频| 国产精品国产自产拍高清av| www.黄色网| 日韩国产在线观看一区| 最近免费观看高清韩国日本大全| 精品视频自拍| 国产精品男人的天堂| 国产蜜臀一区二区打屁股调教| 亚洲美女中文字幕| 国产999久久久| 色视频欧美一区二区三区| 印度午夜性春猛xxx交| 26uuu国产在线精品一区二区| 一级片视频免费观看| 国内精品久久久久久久影视蜜臀 | 性xxxx欧美老肥妇牲乱| 国产伦精品一区二区三| 成人四虎影院| 91国产一区在线| 九七久久人人| 亚洲欧洲一区二区三区在线观看| 国产丰满果冻videossex| 色猫猫国产区一区二在线视频| 午夜免费激情视频| 国产日韩精品视频一区| 97人妻精品一区二区三区免费| 欧美aaaaaa午夜精品| koreanbj精品视频一区| 亚洲天天综合| 视频一区视频二区视频三区视频四区国产 | 四虎影视精品成人| 日韩视频中午一区| 亚洲自拍偷拍另类| 在线视频综合导航| 日韩免费视频网站| 亚洲一区在线免费观看| 在线日韩国产网站| 国产精品久久久久久久裸模| 自拍视频一区二区| 大尺度一区二区| 欧美日韩久久婷婷| 久久99最新地址| 五月婷婷丁香综合网| 三级欧美韩日大片在线看| 成年人网站免费视频| 你懂的网址国产 欧美| 一个色的综合| 日本在线电影一区二区三区| 蜜桃久久影院| 亚洲涩涩av| 欧美日韩精品免费在线观看视频| 盗摄系列偷拍视频精品tp| 91免费看网站| 91精品短视频| 97超级碰碰| 日韩高清一区| 亚洲综合最新在线| 国产一区 二区| 亚洲www永久成人夜色| 激情不卡一区二区三区视频在线 | 中文字幕在线观看1| 在线观看视频一区二区| 手机av免费观看| 在线观看亚洲a| 久久久久久av无码免费看大片| 91成人免费电影| 中文字幕一区二区免费| 欧美日韩精品是欧美日韩精品| 国产精品国产精品国产| 欧美视频一区二区三区四区| 伊人免费在线观看高清版| 欧美日本免费一区二区三区| 一级片在线免费观看视频| 欧美精品在线一区二区三区| 91禁在线观看| 日韩欧美中文字幕制服| 日本波多野结衣在线| 日韩h在线观看| 国产精品二线| 日韩在线观看网站| av在线下载| 国内精品久久久久久中文字幕| 超碰资源在线| 日韩av电影手机在线观看| 国模私拍国内精品国内av| 91九色单男在线观看| 成人高潮视频| 日本不卡一区| 91精品电影| 三上悠亚久久精品| 日韩高清不卡一区| 手机在线观看日韩av| 成人18精品视频| 精品人妻一区二区三区蜜桃视频| 国产精品进线69影院| 久久久综合久久| 色999日韩国产欧美一区二区| 一级特黄aaaaaa大片| 精品国产成人系列| 国产精品影院在线| 色综合天天综合网国产成人网| caoporn视频在线观看| 国产69久久精品成人| 四虎国产精品免费久久| 国产日本一区二区三区| 欧美呦呦网站| 国产精品又粗又长| 蜜臀91精品一区二区三区| 第一页在线视频| 国产亚洲精品资源在线26u| 91香蕉一区二区三区在线观看| 精品久久久久久久久久久| 亚洲天堂中文网| 日韩av一区在线观看| sm国产在线调教视频| 国产成人精品电影久久久| 天堂va在线高清一区| 日韩免费三级| 亚洲国产精品第一区二区| 日韩精品aaa| 国产三级一区二区三区| 日本少妇激情舌吻| 91超碰这里只有精品国产| 你懂的免费在线观看| 欧美激情免费观看| 久久精品嫩草影院| 欧美一二三四五区| 亚洲国产精品一区| 久久黄色一级视频| 中文字幕在线免费不卡| 日本久久综合网| 亚洲精品97久久| 日本欧美电影在线观看| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 日韩中文字幕高清| 亚洲精品福利免费在线观看| 91最新在线视频| 国产在线视频2019最新视频| 国产成人一区二区三区影院| 国产69精品久久久久久久| 国产黑丝在线一区二区三区| 性生交大片免费全黄| 欧美在线观看视频一区二区| 欧美日本韩国一区二区| 97久久久久久| 精品伊人久久久| 国产一线二线三线女| 国产成人精品午夜视频免费| 国产精品视频一区二区三| 欧美电影一区二区| 午夜视频在线观看网站| 国产精品丝袜白浆摸在线| 欧美理论在线播放| 中文字幕第21页| 日本一区二区三区在线观看| 男人天堂av在线播放| 亚洲开心激情网| 日本免费一区二区三区四区| 美乳视频一区二区| 久久裸体视频| 51妺嘿嘿午夜福利| 欧美午夜寂寞影院| 午夜激情视频在线观看| 国产在线播放91| 亚洲深深色噜噜狠狠爱网站| 久久人人爽人人片| 一区二区日韩av| 欧美熟妇交换久久久久久分类| 久久久视频免费观看| 麻豆一区二区| 男女高潮又爽又黄又无遮挡| 91麻豆6部合集magnet| 手机av免费观看| 久久国内精品一国内精品| 精品视频91| 日韩国产一级片| 久久亚洲一级片| 中文字幕一级片| 久久成人亚洲精品| 久久久久久毛片免费看| 凹凸国产熟女精品视频| 国产欧美一区二区精品秋霞影院| 中文字幕人妻丝袜乱一区三区| 日韩在线观看精品| 精品久久国产一区| 国产午夜福利在线播放| 国产欧美日韩综合| 国产黄频在线观看| 97成人超碰免| 日韩一区二区在线免费| 男人添女人荫蒂国产| 欧美日韩视频免费播放| 在线日本视频| 波多野结衣久草一区| 久久高清国产| 少妇视频一区二区| 亚洲第一视频网| 国产麻豆久久| 国产视频在线观看网站| 久久中文娱乐网| 国产精品久久久久久免费播放| 欧美交受高潮1| 欧美先锋资源| 日本一区二区在线观看视频| 色欧美乱欧美15图片| 羞羞视频在线免费国产| 欧美午夜精品久久久久久蜜| 国产乱淫av一区二区三区| 欧美精品韩国精品| 欧美成人性色生活仑片| 国产不卡av一区二区| 2025中文字幕|