精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

10萬美元+26天,一個低成本千億參數LLM就誕生了

人工智能 新聞
訓練一個 GPT 那樣的千億參數規模的大型語言模型需要多少錢和時間?北京智源人工智能研究院和中國科學院計算技術研究所等多所機構近日的一項研究發現可以用 10 萬美元在 26 天內訓練出一個有 1010 億參數的 LLM。

包括僅解碼器結構(如 GPT 和 LLAMA 系列模型)、僅編碼器結構(如 BERT)和編碼器 - 解碼器結構(如 T5)以及它們的變體模型在內的大型語言模型(LLM)已經取得了非凡的成功,并已被廣泛用于各種語言處理和多模態任務。

盡管如此成功,訓練 LLM 的成本還是過于高昂,以至于僅有少數公司能承受其訓練成本。此外,當前的趨勢說明未來還會使用更大規模的訓練數據,這會進一步推升大模型的研發成本。舉個例子,LLAMA-1 訓練使用了 1-1.4 TB token,而 Llama 2 更是達到了 2 TB。

研發 LLM 的另一大關鍵性挑戰是評估。主流的評估方法分為兩類:知識評估(MMLU 和 C-Eval)和 NLP 任務評估。這些評估方法可能無法真實反映模型的能力,因為也許存在數據泄漏問題,即評估數據集中某些部分可能在模型訓練過程中已被使用。此外,面向知識的評估方法可能不足以評估智能水平。一種更為公平客觀的評估方法是測 LLM 的智商(IQ),即將 LLM 泛化用于未在訓練數據中見過的條件和上下文。

增長策略。為了解決訓練成本難題,北京智源人工智能研究院和中國科學院計算技術研究所等多所機構近日做出了一番嘗試 —— 首次通過增長策略(growth strategy)訓練千億參數級的 LLM。增長意味著訓練過程中參數的數量并不固定,而是會從更小的模型擴增成大型模型。

圖片

  • 論文:https://arxiv.org/pdf/2309.03852.pdf
  • 模型:https://huggingface.co/CofeAI/FLM-101B

圖 1 展示了增長策略的三種典型場景。由于 LLM 的 FLOPs 大致與其參數數量成正比,因此模型參數的變化曲線與 X 軸之間的面積便能表示訓練的計算成本。

圖片

圖 1 (a) 展示了沒有模型增長的標準訓練策略;1 (b) 是直線型的增長策略,其能節省 50% 的成本;1 (c) 是一種適量型的增長策略,其節省的成本不到 50%;1 (d) 則是一種激進型的增長策略,能節省超過 50% 的成本。這一分析說明,為了盡可能地節省計算成本,應當采用激進型增長策略。

這項新研究的增長算子的設計靈感來自論文《2x faster language model pre-training via masked structural growth》中的 MSG,這是一個完整的運算集,涵蓋 Transformer 結構的所有四個增長維度。更重要的是,MSG 能在增長的同時嚴格地保存功能。因此,雖然小模型可以通過較小的參數搜索空間快速學習,但其知識可以被后續更大的模型繼承。這讓增長策略有可能使用相同或更少的計算成本實現更好的性能。

開源的 FLM-101B 模型。智源研究院的研究者通過逐步增長訓練了一個有 1010 億參數的 LLM 模型,他們也表示會開源發布該模型。該模型的架構是 FreeLM 的一種演進版。因此,研究者將其命名為 FLM-101B,其中 F 表示 Free。

FreeLM 框架有兩個預訓練目標,分別由語言信號和教師信號引導。在這項新研究中,這兩個目標被統一到了一個通用語言建模范式中。

IQ 評估基準。除了低成本的訓練范式,該團隊還做出了另一項貢獻,即為 LLM 的智商(IQ)評估提出了一套系統性的基準。

之前已有研究表明:盡管困惑度(PPL)指標能在一定程度上反映生成文本的質量,但卻并不可靠。另一方面,LLM 的訓練數據規模非常龐大,以至于我們難以辨別模型究竟只是在引述知識數據,還是真的實現了類似人類的推理、分析和概括能力,而這些能力正是這項研究定義 IQ 的基礎。一些常用的評估指標(用于英語的 MMLU 和用于漢語的 C-Eval)明顯是面向知識的,無法全面反映模型的智能水平。

為了進行完整性檢查,該團隊進行了一項測試:來自世界知名大學的五名計算機科學研究者使用 C-Eval 的化學試題進行了考試。結果發現他們的準確度幾乎相當于隨機亂猜,因為大多數志愿者都已忘記曾學過的化學知識。因此,強調對專業知識的了解程度的評估基準其實不足以衡量模型的 IQ。

為了全面衡量 LLM 的 IQ,該團隊開發了一個 IQ 評估基準,其中考慮了智商的四個關鍵方面:符號映射、規則理解、模式挖掘和抗干擾。

  • 語言本質上是符號的。已經有一些研究在使用符號而非類別標簽來評估 LLM 的智能水平。類似地,該團隊使用了一種符號映射方法來測試 LLM 在未曾見過的上下文上的泛化能力。 
  • 人類智能的一大重要能力是理解給定的規則并采取相應的行動。這種測試方法已被廣泛用在各種等級的測驗中。因此,規則理解成為這里的第二項測試。 
  • 模式挖掘涉及到歸納和演繹,也是智能的重要組成部分。這一方法在科學發展歷史中發揮了至關重要的作用。此外,各種競賽的測試題也往往需要這種能力才能解答。受此啟發,模式挖掘被選為第三個評估指標。 
  • 最后一個也很重要的指標是抗干擾能力,這也是智能的核心能力之一。已有研究指出,語言和圖像都很容易被噪聲干擾。考慮到這一點,該團隊把抗干擾用作了最后一個評估指標。

當然,這四個指標絕非 LLM IQ 評估的定案,但它們可作為一個起點,激勵后續的研究發展,并可望最終催生出一套全面的 LLM IQ 評估框架。 

這項研究的主要貢獻包括: 

  • 研究者表示,這是首個使用增長策略從頭開始訓練超過千億參數的 LLM 研究嘗試。同時,這還是目前成本最低的千億參數模型,成本僅 10 萬美元。 
  • 通過改進 FreeLM 訓練目標、有潛力的超參數搜索方法和功能保留型增長,這項研究解決了不穩定問題。研究者相信該方法也能為更廣大的科研社區提供助力。 
  • 研究者也通過實驗比較了新模型與之前的強大模型,其中既使用了面向知識的基準,也使用了新提出的系統性 IQ 評估基準。實驗結果表明 FLM-101B 是一個有競爭力且穩健的模型。 
  • 該團隊會發布模型檢查點、代碼、相關工具等,以推進千億參數規模的漢語和英語雙語 LLM 的研究開發。

FLM-101B 設計概況

從架構上看,FLM-101B 以 FreeLM 為骨干網絡,并集成了 xPos。在模型大小方面,得益于新的增長策略,研究者能在一次訓練中得到 16B、51B 和 101B 三種大小的模型。

至于預訓練設置,FLM-101B 繼承了 FreeLM 的訓練策略。

而在增長策略方面,不同于獨立訓練不同大小模型的常用實踐方法,該團隊可以依次訓練具有 16B、51B 和 101B 參數的三個模型,其中每個模型都會繼承其前一個較小模型的知識。

至于訓練硬件,則是使用了 24 臺 DGX-A800 GPU (8×80G) 服務器組成的集群;FLM-101B 的訓練時長不到 26 天更多并行策略和模型配置請參閱下表 1 和 2。

圖片

圖片

FLM-101B 的訓練穩定性

為了解決損失發散和梯度暴增等不穩定問題,研究者提出了一種頗具潛力的解決方案,簡述如下。

損失預測。新提出的實現訓練穩定的方法如下:

首先,在 FLM-16B 訓練開始之前先確定數據的分布。

接下來,對三個超參數進行網格搜索,包括學習率、初始化標準差和輸出層的 softmax 溫度。該網格搜索的執行是通過運行一個代理模型,其隱藏狀態維度(即模型寬度)為 256、頭數為 2,參數數量為 4000 萬。該代理模型的其它所有結構超參數和訓練數據與 FLM-16B 相同。在 6 個節點上使用數據并行時,一次運行網格搜索耗時為 24.6 小時,這大致表示:如果使用 24 節點的配置,那么運行一次需要 6 小時。

通過這種網格搜索,研究者找到了最優的超參數:學習率 = 4e-4、標準差 = 1.6e-2、softmax 溫度 = 2.0。

然后他們通過 μP 遷移這些超參數,能實現規避了不穩定問題的無縫訓練體驗。再組合使用 MSG,LM-51B 和 FLM-101B 也沒出現后續的增長發散問題。

圖 2 展示了完整的訓練損失曲線。

圖片

通過 Bfloat16 實現混合精度。使用混合精度的目的是節省運行時的內存和時間成本,這里他們選擇的是 Bfloat16。

基準評估

表 3 比較了 FLM-101B 與其它強大基準模型(LLAMA 系列模型和 GLM-130B)的性能表現。

圖片

研究者表示,這些結果說明 FLM-101B 在事實性知識方面并沒有任何優勢,而如果能使用更多訓練數據,那么其性能還會繼續提升。

表 4 展示了 eFLM-16B 與基準模型在專業知識評估方面的結果。

圖片

結果證明,在強調專業知識的數據集上的得分并不能反映 LLM 的智能水平,因為某些特定訓練數據可能具有壓倒性的貢獻。

表 5 給出了 FLM 模型每一階段的性能表現。

圖片

正如預期的那樣,FLM 的性能表現會隨模型增大而提升。FLM-101B 在幾乎所有任務上都表現最佳。這意味著該模型每一次增長后都會繼承前一階段的知識。

 IQ 實驗

實驗中,為了對 LLM 的 IQ 進行更為系統性的評估,智源研究院的這個團隊使用了現有的 IQ 相關數據集并做了一些必要的修改,他們也生成了一些新的合成數據。

具體來說,他們提出的 IQ 評估主要考慮了四個方面:符號映射、規則理解、模式挖掘和抗干擾。這些任務有一個關鍵的共同點:它們全都依賴于在新的上下文中進行推理和泛化。

下面幾張表格展示了 IQ 實驗的結果:

圖片

圖片


圖片

圖片

從這些表格來看,在這四個 IQ 評估基準上,FLM-101B 憑借低得多的計算成本取得了與 GPT-3 媲美且優于 GLM-130B 的結果。

除了訓練數據的影響外,研究者推測這種優勢可能是由于早期階段的小模型細化了較小的搜索空間,當模型變得更大更寬,泛化能力增強時,這種優勢還在持續發揮作用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-15 09:50:01

漏洞網絡安全網絡攻擊

2013-07-16 09:38:50

2020-12-26 09:12:55

白帽子黑客漏洞

2020-09-04 16:38:01

網絡攻擊勒索軟件數據泄露

2021-10-11 14:07:28

比特幣虛擬貨幣加密貨幣

2021-05-04 21:22:35

勒索軟件數據恢復網絡攻擊

2021-08-03 15:04:13

數據泄露漏洞信息安全

2021-07-07 10:40:49

勒索軟件攻擊贖金

2025-08-04 08:51:00

2025-11-03 07:39:51

2012-02-10 09:34:02

2010-08-18 09:57:44

Unix服務器IBM

2012-05-14 21:31:33

2012-05-23 10:05:49

工作效率效率程序員

2011-04-28 10:59:07

ARM

2015-02-05 10:48:37

360公司360

2025-11-18 08:54:00

2023-07-25 13:39:00

2021-01-14 09:27:05

黑客源代碼網絡攻擊

2021-09-16 09:02:59

數據泄露漏洞成本
點贊
收藏

51CTO技術棧公眾號

国产精品区一区二区三在线播放 | av在线亚洲天堂| 综合精品久久| 日韩精品高清视频| 国产三级生活片| 深夜成人在线| 亚洲老司机在线| 欧美极品日韩| www.超碰在线.com| 丝袜诱惑制服诱惑色一区在线观看| 久久久国产精品一区| 在线免费观看日韩av| 超碰国产精品一区二页| 五月天欧美精品| 欧美日韩一区二区三区电影| 四虎精品在线| 国产高清不卡一区| 国产欧美精品一区二区三区介绍| 天天操天天爽天天干| 亚洲天天影视网| 在线观看欧美日韩国产| 给我看免费高清在线观看| 免费一级欧美在线大片| 欧美日韩专区在线| 日本一区二区黄色| www成人免费观看| 亚洲欧美日韩国产成人精品影院| 久草一区二区| 成人久久精品人妻一区二区三区| 九九**精品视频免费播放| 日本中文字幕成人| 日韩伦理在线视频| 欧美激情aⅴ一区二区三区| 中文字幕日韩精品在线| 日韩精品无码一区二区三区久久久| 在线播放一区二区精品视频| 777xxx欧美| 国产aⅴ爽av久久久久| 日韩毛片在线| 91国产免费观看| 91免费黄视频| 超碰在线97国产| 亚洲国产一区在线观看| 视色,视色影院,视色影库,视色网| 91精品国产综合久久久久久豆腐| 国产欧美一区二区三区在线老狼| 免费av在线一区二区| 无码精品人妻一区二区| 99精品热视频| 欧美极品色图| 大片免费播放在线视频| 久久精品夜色噜噜亚洲aⅴ| 蜜桃av色综合| 国产小视频福利在线| 久久精品夜夜夜夜久久| 午夜欧美性电影| 91涩漫在线观看| 中文字幕在线不卡视频| 久久精品在线免费视频| 在线观看h网| 夜夜爽夜夜爽精品视频| 久久久久久免费看| 午夜欧美激情| 欧美亚洲综合一区| 国产免费中文字幕| 狂野欧美xxxx韩国少妇| 精品国产一区二区三区忘忧草 | 色婷婷久久久| 亚洲欧美精品伊人久久| 精品无码在线观看| 88国产精品视频一区二区三区| 久国内精品在线| www..com国产| 免费观看日韩电影| 91九色偷拍| 午夜视频免费看| 国产欧美一区二区精品性色 | 99精品99| 国产精品欧美激情| 国产黄色片免费| 99久久婷婷国产综合精品| 欧美一区二区三区电影在线观看 | 国产精品大陆在线观看| 亚洲一卡二卡在线观看| 国产成人免费视频网站高清观看视频| 激情视频一区二区| 在线播放日本| 亚洲成av人片| 我要看一级黄色大片| 日本成人手机在线| 日韩精品视频免费在线观看| 精品日韩在线视频| 国产精品v日韩精品v欧美精品网站| 2019中文字幕在线| 国产乱淫片视频| 91免费精品国自产拍在线不卡| 亚洲高清乱码| 2020国产在线| 91精品欧美一区二区三区综合在 | 国产精品电影在线观看| 午夜精品久久久久久久99 | 日韩欧美一区二区三区四区五区| 亚洲电影视频在线| 色素色在线综合| 亚洲成年人av| 天天av综合| 日本精品一区二区三区在线播放视频 | 国内精品免费在线观看| 久久久久久国产精品免费免费| 欧美a免费在线| 色综合 综合色| 国产精品一区二区人妻喷水| 天天做天天爱天天爽综合网| 日本一欧美一欧美一亚洲视频| 成人小说亚洲一区二区三区 | 亚州国产精品视频| 韩国精品久久久| 视频在线99re| 午夜影院一区| 亚洲精品456在线播放狼人| 成人自拍小视频| 美女www一区二区| 免费久久一级欧美特大黄| 天堂va在线| 3d成人h动漫网站入口| 久久视频精品在线观看| 国产日韩欧美一区| 国产精品一 二 三| 香蕉久久aⅴ一区二区三区| 欧美日韩国产区一| 99精品欧美一区二区| 欧美在线综合| 狼狼综合久久久久综合网| a国产在线视频| 亚洲成人激情图| 成人在线观看免费播放| 91精品国产高清一区二区三区| 精品国产成人亚洲午夜福利| 亚洲精品影视| 国产成人一区二区三区免费看| 成人欧美在线| 欧美日韩国产综合一区二区三区| 性欧美一区二区| 裸体素人女欧美日韩| 精品亚洲第一| 欧产日产国产精品视频| 亚洲国产精品va在线看黑人 | 在线观看免费不卡av| 神马影视一区二区| 国产不卡av在线| 国产中文在线视频| 日本二三区不卡| 免费黄色片网站| 奇米一区二区三区| 亚洲视频在线观看日本a| 欧美日韩va| 另类天堂视频在线观看| 午夜免费福利视频| 婷婷成人激情在线网| 国产国语性生话播放| 久久亚洲综合| 亚州欧美一区三区三区在线| 香蕉久久久久久| 欧美日韩福利视频| 无码国精品一区二区免费蜜桃| 色综合色综合色综合 | 亚洲女爱视频在线| 中文字幕乱码在线人视频| 欧美久久一级| 久久riav二区三区| 欧美xnxx| 欧美另类极品videosbestfree| 丰满少妇在线观看bd| 日韩欧美一区二区三区久久| 人妻熟人中文字幕一区二区| 国产原创一区二区| 少妇人妻在线视频| 精品国产乱码| 亚洲自拍偷拍网址| 中文字幕成在线观看| 中文字幕在线观看亚洲| www.五月激情| 色88888久久久久久影院野外| 国产精品综合激情| 成人免费观看视频| 91日韩视频在线观看| 欧美日本一区二区视频在线观看 | 日韩av资源站| 777午夜精品视频在线播放| 久久久精品一区二区涩爱| 久久精品男人的天堂| 无人码人妻一区二区三区免费| 亚洲欧美日韩视频二区| 中文字幕乱码免费| 美女久久久久| 懂色中文一区二区三区在线视频| 视频在线日韩| 久久久久久久久电影| 在线视频三区| 日韩精品视频在线| 国产成人久久精品77777综合 | 天天综合网 天天综合色| 中国1级黄色片| 91在线国产福利| 在线观看中文av| 秋霞午夜av一区二区三区| www.日本少妇| 天天影视综合| 日韩电影免费观看在| 美国十次av导航亚洲入口| 91免费欧美精品| 韩国精品主播一区二区在线观看| 久久久久久国产精品久久| 黄色网在线播放| 中文字幕日韩免费视频| 激情综合闲人网| 亚洲成人网av| 亚洲AV无码一区二区三区少妇| 欧美日韩国产另类一区| jizz国产在线| 日韩欧美精品在线观看| 日韩污视频在线观看| 亚洲一区二区3| 成人免费黄色小视频| 国产精品另类一区| 人妻视频一区二区| 久久免费国产精品| 好吊一区二区三区视频| 成人18精品视频| 国产av一区二区三区传媒| 国产一区二区久久| 污污的视频免费观看| 久久精品国产免费看久久精品| 一级黄色香蕉视频| 久久婷婷麻豆| 粉嫩虎白女毛片人体| 亚洲欧美网站| 91免费视频网站在线观看| 一本久道久久综合狠狠爱| 999在线观看视频| 影院欧美亚洲| 国产极品尤物在线| 亚洲第一伊人| 国产精品沙发午睡系列| 在线亚洲成人| 国产三区在线视频| 老色鬼久久亚洲一区二区| 黄色a级片免费| 日韩电影免费在线看| 日本黄大片一区二区三区| 毛片不卡一区二区| 91亚洲精品久久久蜜桃借种| 韩日精品视频一区| 曰本三级日本三级日本三级| 国产成a人无v码亚洲福利| 大桥未久恸哭の女教师| 99riav久久精品riav| 在哪里可以看毛片| 国产精品久久免费看| 91porn在线视频| 亚洲成av人片| 久久久黄色大片| 欧美日韩激情在线| 国产高清精品软件丝瓜软件| 欧美成人午夜电影| 日韩av高清在线| www.久久色.com| 丁香高清在线观看完整电影视频| 91精品91久久久久久| 国产成人精品一区二三区在线观看| 91精品久久久久| eeuss国产一区二区三区四区| 久久精品五月婷婷| 99精品网站| 国产精品网站免费| 全部av―极品视觉盛宴亚洲| 三级网站免费看| 久久伊99综合婷婷久久伊| 少妇高潮惨叫久久久久| 亚洲午夜羞羞片| 日韩av免费播放| 日韩精品一区二区三区四区| 青青草免费观看免费视频在线| 色老头一区二区三区| 草莓视频丝瓜在线观看丝瓜18| 国产精品久久中文| 综合中文字幕| 三区精品视频| 亚洲欧洲一级| 日日干日日操日日射| 91丨porny丨户外露出| 九九这里只有精品视频| 精品久久中文字幕久久av| 一级特黄特色的免费大片视频| 日韩av一区在线| 国产黄色在线网站| 国产成人97精品免费看片| 中文字幕一区二区三区四区久久 | 欧美男人的天堂| 午夜欧美精品久久久久久久| 男女视频一区二区三区| 成人午夜视频免费看| 亚洲一级二级片| 在线视频你懂得一区二区三区| 丰满人妻一区二区三区无码av| 啊v视频在线一区二区三区| 中文字幕乱码在线播放| 国产精品一区二区在线观看| 国产精品成久久久久| 精品国产成人av在线免| www.亚洲人| 特级片在线观看| 欧美美女一区二区三区| 国产精品二线| 欧美一级电影免费在线观看| 99精品国产高清一区二区麻豆| 日本不卡一区二区三区四区| 三级不卡在线观看| 精品人妻一区二区免费视频| 一区二区三区日韩精品| 国产精品久久久久久免费免熟| 在线观看国产成人av片| 深夜成人在线| 久热这里只精品99re8久| 在线成人国产| 香蕉在线观看视频| 亚洲欧美成aⅴ人在线观看| 97超碰人人模人人人爽人人爱| 中国china体内裑精亚洲片| 成人在线爆射| 青青草原成人| 久久久夜夜夜| 亚洲精品成人无码| 色综合激情五月| 国产日本在线| 国产精品久久久久久久av电影| 国产精品视频一区二区三区四蜜臂| 六月丁香激情网| 91天堂素人约啪| 国产一级片毛片| 亚洲系列中文字幕| 亚洲一区二区三区四区| 新呦u视频一区二区| 久久99九九99精品| 东方av正在进入| 日韩欧美一区在线观看| 高h视频在线播放| 久久er99热精品一区二区三区| 久久国产精品久久久久久电车| 白丝女仆被免费网站| 91官网在线免费观看| 2021av在线| 91亚洲午夜在线| 亚洲午夜黄色| 亚洲av片不卡无码久久| 在线看国产一区| 蜜桃视频在线观看www社区| 亚洲tv在线观看| 亚洲看片一区| 天堂久久精品忘忧草| 欧美日韩亚洲综合| 97超碰资源站在线观看| 精品国产电影| 免费欧美日韩国产三级电影| 黑人操日本美女| 亚洲高清不卡av| 精品亚洲美女网站| 亚洲最新在线| eeuss国产一区二区三区| 尤物视频免费观看| 久久精品视频在线| 国内精品偷拍| 日韩一级理论片| 一区二区三区日本| 日夜干在线视频| 91免费在线视频| 国产精品日韩欧美一区| 殴美一级黄色片| 亚洲成人动漫在线播放| 成人啪啪18免费游戏链接| 中文字幕第一页久久| 99热这里只有精| 国产91精品久久久久久| 99成人在线视频| 三级黄色片网站| 7777精品伊人久久久大香线蕉 | 欧美精品777| 123区在线| 欧美一级黄色录像片| xfplay精品久久| 国产偷拍一区二区| 日本精品视频在线观看| 欧美日一区二区在线观看| 精品人伦一区二区| 欧美变态口味重另类| 88xx成人网| 18禁免费无码无遮挡不卡网站| 亚洲少妇30p| 都市激情一区| 久久av免费一区|