精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

你還在糾結單個GPU怎么訓練GPT-3嗎?快來看看HP調優新范式吧!

人工智能 新聞
在今天的文章中,微軟研究院的研究員們將介紹基礎研究如何首次能夠調整龐大的神經網絡。

偉大的科學成就不能僅靠反復試驗取得。例如太空計劃中的每一次發射都是基于數百年的空氣動力學、推進和天體等基礎研究。同樣,在構建大規模人工智能系統時,基礎研究大大減少了試錯次數,效益明顯。

超參數(Hyperparameter,HP)調優是深度學習的關鍵,但也是一個昂貴的過程,對于具有數十億參數的神經網絡來說更是如此。假如 HP 選擇不當,會導致模型性能不佳、訓練不穩定。當訓練超大型深度學習模型時,這些問題更加嚴重。

最近,有研究表明不同的神經網絡參數化會導致不同的無限寬度極限(infinite-width limits),他們提出了最大更新參數化(Maximal Update Parametrization,μP),該參數化的無限寬極限是實現“最大”特征學習的。直觀地說,它確保每一層激活在訓練期間的更新大小保持一致,而不管寬度如何。相比之下,雖然標準參數化 (standard parametrization,SP) 在初始化時保證了激活的一致性,但實際上在訓練時,由于每層學習率的不平衡,導致激活在寬模型中爆炸。

來自微軟和 OpenAI 的研究者首次提出了基礎研究如何調優大型神經網絡(這些神經網絡過于龐大而無法多次訓練)。他們通過展示特定參數化保留不同大小模型的最佳超參數來實現這一點。利用 μP 將 HP 從小型模型遷移到大型模型。也就是說,該研究在大型模型上獲得了接近最優的 HP。

本文的想法非常簡單,論文中引入了一種特殊參數化 μP,窄和寬的神經網絡共享同一組最優超參數。即使寬度→∞也是如此。

論文作者之一、來自微軟的 Greg Yang 在推特上表示:“你不能在單個 GPU 上訓練 GPT-3,更不用說調優它的超參數了。但是利用新的理論進步,你竟可以在單個 GPU 上調優它的超參數!”

具體而言,該研究證明,在 μP 中,即使模型大小發生變化,許多最優的 HP 仍保持穩定。這導致一種新的 HP 調優范式:μTransfer,即在 μP 中對目標模型進行參數化,并在較小的模型上間接調優 HP,將其零樣本遷移到全尺寸模型上,無需調優后者。該研究在 Transformer 和 ResNet 上驗證 μTransfer,例如,1)通過從 13M 參數的模型中遷移預訓練 HP,該研究優于 BERT-large (350M 參數),總調優成本相當于一次預訓練 BERT-large;2)通過從 40M 參數遷移,該研究的性能優于已公開的 6.7B GPT-3 模型,調優成本僅為總預訓練成本的7%。

  • 論文地址:https://arxiv.org/pdf/2203.03466.pdf
  • 項目地址:https://github.com/microsoft/mup

通過大大減少猜測訓練超參數的需要,這種技術可以加快對巨大神經網絡的研究,例如 GPT-3 和未來可能更大的繼任者。

擴展初始化容易,但擴展訓練難

大型神經網絡很難訓練,部分原因是不了解其行為如何隨著規模增加而變化。在深度學習的早期工作中,研究者采用啟發式算法。一般來說,啟發式方法試圖在模型初始化時保持激活大小一致,無論寬度如何。然而,隨著訓練的開始,這種一致性會在不同的模型寬度處中斷,如圖1左側所示。

與隨機初始化不同,模型訓練期間的行為更難進行數學分析。該研究用 μP 解決,如圖1右側所示,該圖顯示了網絡激活擴展(activation scales)在模型寬度增加的最初幾個訓練步驟中的穩定性。

圖1:在 PyTorch 的默認參數化中,左圖,在經過一次 step 訓練后,激活擴展的寬度會出現差異。但是在右圖的 μP 中,無論訓練 step 寬度如何,激活擴展都會發生一致的變化。

事實上,除了在整個訓練過程中保持激活擴展一致之外,μP 還確保不同且足夠寬的神經網絡在訓練過程中表現相似,以使它們收斂到一個理想的無窮寬極限,該研究稱之為特征學習極限。

如圖所示,μP 是唯一在寬度上保持最佳學習率的參數化,在寬度為8192的模型中實現了最佳性能,并且對于給定的學習率,更寬的模型性能更好——即曲線不相交。

圖2:左側,該研究在 CIFAR10 上以不同的學習率(沿 x 軸顯示)訓練不同寬度(對應于不同顏色和圖案的曲線)的多層感知器 (MLP),并沿 y 軸繪制訓練損失。右側,參數化的 2D 平面由以下插值形成:1)PyTorch 默認值和 μP(x 軸)之間的初始化擴展,以及 2)PyTorch 默認值和 μP(y 軸)之間的學習率擴展。在這個平面上,PyTorch 默認用 (0,0) 表示,μP 默認用 (1,1) 表示。

基于張量程序(Tensor Programs)的理論基礎,μTransfer 自動適用于高級架構,例如 Transformer 和 ResNet。此外,它還可以同時遷移各種超參數。

以 Transformer 為例,圖3展示了關鍵超參數如何在寬度上保持穩定。超參數可以包括學習率、學習率 schedule、初始化、參數乘數等,甚至可以單獨針對每個參數張量。該研究在最大寬度為4096的 Transformer 上驗證了這一點。

圖3:在 μP 中參數化并在 WikiText-2 上訓練的不同寬度的 transformer。隨著模型寬度的增加,最優學習率、交叉熵溫度、初始化規模和學習率方案保持穩定。在右下角的圖中,該研究嘗試了如下學習率方案:(a) 線性衰減,(b) StepLR @ [5k, 8k],衰減因子為0.1,(c) StepLR @ [4k, 7k],衰減因子為0.3,(d) 余弦退火,(e) 常數,(f) 逆平方根衰減。

模型深度的實驗擴展

現代神經網絡擴展不止涉及寬度一個維度。該研究還探索了如何通過將 μP 與非寬度維度的簡單啟發式算法相結合,將其應用于現實的訓練場景。下圖4使用相同的 transformer 設置來顯示最佳學習率如何在合理的非寬度維度范圍內保持穩定。

圖4:在 μP 中參數化并在 Wikitext-2 上訓練的不同大小的 transformer。如圖3所示,最優學習率不僅可以跨寬度遷移,還可在測試范圍內實驗性地跨其他擴展維度遷移,例如深度、批大小和序列長度。這意味著可以將理論上的跨寬度遷移與實驗驗證的跨其他擴展維度遷移相結合,以獲得能在小模型上間接調整超參數并遷移到大模型的 μTransfer。

除了學習率,其他超參數的情況如下圖所示:

測試 μTransfer

在驗證完單個超參數的遷移之后,研究者試圖將它們組合到更現實的場景中。下圖5對比了兩種情況,一種是 μTransfer 從一個小型 proxy 模型遷移調整過的超參數,另一種是直接調整大型目標模型。在這兩種情況下,調整都是通過隨機搜索完成的。

圖5:μTransfer 大約將計算效率提高了一個數量級。

由于 proxy 模型即使很小也能有意義地預測最佳超參數(如圖3、圖4所示),因此隨著該研究用數十億個參數訓練更大的目標模型,研究者預計性能差距會擴大。

μP + GPT-3

在這項工作之前,模型越大,調優成本越高,預計調優效果就越差。研究者預計 μTransfer 將給最大的模型帶來最大的增益,因此該研究與 OpenAI 合作,在 GPT-3 上評估 μTransfer。

使用 μP 對 GPT-3 的一個相對位置編碼版本進行參數化后,該研究調整了一個具有4000萬個參數的小型 proxy 模型,然后按照 μTransfer 的方法將最佳超參數組合復制到 GPT-3 的67億參數變體中。在此調整階段使用的總計算量僅為67億模型預訓練使用計算量的7%。如下圖所示,這個使用 μTransfer 的模型優于 GPT-3 論文中相同大小的模型(絕對位置編碼),它的性能與 GPT-3 論文中參數數量翻倍的模型(絕對位置編碼)相當。

理論意義

μP 給出了一個擴展規則,該規則在訓練損失方面唯一地保留了跨不同寬度模型的最佳超參數組合。相反,其他擴展規則(如 PyTorch 中的默認初始化或 NTK 參數化),隨著網絡變得越來越寬,超參數空間中的最優值卻越來越遠。研究者認為:實際使用特征學習神經網絡時,為了獲得適用的見解,μP 的特征學習極限會比 NTK 極限更自然。因此,過參數化神經網絡應該在大型寬度設置中重現 μP 的特征學習極限。

過去幾年開發的張量程序(TP)理論使這項進展成為可能。TP 理論使研究人員能夠計算任何通用計算圖在其矩陣維數變大時的極限。TP 方法產生了基本的理論結果,例如神經網絡 - 高斯過程對應的架構普遍性和動態二分定理,并通過推導 μP 和特征學習極限形成了 μTransfer。研究者認為將 TP 理論擴展到深度、批大小等擴展維度是大型模型在寬度之外可靠擴展的關鍵。

研究者表示:基礎研究是對反復試錯的一種高成本效益補充,該研究將繼續推導出更具原則性的大規模機器學習方法。

責任編輯:張燕妮 來源: 大數據文摘
相關推薦

2022-03-10 09:48:11

人工智能機器學習模型

2024-06-03 00:00:06

高性能數據傳輸應用程序

2022-02-23 14:18:53

If-Else入參接口

2020-08-13 08:17:50

MQ緩沖秒殺

2022-11-28 07:32:46

迭代器remove數據庫

2021-04-19 09:23:26

數字化

2021-03-23 15:21:00

人工智能機器學習技術

2020-11-04 08:40:23

C++多元組Tuple

2020-04-16 09:35:53

數據科學機器學習數據分析

2020-08-04 07:02:00

TCPIP算法

2022-03-14 09:33:56

神經網絡模型人工智能

2018-02-25 23:12:16

2018-05-02 15:41:27

JavaScript人臉檢測圖像識別

2018-03-06 09:54:48

數據庫備份恢復

2020-08-21 13:22:12

GPT-3AI機器

2019-07-17 15:45:24

Spark內存Java

2020-11-24 06:00:55

PythonPython之父編程語言

2017-02-27 13:22:29

戴爾

2023-04-07 09:53:02

量子AI

2023-03-01 16:15:16

點贊
收藏

51CTO技術棧公眾號

国产三级中文字幕| 欧美日韩国产第一页| 免费在线观看视频a| 天堂影院在线| 老妇喷水一区二区三区| 在线亚洲欧美视频| 亚洲成人av免费观看| 91高清视频在线观看| 久久这里只有精品视频网| 国产精品久久av| 欧美日韩在线视频免费播放| 欧美激情网址| 欧美日韩一区不卡| 男的插女的下面视频| 国产乱理伦片a级在线观看| 国产一区啦啦啦在线观看| 91高清视频在线免费观看| 91资源在线播放| 亚洲午夜精品| 欧美视频在线观看一区二区| 国产美女作爱全过程免费视频| 西西人体44www大胆无码| 另类综合日韩欧美亚洲| 性欧美激情精品| 午夜国产福利视频| 麻豆成人入口| 日韩一区二区三区免费看| 狠狠爱免费视频| 国产婷婷视频在线 | 精品国产一区二区三区在线观看| 亚洲国产欧美日韩在线| 性欧美videohd高精| 亚洲在线成人精品| 一区二区精品国产| 玖玖综合伊人| 99在线精品视频| 亚洲bt欧美bt日本bt| 国产一区二区视频免费| 亚洲国产高清一区二区三区| 日韩在线观看成人| 亚洲人成人无码网www国产 | 日本特黄a级片| 国产中文在线播放| 亚洲欧美日韩人成在线播放| 日韩久久久久久久| 欧美xxx.com| 大陆成人av片| 成人午夜一级二级三级| 中国女人真人一级毛片| 久久久精品网| 91大神在线播放精品| 九九热精品免费视频| 天天色综合色| www.日韩.com| 国产人与禽zoz0性伦| 欧美午夜精彩| 国产亚洲精品久久久久久| 91精品人妻一区二区三区蜜桃欧美 | 五月天综合婷婷| 97电影在线| 国产欧美一区视频| 日韩不卡av| 黄色片视频在线观看| 久久久久综合网| 欧美日韩亚洲一区二区三区四区| 天天操天天爱天天干| 成人免费福利片| 国产精品区免费视频| 亚洲乱码国产乱码精品精软件| 国产一区二区三区四| 亚洲综合激情网| 国产一区二区三区在线看 | 国产·精品毛片| 97超级在线观看免费高清完整版电视剧| 在线观看毛片网站| 久88久久88久久久| 亚洲专区在线视频| 亚洲第一页在线观看| 国产99久久久国产精品免费看| www日韩av| 欧洲精品久久一区二区| 99久久精品免费看| 欧洲一区二区在线| 天堂аⅴ在线地址8| 亚洲丝袜另类动漫二区| 中国黄色录像片| 白白色在线观看| 黑人精品xxx一区一二区| 欧美黄色免费影院| 日本欧美在线| 日韩欧美亚洲一区二区| 国产激情视频网站| 亚洲熟妇av乱码在线观看| 精品人妻伦一区二区三区久久| 激情综合色丁香一区二区| 91在线在线观看| 天堂中文在线资源| 亚洲国产精品国自产拍av| 公共露出暴露狂另类av| 超碰在线网站| 欧洲av在线精品| 亚洲自拍第三页| 凹凸av导航大全精品| 亚洲男人第一网站| 久草视频手机在线| 国产精品日韩精品欧美精品| 国产精品一区av| 亚洲av无码一区二区三区性色| 91首页免费视频| 亚洲图色在线| 成人一级福利| 欧美精品自拍偷拍| 精品人妻一区二区三区香蕉| 欧美国产一级| 69av在线视频| 国产乱子伦精品无码码专区| ww亚洲ww在线观看国产| 欧美一级免费在线观看| 日韩欧美精品一区二区三区| 欧美情侣在线播放| 国产精品揄拍100视频| 一区二区三区在线| 国产精品99久久久久久久久| 亚洲AV无码精品国产| 国产亲近乱来精品视频| 国产女主播自拍| 日韩欧国产精品一区综合无码| 亚洲国产精品电影| 欧美成人免费观看视频 | 99久久精品免费看国产免费软件| 亚洲国产午夜伦理片大全在线观看网站 | 成年人网站免费视频| 四虎国产精品免费久久| 亚洲午夜激情免费视频| 国产一级特黄aaa大片| 狠狠色狠狠色综合系列| 日韩高清dvd| 国产理论在线| 日韩欧美在线影院| 日本黄色免费片| 日韩精品视频网| 精品亚洲第一| 欧美精品videossex少妇| 欧美一区二区三区性视频| 国产熟女一区二区| 久久天天综合| 久久久久久99| 麻豆网站免费在线观看| 精品国产亚洲一区二区三区在线观看 | 日本一区二区三区四区五区| 国产高清成人在线| 成人在线免费观看网址| 国产精品igao视频网网址不卡日韩| 亚洲网站在线播放| 糖心vlog精品一区二区| 国产日韩欧美精品在线| 精品久久久噜噜噜噜久久图片| 欧美巨大xxxx| 欧美激情免费看| 精品欧美一区二区精品少妇| 亚洲色图视频网| 亚洲av无日韩毛片久久| 久久精品影视| 69堂成人精品视频免费| 日本电影在线观看| 日韩美女视频一区二区在线观看| 蜜臀av午夜精品久久| 国产一区二区三区免费在线观看| 桥本有菜av在线| 国产 日韩 欧美| 欧美大胆a视频| 亚洲精品中文字幕成人片| 亚洲一区中文日韩| 国产中文字幕一区二区| 日欧美一区二区| 亚洲欧美日韩精品久久久| 日韩欧乱色一区二区三区在线 | 狠狠综合久久av一区二区| 亚洲国产精品久久人人爱蜜臀| 色哟哟视频在线| 国产日韩一区| 涩涩日韩在线| 在线日韩三级| 欧美极品欧美精品欧美视频| 99热这里只有精品在线| 亚洲国产aⅴ天堂久久| 四虎成人免费视频| 性色一区二区三区| 一本一本a久久| 1769国产精品视频| 欧美又大又硬又粗bbbbb| yiren22亚洲综合伊人22| 69堂成人精品免费视频| 精品少妇久久久| 久久综合丝袜日本网| 日本中文字幕高清| 综合久久婷婷| 欧美国产综合视频| 激情综合婷婷| 热久久美女精品天天吊色| 欧美96在线| 亚洲国产天堂久久综合| 伊人网av在线| 亚洲成人福利片| av男人的天堂av| 国产精品亚洲视频| 欧美综合在线观看视频| 欧美日韩国产成人精品| 日韩成人在线资源| 波多野结衣欧美| 国产精品久久久久久网站| 色帝国亚洲欧美在线| 一区二区三区回区在观看免费视频 | 成人vr资源| 国模一区二区三区私拍视频| 免费一区二区三区四区| 91chinesevideo永久地址| 青青青青在线| 亚洲精品综合精品自拍| 国产成人精品免费看视频| 色视频欧美一区二区三区| 久久久久97国产| 国产欧美日韩三级| 特级特黄刘亦菲aaa级| 免费观看日韩av| 成人中文字幕在线播放| 欧美va天堂在线| 西游记1978| 国产精品对白久久久久粗| 国产精品综合网站| 美女网站视频一区| 2020欧美日韩在线视频| 亚洲卡一卡二| 色小说视频一区| 九色在线播放| 日韩av中文在线| 亚洲av无码片一区二区三区| 欧美美女一区二区在线观看| 国产成人无码av| 精品国产乱码久久久久久虫虫漫画| 免费精品在线视频| 国产视频一区二区在线| 成人免费av片| 99久久er热在这里只有精品15| 国产男女无遮挡猛进猛出| 蜜桃视频在线观看一区二区| 日韩网址在线观看| 雨宫琴音一区二区在线| 日韩国产小视频| 欧美在线免费| 久久观看最新视频| 在线观看日韩| 日本女人高潮视频| 亚洲精品国产首次亮相| 欧美一级黄色录像片| 午夜国产精品视频免费体验区| 在线无限看免费粉色视频| 欧美xxxxx视频| 宅男在线精品国产免费观看| 日韩亚洲一区在线| 中文字幕一区二区三区乱码| 色综合久久网| 中文字幕在线观看一区二区三区| 99久久国产综合精品成人影院| 一级二级三级欧美| 99久久视频| 久久视频免费在线| 欧美视频日韩| 97成人在线免费视频| 亚洲视频播放| 欧美综合在线观看视频| 蜜臀av性久久久久蜜臀aⅴ四虎| 在线看的黄色网址| 国产一区二区三区蝌蚪| 日本wwww色| 91视频在线观看免费| 一级片久久久久| 中文字幕一区二区视频| 欧美一级片在线视频| 一区二区三区av电影| 精品国产免费观看| 91成人免费在线| 国产又粗又猛又爽又黄91| 欧美精品色一区二区三区| 精品国产区一区二| 亚洲精品美女在线| 国产精品ⅴa有声小说| 日韩视频免费大全中文字幕| www在线免费观看视频| 久国内精品在线| 激情aⅴ欧美一区二区欲海潮 | 成人网ww555视频免费看| 国产美女直播视频一区| 国产福利亚洲| 国产成人免费电影| 精品高清久久| 日产精品久久久久久久蜜臀| 香蕉久久a毛片| 999这里有精品| 成人午夜激情影院| 一区二区精品免费| 一区二区三区 在线观看视频| 国产成人无码精品| 在线观看91精品国产麻豆| 色哟哟中文字幕| 日韩在线视频一区| 国产精选在线| 91天堂在线观看| 亚洲三级网页| 久久久久久av无码免费网站下载| 国产欧美三级| 久久久国产精华| 中文字幕被公侵犯的漂亮人妻| 国产精品久久久久久久久动漫| 久久久美女视频| 欧美亚洲禁片免费| 欧美熟女一区二区| 日韩在线观看免费高清| 黄在线观看免费网站ktv| 亚洲wwwav| 国内精品久久久久久99蜜桃| 日韩精品免费一区| 美洲天堂一区二卡三卡四卡视频| 秘密基地免费观看完整版中文| 亚洲国产精品成人综合色在线婷婷 | aa片在线观看视频在线播放| 综合分类小说区另类春色亚洲小说欧美| 国产成人无码精品亚洲| 欧美日韩成人在线一区| 日韩av成人| 蜜月aⅴ免费一区二区三区| 成人在线爆射| 国产在线播放一区二区| 亚洲综合激情在线| 777视频在线| 国产69精品一区二区亚洲孕妇| 免费成人美女女在线观看| 欧美午夜精品久久久久久久| 亚洲黄色小说网| 久久夜色精品国产| 久久av影院| 欧洲精品国产| 国产情侣一区| 成人啪啪18免费游戏链接| 中文字幕一区二区三区在线不卡| 黄色污污网站在线观看| 日韩电影在线观看永久视频免费网站| 青春草在线视频| 91丨九色丨国产在线| 亚洲电影在线一区二区三区| 性生活免费在线观看| 国产欧美精品日韩区二区麻豆天美| 亚洲黄色三级视频| 欧美精品一区二区三区蜜臀 | 亚洲一区二区三区在线免费| 国产av不卡一区二区| 精品中文字幕一区二区小辣椒| 欧美激情 一区| 色88888久久久久久影院野外| 欧美视频免费一区二区三区| 91精品国产九九九久久久亚洲| 久久365资源| 日韩av综合在线观看| 99久久综合狠狠综合久久| 精品欧美一区二区三区免费观看 | 亚洲综合欧美在线| 国产精品免费久久| 亚洲中文字幕在线观看| 日韩在线观看免费网站| 欧洲午夜精品| www.午夜色| 国产精品一区二区在线观看不卡| 欧产日产国产v| 欧美成人一区二区三区| 欧美午夜大胆人体| 激情视频一区二区| 模特精品在线| 精品成人无码一区二区三区| 欧美日韩亚洲综合在线| 国产午夜精品一区二区理论影院| 亚洲黄色在线| 无码人妻少妇色欲av一区二区| 一区二区三区毛片| 熟妇高潮一区二区三区| 国产91免费看片| 欧美xxav| 国产精品嫩草69影院| 狠狠躁夜夜躁久久躁别揉| 国产h在线观看| 91视频免费在线| 国产欧美一级| 自拍偷拍第9页| 精品国产髙清在线看国产毛片| 欧美极品videos大乳护士| 色一情一乱一伦一区二区三区丨 | 国产永久免费网站| 亚洲国产精品影院| www.亚洲.com| 成人动漫在线观看视频| 三级亚洲高清视频|