精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

單個GPU無法訓練GPT-3,但有了這個,你能調優超參數了

人工智能 機器學習 新聞
模型越大,超參數(HP)調優成本越高,微軟聯合 OpenAI 提出 HP 調優新范式,單個 GPU 上就可以調優 GPT-3 超參數。

偉大的科學成就不能僅靠反復試驗取得。例如太空計劃中的每一次發射都是基于數百年的空氣動力學、推進和天體等基礎研究。同樣,在構建大規模人工智能系統時,基礎研究大大減少了試錯次數,效益明顯。

超參數(Hyperparameter,HP)調優是深度學習的關鍵,但也是一個昂貴的過程,對于具有數十億參數的神經網絡來說更是如此。假如 HP 選擇不當,會導致模型性能不佳、訓練不穩定。當訓練超大型深度學習模型時,這些問題更加嚴重。

最近,有研究 [54] 表明不同的神經網絡參數化會導致不同的無限寬度限制(infinitewidth limits),他們提出了最大更新參數化(Maximal Update Parametrization,μP),該方法可以在限制內實現「最大」特征學習。直觀地說,它確保每一層在訓練期間以相同的順序更新,而不管寬度如何。相比之下,雖然標準參數化 (standard parametrization,SP) 在初始化時保證了激活是單位順序的,但實際上在訓練 [54] 時,由于每層學習率的不平衡,導致激活在寬模型中爆炸。

來自微軟和 OpenAI 的研究者首次提出了基礎研究如何調優大型神經網絡(這些神經網絡過于龐大而無法多次訓練)。他們通過展示特定參數化保留不同模型大小的最佳超參數來實現這一點。利用 μP 將 HP 從小型模型遷移到大型模型。也就是說,該研究在大型模型上獲得了接近最優的 HP。

論文作者之一、來自微軟的 Greg Yang 表示:「你不能在單個 GPU 上訓練 GPT-3,更不用說調優它的超參數(HP)了。但是由于新的理論進步,你可以在單個 GPU 上調優 HP ?」

本文的想法非常簡單,論文中引入了一種特殊參數化 μP,窄和寬的神經網絡共享一組最優超參數。即使寬度→∞也是如此。

具體而言,該研究證明,在 μP 中,即使模型大小發生變化,許多最優的 HP 仍保持穩定。這導致一種新的 HP 調優范式:μTransfer,即在 μP 中對目標模型進行參數化,并在較小的模型上間接調優 HP,將其零樣本遷移到全尺寸模型上,無需調優后者。該研究在 Transformer 和 ResNet 上驗證 μTransfer,例如,1)通過從 13M 參數的模型中遷移預訓練 HP,該研究優于 BERT-large (350M 參數),總調優成本相當于一次預訓練 BERT-large;2)通過從 40M 參數遷移,該研究的性能優于已公開的 6.7B GPT-3 模型,調優成本僅為總預訓練成本的 7%。

  • 論文地址:https://arxiv.org/pdf/2203.03466.pdf
  • 項目地址:https://github.com/microsoft/mup

通過大大減少猜測要使用哪些訓練超參數的需要,這種技術可以加快對巨大神經網絡的研究,例如 GPT-3 和未來可能更大的繼任者。

擴展初始化容易,但擴展訓練難

大型神經網絡很難訓練,部分原因是不了解其行為如何隨著規模增加而變化。在深度學習的早期工作中,研究者采用啟發式算法。一般來說,啟發式方法試圖在模型初始化時保持激活擴展一致。然而,隨著訓練的開始,這種一致性會在不同的模型寬度處中斷,如圖 1 左側所示。

與隨機初始化不同,模型訓練期間的行為更難進行數學分析。該研究用 μP 解決,如圖 1 右側所示,該圖顯示了網絡激活擴展(activation scales)在模型寬度增加的最初幾個訓練步驟中的穩定性。

圖 1:在 PyTorch 的默認參數化中,左圖,在經過一次 step 訓練后,激活擴展的寬度會出現差異。但是在右圖的 μP 中,無論訓練 step 寬度如何,激活擴展都會發生一致的變化。

事實上,除了在整個訓練過程中保持激活擴展一致之外,μP 還確保不同且足夠寬的神經網絡在訓練過程中表現相似,以使它們收斂到一個理想的極限,該研究稱之為特征學習極限。

如圖所示,μP 是唯一在寬度上保持最佳學習率的參數化,在寬度為 213 - 8192 的模型中實現了最佳性能,并且對于給定的學習率,更寬的模型性能更好——即曲線不相交。

圖2左側,該研究在 CIFAR10 上以不同的學習率(沿 x 軸顯示)訓練不同寬度(對應于不同顏色和圖案的曲線)的多層感知器 (MLP),并沿 y 軸繪制訓練損失。右側,參數化的 2D 平面由以下插值形成:1)PyTorch 默認值和 μP(x 軸)之間的初始化擴展,以及 2)PyTorch 默認值和 μP(y 軸)之間的學習率擴展。在這個平面上,PyTorch 默認用 (0,0) 表示,μP 默認用 (1,1) 表示。

基于張量程序(Tensor Programs)的理論基礎,μTransfer 自動適用于高級架構,例如 Transformer 和 ResNet。此外,它還可以同時遷移各種超參數。

以 Transformer 為例,圖 3 展示了關鍵超參數如何在寬度上保持穩定。超參數可以包括學習率、學習率 schedule、初始化、參數乘數等,甚至可以單獨針對每個參數張量。該研究在最大寬度為 4096 的 Transformer 上驗證了這一點。

圖 3:在 μP 中參數化并在 WikiText-2 上訓練的不同寬度的 transformer。隨著模型寬度的增加,最優學習率、交叉熵溫度、初始化規模和學習率方案保持穩定。查看網絡的超參數有助于預測更寬網絡的最佳超參數。在右下角的圖中,該研究嘗試了如下學習率方案:(a) 線性衰減,(b) StepLR @ [5k, 8k],衰減因子為 0.1,(c) StepLR @ [4k, 7k],衰減因子為 0.3,(d) 余弦退火,(e) 常數,(f) 逆平方根衰減。

模型深度的實驗擴展

現代神經網絡擴展不止涉及寬度一個維度。該研究還探索了如何通過將 μP 與非寬度維度的簡單啟發式算法相結合,將其應用于現實的訓練場景。下圖 4 使用相同的 transformer 設置來顯示最佳學習率如何在合理的非寬度維度范圍內保持穩定。

圖 4:在 μP 中參數化并在 Wikitext-2 上訓練的不同大小的 transformer。如圖 3 所示,最優學習率不僅可以跨寬度遷移,還可在測試范圍內實驗性地跨其他擴展維度遷移,例如深度、批大小和序列長度。這意味著可以將理論上的跨寬度遷移與實驗驗證的跨其他擴展維度遷移相結合,以獲得能在小模型上間接調整超參數并遷移到大模型的 μTransfer。

除了學習率,其他超參數的情況如下圖所示:

測試 μTransfer

在驗證完單個超參數的遷移之后,研究者試圖將它們組合到更現實的場景中。下圖 5 對比了兩種情況,一種是 μTransfer 從一個小型 proxy 模型遷移調整過的超參數,另一種是直接調整大型目標模型。在這兩種情況下,調整都是通過隨機搜索完成的。

圖 5:μTransfer 大約將計算效率提高了一個數量級。

由于 proxy 模型即使很小也能有意義地預測最佳超參數(如圖 3、圖 4 所示),因此隨著該研究用數十億個參數訓練更大的目標模型,研究者預計性能差距會擴大。

未來方向:μP + GPT-3

在這項工作之前,模型越大,調優成本越高,預計調優效果就越差。研究者預計 μTransfer 將給最大的模型帶來最大的增益,因此該研究與 OpenAI 合作,在 GPT-3 上評估 μTransfer。

使用 μP 中的相對注意力對 GPT-3 的一個版本進行參數化后,該研究調整了一個具有 4000 萬個參數的小型 proxy 模型,然后按照 μTransfer 的方法將最佳超參數組合復制到 GPT-3 的 67 億參數變體中。在此調整階段使用的總計算量僅為 67 億模型預訓練使用計算量的 7%。如下圖 6 所示,這個使用 μTransfer 的模型優于 GPT-3 論文中相同大小的模型(絕對注意力),它的性能與 GPT-3 論文中參數數量翻倍的模型(絕對注意力)相當。

理論意義

μP 給出了一個擴展規則,該規則在訓練損失方面唯一地保留了跨不同寬度模型的最佳超參數組合。相反,其他擴展規則(如 PyTorch 中的默認初始化或 NTK 參數化),隨著網絡變得越來越寬,超參數空間中的最優值卻越來越遠。研究者認為:實際使用特征學習神經網絡時,為了獲得適用的見解,μP 的特征學習限制會比 NTK 限制更自然。因此,過參數化神經網絡應該在大型寬度設置中重現 μP 的特征學習限制。

過去幾年開發的張量程序 (TP) 理論使這項進展成為可能。TP 理論使研究人員能夠計算任何通用計算圖在其矩陣維數變大時的極限。TP 方法產生了基本的理論結果,例如神經網絡 - 高斯過程對應的架構普遍性和動態二分定理,并通過推導 μP 和特征學習限制形成了 μTransfer。研究者認為將 TP 理論擴展到深度、批大小等擴展維度是大型模型在寬度之外可靠擴展的關鍵。

研究者表示:基礎研究是對反復試錯的一種高成本效益補充,該研究將繼續推導出更具原則性的大規模機器學習方法。

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2022-05-12 15:17:09

GPU微軟神經網絡

2022-03-14 09:33:56

神經網絡模型人工智能

2021-01-19 16:34:30

開源技術 GPT-3

2023-04-07 09:53:02

量子AI

2021-03-23 15:21:00

人工智能機器學習技術

2021-01-22 11:18:58

Python機器學習超參數

2021-08-12 16:27:04

模型人工智能深度學習

2024-07-16 16:13:14

2020-09-02 10:10:37

AI 數據人工智能

2023-02-20 14:06:19

GPT-3AI

2020-11-09 07:34:49

JVM性能監控

2022-10-31 11:33:30

機器學習參數調優

2022-12-05 12:50:44

AIGPT-3程序員

2023-03-01 16:15:16

2022-03-24 10:35:38

人工智能模型代碼

2021-07-19 10:56:36

GPE-3OpenAI微軟

2023-06-08 11:41:40

芯片AI

2023-06-06 15:42:13

Optuna開源

2022-03-22 13:58:34

GPT-3AI功能

2023-02-14 08:00:00

人工智能GPT-3語言模型
點贊
收藏

51CTO技術棧公眾號

欧美亚一区二区三区| 亚洲无玛一区| 国产精品久久久久久久妇| 亚洲精品无吗| 欧美三级欧美一级| 在线观看成人免费| 头脑特工队2免费完整版在线观看| 亚洲欧美日韩国产一区二区| 日韩中文字幕在线精品| 日批视频免费看| 日本精品在线中文字幕| 一区二区激情视频| 日韩av一级大片| 亚洲第九十九页| 日本不卡一二三区黄网| 久久久久久久香蕉网| 国产一级淫片久久久片a级| 国产精品调教视频| 欧美日韩欧美一区二区| 97超碰在线人人| 麻豆传媒在线免费看| 久久综合九色综合97_久久久| 92看片淫黄大片欧美看国产片 | jlzzjlzz亚洲女人18| 亚洲一卡久久| 亚州欧美日韩中文视频| 午夜剧场免费在线观看| 国产aⅴ精品一区二区三区久久| 欧美一级高清片| 奇米影音第四色| 97成人资源| 黄色成人av在线| 国产内射老熟女aaaa| 成a人v在线播放| 久久久久久久久久看片| 极品校花啪啪激情久久| 亚洲伦理在线观看| 国产九色精品成人porny| 国产精品久久久久福利| www亚洲视频| 一区二区三区精品视频在线观看| 欧美国产精品人人做人人爱| 国产精品久久久免费看| 北条麻妃国产九九九精品小说| 亚洲精品视频在线播放| 国产真实乱人偷精品| 97久久综合区小说区图片区| 精品日产卡一卡二卡麻豆| 日本特黄在线观看| 久久国产精品免费一区二区三区| 欧美日本免费一区二区三区| 少妇网站在线观看| 精品176极品一区| 欧美日韩一区不卡| 在线观看免费av网址| 欧美激情三区| 欧美一区中文字幕| 欧美激情第四页| 免费看日产一区二区三区| 欧美一二三四在线| 无码av免费精品一区二区三区| 澳门精品久久国产| 亚洲国产另类久久精品| jizz欧美性20| 精品久久久久久久| 色妞欧美日韩在线| 免费高清在线观看电视| 欧美69wwwcom| 午夜精品蜜臀一区二区三区免费| 亚洲欧美在线观看视频| 香蕉久久国产| 国产精品中文久久久久久久| 一级做a爱片久久毛片| 国产精品影视网| 国产精品视频免费观看| 日韩一区av| 中文字幕乱码一区二区免费| 青青草免费在线视频观看| 91九色porn在线资源| 色综合色综合色综合色综合色综合| 女性隐私黄www网站视频| 国产91在线播放精品| 91精品久久久久久久99蜜桃| 日本一区二区免费视频| 久久99国产精一区二区三区| 日韩在线播放一区| 久久精品久久精品久久| 久久综合图片| 亚洲综合视频1区| 日韩在线无毛| 亚洲免费av网站| 黄色片久久久久| 国产高清日韩| 亚洲精选一区二区| 国产综合精品久久久久成人av| 一区二区三区四区在线观看国产日韩 | 中国黄色片视频| 九色成人国产蝌蚪91| 久久久国产视频| 亚洲欧美在线观看视频| 理论电影国产精品| 国内精品视频在线播放| a√资源在线| 香蕉影视欧美成人| 99sesese| 亚洲精品中文字幕99999| 久久久国产精品一区| 人人爽人人爽人人片av| 国产成人免费视频| 亚洲韩国在线| 日本在线播放一二三区| 91精品国产综合久久福利| 免费观看av网站| 国产真实久久| 成人精品一区二区三区电影免费| 涩涩视频在线观看免费| 亚洲在线视频免费观看| 午夜精品免费看| 免费av一区二区三区四区| 欧美高清无遮挡| 97精品人妻一区二区三区在线| 久久精品视频网| 男女超爽视频免费播放| 麻豆精品国产| 久久精品视频在线播放| 亚洲中文无码av在线| 91女人视频在线观看| 2019日韩中文字幕mv| 国产精品一区二区三区四区在线观看 | 丰满饥渴老女人hd| 99视频精品全国免费| 国产精品99久久99久久久二8| 日本黄色一区二区三区| 一区二区三区免费| 亚洲一区二区三区四区精品| 日韩欧美字幕| 国产精品亚洲网站| 成人在线免费电影| 91九色最新地址| 欧美多人猛交狂配| 久久综合导航| 日本不卡一二三区| 日韩和的一区二在线| 亚洲人午夜精品| 国产成人无码av| 久久久777精品电影网影网| 国产成人无码精品久久久性色| 粉嫩久久久久久久极品| 久久久久五月天| 亚洲a视频在线观看| 一区二区三区久久久| avtt中文字幕| 在线亚洲观看| 欧美综合77777色婷婷| 成人勉费视频| 尤物九九久久国产精品的特点 | 久久精品中文字幕一区二区三区 | 亚洲国产美女| 国产一区再线| 三上悠亚国产精品一区二区三区| 亚洲欧美日韩国产中文| 成人a v视频| 欧美国产欧美综合| 亚洲a级黄色片| 亚洲欧美在线专区| 春色成人在线视频| 日韩伦理福利| 亚洲精品色婷婷福利天堂| 日本熟妇一区二区三区| 中文字幕永久在线不卡| 亚洲熟女乱综合一区二区| 在线精品一区二区| 日本一区二区三区免费看| 欧美高清免费| 性色av一区二区三区免费| 免费在线视频一级不卡| 欧美美女网站色| 久久免费视频99| 久久久久久久久久久99999| 中文字幕第88页| 国产一在线精品一区在线观看| 九九99久久| 成人综合网站| 国产最新精品视频| 成年午夜在线| 亚洲第一精品福利| 懂色av蜜臀av粉嫩av喷吹| 一卡二卡三卡日韩欧美| 9.1成人看片免费版| 国产一区 二区 三区一级| 国产美女主播在线播放 | 99国产精品久久久久久久久久久| 国产av人人夜夜澡人人爽| 综合一区二区三区| 欧美一区二区三区成人久久片| 国产一区二区三区| 亲爱的老师9免费观看全集电视剧| 免费大片黄在线| 精品亚洲一区二区三区在线观看| 91精品国产乱码久久久| 欧美日韩在线视频一区| 女同久久另类69精品国产| 99麻豆久久久国产精品免费| 不用播放器的免费av| 亚洲综合三区| 国产91沈先生在线播放| 日韩系列欧美系列| 欧美大陆一区二区| 亚洲欧美日本国产| 国产日韩中文字幕在线| 一区二区三区短视频| 欧美片一区二区三区| 高清中文字幕一区二区三区| 亚洲国产精品久久久久| 国产精品久久综合青草亚洲AV| 色综合婷婷久久| 国产亚洲第一页| 亚洲人成网站精品片在线观看| 日本黄色网址大全| 成人福利视频在线看| 天天操精品视频| 卡一卡二国产精品 | 中文字幕一区二区三区手机版| 国产精品国模大尺度视频| 国产精品扒开腿做爽爽| 成人av手机在线观看| 妖精视频在线观看| 精品亚洲免费视频| 亚洲精品视频导航| 久久久夜夜夜| 欧美日韩亚洲一| 中文在线一区| 日韩欧美亚洲天堂| 亚洲国产高清视频| 男人添女人荫蒂免费视频| 欧美日韩国产欧| 青青草综合在线| 亚洲欧美亚洲| 欧美做暖暖视频| 欧美三级第一页| 97碰在线视频| 在线看片日韩| 久久黄色片视频| 国产精品亚洲欧美| 国产免费成人在线| 日韩精品乱码av一区二区| 虎白女粉嫩尤物福利视频| 麻豆精品网站| 天堂av在线网站| 久久精品国产99国产| 国产欧美激情视频| 国产激情一区二区三区| 女同性αv亚洲女同志| 成人网在线免费视频| 久草视频福利在线| 91色综合久久久久婷婷| 日本高清www| 国产精品国产三级国产| 三级影片在线看| 亚洲高清免费在线| www.国产色| 色av一区二区| 国产又黄又猛又爽| 精品国产精品一区二区夜夜嗨| 秋霞av鲁丝片一区二区| 日韩大陆欧美高清视频区| 国产在线观看免费| 久久精品国产亚洲精品| 日本色护士高潮视频在线观看| 91国产美女在线观看| 国产精品久久久久av电视剧| 国产欧美日韩中文字幕| 97一区二区国产好的精华液| 精品国产乱码久久久久久丨区2区| 国产一区二区三区电影在线观看 | 日本女优在线视频一区二区| 网站一区二区三区| 国产成人日日夜夜| 人妻精品久久久久中文字幕| 中文字幕五月欧美| 国产亚洲小视频| 在线观看亚洲一区| 亚洲高清视频网站| 亚洲色图18p| 色婷婷在线播放| 国产精品成人在线| 岛国精品一区| 亚洲精品国产一区| 在线视频观看日韩| 一起操在线视频| 91原创在线视频| 日韩激情小视频| 欧美性生活大片免费观看网址| 91 中文字幕| 精品亚洲一区二区三区在线播放| 菠萝菠萝蜜在线观看| 欧美专区中文字幕| 日韩一区二区三区精品| 人偷久久久久久久偷女厕| 红桃视频亚洲| 男人的天堂最新网址| 91网站视频在线观看| 波多野结衣亚洲一区二区| 色婷婷亚洲一区二区三区| 亚洲av无码一区二区三区dv| 中文字幕欧美在线| 色吧亚洲日本| av色综合网| 日韩欧美视频在线播放| 久久精品.com| 成人午夜av在线| 久草视频免费在线播放| 精品视频1区2区3区| 三区在线观看| 久久久久久综合网天天| 成人在线啊v| 亚洲欧洲精品在线| 日韩主播视频在线| 法国伦理少妇愉情| 天天射综合影视| 日本黄视频在线观看| 欧美大片免费看| 九九99久久精品在免费线bt| 中文字幕剧情在线观看一区| 视频在线在亚洲| 3d动漫精品啪啪一区二区下载| 亚洲国产cao| 亚洲第一黄色片| 欧美另类极品videosbestfree| 欧美成a人片免费观看久久五月天| 欧美在线视频二区| 欧美亚洲自偷自偷| a级在线观看视频| 红桃av永久久久| 无码精品一区二区三区在线| 久久免费福利视频| 国产 日韩 欧美 综合 一区| 4444亚洲人成无码网在线观看| 国产在线播精品第三| 三级黄色在线观看| 欧美精品自拍偷拍动漫精品| 成年在线电影| 91精品久久久久久| 伊人情人综合网| 女教师高潮黄又色视频| 一区二区三区欧美激情| 理论片中文字幕| 午夜精品福利在线观看| 久久精品国产亚洲blacked| 国产伦精品一区二区三区四区视频_| 成人一区在线看| 日韩久久久久久久久| 日韩成人性视频| 欧美xxxx做受欧美护士| 亚洲高清视频在线观看| 久久国产剧场电影| 91嫩草|国产丨精品入口| 欧美一级午夜免费电影| 久久大胆人体| 精品久久久久久一区| 久久高清免费观看| 快灬快灬一下爽蜜桃在线观看| 欧美日韩精品一二三区| 99视频免费在线观看| 国产精品毛片一区视频| 免费永久网站黄欧美| 国产农村妇女精品一区| 欧美一级在线免费| √8天堂资源地址中文在线| 欧美精品一区二区三区四区五区 | av网页在线| 亚洲在线观看视频| 亚洲高清毛片| 欧洲美熟女乱又伦| 日韩欧美在线观看一区二区三区| 波多野结衣乳巨码无在线观看| 欧美连裤袜在线视频| 精品一区二区三区在线视频| 在线看成人av| 中文字幕日韩有码| 视频一区在线| 黄色三级视频片| 亚洲国产综合91精品麻豆| 巨骚激情综合| 亚洲www视频| 老鸭窝91久久精品色噜噜导演| 午夜国产福利视频| 欧美精品一区二区久久婷婷| 成人在线爆射| 香港三级日本三级a视频| 久久久久久一二三区| 国产成人三级在线播放| 国产97人人超碰caoprom| 欧美精品成人| 人妻熟人中文字幕一区二区| 欧美成人一区二区| 久久精品xxxxx| 国产欧美在线一区| 亚洲精品高清视频在线观看| 福利片在线看|