精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

估值840億AI實驗室再放大招,他們要給大模型戴上「緊箍咒」

人工智能 新聞
在大模型訓練時,如何管理權重、避免數值爆炸與丟失?Thinking Machines Lab 的新研究「模塊流形」提出了一種新范式,它將傳統「救火式」的數值修正,轉變為「預防式」的約束優化,為更好地訓練大模型提供了全新思路。

剛剛,OpenAI前CTO Mira Murati創辦的Thinking Machines Lab再次發布成果!

這是他們繼《克服LLM推理中的不確定性》(Defeating Nondeterminism in LLM Inference)之后,第二篇研究文章——《模塊流形》(Modular Manifolds)。

博客地址:https://thinkingmachines.ai/blog/modular-manifolds/

訓練大型神經網絡如同「走鋼絲」,必須小心翼翼地維持其內部「健康」,防止權重、激活值或梯度這些關鍵張量變得過大或過小,以免引發數值溢出等一系列問題。

其中一個重要的思路,是為大模型提供一套統一的量級管理。

首先是穩住基本盤。

使用Layer Norm技術把每層的輸出拉回合適范圍,對激活向量進行歸一化(normalization)這也是目前一種普遍的做法。

對梯度更新進行歸一化也很常見,例如Muon優化器對更新進行譜歸一化處理,使每一步更新的幅度可控。

再進一步,是直接「管住」權重本體。

歸一化權重矩陣是一個值得嘗試的方向。

文中提出了一種重新思考優化算法提供了新視角:將權重張量約束在某個子流形(submanifold)上,以便與這些流形約束協同設計優化算法。

這好比把「救火」變「預防」:

一開始就把參數放在健康區間,讓訓練更穩、更具解釋性,從而使大模型可以更穩定、高效地訓練起來。

流形優化器的形態

我們知道,流形只是一個局部看起來很平坦的曲面。

如果放大到足夠多,它看起來就像是一個普通平面。

流形上某一點附近的局部平坦空間稱為「切空間」(tangent space)。

如圖1所示,三維球面或更高維度的超球面是一個流形,圖中以紅色部分表示其在某點的切平面。

為了讓權重能夠「待在」指定的流形里,一個簡單的方法是使用普通優化器,在每步更新后將權重投影回流形。

但問題是如果優化步驟偏離流形太多,再被強制投影回來,這會導致名義學習率不再對應參數在流形上的實際位移,從而削弱我們對「步長—效果」關系的直覺。

想在流形上認真設計訓練算法,必須先想清楚:在切空間里怎么度量「距離」?

一個解決思路是直接在切空間中進行優化。這樣,每一步都是沿著流形「表面」走,學習率能更好地對應「實際位移」。

常見的選擇是歐幾里得距離,但也可以選擇以其他方式測量距離,如圖2所示。

值得注意的是,距離度量方式的選擇會直接影響最優優化步驟的方向。

圖3中,粉色箭頭表示原始梯度——即損失函數對權重的偏導數(partial derivative)。

也就是說,我們不一定非要嚴格按照梯度方向移動。

為了用數學表達這個過程,我們可以把「在流形約束和特定距離度量下的最優更新方向」看作一個帶約束的優化問題,可以用一個搭配歐幾里得范數的超球面來舉例。

用g表示梯度, w表示超球面上的當前點, a表示更新方向, η表示學習率,我們需要解決的問題是:

再回到圖 1、2 和3所展示的可視化語言,這個公式的意思是:綠色箭頭(也就是a的最優解)必須同時滿足兩個條件:

一是它要落在紅色的切平面上,二是它必須在半徑為η的黃色圓圈上。

我們可以應用拉格朗日乘數法來求解。

其中λ和μ是拉格朗日乘子。

對這個拉格朗日函數對a求導并令其為零,然后結合兩個約束條件求解λ和μ,就可以得到最優更新方向。

簡單來說最優更新的做法是:先從梯度中減去與w同方向的徑向分量,即把梯度投影到切空間上,然后將結果歸一化,再乘以學習率。

這樣得到的更新方向就在切空間里了。

圖4中顯示這個微小的修正過程被稱為「回縮映射」(retraction map)。

完整的流形優化算法如下:

總結來說,一階流形優化器包含三個步驟:

  • 找到一個單位長度的切向量,在梯度方向上盡可能遠;
  • 用學習率乘以這個方向,然后從當前權重中減去;
  • 把更新后的權重通過回縮映射拉回流形上。

在執行這一流程時,我們需要決定選擇什么樣的流形來作為約束,此外是如何定義「長度」的度量方式。

根據這兩個選擇的不同,我們就能得到不同的優化算法,具體見下表。

流形Muon

Transformer中的典型權重矩陣W是一個「向量變換器」,即它將輸入向量x
轉換為輸出向量y=Wx。

我們希望設計一種流形約束和距離函數,使得該矩陣對輸入向量的作用合理:既不應導致輸出值過大或過小,也不應在更新權重時引起輸出向量劇烈變化或幾乎無變化。

一個思考矩陣如何作用于向量的好方法是使用奇異值分解(SVD),如圖 5 所示。

SVD以分解矩陣的方式顯示矩陣如何沿著不同的軸拉伸輸入向量。

我們希望矩陣的「拉伸效應」接近于1,因此選擇了一個所有奇異值均為1的矩陣流形。

這種矩陣流形在數學上被稱為Stiefel流形,在高矩陣( m≥n)的假設下,它可以等價地定義為以下集合:

要為Stiefel流形設計優化器,還需選擇一個合適的距離函數。

為限制權重更新對輸入向量的最大拉伸作用,譜范數(spectral norm),即矩陣最大奇異值的度量是一個合適的選項。

雖然它只約束了最大效應,但由于優化器會飽和這一上限,因此也能間接防止最小效應過小。

正是這一想法,促成了Muon優化器的提出。

這一想法與Stiefel流形約束結合后,就形成了「manifold Muon」問題

文中的一個關鍵發現是一個凸優化問題,可以通過標準方法——對偶上升法(dual ascent)來求解。

經過推導,對偶函數的梯度為:

通過一個小實驗,可以驗證算法的可行性,實驗設置與結果見圖6。

模塊流形

這里還有一個重要的問題:當我們將多個層組合起來構建完整的神經網絡時,會發生什么?

是否需要關注層與層之間的交互,并據此修改優化策略?

這需要一種可以將前文介紹的推導邏輯推廣到整個神經網絡的方法——模塊流形(modular manifolds)理論。

該理論的核心思想是:構建一種抽象機制,用來指導如何在各層之間合理分配學習率。

在本質上,在不同層之間分配學習率,或者對單個層進行縮放,都依賴于我們對網絡輸出對權重的Lipschitz敏感性的理解。

我們在搭建網絡的過程中會追蹤這種敏感性,而流形約束有助于我們更加精準地把握它。

責任編輯:張燕妮 來源: 新智元
相關推薦

2017-03-07 16:09:14

IBM量子計算互聯網

2024-12-19 09:00:00

模型數學訓練

2019-05-22 11:50:46

5G運營商網絡

2019-05-21 14:15:07

美國5G運營商

2025-07-22 10:45:55

2021-08-04 09:48:05

數字化

2009-05-07 16:20:20

谷歌實驗室Gmail

2021-07-05 09:52:05

大數據大數據“殺熟”數據監管

2025-08-04 09:17:00

馬斯克AI視頻生成

2015-02-06 09:23:52

賽可達實驗室網絡安全

2011-05-25 17:51:40

2017-10-12 15:51:14

AI人工智能

2018-07-05 17:50:14

AI

2025-11-14 11:17:07

2010-01-18 15:29:23

IT教育

2022-07-01 12:42:53

VR新模型元宇宙

2016-03-21 12:56:26

2009-09-21 11:45:36

CCIE實驗室考試

2024-12-25 12:04:34

點贊
收藏

51CTO技術棧公眾號

欧美一级免费在线观看| 五月天亚洲精品| 国产手机视频精品| 最新av在线免费观看| 国产成人无码www免费视频播放| 日韩视频不卡| 在线视频欧美日韩| 久久无码专区国产精品s| 免费成人动漫| 亚洲乱码精品一二三四区日韩在线| 福利精品视频| 中文字幕乱码人妻二区三区| 欧美日韩久久| 国产一区二区三区在线观看网站 | 久久国产柳州莫菁门| 91成人app| 欧美性猛交xxxx| 成人午夜免费剧场| 69xxxx欧美| 成人永久看片免费视频天堂| 国产精品一二三视频| 亚洲一区欧美在线| 午夜精品影院| 日韩一区二区福利| 成年人网站免费看| 国产精品1luya在线播放| 欧美日本一区二区三区四区| 91猫先生在线| 午夜激情在线| 国产精品成人一区二区艾草| 欧美中文娱乐网| 亚洲精品一级片| 国产制服丝袜一区| 国产精品久久久久久久久久尿 | 久久久久久黄| 久久久在线视频| 国产性生活大片| 欧美精品一二| 亚洲男人天堂手机在线| 粉嫩av懂色av蜜臀av分享| 综合中文字幕| 日韩一区二区三区精品视频| www.亚洲高清| 91精品店在线| 欧美视频在线观看一区二区| 成人在线观看黄| 欧美电影免费观看| 欧美日韩一区二区在线播放| 伊人成色综合网| freexxx性亚洲精品| 亚洲国产精品一区二区久久 | 欧美精品在线一区| 婷婷在线免费观看| 97精品久久久午夜一区二区三区| 国产精品国模大尺度私拍| 国产91绿帽单男绿奴| 国产成人免费在线观看| 国产精品青青草| 免费观看毛片网站| 91视频国产观看| 蜜桃成人在线| 九色在线免费| 国产精品你懂的在线欣赏| 亚洲第一综合| 成人在线观看免费网站| 一区二区三区视频在线看| 免费看欧美一级片| h片精品在线观看| 欧美日韩亚洲视频| 91激情视频在线| 亚洲国产91视频| 欧美不卡一区二区三区| 大桥未久恸哭の女教师| 一区三区在线欧| 最近2019中文免费高清视频观看www99 | 国产精品稀缺呦系列在线| 91av久久久| 国产成人鲁色资源国产91色综| 国产高清自拍一区| 中文字幕日日夜夜| 国产xxx精品视频大全| 国产午夜精品在线| 国产精品影院在线| 一区二区三区在线观看国产| 日韩av高清在线看片| 欧美性片在线观看| 欧美一级理论性理论a| 国产精品久久久久久久av福利| julia中文字幕一区二区99在线| 日韩av在线免费观看一区| 超碰人人干人人| 欧美日韩免费观看一区=区三区| 欧美在线视频一区二区| 怡红院成永久免费人全部视频| 国产高清久久久| 欧美一区国产一区| 一区二区三区伦理| 色婷婷久久综合| 精品999日本| 亚洲欧洲日产国产综合网| 国产精品无码乱伦| а√天堂中文在线资源8| 欧洲生活片亚洲生活在线观看| 亚洲一级片网站| 久久精品国产福利| a级毛片免费观看在线| 韩国精品一区二区| 久久免费视频1| 国产又粗又黄视频| 久久精品人人| 国产一区欧美二区三区| 在线免费看黄色片| 一级黄色a毛片| 激情五月婷婷综合网| 国产精品久久久久影院日本| 亚洲欧美一二三区| 久久99久久99| 日本高清不卡一区二区三| 国内三级在线观看| 亚洲成a人v欧美综合天堂| 女人扒开屁股爽桶30分钟| 麻豆免费版在线观看| 欧美电影在线免费观看| 欧美人与性囗牲恔配| 伊人青青综合网| 国产精品av在线播放| 天堂中文在线资源| aa级大片欧美三级| 成人中心免费视频| 国产高清视频在线播放| 亚洲天堂精品视频| 黄色三级视频片| 黄色欧美在线| 欧美精品激情在线观看| 一级黄色录像大片| 91麻豆成人久久精品二区三区| 91看片淫黄大片91| 成人免费在线观看视频| 亚洲视频在线观看视频| 黄色一级片在线| 国产一本一道久久香蕉| 国产成人精品免费看在线播放| av在线播放一区| 一本一道久久a久久精品逆3p| 国产成人无码一区二区在线播放| av在线一区二区三区| 国产日韩av网站| 国产精品网址| 91国内免费在线视频| 少妇又色又爽又黄的视频| 亚洲成a人片综合在线| 国产免费无码一区二区| 狠狠干成人综合网| 国产伦一区二区三区色一情| 福利小视频在线| 亚洲精品国精品久久99热一| 色播视频在线播放| 2014亚洲片线观看视频免费| 99蜜桃臀久久久欧美精品网站| 国产欧美日韩免费观看| 国产999视频| fc2在线中文字幕| 欧美日本在线一区| 永久久久久久久| 成人永久免费视频| 精品无码一区二区三区在线| 日韩精品导航| 国产精品你懂得| 国产精品实拍| 亚洲精品第一页| 国产成人无码专区| 中文字幕日本不卡| 午夜性福利视频| 国产精品久久久免费| 日韩少妇中文字幕| 美国十次综合久久| 97欧美精品一区二区三区| 可以在线观看的av| 欧美巨大另类极品videosbest | 中文字幕在线观看日本| 欧美丰满高潮xxxx喷水动漫| 国产成年人免费视频| 久久精品一区四区| www,av在线| 夜夜夜久久久| 一区不卡视频| 美腿丝袜亚洲图片| 国产精品视频精品| 岛国毛片av在线| 一本色道久久88综合亚洲精品ⅰ| 国产黄色av片| 色系网站成人免费| 91嫩草|国产丨精品入口| 99精品视频一区二区| 午夜久久久精品| 亚洲区欧美区| 在线成人av电影| 网曝91综合精品门事件在线| 成人福利视频网| 2022成人影院| 欧美老少配视频| 国产三级视频在线播放线观看| 日韩欧美卡一卡二| 毛片在线免费播放| 五月婷婷久久综合| 亚洲不卡在线播放| 国产亚洲欧美日韩在线一区| 国产调教打屁股xxxx网站| 日本aⅴ亚洲精品中文乱码| 日韩伦理在线免费观看| 色喇叭免费久久综合网| 另类小说综合网| www.成人网| 91精品在线看| 日本综合视频| 69影院欧美专区视频| 在线观看wwwxxxx| xxx成人少妇69| jizz视频在线观看| 亚洲老头同性xxxxx| 男人天堂手机在线观看| 日韩网站在线看片你懂的| 一区二区美女视频| 欧美在线观看一区二区| 日韩av在线电影| 一区二区三区在线免费播放 | 毛片在线免费| 精品福利在线导航| 性一交一乱一乱一视频| 337p亚洲精品色噜噜| 中文字幕av影视| 色婷婷狠狠综合| 香蕉影院在线观看| 一本色道亚洲精品aⅴ| 影音先锋亚洲天堂| 天天操天天色综合| 日本高清www免费视频| 亚洲国产精品自拍| 激情五月色婷婷| 亚洲国产另类av| 奇米影视第四色777| 亚洲国产一区二区视频| 久久亚洲国产成人精品性色| 一区二区三区在线免费视频| 亚洲综合网在线| 亚洲影院理伦片| 国产精品6666| 天天色天天操综合| 91video| 欧美性生交xxxxxdddd| 97超碰人人干| 色综合网色综合| 天堂网免费视频| 在线观看91精品国产入口| 4438国产精品一区二区| 色久综合一二码| 中文字幕永久在线观看| 欧美日韩视频在线第一区| 男人搞女人网站| 免费观看成人毛片| 中文字幕不卡在线观看| 三年中国中文观看免费播放| 中文字幕免费一区| www.xxxx日本| 亚洲午夜久久久| 国产女同在线观看| 一区二区三区日韩欧美| 日本特黄一级片| 一本一本久久a久久精品综合麻豆| 日韩不卡高清视频| 欧美日本精品一区二区三区| 波多野结衣视频免费观看| 欧美精品在线视频| 欧美日韩综合在线观看| 欧美中文字幕亚洲一区二区va在线| 亚洲视屏在线观看| 欧美一卡在线观看| 天堂av2024| 在线成人中文字幕| 亚洲夜夜综合| 777国产偷窥盗摄精品视频| 香蕉成人影院| 国产一区二区三区在线播放免费观看| 头脑特工队2在线播放| 一区二区日韩精品| 高清全集视频免费在线| 97在线观看免费高清| 清纯唯美亚洲色图| 日韩在线视频二区| 伊人在我在线看导航| 国产99久久精品一区二区 夜夜躁日日躁| av亚洲一区| 成人动漫在线观看视频| 亚洲欧洲日韩综合二区| 久久www人成免费看片中文| 奇米四色中文综合久久| 高清久久一区| 成人免费福利视频| 最新亚洲国产| 久久久久无码国产精品一区| 国产精品88久久久久久| 国产黄色一级网站| 免费在线欧美黄色| 妺妺窝人体色www在线观看| 国产成人亚洲综合a∨猫咪| 99久久久无码国产精品衣服| 亚洲激情网站免费观看| 欧美卡一卡二卡三| 欧美制服丝袜第一页| 黄色av网址在线| 丝袜情趣国产精品| 黄色一级片在线观看| 欧美亚洲国产视频小说| 亚洲电影有码| 国产精品久久网| 美女毛片在线看| 97视频在线观看成人| 精品国产欧美| 亚洲欧美综合一区| 久久久国产精品一区二区中文| 青青青在线视频免费观看| 成人av免费网站| 国产精品久久久久久久久婷婷| 国产一区二区三区四区五区传媒| 无码粉嫩虎白一线天在线观看| 国产做a爰片久久毛片| 欧美福利第一页| 91电影在线观看| 欧美日韩视频精品二区| 97成人在线视频| 北条麻妃一区二区三区在线观看| 中文字幕一区二区三区四区五区人 | 成人做爰免费视频免费看| 亚洲精品二三区| 鲁大师私人影院在线观看| 欧美国产1区2区| 天堂网免费视频| 亚洲欧美国产精品va在线观看| h片在线观看视频免费免费| 99国产在线视频| 欧美日韩国内| 亚洲成人激情小说| 亚洲黄色小视频| 亚洲精品18在线观看| 欧美激情精品久久久久久免费印度| 日本精品视频| 日韩一级特黄毛片| 粉嫩高潮美女一区二区三区| 久久久久亚洲av无码专区| 精品国一区二区三区| 草草影院在线| 韩国一区二区三区美女美女秀| 亚洲日韩成人| 三上悠亚ssⅰn939无码播放| 色美美综合视频| 福利视频在线导航| 国产美女91呻吟求| 亚洲精品小说| 天堂va欧美va亚洲va老司机| 亚洲国产精品一区二区久久恐怖片 | 日韩精品在线电影| 日韩成人影音| 亚洲人成77777| 国产激情一区二区三区| 亚洲一区二区91| 亚洲欧美国产一本综合首页| 成人国产精品入口免费视频| 中文字幕一区二区三区四区五区六区 | 欧美日韩成人精品| 北条麻妃一区二区三区在线| 青青视频在线播放| 欧美激情综合五月色丁香| 一区二区视频网站| 欧美精品免费在线| 久久99偷拍| 无需播放器的av| 亚洲人123区| 天天干在线观看| 国产精品视频久| 欧美视频二区| 一区二区精品免费| 欧美一区日韩一区| 偷拍自拍在线看| 国产高潮呻吟久久久| 91在线视频在线| 97在线公开视频| 91精品国产高清| 外国成人免费视频| 在线免费播放av| 欧美日韩国产一区| 2020国产在线| 伊人色综合久久天天五月婷| 成人av在线播放网站| 一本一道人人妻人人妻αv| 欧美精品久久久久久久久| 久久93精品国产91久久综合| 操人视频免费看| 色94色欧美sute亚洲线路二| 日本资源在线| 亚洲国内在线|