精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦

發布于 2024-5-24 13:01
瀏覽
0收藏

在 AI 領域,擴展定律(Scaling laws)是理解 LM 擴展趨勢的強大工具,其為廣大研究者提供了一個準則,該定律在理解語言模型的性能如何隨規模變化提供了一個重要指導。


但不幸的是,擴展分析在許多基準測試和后訓練研究中并不常見,因為大多數研究人員沒有計算資源來從頭開始構建擴展法則,并且開放模型的訓練尺度太少,無法進行可靠的擴展預測。


來自斯坦福大學、多倫多大學等機構的研究者提出了一種替代觀察法:可觀察的擴展定律(Observational Scaling Laws),其將語言模型 (LM) 的功能與跨多個模型系列的下游性能聯系起來,而不是像標準計算擴展規律那樣僅在單個系列內。


該方法繞過了模型訓練,而是從基于大約 80 個公開可用的模型上建立擴展定律。但這又引出了另一個問題,從多個模型族構建單一擴展定律面臨巨大的挑戰,原因在于不同模型之間的訓練計算效率和能力存在很大差異。


盡管如此,該研究表明,這些變化與一個簡單的、廣義的擴展定律是一致的,在這個定律中,語言模型性能是低維能力空間(low-dimensional capability space)的函數,而整個模型系列僅在將訓練計算轉換為能力的效率上有所不同。


使用上述方法,該研究展示了許多其他類型的擴展研究具有驚人的可預測性,他們發現:一些涌現現象遵循平滑的 sigmoidal 行為,并且可以從小模型中預測;像 GPT-4 這樣的智能體性能可以從更簡單的非智能體基準中精確預測。此外,該研究還展示了如何預測后訓練干預措施(如思維鏈)對模型的影響。 


研究表明,即使僅使用小型 sub-GPT-3 模型進行擬合,可觀察的擴展定律也能準確預測復雜現象,例如涌現能力、智能體性能和后訓練方法的擴展(例如思維鏈)。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


  • 論文地址:https://arxiv.org/pdf/2405.10938
  • 論文標題:Observational Scaling Laws and the Predictability of Language Model Performance


論文作者共有三位,其中 Yangjun Ruan 為華人作者 ,他本科畢業于浙江大學。


這篇論文也得到了思維鏈提出者 Jason Wei 的轉發評論,Jason Wei 表示,他非常喜歡這項研究。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


論文介紹


該研究觀察到目前存在數百個開放模型,這些模型擁有不同的規模和能力。不過研究者不能直接使用這些模型來計算擴展定律(因為模型族之間的訓練計算效率差異很大),但研究者希望存在一個適用于模型族的更通用的擴展定律。


特別是,本文假設 LM 的下游性能是低維能力空間(例如自然語言理解、推理和代碼生成)函數,模型族的變化僅僅在于它們將訓練計算轉換為這些能力的效率。如果這種關系成立,則意味著從低維能力到跨模型族的下游能力存在對數線性關系(這將允許研究者利用現有模型建立擴展定律)(圖 1)。該研究使用近 80 個公開可用的 LM 獲得了低成本、高分辨率的擴展預測 (右)。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


通過對標準的 LM 基準分析(例如,Open LLM Leaderboard ),研究者發現了一些這樣的能力度量, 這些度量在模型家族內部與計算量之間存在擴展定律關系(R^2 > 0.9)(見下圖 3),并且在不同模型家族與下游指標上也存在這種關系。本文將這種擴展關系稱為可觀察的擴展定律。 


最后,該研究表明使用可觀察的擴展定律成本低且簡單,因為有一些系列模型足以復制該研究的許多核心發現。通過這種方法,該研究發現只需評估 10-20 個模型就可以輕松地對基準和后訓練干預進行擴展預測。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


涌現能力


關于 LM 是否在某些計算閾值下具有不連續出現的「涌現」能力,以及這些能力是否可以使用小模型進行預測,一直存在著激烈的爭論。可觀察的擴展定律表明,其中一些現象遵循平滑的 S 形曲線,并且可以使用小型 sub Llama-2 7B 模型進行準確預測。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


智能體能力


該研究表明,正如 AgentBench 和 AgentBoard 所測量的,LM 作為智能體的更高級、更復雜的能力可以使用可觀察的擴展定律來預測。通過可觀察的擴展定律,該研究僅使用較弱的模型(sub GPT-3.5)就能精確預測 GPT-4 的性能,并將編程能力確定為驅動智能體性能的因素。


后訓練方法擴展


該研究表明,即使將擴展定律擬合到較弱的模型(sub Llama-2 7B)上,擴展定律也可以可靠地預測后訓練方法的收益,例如思維鏈(Chain-of-Thought)、自洽性(Self-Consistency)等等。


總的來說,該研究的貢獻是提出可觀察的擴展定律,利用了計算、簡單能力度量和復雜下游指標之間可預測的對數線性關系。


驗證可觀察的擴展定律


研究者通過實驗驗證了這些擴展定律的有用性。此外,在論文發布后,研究者還預注冊了對未來模型的預測,以測試擴展定律是否對當前的模型過擬合。關于實現過程和收集數據的相關代碼已在 GitHub 上放出:


GitHub 地址:https://github.com/ryoungj/ObsScaling


涌現能力的可預測性


下圖 4 展示了使用 PC(principal capability)度量的預測結果,以及基于訓練 FLOPs 來預測性能的基線結果。可以發現,即使僅僅使用性能不佳的模型,也可以使用本文的 PC 度量來準確預測這些能力。


相反,使用訓練 FLOPs 會導致測試集上的外推效果和訓練集上的擬合效果明顯更差,正如更高的 MSE 值所示。這些差異可能是由不同模型系列的訓練 FLOPs 導致的。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


智能體能力可預測性


下圖 5 展示了使用 PC 度量后,可觀察的擴展定律的預測結果。可以發現,在兩個智能體基準上,使用 PC 度量的留出模型(GPT-4 或 Claude-2)的性能可以從更弱性能(10% 以上的差距)的模型中準確地預測出。


這表明 LMs 的更復雜智能體能力與它們的基礎模型能力息息相關,并能夠基于后者進行預測。這也說明了隨著基干 LMs 持續擴展規模,基于 LM 的智能體能力具有良好的擴展特性。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


后訓練技術的影響


下圖 6a 展示了使用可觀察的擴展定律,CoT 和 SC(Self-Consistency,自洽性)的擴展預測結果。可以發現,使用 CoT 和 CoT+SC 但不使用(Naive)后訓練技術的更強、規模更大模型的性能可以從更弱、更小計算規模(比如模型大小和訓練 FLOPs)的模型中準確預測出。


值得注意的是,兩種技術之間的擴展趨勢不同,其中與使用 CoT 的自洽性相比,CoT 表現出更明顯的擴展趨勢。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


更多技術細節請參閱原論文。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/D8yx5Ma38TXjV3Yepa1_Sg??

收藏
回復
舉報
回復
相關推薦
成人亚洲欧美| 香蕉视频黄色片| 中文字幕一区二区三区欧美日韩| 欧美一级黄色录像| 少妇大叫太大太粗太爽了a片小说| 国产小视频免费观看| 翔田千里一区二区| 啊v视频在线一区二区三区| 9191在线视频| 最新日韩三级| 一区二区三区日韩欧美| 蜜桃麻豆www久久国产精品| 一级片aaaa| 在线亚洲观看| 久久天堂av综合合色| 中国极品少妇videossexhd| 日韩中文视频| 亚洲成人激情自拍| 中文字幕一区二区中文字幕| 色wwwwww| 国内国产精品久久| 日韩免费高清在线观看| 天天综合天天做| 九九精品在线| 精品国产乱码91久久久久久网站| 日韩av片网站| 天天综合av| 亚洲精品自拍动漫在线| 欧美精品免费观看二区| 99热这里只有精品3| 日韩综合在线视频| 国语自产精品视频在线看抢先版图片| gv天堂gv无码男同在线观看| 久久午夜影院| 日韩精品自拍偷拍| 手机在线成人免费视频| 中文字幕资源网在线观看免费 | 精品欧美日韩在线| 国产乱淫av免费| 日韩二区三区在线观看| 久久乐国产精品| 中文字幕电影av| 欧美日韩性在线观看| 日韩国产欧美精品一区二区三区| 亚洲AV无码久久精品国产一区| 日本在线中文字幕一区二区三区| 亚洲午夜久久久久中文字幕久| 一级做a爰片久久| 国产视频第一区| 91视频com| 精品一区2区三区| 蜜桃视频在线观看www| 国内精品视频一区二区三区八戒| 国产精品自在线| 无码人妻丰满熟妇奶水区码| 日韩午夜黄色| 97超级碰在线看视频免费在线看| 精品无码人妻一区二区三| 亚洲综合专区| 九九热精品在线| 永久久久久久久| **女人18毛片一区二区| 日韩综合中文字幕| 免费在线观看黄色小视频| 欧美偷拍自拍| www国产精品视频| 午夜激情福利网| 欧美激情91| 久久免费观看视频| 国产欧美一区二区三区在线看蜜臂| 亚洲视频大全| 国产suv精品一区二区三区88区| 少妇高潮av久久久久久| 日本不卡视频在线| 成人有码视频在线播放| 国产按摩一区二区三区| 成人美女视频在线看| 精品国产一区二区三区久久久久久 | 在线国产91| 亚洲色图视频网站| 国产高清www| 国产99在线| 日本乱人伦aⅴ精品| 91香蕉视频导航| 日本免费在线一区| 精品日本一线二线三线不卡| 成人手机在线免费视频| 你懂的一区二区三区| www日韩欧美| 久久影院一区二区| 久久激情一区| 91精品视频专区| 色窝窝无码一区二区三区| 国产午夜精品福利| 国产一二三四区在线观看| h片视频在线观看| 日本精品视频一区二区三区| 制服丝袜中文字幕第一页| av成人资源| 一区二区三区www| 1024手机在线视频| 免费日韩精品中文字幕视频在线| 国产美女久久久| 人妻偷人精品一区二区三区| 久久久不卡网国产精品一区| 视色,视色影院,视色影库,视色网| av漫画网站在线观看| 欧美日韩在线观看一区二区| 亚洲成a人片在线www| 成人高清av| 久久久久免费精品国产| 中文字字幕在线观看| 波多野结衣视频一区| 亚洲日本精品| av日韩亚洲| 欧美成人一区二区三区片免费| www.av欧美| 激情丁香综合| 91精品免费视频| 激情小视频在线| 亚洲一级片在线观看| 午夜久久久精品| 网红女主播少妇精品视频| 欧美成人午夜激情视频| 日本视频www色| 91麻豆6部合集magnet| 日本国产中文字幕| 99精品美女视频在线观看热舞| 亚洲男人天堂手机在线| 精品无码av在线| 国产精品1区2区3区在线观看| 日韩在线导航| xxxxx性欧美特大| 亚洲成人免费网站| 久热这里有精品| 精品一区二区三区免费| 青青草国产精品| 亚洲第一av| 亚洲国产精品99| 欧美黑人一级片| 久久国产精品无码网站| 日韩av在线电影观看| 色多多在线观看| 亚洲国产欧美在线成人app| 国产一二三四区| 精品午夜久久福利影院| 亚洲国产精品日韩| h1515四虎成人| 亚洲欧美日韩在线一区| 一级片中文字幕| 99久久国产综合精品色伊 | 黄网站在线免费| 欧美色倩网站大全免费| 一区二区黄色片| 久久久成人网| 日本成人黄色| 黄色精品视频| 自拍偷拍免费精品| 怡红院男人天堂| 国产精品美女久久久久久久久久久 | 国产稀缺精品盗摄盗拍| 国产一区二区在线免费观看| 中文字幕中文字幕在线中心一区 | 欧美亚洲高清一区二区三区不卡| 国产精品无码永久免费不卡| 欧美亚洲免费| 日韩av在线一区二区三区| jizzjizz少妇亚洲水多| www.日韩视频| 亚洲精品中文字幕成人片| 亚洲一级二级三级在线免费观看| 波多野结衣加勒比| 西西裸体人体做爰大胆久久久| 久久久久成人精品免费播放动漫| 日本综合字幕| 俺去了亚洲欧美日韩| 国产免费不卡av| 亚洲国产精品久久一线不卡| 午夜av免费看| 免费欧美日韩国产三级电影| 欧美性受xxxx黑人猛交88| 综合久久成人| 26uuu日韩精品一区二区| 九一国产在线| 91精品国产一区二区三区蜜臀| 九九九免费视频| 91亚洲永久精品| 无需播放器的av| 欧美黄色免费| 欧美亚洲另类久久综合| 亚洲人成网站在线在线观看| 欧美国产日本高清在线| 精品成人一区二区三区免费视频| 制服视频三区第一页精品| 国产一级一片免费播放| 国产日韩视频一区二区三区| 免费黄频在线观看| 一区二区日韩免费看| 亚洲高清乱码| 狠狠一区二区三区| 国产免费一区二区三区在线能观看| 污视频网站免费在线观看| 亚洲精品资源在线| 国产高清在线免费| 日本久久一区二区三区| 久草视频免费在线播放| 国产亲近乱来精品视频| 扒开伸进免费视频| 蜜桃av噜噜一区二区三区小说| 野外做受又硬又粗又大视频√| 日韩精品不卡一区二区| 国产伦精品一区二区三区视频孕妇 | 人妻精品久久久久中文| 国产suv一区二区三区88区| 色诱视频在线观看| 极品中文字幕一区| 大桥未久一区二区| 欧美精品乱码| 好看的日韩精品| 老司机亚洲精品一区二区| 国产成人精品在线| 国产色播av在线| 欧美xxxx做受欧美.88| 幼a在线观看| 亚洲精品一区二区在线| 免费观看a视频| 日韩一本二本av| 一级日韩一级欧美| 在线观看视频91| 在线精品免费视| 午夜亚洲福利老司机| 丁香花五月激情| 中文字幕亚洲一区二区av在线| 人妻少妇精品视频一区二区三区| 国产成人精品一区二区三区网站观看| 国产又大又黄又粗又爽| 久久福利影视| 欧美 国产 综合| 99精品福利视频| 日本免费a视频| 中文字幕亚洲综合久久五月天色无吗'' | 欧美在线一区二区视频| 国产桃色电影在线播放| 久久精品人人做人人爽| 日本免费中文字幕在线| 中文字幕日韩欧美精品在线观看| 你懂的在线观看| 亚洲毛片在线看| 天堂成人在线| 亚洲精品成人久久电影| 无码国产精品一区二区色情男同| 精品欧美一区二区在线观看| 黄色片网站免费在线观看| 日韩精品一区二区三区中文不卡| 国产丰满美女做爰| 欧美xingq一区二区| www.黄色av| 精品嫩草影院久久| 天堂中文在线资源| 亚洲精品视频网上网址在线观看 | 欧美激情亚洲自拍| 在线免费观看污| 欧美激情乱人伦| а√天堂中文在线资源8| 91精品国产99| 一区二区乱码| 国产成人精品一区二区三区| 福利视频一区| 91天堂在线视频| 中文字幕久久精品一区二区| 国产精品一区免费观看| 日韩成人av在线资源| 女同一区二区| 久久综合国产| 国产精品第157页| 国产精品高清亚洲| 日韩在线第三页| 久久精品日韩欧美| 我要看一级黄色大片| 精品在线亚洲视频| 亚洲精品久久久久久| 成人av资源网站| 一区二区精品免费| 亚洲欧美日韩人成在线播放| 国产网址在线观看| 日韩欧美999| 在线观看免费观看在线| 日韩三级av在线播放| 蜜桃视频久久一区免费观看入口| 亚洲乱码国产乱码精品精天堂| 午夜在线观看视频| 久久99国产精品久久久久久久久| 狠狠操一区二区三区| 国产精品久久久久77777| 国产精品一区免费在线| 久久久久欧美| 婷婷久久国产对白刺激五月99| 国产二区视频在线| 麻豆精品国产91久久久久久| 亚洲欧美高清在线| 国产欧美一区二区精品久导航 | 亚洲欧美另类久久久精品| 国产精品美女毛片真酒店| 欧美自拍偷拍午夜视频| www日本视频| 一本色道久久88亚洲综合88| 97caopor国产在线视频| 国产成人精品视频在线| 伊色综合久久之综合久久| 日韩久久久久久久久久久久久| 欧美另类亚洲| 999在线观看| 26uuu亚洲综合色欧美| 青草影院在线观看| 在线影院国内精品| 欧洲成人一区二区三区| 中文综合在线观看| 不卡av播放| 超碰在线观看97| 99久久.com| 已婚少妇美妙人妻系列| 99久久久国产精品| 黄色a级片在线观看| 在线观看亚洲一区| 欧美男男同志| 国a精品视频大全| 日韩视频在线直播| 自拍视频一区二区三区| 久久综合狠狠| 中文字幕一区二区久久人妻网站 | 成人免费视频国产免费| 精品剧情v国产在线观看在线| 午夜小视频在线| 国产精品美女久久| 欧美男同视频网| 国产黄色一级网站| www.av亚洲| 精品一区二区三区四| 日韩一区二区三免费高清| 日本高清中文字幕在线| 国产精品入口福利| 国产一区二区三区电影在线观看| 国产99久久九九精品无码| 成人动漫视频在线| 欧美爱爱小视频| 欧美一区二区成人6969| 九七久久人人| 92看片淫黄大片看国产片| 国产精品久久久久久麻豆一区软件| 青青青在线视频免费观看| 国产人伦精品一区二区| 免费视频网站在线观看入口| 国产亚洲欧美日韩一区二区| 朝桐光一区二区| 午夜欧美性电影| 久久精品av麻豆的观看方式| 手机av在线不卡| 欧美日韩国产在线播放网站| 午夜在线播放| 亚洲最大的av网站| 欧美日韩国产精品一区二区亚洲| 在线免费看v片| 亚洲图片自拍偷拍| 少妇av在线播放| 欧美一级高清免费播放| 蜜桃精品wwwmitaows| 国内自拍视频一区| 国产精品福利一区| 国产情侣av在线| 欧美激情精品久久久久久蜜臀| 国产精品qvod| 亚洲国产精品久久久久爰色欲| 久久免费电影网| 在线观看中文字幕2021| 久久成人在线视频| 国产成人高清精品免费5388| 69堂免费视频| 中文字幕av不卡| 国产三级三级在线观看| 国内精久久久久久久久久人| 亚洲a级精品| 亚洲xxxx2d动漫1| 亚洲精品国产一区二区精华液| 免费激情视频网站| 热草久综合在线| 99久久.com| 欧美无人区码suv| 精品视频在线免费| 福利写真视频网站在线| 欧美第一黄网| 国产在线国偷精品免费看| 日本熟伦人妇xxxx| 一区二区三区在线播放欧美| 精品国产亚洲一区二区三区在线| 霍思燕三级露全乳照| 中文字幕成人av| 亚洲黄色在线播放| 国产精品扒开腿做爽爽爽视频| 在线电影一区二区| 色无极影院亚洲|