精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

普林斯頓DeepMind用數學證明:LLM不是隨機鸚鵡!「規模越大能力越強」有理論根據

人工智能 新聞
普林斯頓大學和DeepMind的科學家用嚴謹的數學方法證明了大語言模型不是隨機鸚鵡,規模越大能力一定越大。

今天故事的主角是兩位科學家,Sanjeev Arora和Anirudh Goyal。

Arora來自普林斯頓大學,而Goyal則來自谷歌DeepMind。

他們湊到一起,只想探究一個問題。

那就是,LLM,究竟是只會嘰嘰喳喳學舌的隨機鸚鵡,還是真學會了什么,搖身一變成為了具有涌現能力的智能體?

AI先驅Hinton和吳恩達曾經也聊過這個問題,但彼時并沒有得出什么明確的結論。

不過Hinton表示,在這個問題的回答上如果我們不能達成共識,那么在AI會產生多大危害這個問題上也不可能達成共識。

而Arora和Goyal的觀點是,LLM并不是只會學舌的鸚鵡。具體來說,他們不認為LLM的輸出內容只是從海量的訓練數據中隨機組合而來的。

兩個人為此合寫了一篇論文。

論文地址:https://arxiv.org/abs/2307.15936

真相則是,經過大量訓練,LLM的規模變得越來越大,它們的相關能力會得到切實的提升,并開發出新的能力。

這可不是一般的排列組合能做到的。

大模型之「大」

眾所周知,LLM是一個龐大的人工神經網絡,連接著一個個「神經元」。

其實說的就是模型的參數。參數越多,LLM的規模越大。

咱們先了解一下訓練LLM的機制和環節。

訓練的過程會有這么個環節——給LLM提供一個單句,把最后一個詞隱藏掉,然后讓LLM根據概率來預測空缺的詞匯應該是誰。

假如LLM知道1000個單詞,那它就會搞出1000個概率。最后選一個概率最大的填上。

一開始,LLM可能選不準詞,算法就會給出一個損失值,即在某個高維的數學空間中,LLM給出的初始答案和原句正確答案之間的「距離」(distance),然后用這個值來對參數進行微調。

之后,還是同一個句子,LLM就能算出一個更正確的概率分布,上述損失值就會稍微降低一點。

如此這般,訓練數據中數以十億計的句子都跑一遍這個流程,等LLM的總體損失值降低到一個還不錯的程度為止。

同樣,測試LLM也會走這個流程,根據損失值得出測試的結果(當然,測試用的句子肯定不在訓練數據里,要不然不是作弊了嘛)。

訓完練,測完試,LLM在遇到全新的文本prompt時,就有極大可能生成最正確的那個詞了。一個詞出來,扔到prompt里,再生成下一個詞。

慢慢生成下去,一個看似連貫的回答就躍然紙上了。

然而在這個過程中,并沒有跡象表明,規模更大的LLM會在需要推理能力(reasoning)的提問上表現更好。

注意跟上思路,沒有跡象表明,意思是說沒有實證能指向這個結果,但是從表面上的事實來看,這個結論是對的。

也就是說,規模更大的LLM會在推理能力上表現的比小規模的模型好,雖然二者在訓練方式上沒有不同,只差在規模上。

Arora大惑不解,那這能力是從哪來的?

這也就是Arora和Goyal研究的起點了——試圖構建一個理論框架來分析這些新能力是如何出現的。

于是,他們把目光轉向了數學領域,瞄上了一個叫隨機圖的東西。簡單來說,這個名詞處于圖論和概率論兩個領域的交叉地帶。

在隨機圖中,任何兩個節點之間是否存在一條把它們連起來的邊,是隨機的,就好像拋硬幣一樣。

硬幣擲出正面,就有一條邊,概率為p。

p的值發生某些變化的時候,整個隨機圖的屬性就可能發生突然的轉變。比方說,p值超過某個特定閾值,有些孤立的節點(即和其它節點不存在連接的點),就會突然消失。

兩位科學家意識到,隨機圖的這個特點可能是模擬大語言模型的一種直觀方式。

雖說神經網絡的復雜程度難以言說,幾乎難以分析,但是隨機圖這個概念已經被數學家研究了相當長的一段時間,還開發出了各種工具來分析。

也許,通過隨機圖的相關理論,神經網絡的研究人員就可以試著理解并分析大語言模型的一些特征。

這里,兩位研究人員把目光專注在了二分圖上,圖里會包含兩種類型的節點。

在他們的模型中,一種類型的節點代表著文本片段。注意,這里的片段從篇幅上看最起碼得是個段落,甚至長達幾頁都有可能,而非單個的詞匯。

這類節點構成一條直線。

第二類節點,代表著理解上述給定文本所需要的的技能。比方說,對邏輯關系的理解,或是計算的能力,更具體點,還可能有理解諷刺的能力。

舉這幾個例子是為了講明白,這第二類節點所代表的能力多種多樣,沾的上邊的都算。

Arora表示,LLM如果能看出某段文本里含有反諷,可能對整體的理解都會出現較大變化。

不過,我們上面講到過,第二類節點所代表的能力,不代表LLM在訓練的過程中的目的是為了實現這些能力。換句話說,LLM在訓練的時候只訓練了對下一個可能出現的單詞的預測能力。

也就是說,第二類節點所代表的能力,是Arora和Goyal從結果的角度設計的,為的是更好的理解LLM所展現出來的能力。

設定講完了,兩類節點就要開始互相連接了,連接代表的是LLM為了讀懂某段文字需要哪些能力。可能一對一,可能一對多,也可能多對一。

還拿讀懂反諷舉例,這個技能點就會和所有包含反諷元素的文本建立聯系。

連接可沒那么簡單。要知道,OpenAI和DeepMind這種大公司,是不會公開訓練數據或者測試數據的。所以兩位研究人員不能依賴這些。

此外,他倆想搞明白的還是規模和行為、能力之間的關系。

自從2021年以來,研究LLMs和其他神經網絡性能的研究人員已經觀察到了一個普遍的特征。

他們注意到,隨著模型的增大,無論是在大小還是在訓練數據量上,它在測試數據上的損失(在訓練后對新文本的預測與正確答案之間的差異)以一種非常特定的方式減少。

這些觀察已被編碼為一個叫做神經縮放定律的方程。

圖片

因此,Arora和Goyal表示,他們的理論不依賴于任何單個LLM的情況、或者特定的一組訓練和測試數據,而是某種普適法則:通過縮放定律預測的損失。

而他們進一步研究的關鍵,就是神經縮放定律和上面介紹的二分圖之間的關系。

二分圖的借用

首先,研究人員假設存在一個對應LLM在測試數據上行為的二分圖。

為了利用好LLM在測試數據上的損失變化,他們設想了一種如下這種方式,來描繪LLM是如何習得技能的。

還是以能理解反諷這種技能為例——

這個概念由一個技能節點表示,因此研究人員查看這個技能節點連接到了哪些文本節點。

如果幾乎所有這些連接的文本節點都成功——意味著LLM對這個特定技能所代表的文本的預測非常準確——那么LLM在這個特定技能上是有能力的。

但如果超過一定比例的技能節點連接到失敗的文本節點,那么LLM在這個技能上就算失敗了。

這些二分圖與LLMs之間的連接使Arora和Goyal能夠利用隨機圖理論的工具來分析LLM的行為。

研究這些圖揭示了節點之間的某些關系。這些關系進而轉化為一種有邏輯,且可測試的方法,得以解釋大語言模型究竟怎么獲得一些意想不到的能力。

這里,Arora和Goyal首先解釋了一個關鍵行為——為什么較大的LLMs在個別技能上比相對較小的模型更加熟練。

他們從神經縮放定律預測的較低測試損失開始。

如果失敗的測試節點較少,那么說明失敗的測試節點與技能節點之間的連接也較少。因此,更多的技能節點與成功的測試節點相連接,就表明模型在技能方面的能力增強。

接下來,兩位研究人員又找到了一種解釋更大模型所獲得的能力的方法——隨著LLM的大小增加和測試損失減小,技能節點的隨機組合開始連接到個別文本節點。

這表明LLM也變得更擅長同時使用多個技能,并開始使用多個技能生成文本,即使這些確切的技能組合在訓練數據的任何文本中都沒有出現過。

比方說,一個LLM已經可以使用一種技能來生成文本了,那么如果我們把LLM的參數數量或訓練數據擴大一個數量級,它將同樣擅長生成需要兩種技能的文本。

以此類推,再擴大一個數量級,LLM現在就可以執行需要同時具備四種技能的任務了!而且,在各項能力上所具有的熟練程度也是相同的。

因此,更大的LLMs有更多將技能組合在一起的方式,從而導向LLM自身的性能得到大幅提升。

隨著LLM的擴大,它在訓練數據中遇到所有這些技能組合的可能性變得越來越小,直至0。

根據隨機圖理論的規則,每種組合都來自對可能技能的隨機抽樣。因此,如果圖中存在大約一千個基本的單個技能節點,并且假設我們想要組合四種技能,那么有大約1000的四次方——也就是足足一萬億種可能的組合方式。

也就是說,如果一個LLM真的能夠通過組合這1000種技能中的四種來執行這些任務,那么意味著該模型一定具備了泛化能力,更進一步說,這個模型很可能就不是一個隨機鸚鵡了。

但是Arora和Goyal想要超越理論,進一步來測試他們的觀點——LLMs在規模和訓練數據增加時,會更擅長組合更多的技能,因此在泛化方面表現得更好。

他們與團隊其他成員一起設計了一種稱為技能混合的方法,用于評估LLM使用多種技能生成文本的能力。

為了對LLM進行測試,研究團隊要求它生成關于隨機選擇的主題的三個句子,這些句子的生成首先展示了LLM隨機選擇的技能點。

比方說,他們要求GPT-4寫一篇有關劍術的文章,然后他們再要求該模型展示來自四個領域的技能:自我偏見、比喻、統計學和物理學嘗試的掌握。

GPT-4的輸出是這樣的:

在這場與鋼鐵的舞蹈中,我的勝利(用上了比喻)像物體會自由落體一樣確定(用上了物理學嘗試)。

而作為一名著名的決斗者,我天生靈活,就像大多數人所知曉的我一樣(用上了統計)。失敗?只可能是由于戰場偏向了敵人,不可能是由于我的不足(自我偏見)。

實際上的結果,正如數學所預測的那樣,GPT-4的性能遠遠超過了GPT-3.5。

Arora大膽猜想,會不會一年后,會有遠超GPT-4的模型出現呢?

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2012-08-02 16:18:10

普林斯頓結構哈佛結構架構

2025-02-14 10:23:00

LLM模型谷歌

2023-06-19 19:22:50

AI場景隨機數學

2023-05-22 15:17:02

谷歌AI

2011-04-22 10:14:34

無線網絡DHCPAndroid

2022-07-26 09:56:48

模型AI

2025-07-18 09:55:11

2023-05-27 23:43:28

GPUGPT-4算法

2025-02-12 12:04:54

2020-12-02 10:05:26

AI 數據人工智能

2025-02-13 12:23:28

2025-05-06 00:45:00

2023-09-12 14:45:18

2023-05-30 13:29:25

2021-11-09 09:52:57

神經網絡AI算法

2023-05-31 14:23:44

人工智能

2023-10-13 13:10:19

2023-06-19 09:36:16

AI矩陣

2025-07-18 07:07:00

人工智能AIAI模型

2024-05-20 15:19:25

訓練模型
點贊
收藏

51CTO技術棧公眾號

免费毛片在线播放免费| 美女久久久久久久久| 蜜桃视频网站在线| 国产99久久久精品| 91成品人片a无限观看| 极品粉嫩小仙女高潮喷水久久 | 高潮久久久久久久久久久久久久| 精品国产老师黑色丝袜高跟鞋| 欧美性xxxx69| 国产按摩一区二区三区| 久久久天天操| 欧美日本高清视频| 中文字幕黄色网址| 日本一道高清一区二区三区| 欧美亚洲国产一区二区三区va| 天天想你在线观看完整版电影免费| 色视频精品视频在线观看| 狠狠狠色丁香婷婷综合激情 | 波多野结衣三级在线| 色婷婷激情五月| 激情综合色综合久久| 日本久久久久久| 美女视频黄免费| 俺要去色综合狠狠| 日韩毛片中文字幕| 成人免费播放视频| 成人黄页网站视频| 日韩欧美在线观看视频| 日本aa在线观看| 美女写真理伦片在线看| 久久精品夜夜夜夜久久| 国产精品一区二区免费看| 91久久精品国产91性色69| 亚洲女人av| 久久免费精品视频| 欧美日韩免费一区二区| 国产一区二区三区四区二区| 亚洲第一区第二区| 国产毛片久久久久久| 日本一区免费网站| 一本大道久久a久久精品综合| 男人添女荫道口女人有什么感觉| 麻豆传媒在线完整视频| 中文一区二区在线观看| 日本午夜精品一区二区| 日韩a级作爱片一二三区免费观看| 成人午夜免费av| 91在线在线观看| 国产三级伦理片| 激情综合网最新| 91日韩在线视频| 一级黄色录像大片| 久久国产精品72免费观看| 国产成人小视频在线观看| 天天干在线播放| 性久久久久久| 国产精品av网站| 自拍偷拍18p| 奇米一区二区三区av| 国产精品视频网站| 中文字幕日本人妻久久久免费 | 亚洲美女一区| 91高清在线免费观看| av黄色在线看| 亚洲欧美日韩视频二区| 国产91热爆ts人妖在线| 欧美男人天堂网| 另类综合日韩欧美亚洲| 成人a视频在线观看| 国产人妖一区二区| 岛国精品在线播放| 久久av一区二区三区漫画| 神马亚洲视频| 国产精品午夜久久| 久久久久久久久久久久久国产| 在线你懂的视频| 欧美日韩激情小视频| 青青在线视频免费| 国模套图日韩精品一区二区| 欧美三级在线看| 日本黄色一级网站| 首页亚洲中字| 日韩中文字幕在线观看| 久久午夜鲁丝片午夜精品| 99香蕉国产精品偷在线观看| 国产不卡视频在线| 国产伦精品一区二区三区免.费 | 免费看污黄网站在线观看| 国产一区二区三区电影在线观看| 精品国产一区二区三区久久狼5月| 91麻豆免费视频网站| 在线免费高清一区二区三区| 国产www精品| 国产免费一区二区三区免费视频| 成人国产视频在线观看| 欧美一区二区在线| 国内精品久久久久久野外| 午夜精彩视频在线观看不卡| 伊人国产在线视频| 成人爽a毛片免费啪啪红桃视频| 亚洲免费精彩视频| 欧美成人精品欧美一| 久久久国产精品一区二区中文| 国产在线播放91| 日韩av资源站| 一区二区三区在线免费| 黄色片视频在线免费观看| 美女久久久久久| 日韩av在线不卡| 丰满少妇被猛烈进入一区二区| 国产精品久久久亚洲一区| 国产日韩欧美影视| 男同在线观看| 一区二区三区日韩在线观看| 亚洲五月天综合| 久9re热视频这里只有精品| 日韩专区在线播放| 丁香社区五月天| 不卡的av在线| 天天想你在线观看完整版电影免费| 日韩视频网站在线观看| 亚洲第一av在线| 中国毛片直接看| 免费av成人在线| 日本在线观看一区二区| 91美女主播在线视频| 欧美一区二区三区男人的天堂| 伊人网在线视频观看| 亚洲精品人人| 超碰97网站| 成人在线免费看黄| 欧美日韩在线播放一区| 中文字幕在线1| 性xx色xx综合久久久xx| 久久精品成人一区二区三区蜜臀| 欧美草逼视频| 欧美一区二区视频在线观看| 麻豆一区在线观看| 日本aⅴ精品一区二区三区| 欧美成人免费在线| 在线观看网站免费入口在线观看国内| 亚洲成人激情在线| 五月天婷婷网站| 成人看片黄a免费看在线| 日本天堂免费a| 日本精品国产| 欧美精品一二区| www.色婷婷.com| 亚洲精品乱码久久久久久黑人 | 国产成人免费在线观看不卡| 精品一区二区成人免费视频| 一级欧美视频| 久久精品人人爽| 国产视频一区二区三| 亚洲免费伊人电影| 色婷婷狠狠18禁久久| 欧美日韩第一区| 国产一区二区免费在线观看| av女在线播放| 亚洲精品日韩在线| 成人h动漫精品一区二区下载| 国产午夜亚洲精品不卡| jizz欧美性11| 91精品亚洲| 超碰97在线资源| 中文在线中文资源| 亚洲人午夜精品| 一级特黄aaa| 亚洲免费av网站| 一级欧美一级日韩片| 噜噜爱69成人精品| 这里只有精品66| 亚洲福利合集| 欧美亚洲视频一区二区| av网站在线免费观看| 欧美乱熟臀69xxxxxx| 欧美片一区二区| 91在线国产福利| 亚洲欧美国产日韩综合| 午夜欧美理论片| 免费精品视频一区| 日韩伦理一区二区| 欧美激情一区二区三区在线视频观看| 污视频在线免费观看| 91国产精品成人| 欧美成人黄色网| 久久免费午夜影院| 亚洲制服在线观看| 国产日韩欧美三区| 中文字幕av日韩精品| 国内自拍欧美| 国产日韩欧美自拍| 僵尸再翻生在线观看| 在线国产精品视频| 黄色www视频| 欧美曰成人黄网| 中文在线观看免费网站| 国产精品伦一区二区三级视频| 国产亚洲精品成人a| 日韩国产欧美在线视频| 91亚洲精品国产| 精品国产一级毛片| 国产伦精品一区| 国产一区二区三区四区五区3d | 一本色道久久88亚洲精品综合| 欧美影院天天5g天天爽| 91精品视频在线免费观看| 综合日韩av| 欧美高清在线播放| 日本最新在线视频| 亚洲男人天堂久| 黄色美女一级片| 欧美猛男男办公室激情| 日日骚av一区二区| 亚洲va国产天堂va久久en| 午夜剧场免费在线观看| 久久男人中文字幕资源站| 亚洲无人区码一码二码三码| 极品美女销魂一区二区三区免费| 国产综合免费视频| 国产精品99re| japansex久久高清精品| 欧美在线视频观看| 激情网站在线| 久久国产精品电影| 免费av毛片在线看| 色先锋资源久久综合5566| 水中色av综合| 亚洲国产成人在线视频| 国产偷拍一区二区| 777a∨成人精品桃花网| 依依成人在线视频| 日本丰满少妇一区二区三区| www成人在线| 午夜精品成人在线视频| 伊人国产在线观看| 亚洲一区二区三区视频在线| 一区二区成人免费视频| 亚洲日本一区二区三区| 日本黄色录像视频| 中文字幕在线不卡一区| 少妇高潮惨叫久久久久| 国产精品天天摸av网| 性欧美一区二区| 欧美国产一区二区在线观看| 天堂久久精品忘忧草| 国产日产欧美精品一区二区三区| 四虎永久免费影院| 久久欧美一区二区| av男人的天堂av| 国产精品美女久久久久久 | 亚洲欧洲国产日本综合| 青青青手机在线视频| 中文字幕一区二区三区四区 | 中文字幕一区二区三区在线视频| 亚洲一区免费看| 天天天综合网| 久久久久福利视频| 国产一区二区三区四区老人| 91丨porny丨探花| 亚洲一区二区三区免费在线观看| 播放灌醉水嫩大学生国内精品| 久久精品人人| 中文字幕成人在线视频| 国产一区久久久| 国内精品免费视频| 久久久久久一二三区| 免费黄在线观看| 亚洲日本在线观看| 日本一级片免费看| 色婷婷av一区二区| 91成人在线免费| 精品久久国产字幕高潮| 香蕉视频成人在线| 在线观看国产欧美| 国产精品探花在线| 青青久久av北条麻妃黑人| 久久精品嫩草影院| 国产伦精品一区二区| 国产中文精品久高清在线不| 一区精品在线| 99热免费精品在线观看| 丰满少妇在线观看| 国产成人午夜片在线观看高清观看| 男女性杂交内射妇女bbwxz| 国产日本一区二区| 91视频免费在线看| 欧美日韩综合视频网址| 91亚洲欧美激情| 亚洲精品久久7777777| 在线观看麻豆| 66m—66摸成人免费视频| 开心久久婷婷综合中文字幕| 国产高清精品一区| 四虎成人精品永久免费av九九| 国产内射老熟女aaaa| 日韩电影在线观看网站| 国产乱淫av麻豆国产免费| 欧美国产成人在线| 日韩大片免费在线观看| 91精品久久久久久久91蜜桃| 三区在线观看| 欧美高清性猛交| 国产成人亚洲一区二区三区| 国产一区二区三区免费不卡| 欧美高清视频手机在在线| 91精品91久久久中77777老牛| 韩国av一区二区三区在线观看| 人妻少妇无码精品视频区| 亚洲国产成人av网| 国产伦精品一区二区三区四区| 亚洲精品视频二区| 欧美精品videossex少妇| 国产在线精品成人一区二区三区| 日韩av网站在线免费观看| 欧美少妇一区二区三区| 青青草国产成人av片免费| 黄色在线观看av| 亚洲电影第三页| 亚洲免费国产视频| 久久精品国产电影| 99精品国自产在线| 欧美一二三四五区| 国产日韩一区二区三区在线| 丰满人妻一区二区三区53视频| 国产精品久久久久影院色老大| 日韩免费av网站| 亚洲精品一二区| 中国色在线日|韩| 国产麻豆日韩| 伊人成年综合电影网| 韩国三级hd中文字幕有哪些| 中文字幕在线观看不卡| 一本到在线视频| 深夜福利日韩在线看| 快播电影网址老女人久久| 久久人人97超碰人人澡爱香蕉| 一区免费视频| 亚洲一区二区三区四区av| 亚洲小说欧美激情另类| 精品区在线观看| 欧美国产日本高清在线 | 国产精品综合二区| 日本一级特级毛片视频| 777午夜精品免费视频| 成人短视频在线| 91在线精品视频| 欧美日韩91| 精品1卡二卡三卡四卡老狼| 香蕉成人啪国产精品视频综合网| 天天综合网在线观看| 欧美亚洲日本网站| 欧美日韩激情| 在线观看日本一区二区| 自拍偷拍国产精品| 成人无码一区二区三区| 韩国福利视频一区| 亚洲国产合集| 天天操天天爱天天爽| 中文字幕中文字幕一区二区| 国产aⅴ一区二区三区| 色综合男人天堂| 欧美一性一交| 亚洲这里只有精品| 亚洲免费大片在线观看| 男人天堂一区二区| 国产suv精品一区二区| 日韩欧美二区| 亚洲熟妇一区二区| 狠狠干狠狠久久| 亚洲免费视频一区二区三区| 91精品国产综合久久久久久丝袜| 欧美亚韩一区| 少妇久久久久久久久久| 欧美午夜电影在线播放| 在线看福利影| 欧美一区1区三区3区公司| 九九视频精品免费| 国产一级特黄aaa大片| 一道本无吗dⅴd在线播放一区| 国产精品一区免费在线| 欧美不卡在线播放| 国产精品素人视频| 黄频网站在线观看| 国产精品久久久久久久久久久不卡| 中文字幕一区二区av| 亚洲av无码一区二区三区网址 | 性生交大片免费看女人按摩| 欧美亚洲国产另类| 国产精品久久久久久久久久10秀| jjzzjjzz欧美69巨大| 欧美午夜理伦三级在线观看| 欧美人与牲禽动交com| 欧美亚州在线观看| 国产精品夜夜嗨| 亚洲中文无码av在线| 午夜精品久久久久久99热软件| 欧美手机在线| 少妇激情一区二区三区视频| 欧美精品亚洲二区|