精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Nature封面:AI訓練AI,越訓越離譜

人工智能 新聞
訓練數據是用 GPT-4o 生成的?那質量不好說了。

我們知道,大模型面臨的三大挑戰是算法、算力和數據。前兩者靠優化升級,后者靠積累。隨著技術的不斷發展,高質量數據已經逐漸成為最大的瓶頸。

在很多新模型上,人們為了提升模型能力,都采用了使用 AI 生成數據來訓練的方式。人們普遍認為,使用合成數據可以顯著提升模型質量。

不過,最新的研究認為,使用 AI 生成的數據并不是什么好辦法,反而可能會讓模型陷入崩潰。

今天發表在學術頂刊《自然》雜志的封面研究認為,如果放任大模型用自動生成的數據訓練自己,AI 可能會自我退化,在短短幾代內將原始內容迭代成無法挽回的胡言亂語。

圖片

這篇由牛津大學等機構提交的研究,強調了由于自我訓練導致人工智能模型崩潰(Model Collapse)的風險,論證了原始數據源和仔細數據過濾的必要性。

圖片

論文鏈接:https://www.nature.com/articles/s41586-024-07566-y

哪種模型容易崩潰?

研究認為,當人工智能模型在生成的數據上進行過度訓練時,就會發生不可逆轉的模型崩潰。

「模型崩潰是指由于對合成數據進行不加區分的訓練而導致模型崩潰的現象」,牛津大學研究員、該論文的主要作者 Ilia Shumailov 表示。

根據論文所述,大型語言模型等生成式 AI 工具可能會忽略訓練數據集的某些部分,導致模型只對部分數據進行訓練。

眾所周知,大語言模型(LLM)需要巨量數據進行訓練,從而使自身獲得解釋其中信息并應用于各種用例的能力。LLM 通常是為了理解和生成文本而構建的,但研究小組發現,如果忽略它據稱正在閱讀并納入其知識庫的大量文本,可能會很快地使 LLM 淪為空殼。

「在模型崩潰的早期階段,模型首先會失去方差,在少數數據上的表現下降,在模型崩潰的后期階段,模型則會完全崩潰」,Shumailov 說道。因此,隨著模型繼續在模型本身生成的越來越不準確和相關的文本上進行訓練,這種遞歸循環會導致模型退化。

模型崩潰,到底是什么

在該論文中,作者發現的模型崩潰效應是一種退化過程,模型生成的數據會污染下一代模型的訓練集。模型接受受污染數據的訓練,會錯誤地感知現實,如下圖 (a) 所示。

圖片


模型崩潰可以分為早期和后期階段,早期模型會在少數數據上表現下降,后期模型會收斂到一種與原始分布幾乎沒有相似之處的分布,并且方差通常大大減少。

模型崩潰發生主要是因為下述三個特定誤差源在幾代模型中復合,并導致與原始模型出現較大偏差:

  • 統計近似誤差。這是由于樣本數量有限而產生的主要誤差,并且隨著樣本數量趨于無窮大而消失。發生這種情況是因為重采樣的每一步都可能丟失信息。

  • 函數表達誤差。這是第二種類型的誤差,是由于函數逼近器表達能力有限而產生的。特別是,神經網絡只是通用逼近器,無法完美地逼近任何分布。神經網絡可以在原始分布之外引入非零似然,或者在原始分布內引入零似然。函數表達誤差的一個簡單例子是,如果我們嘗試用單個高斯擬合兩個高斯的混合。即使我們有關于數據分布的完美信息(即無限數量的樣本),模型誤差也將是不可避免的。然而,在沒有其他兩種類型的誤差的情況下,這種情況只能發生在第一代模型。

  • 函數逼近誤差。這是次要類型的誤差,主要源于學習過程的局限性,例如隨機梯度下降的結構偏差。

上述每一項都可能導致模型崩潰變得更糟或更好。更高的逼近能力甚至可以是一把雙刃劍,更好的表達能力可以抵消統計噪聲,從而很好地逼近真實分布,但它同樣會加劇噪聲。這通常會產生級聯效應,其中個體的不準確性結合起來會導致整體誤差增加。

例如,過度擬合密度模型會導致模型錯誤推斷,將高密度區域分配給訓練集未覆蓋的低密度區域。

值得注意的是,還存在其他類型的誤差。例如,計算機在實踐中的精度有限。

語言模型中的模型崩潰

作者在文中還評估了模型崩潰對語言模型的影響。模型崩潰在各種機器學習模型中普遍存在。然而,與通常從零開始訓練的小模型(如 GMMs 和 VAEs)不同,LLM 需要巨大的成本從頭開始訓練,因此通常使用預訓練模型(如 BERT、RoBERTa 或 GPT-2)初始化,這些模型是在大型文本語料庫上訓練的。隨后,這些模型被微調以適應各種下游任務。

在這篇論文中,作者探討了當語言模型使用由其他模型生成的數據進行連續微調時會發生什么。本文中涉及的所有實驗可以在非微調設置下用更大的語言模型輕松復制。鑒于訓練一個中等規模的模型需要的算力也非常可觀,作者選擇不進行這樣的實驗,而是專注于更現實的概念驗證設置。

需要注意的是,本文描述的語言實驗即使在這種情況下也需要幾周時間才能完成。作者評估了訓練語言模型的最常見設置 —— 微調設置,其中每個訓練周期都從一個具有最新數據的預訓練模型開始。這里的數據來自另一個經過微調的預訓練模型。由于訓練被限制在生成與原始預訓練模型非常相似的模型,并且這些模型生成的數據點通常只會產生非常小的梯度,因此預期在微調后,模型只會發生適度的變化。作者使用 Meta 通過 Hugging Face 提供的 OPT-125m 因果語言模型進行了微調。

案例研究:教堂和長耳大野兔

研究人員在論文中提供了一個使用文本生成模型 OPT-125m 的示例(使用 wikitext2 數據集微調),該模型的性能與 ChatGPT 的 GPT-3 類似,但需要的算力較少。

研究人員將有關設計 14 世紀教堂塔樓的文本輸入到模型中。在第一代文本輸出中,該模型主要討論了在不同教皇統治下建造的建筑物。但到了第九代文本輸出,該模型主要討論了大量的黑尾、白尾、藍尾、紅尾和黃尾長耳大野兔。我們應該注意到的是,其中大多數并不是真正存在的長耳大野兔物種。

圖片

大模型輸出的內容:從教堂到 100 多種語言,再到野兔。

實驗結果表明,即使原數據一直保留,但模型崩潰的現象仍然會發生。隨著不斷迭代,模型開始忘記真實數據中的信息,并且生成的內容中包含越來越多重復的短語。

網絡充斥 AI 內容,「數據源」早已被污染

看到這里你可能會問了:那還不簡單,不使用合成數據訓練 AI 不就完事了?但實際上,現在能從互聯網上獲取的「數據」,里面已經不知道有多少是 AI 生成的了,而且我們經常無法把它們和正常內容區分開來。

互聯網上充斥著各種內容,這并不是新鮮事。正如研究人員在論文中指出的那樣,早在大規模語言模型(LLM)成為公眾熟知的話題之前,惡意網站就已經在制造內容,以欺騙搜索算法優先顯示他們的網站以獲取點擊量。隨著 OpenAI 的 GPT 系列大模型問世,生成式 AI 已經并將會極大地改變文本和圖像內容的生態。

AI 生成文本可比人類說廢話快得多,這引發了更大規模的擔憂。杜克大學專門研究隱私與安全的計算機科學家艾米麗 - 溫格 Emily Wenger 曾在文章中寫到相關內容:「盡管 AI 生成的互聯網對人類的影響還有待觀察,但 Shumailov 等人報告稱,在線上大量涌現的 AI 生成內容可能對這些模型本身造成毀滅性的影響。」

「模型崩潰帶來的問題之一是對生成式 AI 的公平性構成挑戰。崩潰的模型會忽略訓練數據中的一些不常見元素,從而無法反映世界的復雜性和細微差別,」Wenger 補充道,「這可能導致少數群體或觀點的代表性減少,甚至可能被抹去。」

大型科技公司正在采取一些措施,以減少普通網絡用戶看到的 AI 生成內容的數量。3 月份,谷歌宣布將調整其算法,把那些看起來是為搜索引擎而非人類搜索者設計的頁面的優先級進行降低。然而,這一聲明是在 404 Media 關于谷歌新聞推廣 AI 生成文章的報道之后發布的。

《自然》雜志封面的這項研究強調,訪問原始數據源并在遞歸訓練的模型中仔細過濾數據,有助于保持模型的準確性。

該研究還建議,創建大型語言模型(LLM)的 AI 社區可以協調合作,追蹤輸入到模型中的信息來源。「否則,隨著這種技術的廣泛應用,如果無法獲得在技術普及之前從互聯網上爬取的數據或大量人類生成的數據,訓練新的 LLM 版本可能會變得越來越困難」,研究團隊總結道。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-29 07:04:00

大模型AI訓AI人工智能

2025-05-08 06:00:00

AI幻覺AI人工智能

2021-08-16 15:47:02

AI決策人工智能

2023-08-31 07:16:32

人工智能AI算力

2021-08-16 20:45:52

AI人工智能

2024-07-25 13:56:49

2024-07-29 08:00:00

模型論文

2025-08-06 06:00:00

AI人工智能AI安全

2025-07-24 10:43:46

2025-11-04 08:43:00

2024-08-06 11:09:37

2021-09-29 15:36:43

人工智能算法AI

2021-09-18 09:52:07

AI 數據人工智能

2025-05-26 09:06:00

2025-09-01 08:46:00

AI數據職業

2025-07-01 08:37:13

2021-01-18 08:23:09

大數據AI人工智能

2018-05-05 08:54:24

2024-09-09 10:20:00

AI模型

2017-12-17 16:24:31

云計算AISaaS
點贊
收藏

51CTO技術棧公眾號

日韩免费一级| 欧美一区二区三区在线观看免费| 一区视频在线看| 日韩成人av网址| 午夜肉伦伦影院| 亚洲色欧美另类| 蜜桃久久av一区| 欧美理论电影在线播放| 国产麻豆xxxvideo实拍| 久久久成人av毛片免费观看| 国产精品国产三级国产aⅴ无密码| 亚洲最大福利网站| 成年免费在线观看| 99九九热只有国产精品| 精品国产欧美一区二区| 欧美三级午夜理伦三级| 影音先锋在线播放| 国产日本欧美一区二区| 风间由美久久久| 中文字幕第一页在线播放| 一区免费在线| 久久躁狠狠躁夜夜爽| 中文字幕一区二区人妻在线不卡| 国产麻豆一区二区三区| 色网站国产精品| www婷婷av久久久影片| www.国产精品.com| 成人午夜视频在线| 成人国内精品久久久久一区| 久久久精品福利| 亚洲视频日本| 久久精品视频va| 青青草福利视频| gogo人体一区| 欧美一区二区视频免费观看| 日韩精品免费播放| 涩涩涩视频在线观看| 亚洲美女精品一区| 亚洲天堂电影网| 男男激情在线| 91麻豆高清视频| 国产精品一区二区欧美| 国产成人精品免费看视频| 免费的成人av| 国产精品精品一区二区三区午夜版 | 国产黄色录像视频| 亚洲涩涩av| 日韩电影中文字幕av| 国产精久久久久| 麻豆一区在线| 欧美一区二区网站| 91大神免费观看| 国产传媒一区二区| 最近免费中文字幕大全免费版视频| 欧美日韩一区二区国产| 久久精品国产久精国产思思| 天天操天天舔天天射| 激情五月色综合国产精品| 国产视频精品va久久久久久| 800av在线播放| 国产亚洲精品美女久久| 精品捆绑美女sm三区| 男人女人拔萝卜视频| 欧美国产中文高清| 精品国产一区二区精华| 日本一区二区免费视频| www.亚洲一二| 亚洲国产精品999| 亚洲精品中文字幕在线播放| 美女主播精品视频一二三四| 国产婷婷成人久久av免费高清| 日本aaa视频| 国产中文精品久高清在线不| 在线色欧美三级视频| 日本xxxxxxxxx18| 日韩欧美一区二区三区免费看| 最近2019好看的中文字幕免费| 91视频免费在观看| 亚洲区综合中文字幕日日| 色综合老司机第九色激情| 国产对白videos麻豆高潮| 国产一区二区高清| 国产成人精品一区二区| 亚洲一级在线播放| 国产成人综合视频| 农村寡妇一区二区三区| 国产高清免费av在线| 自拍偷拍欧美精品| 成年人午夜免费视频| 日韩在线影院| 日韩小视频在线观看专区| 国产高潮视频在线观看| 亚洲人成精品久久久 | 超碰国产在线观看| 亚洲婷婷综合久久一本伊一区| 欧美 亚洲 视频| 性欧美又大又长又硬| 欧美婷婷六月丁香综合色| 欧美日韩久久婷婷| 日韩在线你懂的| 久久精品99久久久久久久久| 日韩精品一卡二卡| 麻豆91在线看| 国产精品国产三级欧美二区| 国模精品一区二区| 亚洲一区二区三区视频在线播放 | 你懂的网址一区二区三区| 日本高清视频在线观看| 亚洲成av人片在线观看无码| 五月婷婷狠狠操| 一区二区三区视频免费视频观看网站 | 校花撩起jk露出白色内裤国产精品| 最新中文字幕亚洲| 久久国产在线视频| 麻豆成人久久精品二区三区小说| 国产一区二区三区四区hd| 香蕉视频在线播放| 欧美日韩国产在线| 国产精品久久久久久久av福利| 婷婷精品在线| 欧美黑人极品猛少妇色xxxxx| 香蕉污视频在线观看| 成人午夜av电影| 先锋影音男人资源| 欧美日韩在线精品一区二区三区激情综合 | 欧美贵妇videos办公室| 亚洲精品一区二区二区| av中文字幕亚洲| 青草全福视在线| av成人免费看| 亚洲欧美福利视频| 在线观看黄网站| 成人h动漫精品一区二| 男插女免费视频| 成人自拍视频网| 日韩精品中文字| 日韩精品成人在线| gogo大胆日本视频一区| 日本黄大片在线观看| 精品视频一二| 久久国产精品久久久久久| 一级日韩一级欧美| 欧美高清在线精品一区| 久久精品午夜福利| 亚洲激情播播| 欧洲精品毛片网站| 青青草在线免费观看| 亚洲最快最全在线视频| 中文字幕第22页| 91精品久久久久久久蜜月| 成人免费淫片aa视频免费| 午夜视频成人| 91精品国产综合久久精品性色| 自拍偷拍第9页| 久久成人麻豆午夜电影| 亚洲精品在线免费| 亚洲午夜剧场| 色香阁99久久精品久久久| 中文字幕黄色av| 国产精品毛片高清在线完整版| 日韩av片网站| 我不卡神马影院| 5g国产欧美日韩视频| 日本在线视频www鲁啊鲁| 精品国产免费一区二区三区四区| 天堂资源在线播放| 91丨九色丨蝌蚪富婆spa| 国产免费毛卡片| 国产精品美女久久久久久不卡 | 给我免费播放片在线观看| 国产精品三p一区二区| 88xx成人精品| 国产中文在线视频| 欧美日韩黄色一区二区| 欧美在线视频第一页| 国产一区二区三区蝌蚪| 日本大胆人体视频| 亚洲欧美校园春色| 国产精品久久久久免费a∨大胸 | 欧美成人一二三| 国产av无码专区亚洲a∨毛片| 亚洲国产成人91porn| 精品中文字幕在线播放| 久久婷婷av| 艳色歌舞团一区二区三区| 高清一区二区| 97av在线影院| 米奇777四色精品人人爽| 精品国产乱码久久| 波多野结衣日韩| 亚洲人成在线播放网站岛国| 在线精品一区二区三区| 日本亚洲一区二区| 女人被男人躁得好爽免费视频| 夜夜躁狠狠躁日日躁2021日韩| 国产精品久久久久久久久久99| 99热国产在线| 国产视频在线一区二区| 国产精品视频一区二区三区,| 午夜电影网一区| 日韩精品久久久久久久的张开腿让| 成人午夜av影视| www.国产视频.com| 99在线精品视频在线观看| 宅男av一区二区三区| 美女视频免费精品| 亚洲一区二区三区毛片| 另类激情视频| 久久久久久久久91| 日本在线观看| 亚洲免费av片| 亚洲精品一区二区三区新线路| 在线亚洲人成电影网站色www| 久久久无码精品亚洲国产| 日本一区二区三区四区| 亚洲国产精品成人综合久久久| 国内成+人亚洲+欧美+综合在线| 久久久999视频| 欧美日韩国产精品一区二区亚洲| 香蕉久久免费影视| 杨幂一区二区三区免费看视频| 亚洲自拍小视频| 久久久久久一区二区三区四区别墅| 91精品国产99| 国产啊啊啊视频在线观看| 久久精品中文字幕免费mv| jizz在线免费观看| 亚洲欧美在线播放| 欧美一级视频免费| 日韩欧美色综合| 国产精品毛片久久久久久久av| 在线一区二区观看| 手机在线看片1024| 欧美日韩国产影院| 欧美一区二区三区四| 亚洲国产cao| 久草国产在线观看| 一区二区在线观看免费| 欧美另类videoxo高潮| 国产精品久久久久久久久快鸭| 久久久久久亚洲中文字幕无码| 99久久精品国产导航| 日本性生活一级片| 成人av午夜影院| 久久久男人的天堂| 成人综合婷婷国产精品久久蜜臀 | 欧美成人性色生活仑片| 免费av在线播放| 精品国产一区二区三区四区在线观看 | 国产精品一卡二卡在线观看| 亚洲一二三av| 国产精品资源网站| 国产成人av片| 高清久久久久久| 欧美xxxx日本和非洲| 国产.欧美.日韩| 毛茸茸free性熟hd| 99视频超级精品| 亚洲精品女人久久久| 久久综合一区二区| 五月婷婷综合在线观看| 久久久久国产精品麻豆ai换脸| 国产特级黄色录像| 欧美国产一区视频在线观看| sm捆绑调教视频| 中文字幕在线观看一区| 亚洲熟女www一区二区三区| 一区二区三区日韩在线观看| 国产一级一片免费播放| 第一福利永久视频精品| 人人草在线观看| 欧美日韩亚洲综合一区| 99久久99久久久精品棕色圆| 日韩精品中文字幕在线一区| 蜜桃久久一区二区三区| 亚洲人成人99网站| 午夜在线视频| 久久久久五月天| 少妇一区视频| 91影视免费在线观看| gogo人体一区| 日韩一区不卡| 女人香蕉久久**毛片精品| 欧美不卡在线播放| 奇米精品一区二区三区在线观看| 日本中文字幕观看| 成人h精品动漫一区二区三区| 性欧美一区二区| 亚洲精品精品亚洲| 日日噜噜噜噜人人爽亚洲精品| 欧美猛男超大videosgay| 好吊色一区二区三区| 国产一区二区日韩| 美女精品视频| 国产精品欧美激情| 国产乱人伦精品一区| 日韩一区二区三区高清| 激情久久久久久| 伊人影院综合在线| 99久久久无码国产精品| 午夜国产福利视频| 色综合天天在线| 亚洲精品一区二区口爆| 日韩亚洲一区二区| 伊人久久精品一区二区三区| 91精品啪在线观看麻豆免费| 性欧美lx╳lx╳| 国产免费一区二区视频| 久久成人精品无人区| 色婷婷在线影院| 亚洲va欧美va人人爽| 国产又粗又猛又色又| 亚洲欧美国产一区二区三区| 午夜dj在线观看高清视频完整版| 国产精品丝袜高跟| 亚洲精品国产setv| www污在线观看| 国产在线播精品第三| 手机看片福利视频| 精品久久久一区二区| 精品女同一区二区三区| 在线观看欧美成人| 亚洲天堂免费电影| 国产精品入口免费| 亚洲欧美综合久久久| 亚洲精品久久久久久宅男| www成人在线观看| 日韩成人一区二区三区| 91精品国产综合久久精品| 日本三级在线视频| 国产欧美日韩视频| 成人写真视频| 亚洲性生活网站| 久久综合视频网| 日本一区二区三区四区五区| 日韩欧美一区二区三区在线| 色的视频在线免费看| 国产精品久久久久福利| 国产成人ay| 日韩欧美黄色大片| 国产亚洲人成网站| 午夜久久久久久久久久影院| 亚洲摸下面视频| 亚洲精品国产精品国产| 久久大片网站| 亚洲一区二区三区高清| 中文字幕av网址| 日韩欧美视频一区二区三区| 西西人体44www大胆无码| 97精品国产91久久久久久| 国产一区在线电影| 少妇无码av无码专区在线观看 | 欧美wwww| av免费观看久久| 国语自产精品视频在线看8查询8| 欧美国产在线一区| 亚洲综合色网站| 免费观看的毛片| 69国产精品成人在线播放| 亚洲影院天堂中文av色| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 成人在线观看视频网站| 亚洲人metart人体| 影音先锋资源av| 欧美日韩国产专区| 你懂的在线视频| 国产精品普通话| 中文字幕一区二区av | 精品国内亚洲2022精品成人| 国产乱子伦农村叉叉叉| 国产午夜亚洲精品羞羞网站| 自拍偷拍精品视频| 欧美成年人在线观看| 国产福利一区二区精品秒拍| 精品www久久久久奶水| 亚洲欧洲国产专区| 免费看日韩av| 国产精品久久国产精品99gif| 久久精品高清| 亚洲精品久久一区二区三区777| 欧美性xxxx极品hd满灌| 97超碰人人在线| 99久久综合狠狠综合久久止| 国产色综合网| 成人18视频免费69| 亚洲国产天堂久久综合| 999国产精品亚洲77777| 美女av免费观看| 久久久久久久性| 国产手机av在线| 日本精品性网站在线观看| 婷婷综合视频| 中文字幕在线看高清电影| 日韩视频一区在线观看| 日韩免费电影| 国产日韩欧美大片| 国产亚洲成av人在线观看导航| 国产日韩一级片| 国产成人精品久久久| 女生裸体视频一区二区三区|