精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

訓出GPT-5短缺20萬億token!OpenAI被曝計劃建「數據市場」

人工智能 新聞
全網高質量數據集告急!OpenAI、Anthropic等AI公司正在開拓新方法,訓練下一代AI模型。

全網真的無數據可用了!

外媒報道稱,OpenAl、Anthropic等公司正在努力尋找足夠的信息,來訓練下一代人工智能模型。

圖片

前幾天,OpenAI和微軟被曝出正在聯手打造超算「星際之門」,解決算力難題。

然而,數據也是訓練下一代強大模型,最重要的一味丹藥。

面對窮盡互聯網的數據難題,AI初創、互聯網大廠真的坐不住了。

圖片

GPT-5訓練,用上了YouTube視頻

不論是下一代GPT-5、還是Gemini、Grok等強大系統的開發,都需要從大量的海洋數據中學習。

可以預見的是,互聯網中高質量公共數據已經變得非常稀缺。

與此同時,一些數據所有者,比如Reddit等機構,制定政策阻止AI公司的訪問數據。

一些高管和研究人員稱,由于對高質量文本數據的需求,可能會在2年內超過供應,這可能會減緩人工智能的發展。

也包括2022年11月,就有MIT等研究人員警告,機器學習數據集可能會在2026年之前耗盡所有「高質量語言數據」。

圖片

論文地址:https://arxiv.org/pdf/2211.04325.pdf

WSJ報道稱,這些人工智能公司正在尋找未開發的信息源,并重新思考如何訓練先進的AI系統。

知情人士透露,OpenAI已經在討論如何通過轉錄YouTube公開視頻,來訓練下一個模型GPT-5。

圖片

為了獲取更多真實數據,OpenAI還曾與不同機構合作簽署協議,以便雙方共享部分內容和技術。

還有一些公司采用AI生成的合成數據,作為訓練材料。

不過,這種方法實際上可能會造成嚴重的故障。

此前,萊斯大學和斯坦福團隊的研究發現,將AI生成的內容喂給模型,尤其經過5次迭代后,只會導致性能下降。

研究人員對此給出一種解釋,叫做「模型自噬障礙」(MAD)。

論文地址:https://arxiv.org/abs/2307.01850

對于AI合成數據的使用,在這些公司都是秘密進行的。這種解決方案已然被視為一種新的競爭優勢。

AI研究Ari Morcos表示,「數據短缺」是一個前沿的研究問題。他在去年創立DatologyAI之前。曾在Meta Platforms和谷歌的DeepMind部門工作。

他的公司建立了改進數據選擇的工具,可以幫助公司以更低的成本訓練AI模型.

「不過目前還沒有成熟的方法可以做到這一點」。

數據稀缺,成為永恒

數據、算力、算法都是訓練強大人工智能重要的資源之一。

對于訓練ChatGPT、Gemini這樣的大模型完全基于互聯網上獲取的文本數據打造的,包括科學研究、新聞報道和維基百科條目。

這些材料被分成「詞塊」——單詞和單詞的一部分,模型利用這些詞塊來學習如何形成類人的表達方式。

一般來說,AI模型接受訓練的數據越多,能力就越強。

OpenAI正是在這種策略上大大投入,才使得ChatGPT名聲遠揚。

不過一直以來,OpenAI從未透露過關于GPT-4的訓練細節。

但研究機構Epoch研究人員Pablo Villalobos估計,GPT-4是在多達12萬億個token上訓練的。

他繼續表示,基于Chinchilla縮放定律的原理,如果繼續遵循這樣擴展軌跡,像GPT-5這樣的AI系統將需要60萬億-100萬億token的數據。

利用所有可用的高質最語言和圖像數據,仍可能會留下10萬億到20萬億,甚至更多的token的缺口,目前尚不清楚如何彌合這一差距。

兩年前,Villalobos在論文中寫道,到2024年中期,高質量數據供不應求的可能性為50%。到2026年,供不應求的可能概率達到90%。

不過,現在他們變得樂觀了一些,并估計這一時間將推遲到2028年。

圖片

大多數在線數據對于AI的訓練是無用的,因為它們包含了大量的句子片段、污染數據等,或者不能增加模型的知識。

Villalobos估計,只有一小部分互聯網對模型訓練會有用,可能只有CommonCrawl收集的信息的1/10。

與此同時,社交媒體平臺、新聞出版商和其他公司一直在限制AI公司,使用自家平臺數據進行人工智能訓練,因為擔心公平補償等問題。

而且公眾也不愿意交出私人對話數據(比如iMessage上的聊天記錄)來幫助訓練模型。

然而,小扎最近把Meta在其平臺上獲取數據的能力,吹捧為Al研究工作的一大優勢。

他對外公開稱,Meta可以在其網絡(包括Facebook和Instagram)上挖掘數千億張公開共享的圖片和視頻,這些圖片和視頻的總量超過了大多數常用的數據集。

圖片

數據選擇工具的初創公司DatologyAI使用可一種稱為「課程學習」的策略。

在這種策略中,數據以特定的序列被輸入到語言模型中,希望人工智能能夠在概念之間形成更智能的連接。

在2022年的一篇論文中,Datalogy AI研究人員Morcos和合著者估計,如果數據正確,模型可以用一半的時間取得同樣的結果。

圖片

這有可能降低訓練和運行大型生成式人工智能系統的巨大成本。

不過,到目前為止,其他的研究表明,「課程學習」的方法并不有效。

Morcos表示團隊正在調整這一方法,這是深度學習最骯臟的秘密。

OpenAI谷歌要建「數據市場」?

奧特曼曾在去年對外透露,公司正在研究訓模型的新方法。

「我認為,我們正處于這些巨型模型時代的末期。我們會用其他方法讓它們變得更好」。

知情人士表示,OpenAI還討論了創建一個「數據市場」。

在這個市場上,OpenAI它可以建立一種方法,來確定每個數據點對最終訓練模型的貢獻,并向該內容的提供商支付費用。

同樣的想法,也在谷歌內部進行了討論。

目前,研究人員一直努力創建這樣一個系統,暫不清楚是否會找到突破口。

據知情人士透露,高管們已經討論過使用其自動語音識別工具Whisper在互聯網上轉錄高質量的視頻和音頻示例。

其中一些將通過YouTube公共視頻進行,并且部分數據已經用于訓練GPT-4。

下一步,合成數據

一些公司也在嘗試制作自己的數據。

喂養AI生成的文本,被認為是計算機科學領域的「近親繁殖」。

這樣的模型往往會輸出沒有意義的內容, 一些研究人員將其稱為「模型崩潰」。

OpenAI和Anthropic的研究人員正試圖通過創建所謂的更高質量的合成數據來避免這些問題。

在最近的一次采訪中,Anthropic的首席科學家JaredKaplan表示,某些類型的合成數據可能會有所幫助。同時,OpenAI也在探索合成數據的可能性。

圖片

許多研究數據問題的人都樂觀認為,「數據短缺」解決方案終會出現。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-01-20 07:30:00

OpenAIGPT-5模型

2024-01-18 12:30:03

2024-12-24 14:30:00

模型AI訓練

2024-12-23 09:22:00

AI模型訓練

2023-08-02 13:52:59

GPT-5模型

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2025-05-13 09:02:23

2023-06-08 07:58:29

2024-09-05 21:02:58

2025-08-04 14:22:33

GPT-5Claude編碼

2025-08-25 10:21:29

2024-11-11 13:52:31

2023-04-13 13:38:59

2023-09-19 12:45:36

2023-11-07 16:10:18

OpenAIGPTAI

2025-08-07 16:21:27

GPT-5AI模型

2023-08-10 15:22:48

人工智能OpenAI

2023-11-14 14:26:29

OpenAIGPT-5

2025-10-31 15:53:06

AI模型GPT-5

2025-02-13 10:52:56

點贊
收藏

51CTO技術棧公眾號

好男人www在线视频| 国产精品国产精品88| 亚洲精品一级二级| 中文字幕一区二区三区在线播放| 91丨九色丨国产在线| 欧美成欧美va| 小嫩嫩12欧美| 欧美日韩一区国产| 国产美女主播在线| h视频网站在线观看| 国产ts人妖一区二区| 国产成人av在线| 国产精品久久久精品四季影院| 久久综合五月婷婷| 欧美日韩情趣电影| 久久久久久免费看| 麻豆视频在线免费观看| 懂色一区二区三区免费观看 | 奇米精品在线| www.色婷婷.com| 丝袜亚洲另类欧美| 欧美老女人性生活| 国产毛片久久久久久久| 嫩呦国产一区二区三区av| 色婷婷av一区二区| 久久亚洲精品无码va白人极品| 国产精品无码2021在线观看| 成人午夜精品一区二区三区| 国产精品网红直播| 亚洲成人第一网站| 国模 一区 二区 三区| www.亚洲男人天堂| 蜜桃av免费看| 国偷自产av一区二区三区| 欧美精品久久一区二区三区| 男女视频一区二区三区| 成年女人在线看片| 一区二区三区四区不卡视频| 少妇无套高潮一二三区| 你懂的在线观看视频网站| 国产精品一区二区免费不卡 | 超碰99在线| 亚洲精品国产精品乱码不99| 中文字幕欧美日韩一区二区| 你懂的免费在线观看| 成人av免费在线观看| 91色中文字幕| 国产女同91疯狂高潮互磨| 免费成人在线网站| 国产精品女人久久久久久| 青草视频在线观看免费| 亚洲狼人精品一区二区三区| 欧美猛交免费看| 中文字幕无码日韩专区免费| 欧美另类69xxxxx| 亚洲欧美自拍一区| 成人精品999| 国产精品美女久久久久久不卡| 日韩电视剧在线观看免费网站| 亚洲午夜久久久久久久久| 日韩视频在线直播| 日韩一区和二区| 中文字幕欧美视频| 亚洲性视频在线| 日韩免费观看高清完整版| 欧美日韩一区二区区别是什么 | 国产伦精品一区二区三区| 性欧美8khd高清极品| 国产成人免费视频精品含羞草妖精| 91视频在线免费观看| 亚洲精品成人区在线观看| 丁香一区二区三区| 国产女主播一区二区三区| 天堂av在线免费| 久久综合丝袜日本网| 欧美日韩精品久久久免费观看| 黄色小视频在线免费观看| 国产欧美日韩亚州综合| 中文字幕中文字幕99| v天堂福利视频在线观看| 一个色在线综合| www.99热这里只有精品| 在线播放高清视频www| 欧洲一区二区三区在线| www.成年人| 一区二区三区四区高清视频| 亚洲高清久久久久久| 欧美亚一区二区三区| 日韩精品1区| 色综合视频网站| 国产成人无码精品亚洲| 日韩精品一二区| 国产原创欧美精品| 欧美特黄一级视频| 国产人妖乱国产精品人妖| 亚洲第一综合网站| 亚洲人成午夜免电影费观看| 欧美日韩国产三级| 稀缺呦国内精品呦| 精品国产成人| 欧美精品一区在线播放| 91精品国产综合久久久蜜臀九色 | 绯色av蜜臀vs少妇| 日韩mv欧美mv国产网站| 中文字幕亚洲天堂| 日本在线小视频| 蜜臀久久99精品久久久久久9 | 欧美激情第3页| 久久精品亚洲成在人线av网址| 亚洲香蕉成人av网站在线观看| 一区二区三区影视| 久久精品一区二区国产| 亚洲最大福利视频网| 国产在线黄色| 艳妇臀荡乳欲伦亚洲一区| 国产视频一区二区视频| 97视频一区| 日韩亚洲综合在线| 97人妻一区二区精品视频| 成人小视频在线观看| 亚洲一区二区在| 一本大道色婷婷在线| 精品乱人伦一区二区三区| 在线看片中文字幕| 国产精品嫩草99av在线| 99九九视频| 日韩伦理在线观看| 在线看不卡av| 国产精品伦子伦| 亚洲精品一区二区在线看| 国产成人a亚洲精品| 亚洲av成人精品一区二区三区在线播放 | 日韩一区欧美| 日韩美女中文字幕| 色婷婷综合视频| 亚洲精品高清在线观看| 天天综合天天添夜夜添狠狠添| 免费视频国产一区| 国产做受高潮69| 成人激情四射网| 亚洲精品va在线观看| 在线观看免费视频高清游戏推荐| 色棕色天天综合网| 欧美孕妇孕交黑巨大网站| 亚洲精品一级片| 一二三区精品视频| 国产精品91av| 亚洲天堂男人| 国产精品免费一区二区| 福利小视频在线| 欧美mv和日韩mv国产网站| a级片在线观看免费| 国产精品一区久久久久| 色哺乳xxxxhd奶水米仓惠香| 国产精品亚洲欧美一级在线| 美女久久久久久久| 999久久久久| 亚洲精品国产a久久久久久| 97超碰人人看| 欧美天堂亚洲电影院在线观看| 99国产视频| 国内小视频在线看| 日韩av在线不卡| 性无码专区无码| 久久久久久久久蜜桃| 999精品视频在线| 四虎8848精品成人免费网站| 成人国内精品久久久久一区| 粗大黑人巨茎大战欧美成人| 欧美成人伊人久久综合网| 日韩精品一卡二卡| 久久这里只有精品6| 美女网站免费观看视频| 99久久99久久精品国产片桃花| 91福利社在线观看| 精品少妇人妻一区二区黑料社区| 久久精品麻豆| 午夜免费电影一区在线观看| 国产人与zoxxxx另类91| 久久久久国色av免费观看性色| 手机看片福利在线| 在线亚洲一区观看| www.5588.com毛片| caoporn国产一区二区| 成年人免费大片| 91高清一区| 久久99精品久久久久久青青日本 | 成人在线高清视频| 日韩一区二区三区四区| av大片在线免费观看| 国产精品女同一区二区三区| 欧美xxxx黑人| 久久这里有精品15一区二区三区| 亚洲看片网站| 亚洲1区在线观看| 国产99久久精品一区二区永久免费| 中文日本在线观看| 亚洲成人久久一区| 在线亚洲欧美日韩| 五月婷婷欧美视频| 国产精品成人69xxx免费视频| 成人黄色大片在线观看| 中文字幕天天干| 日韩视频免费| 欧美日韩视频免费在线观看| 午夜a一级毛片亚洲欧洲| 91免费的视频在线播放| 中文字幕21页在线看| 欧美成人全部免费| 国产51人人成人人人人爽色哟哟| 日韩久久精品一区| 日批视频免费观看| 精品国产31久久久久久| 黄色录像二级片| 久久久99久久| 在线免费观看a级片| 国产麻豆精品95视频| 午夜视频在线瓜伦| 香蕉视频成人在线观看| av在线观看地址| 欧美国产精品| 中文字幕一区综合| 久久伦理在线| 日韩福利影院| 亚洲动漫在线观看| 国产99在线免费| 欧美特黄不卡| 国产日韩欧美中文| 国产极品久久久久久久久波多结野| 午夜精品三级视频福利| 99久久精品免费观看国产| 中文字幕欧美精品在线| 国产在线三区| 亚洲深夜福利在线| 色视频在线观看| 亚洲精品久久久一区二区三区| 99riav国产| 337p亚洲精品色噜噜狠狠| 中文字幕一区二区三区免费看| 一本色道**综合亚洲精品蜜桃冫| 一级片免费网址| 亚洲成av人片一区二区| 日韩精品成人在线| 精品久久久久久| 日本三级免费看| 亚洲第一搞黄网站| 五月天婷婷丁香| 亚洲第一久久影院| 成年人免费看毛片| 精品成人乱色一区二区| 伊人手机在线视频| 色综合久久88色综合天天6| 亚洲欧美精品一区二区三区| 日韩人体视频一二区| 国产婷婷色一区二区在线观看| 欧美日韩国产专区| 天天干天天干天天| 色天天综合色天天久久| 91黑人精品一区二区三区| 一本色道久久综合亚洲91| 一级黄色在线视频| 欧美性受xxxx黑人xyx| 中文字幕乱码无码人妻系列蜜桃| 欧美日韩亚洲综合在线| 国产三级精品在线观看| 欧美成人精品高清在线播放| 欧美一区二不卡视频| 日韩精品高清视频| 国产69久久| 久久的精品视频| 免费电影视频在线看| 91精品国产99久久久久久| 黑人巨大亚洲一区二区久 | 嫩草影院中文字幕| 亚洲区欧美区| 免费日韩中文字幕| 麻豆国产精品视频| 香蕉久久久久久av成人| 91天堂素人约啪| 国产传媒在线看| 亚洲精品国产一区二区精华液| 日韩成年人视频| 91成人在线观看喷潮| 国产熟女精品视频| 日韩av最新在线| 丝袜美腿美女被狂躁在线观看| 久久69精品久久久久久国产越南| 少妇视频一区| 国产在线高清精品| 欧美午夜18电影| 在线看无码的免费网站| 影音先锋中文字幕一区| 蜜桃免费在线视频| 成人午夜视频福利| av永久免费观看| 亚洲国产视频在线| 国产精品尤物视频| 精品国产1区2区3区| 国产高清免费av在线| 久久久久久中文字幕| 91亚洲视频| 国产专区一区二区| 久久久久免费av| 国产a级一级片| 国产最新精品精品你懂的| 亚洲第一页av| 亚洲精品免费在线观看| 日韩精品在线免费视频| 在线综合亚洲欧美在线视频| 日本不卡视频一区二区| 久久99精品视频一区97| 欧美free嫩15| 国产传媒一区二区三区| 香蕉视频国产精品| 99视频在线免费| 99免费精品视频| 男女性高潮免费网站| 欧美丝袜丝nylons| 欧美日韩免费做爰大片| 久久久久久久一| 国产欧美视频在线| 中文字幕剧情在线观看一区| 蘑菇福利视频一区播放| 亚洲国产精品第一页| 中文字幕日韩一区| 在线免费看av的网站| 亚洲偷熟乱区亚洲香蕉av| eeuss鲁一区二区三区| 91视频国产精品| 99国内精品久久久久久久| 丰满少妇在线观看| 久久众筹精品私拍模特| 国产精品午夜影院| 日韩av综合网站| 美女网站在线看| 精品国产一区二区三| 亚洲国产激情| 久久久久无码国产精品一区李宗瑞 | 成人免费观看网站| 欧美 日韩 国产精品免费观看| 亚洲欧美日韩精品一区| 国产精品私人影院| 中文字幕在线视频第一页| 在线看日韩欧美| 久久xxx视频| 亚洲欧美日韩国产成人综合一二三区 | 日韩欧美亚洲天堂| 成人av在线观| 99免费在线观看| 亚洲国产毛片完整版| 美女高潮在线观看| 欧美激情视频一区二区三区| 麻豆久久精品| 在线观看免费黄色网址| 欧美日韩一区小说| 福利在线视频网站| 91手机在线视频| 日韩视频二区| 波多野结衣片子| 欧美三级电影网站| 麻豆传媒视频在线观看| 亚洲影院色无极综合| 亚洲夜间福利| theav精尽人亡av| 日本高清免费不卡视频| 免费大片在线观看www| **亚洲第一综合导航网站| 亚洲人体大胆视频| 熟女少妇一区二区三区| 欧美色综合影院| av网站导航在线观看免费| 国产午夜精品一区| 久热精品在线| www欧美com| 亚洲国产高潮在线观看| 欧美色网一区| 亚洲美女自拍偷拍| 99re亚洲国产精品| 亚洲最大成人av| 欧美激情视频网| 国产中文精品久高清在线不| www.51色.com| 精品久久久久人成| 麻豆视频在线观看免费| 精品国产免费久久久久久尖叫| 久久综合九色综合欧美狠狠| 久久国产精品国语对白| 亚洲精品狠狠操| 日本亚洲欧洲无免费码在线| 日本国产中文字幕| 久久久五月婷婷| 精品人妻无码一区二区| 欧美在线观看网站| 亚洲影视一区二区三区| 国产精品无码一区二区三区免费| 欧美日韩1区2区| a欧美人片人妖| xxxxxx在线观看| 国产午夜亚洲精品不卡| 亚洲AV无码精品色毛片浪潮|