精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

人類創造的數據太貴了!開發者悄悄使用AI合成數據訓練模型

人工智能 新聞
人類數據快耗盡了,怎么訓練更高級的AI?很多公司,已經在悄悄使用AI合成的數據來訓練AI模型了。

現在,開發者都在悄悄使用AI生成的數據來訓練AI模型。

原因就是——人類創造的數據,實在是太貴了!

在以往,大多數AI模型都是靠人類的數據訓練的,但現在,越來越多的公司(包括OpenAI、微軟,以及Cohere這樣的初創公司)都開始使用這種AI生成的「合成數據」,或者在努力搞清如何使用AI生成的數據了。

雖然,這會讓整個AI生態系統變成一種自己吃自己的「貪吃蛇」,但是,人類自己創造的數據,實在是負擔不起了??!

互聯網上的人類數據快耗盡了

除了價格,另外還有一個原因,就是規模問題。

現在,互聯網上很多可用的人類數據都被薅干凈了,可是如果要構建更強大的模型,就需要更多數據。

去年11月,ChatGPT的推出引爆了大模型之戰,谷歌、微軟、Meta、Anthropic等大科技公司輪番下場,三不五時就更新一波新產品。

而像ChatGPT和Bard這樣的聊天機器人背后的LLM,主要就是通過抓取互聯網數據來訓練的,包括所有數字化書籍、新聞文章、博客、搜索查詢、Twitter和Reddit帖子、YouTube視頻、Flickr圖像等等。

但現在,生成式AI變得越來越復雜,即使是很多財力雄厚的大公司,也耗盡了易于訪問的高質量數據,來訓練AI模型。

與此同時,因為訓練AI所消耗的個人數據數量龐大,來源廣泛,他們也在不斷承受著全世界各地的監管機構、藝術家和媒體的抨擊。

大家早就在悄悄用了

開發者紛紛表示,來自網絡的通用數據,已經不足以推動人工智能模型的性能。

Cohere首席執行官Aiden Gomez在接受《金融時報》采訪時表示,如果能從網上獲取需要的所有數據,就太完美了。

然而可惜的是,互聯網上的信息如此嘈雜、混亂,以至于它們并不能代表開發者真正想要的數據。

圖片

其實,Cohere早就在悄悄用合成數據訓練LLM了,雖然這個消息還未被廣而告之。

而OpenAI之類的公司,也在做此打算。

在五月份于倫敦舉行的一次活動中,OpenAI CEO Sam Altman被問及是否擔心對ChatGPT隱私侵犯風險的監管調查。

Altman對此不以為意,云淡風輕地表示,很快所有的數據都會變成合成數據,他對此非常有信心。

合成數據潛力巨大

合成數據,似乎前途大好。

而微軟已經發表了一項研究,來論證合成數據如何加強基本的LLM。

論文地址:https://arxiv.org/pdf/2306.11644.pdf

如今,像GPT-4這類最前沿的模型,在寫作和編碼等領域的表現已經在接近人類,還能通過美國律詩考試等基準測試。

為了顯著提高性能,讓它們能夠應對科學、醫學或商業方面的挑戰,就需要使用獨特而復雜的數據集來訓練AI模型。

這些數據集要么需要由科學家、醫生、作家、演員或工程師等專家創建,要么需要作為專有數據,從制藥、銀行和零售商等大公司獲得。

然而,人類創造的數據集,價格太昂貴了。

如果使用合成數據,成本就會大大降低。

公司可以用AI模型來生成與醫療保健、金融欺詐等領域相關的文本、代碼或更復雜的信息,然后用這些合成數據來訓練高級LLM,讓它們性能更強。

Gomez透露,Cohere及其幾個競爭對手早就在使用合成數據,然后由人類進行微調和調整了?,F在很多地方都在大量采用合成數據了,盡管這個消息還沒有大量公開。

Gomez解釋道,比如為了訓練一個高等數學模型,Cohere就會讓兩個AI模型對話,一個充當導師,一個充當學生。

它倆會談論三角學,所有對話都是合成的、靠模型想象出來的。

然后人類會檢查這個對話,如果模型說錯了,人類就去糾正。

微軟最近的兩項研究表明,合成數據可以用來訓練比OpenAI的GPT-4或Google的PaLM-2這類先進模型更小、更簡單的模型。

一篇論文描述了由GPT-4生成的短篇小說的合成數據集,它只包含了四歲孩子能理解的單詞。

論文地址:https://arxiv.org/pdf/2305.07759.pdf

這個數據集被稱為TinyStories,它被用來訓練一個簡單的LLM,它會講出流利和語法正確的故事。

另一篇論文表明,人工智能可以以教科書和練習的形式進行合成Python代碼的訓練,這些代碼在編碼任務上表現得很好。

Scale AI和Gretel.ai等初創企業也如雨后春筍般涌現,它們提供的,就是合成數據即服務。

Gretel由來自NSA和CIA的前美國分析師成立,與谷歌、匯豐銀行、Riot Games和Illumina等公司合作,用合成數據訓練更好的AI模型。

根據Gretel CEO Ali Golshan的說法,合成數據關鍵就在于,它保留了數據集中的所有個人隱私,同時仍然保持了統計上的完整性。

并且,精心制作的合成數據還可以消除現有數據中的偏見和不平衡。

「對沖基金可以查看黑天鵝事件,還能創建一百種變體,看看我們的模型是否會失敗?!?/span>

對于銀行來說,欺詐通常占總數據的不到100%,而Gretel的軟件可以生成「數千個關于欺詐的邊緣案例場景,并用于訓練AI模型。

AI貪吃蛇,可行嗎?

當然,用AI「自產自銷」的貪吃蛇式數據,也存在著巨大的問題。

就算是在人類數據上訓練出來的AI,都會出現重大的事實性錯誤,更何況AI自己生成數據呢。

批評者指出,并非所有合成數據都會經過精心策劃,以反映或改進現實世界的數據。

隨著AI生成的文本和圖像開始充斥互聯網,人工智能公司很可能最終會使用由自己模型的原始版本產生的原始數據——這種現象被稱為「狗糧」。

斯坦福大學和萊斯大學的科學家發現,將人工智能生成的內容提供給人工智能模型,似乎會導致它們的輸出質量下降。

論文地址:https://arxiv.org/abs/2307.01850

這種類似貪吃蛇的自我消費,會打破模型的數字大腦。

萊斯大學和斯坦福團隊發現,將AI生成的內容喂給模型,只會導致性能下降。研究人員對此給出一種解釋,叫做「模型自噬障礙」(MAD)。

研究發現在使用AI數據,經過第5次迭代訓練后,模型就會患上MAD。

在合成數據上訓練AI模型會逐漸放大偽影

換句話說,如果不能給模型提供「新鮮的數據」,即由人類標注的數據,其輸出質量將會受到嚴重影響。

而牛津大學和劍橋大學的研究者也發表了論文,發出警告說,在自己的原始輸出上訓練人工智能模型,其中可能包含虛假或捏造,會隨著時間的推移,這些數據或許會破壞模型,導致「不可逆轉的缺陷」。

論文地址:https://arxiv.org/pdf/2305.17493v2.pdf

AI,你趕快學會自學吧

Golshan同意,如果用糟糕的合成數據進行訓練模型,可能會阻礙它們的進步。

「隨著互聯網上充斥著越來越多AI生成的內容,確實會導致模型退化,因為它們在產生反芻的知識,沒有產生任何新的見解?!?/span>

盡管存在這些風險,但Cohere的Gomez等AI研究人員仍然表示,合成數據有望加速通往超級智能AI系統的道路。

CEO Gomez這樣說道:你真正需要的,就是能夠自學的AI模型——自己提出問題,自己發現真理,自己創造知識,這就是人類的夢想。

網友展開激烈辯論

對此,多位網友發表了高見。

合成數據有以下好處—— 

?? 合成數據可以潛在地解決使用真實世界數據會產生的隱私問題。 

?? 針對特定需求創建的合成數據,可能具有更高的質量,從而產生更準確的AI模型。 

?? 訓練高級AI模型對數據的需求正在飆升。合成數據幾乎能無限供應,大大減少了數據赤字。

但是,AI訓練AI背后的目的至關重要: 

??如果我們的目標是創建幫助人類的人工智能模型,那么對人類生成的數據進行訓練可能更合適。這確保了人工智能的反應和行為與我們自己的反應和行為更加一致,并且與我們相關。 

??如果我們的目標是創建超級智能AI,那么合成數據可能是關鍵,它讓模型能夠從超出人類理解能力的模型中學習。 

??我們已經看到很多例子,人工智能從合成數據中自我學習導致結果質量下降。所以,現在的答案在于真實世界的合成數據和用于訓練的專家數據的平衡組合。可解釋性AI是解釋如何確定模型結果的絕對關鍵。

我的立場和其他人不同:我不認為在未來應該讓LLM生成數據并讓其他模型從中學習,我認為,必須在私有領域數據上進行進一步的模型訓練和調整,使公司能夠利用其敏感但獨特的數據,作為業務的核心差異化因素。 

正確的方法是,具有隱私保證的合成數據。

正如我們所說,「訓練模型是為了了解疾病,而不是了解患者」——這就是合成數據的承諾,我們是將自己的見解轉移到模型中,而無需分享我們的個人詳細信息。

1. 有些領域需要好的數據,而不是完美的數據,在這些地方合成數據將產生最大的影響。

2. 與此相關的是,質量將基于平均水平的范圍,而不是極端情況下的杰出結果。 

3. 如果技術人員設計的計算機制造數據被用于訓練AI,就會加劇系統中的偏見——其中大多數是認知偏見——即使只是無意中, 因此,與其考慮有風險的工作類別,更好的方法可能是考慮哪些工作是體面的、必要的,但它只需要達到一定的閾值標準,而不是100%。 

最后一點,很多人在討論人工智能與工業革命的相似之處。在股市場上,被動投資基金和ETF的興起也有很多相似之處,即現在大多數交易都是基于算法,而不是實際的人為干預完成的。

但這樣的系統本質上往往是被動的,并且很容易被操縱。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-06-13 11:18:08

合成數據AIML

2023-02-23 07:46:48

學習模型數據倉庫

2021-03-23 23:17:18

AI人工智能

2024-04-18 08:38:15

LLM數據訓練模型

2025-06-27 07:10:00

合成數據AI人工智能

2023-08-13 14:48:14

OpenAIAI模型

2023-02-22 09:37:14

AI模型

2025-06-04 09:15:16

2022-08-11 08:00:00

機器學習合成數據深度學習

2025-01-23 09:15:00

數據技術模型

2025-06-04 03:00:00

人工智能AI智能訓練

2024-07-08 10:51:16

2024-09-24 07:31:52

2024-07-05 11:34:07

2025-10-16 05:00:00

2017-04-01 18:00:08

開發者數據庫

2019-05-08 10:16:03

谷歌Android開發者

2024-01-23 18:53:04

PostgreSQL關系數據庫

2024-01-16 14:23:32

大數據人工智能AI

2019-08-16 10:55:37

開發者技能AI
點贊
收藏

51CTO技術棧公眾號

国产剧情在线| 日本中文字幕免费观看| 亚洲一区二区av| 亚洲欧美日本在线| 国产一级二级三级精品| 国产亚洲成人精品| 精品无人区麻豆乱码久久久| 日韩一区二区三区在线视频| 精品久久久久久无码国产| 国产乱色在线观看| 久久久久高清精品| 亚洲最大的成人网| 国产精品一区二区三区四| 国产精品成人a在线观看| 精品久久久久久久久久久久包黑料| av天堂永久资源网| 亚洲色图美国十次| 欧美国产日韩a欧美在线观看| www日韩av| 一区二区视频网| 午夜亚洲视频| 欧美国产精品日韩| 国产视频123区| 欧洲精品一区| 欧美大片在线观看一区二区| 亚洲精品手机在线观看| 性欧美gay| 福利微拍一区二区| 一区二区三区的久久的视频| 三级做a全过程在线观看| 国产成人午夜精品影院观看视频| 国产一区二中文字幕在线看| 波多野结衣黄色网址| 国产欧美亚洲一区| 久久久久久av| 乱h高h女3p含苞待放| 97精品国产| 伊人久久久久久久久久| 玖玖爱在线观看| 久久夜色电影| 欧美成人伊人久久综合网| 91日韩精品视频| 国产激情欧美| 欧美日韩一级黄| 91n.com在线观看| 三上悠亚亚洲一区| 在线观看国产日韩| 日韩无套无码精品| 欧美不卡高清一区二区三区| 色久综合一二码| 久久黄色免费看| 色老太综合网| 欧美视频一区二区三区四区| 美女网站视频黄色| www.成人在线视频| 欧美日韩视频在线第一区| 国产喷水theporn| 色婷婷成人网| 欧美精品久久久久久久久老牛影院| 91精品无人成人www| 欧美videos粗暴| 在线观看亚洲a| 免费一区二区三区在线观看| 伊人久久一区| 精品国产污网站| 艳妇乳肉豪妇荡乳xxx| 久久香蕉精品香蕉| 亚洲午夜小视频| 精品在线观看一区| 欧美国内亚洲| 97超视频免费观看| 日日夜夜狠狠操| 精品在线一区二区三区| 亚洲影院在线看| 污视频网站免费观看| 久久精品视频免费| 在线播放 亚洲| 国产精品一品| 欧洲一区在线电影| 中文国产在线观看| 日本亚洲不卡| 社区色欧美激情 | 欧美日韩人妻精品一区二区三区| 亚洲美女啪啪| 国产女精品视频网站免费| 国产高清视频免费观看| 99久久精品国产精品久久| 翔田千里亚洲一二三区| 七七久久电影网| 色香色香欲天天天影视综合网| www.com污| 亚洲三级网页| 欧美成人国产va精品日本一级| 久久国产视频播放| 久久99国产精品麻豆| 国内精品久久国产| 思思99re6国产在线播放| 亚洲成人在线免费| 天堂网在线免费观看| jizzjizzjizz欧美| 中文字幕无线精品亚洲乱码一区| 久草资源在线视频| 久久精品伊人| 9a蜜桃久久久久久免费| а√天堂中文在线资源bt在线 | 97在线观看视频免费| 狠狠88综合久久久久综合网| 国产精品久久久久久久久久久新郎| 亚洲成熟女性毛茸茸| 欧美激情一区二区三区在线| 久在线观看视频| 日韩中文在线| 日韩综合视频在线观看| 精品人妻一区二区三区潮喷在线| 风间由美性色一区二区三区| 一区二区视频在线免费| 北岛玲heyzo一区二区| 精品成人免费观看| 国产精品久久久精品四季影院| 日韩精品成人一区二区三区| 久久国产精品久久精品国产| 色帝国亚洲欧美在线| 欧美日韩电影在线播放| 无码国产69精品久久久久同性| 亚洲激情偷拍| 国产精品久久久久久久免费大片 | the porn av| 校园春色另类视频| 久久久午夜视频| 国产成年妇视频| 亚洲精品一二三| 亚洲无在线观看| 99久久综合| 国产精品自拍小视频| 国产三级视频在线| 一本大道久久精品懂色aⅴ| 成人区人妻精品一区二| 欧美日韩ab| 福利视频一区二区三区| 牛牛电影国产一区二区| 精品动漫一区二区三区在线观看| 日本天堂中文字幕| 国产精品 日产精品 欧美精品| 一区中文字幕在线观看| www.欧美视频| 美日韩在线视频| 性猛交富婆╳xxx乱大交天津 | www.亚洲一区| 国产又粗又猛又爽又黄的| 国产精品成人午夜| 一区二区免费av| 欧美在线三区| 高清国产在线一区| 92久久精品| 日韩精品极品视频| 无码日韩精品一区二区| 欧美国产欧美综合| 婷婷中文字幕在线观看| 欧美日韩蜜桃| 久久精品国产精品国产精品污| 奇米777日韩| 中文字幕自拍vr一区二区三区| 91超薄丝袜肉丝一区二区| 亚洲人xxxx| 催眠调教后宫乱淫校园| 欧美中文日韩| 影音先锋欧美资源| 日韩激情欧美| 欧美一级电影久久| aaa在线观看| 日韩片之四级片| 国产小视频在线免费观看| 国产欧美一区二区精品性色超碰| 午夜天堂在线视频| 亚洲精品国产日韩| 五码日韩精品一区二区三区视频| 国产一区二区三区免费观看在线 | 国产又粗又大又爽的视频| **爰片久久毛片| 日韩美女主播视频| 国产在线观看av| 日韩精品在线看| 6—12呦国产精品| 亚洲一区影音先锋| 日本二区在线观看| 国产精品911| 久久久噜噜噜www成人网| 亚洲第一偷拍| 麻豆av一区| 国产精品国产三级在线观看| 欧美一区二区影院| v片在线观看| 日韩激情第一页| 国产jzjzjz丝袜老师水多| 欧美午夜电影在线| 99久久99久久精品国产| 2欧美一区二区三区在线观看视频| 奇米视频7777| 久久aⅴ国产紧身牛仔裤| 黄色一级片av| 青青草国产免费一区二区下载| 国产精品伊人日日| 亚洲欧美专区| 日本电影亚洲天堂| 黑人精品视频| 久久国产精品久久久久| www在线免费观看| 亚洲精品456在线播放狼人| 国产乱子伦精品无码码专区| 日本电影亚洲天堂一区| 国产一级片播放| 日韩毛片高清在线播放| 在线免费看黄视频| 97超碰欧美中文字幕| 999热精品视频| 另类小说视频一区二区| 日本免费一级视频| 亚洲区欧美区| 国产玉足脚交久久欧美| 亚洲澳门在线| 一区二区三区观看| 日韩av片子| 日本精品一区二区三区不卡无字幕| 久久狠狠久久| 国产二区不卡| 人人九九精品视频| 成人精品久久av网站| 精品国产黄a∨片高清在线| 日韩女在线观看| 欧美色网一区| 青青青国产精品一区二区| 蜜桃在线视频| 国产91精品久久久久久| 97在线视频免费观看完整版| 久久人人爽人人| 黄色美女视频在线观看| 欧美黑人国产人伦爽爽爽| 91精品久久久久久粉嫩| 久久亚洲成人精品| 黄网页免费在线观看| 日韩资源在线观看| huan性巨大欧美| 自慰无码一区二区三区| 日本一区二区三区视频在线看| 成人妇女淫片aaaa视频| 久草综合在线| 国产日韩精品视频| 日韩五码电影| 成人情趣片在线观看免费| 精品九九久久| 亚洲综合大片69999| 一区二区精彩视频| 国产精品国产三级国产专区53| 国产一区二区三区亚洲| 久久精品一二三区| 国产日韩视频在线| 亚洲永久一区二区三区在线| 91精品国产自产拍在线观看蜜 | 成年女人的天堂在线| 色噜噜国产精品视频一区二区| 高潮毛片在线观看| 色综合老司机第九色激情 | 亚洲成人你懂的| 特级做a爱片免费69| 日本精品一区二区三区高清| 亚洲精品91天天久久人人| 欧美日韩成人一区| 亚洲爆乳无码一区二区三区| 亚洲精品成人久久| 国产视频三级在线观看播放| 久久资源免费视频| 1区2区3区在线| 国产成人在线播放| 国产免费av国片精品草莓男男 | 大片网站久久| 男人c女人视频| 欧美一级二区| 亚洲男人天堂av在线| 成人中文字幕电影| 亚洲熟妇一区二区三区| 中文字幕中文字幕在线一区 | 超碰超碰人人人人精品| 国产日韩在线看| 国产亚洲精品美女久久| 亚洲图色在线| 99热精品在线| 精品综合久久久久| 99久免费精品视频在线观看| 成人精品一二三区| 姬川优奈aav一区二区| 在线观看黄色网| 日韩成人在线播放| 黄色小网站在线观看| 2019精品视频| 精品国产第一国产综合精品| 欧美大香线蕉线伊人久久国产精品| 久久高清精品| 国产白丝袜美女久久久久| 国内精品第一页| 欧洲av一区二区三区| 亚洲成人第一页| 91九色蝌蚪91por成人| 亚洲精品国产精品自产a区红杏吧| 麻豆影视国产在线观看| 欧美制服第一页| 最新国产一区二区| 亚洲一区二区三区精品视频| 久久aⅴ乱码一区二区三区| 91成人在线观看喷潮蘑菇| 1024国产精品| 进去里视频在线观看| 国产视频精品一区二区三区| 丁香高清在线观看完整电影视频 | 久久精品影视| www亚洲成人| 久久久精品国产免大香伊| 国产极品在线播放| 在线成人高清不卡| 国产污视频在线| 亲爱的老师9免费观看全集电视剧| 成人看片爽爽爽| 今天免费高清在线观看国语| 另类欧美日韩国产在线| 成人国产精品久久久网站| 欧美日韩加勒比精品一区| 可以免费看毛片的网站| 久久国产精品久久久久久| 亚洲毛片在线免费| 亚洲免费久久| 麻豆一区二区三| 亚洲精品视频网址| 91久久线看在观草草青青| 久青草国产在线| 国产99久久精品一区二区| 欧美猛男男男激情videos| 99色精品视频| 久久蜜桃av一区二区天堂| 91玉足脚交嫩脚丫在线播放| 日韩精品在线免费播放| 亚洲啊v在线| 欧美性xxxx69| 日韩中文字幕亚洲一区二区va在线| 国精产品一区一区三区免费视频| 一区二区三区色| 亚洲精品成av人片天堂无码| 欧美精品国产精品日韩精品| 国产图片一区| www.亚洲天堂网| 久久九九全国免费| 国产精品成人久久久| 日日狠狠久久偷偷四色综合免费 | 噜噜噜噜噜久久久久久91| 亚洲一区日韩| 51妺嘿嘿午夜福利| 欧美熟乱第一页| 国产区在线观看| 国产伦视频一区二区三区| 一区二区三区国产盗摄| 免费观看av网站| 欧美日韩在线综合| 99久久精品免费观看国产| 99在线视频首页| 亚洲视频二区| 国产精品视频在| 日韩一二三区视频| 性xxxxfreexxxxx欧美丶| 婷婷五月色综合| 高清国产午夜精品久久久久久| 亚洲精品国产精品乱码| 伊人一区二区三区久久精品 | 麻豆一区二区99久久久久| 欧美日韩大片在线观看| 国产视频久久久久| 亚洲一区二区小说| 成人毛片一区二区| 亚洲国产精品t66y| 亚洲AV无码成人片在线观看| 欧美在线一级va免费观看| 99成人在线视频| 久久久老熟女一区二区三区91| 在线观看日产精品| 久草在线新免费首页资源站| 欧美尤物一区| 国产精品一区在线| 99久久久久久久久| 久久成人精品视频| 蜜桃精品wwwmitaows| 91看片破解版| 欧美性猛交xxxx免费看漫画| 国产福利视频在线观看| 蜜桃av色综合| 国产精品自在欧美一区| 麻豆精品久久久久久久99蜜桃| 九九精品视频在线| 欧美中文一区二区| 女性生殖扒开酷刑vk| 在线成人av网站| 666av成人影院在线观看| 国产免费黄色一级片| 国产精品久久久久久久午夜片|