精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI曾轉(zhuǎn)錄100萬小時(shí)視頻數(shù)據(jù),訓(xùn)練GPT-4 精華

發(fā)布于 2024-4-9 13:06
瀏覽
0收藏

4月7日,紐約時(shí)報(bào)在官網(wǎng)發(fā)布了一篇名為《科技巨頭如何挖空心思,為AI收集數(shù)據(jù)》的技術(shù)文章。


紐約時(shí)報(bào)表示,OpenAI曾在2021年幾乎消耗盡了互聯(lián)網(wǎng)有用的文本數(shù)據(jù)源。為了緩解訓(xùn)練數(shù)據(jù)短缺的難題,便開發(fā)了知名開源語音識(shí)別模型Whisper。


隨后在OpenAI副總裁Greg Brockman的帶領(lǐng)下,從視頻平臺(tái)YT、有聲播客/讀物等轉(zhuǎn)錄了超過100萬小時(shí)的視頻數(shù)據(jù),然后轉(zhuǎn)化成文本數(shù)據(jù)用于訓(xùn)練GPT-4


雖然這一舉措游走在法律的邊緣處于灰色地帶,但也直接反映出了大模型廠商對(duì)于訓(xùn)練數(shù)據(jù)的饑渴程度。

OpenAI曾轉(zhuǎn)錄100萬小時(shí)視頻數(shù)據(jù),訓(xùn)練GPT-4-AI.x社區(qū)

紐約時(shí)報(bào)指出,不只是OpenAI,谷歌、Meta等科技巨頭因?yàn)橄胨鸭哔|(zhì)量訓(xùn)練數(shù)據(jù)而修改隱私數(shù)據(jù)條款,來避免版權(quán)法的制裁


例如,Meta為了追趕OpenAI、微軟,使用了互聯(lián)網(wǎng)上幾乎所有公開的英語書籍、散文、詩歌和新聞文章等內(nèi)容。


甚至想直接買下一家大型出版社,來獲取更高質(zhì)量的有版權(quán)、付費(fèi)數(shù)據(jù)。不過沒有人敢輕易相信Meta的數(shù)據(jù)隱私條例。


這是因?yàn)?018年的“劍橋分析丑聞”讓Meta的信譽(yù)陷入低谷(那時(shí)的名字是Facebook)。

該事件是,一家英國劍橋分析公司通過一款心理測試程序,非法獲取了大約8700萬Facebook用戶的個(gè)人隱私數(shù)據(jù),包括未經(jīng)用戶明確同意的信息。

OpenAI曾轉(zhuǎn)錄100萬小時(shí)視頻數(shù)據(jù),訓(xùn)練GPT-4-AI.x社區(qū)

用戶在參與測試時(shí),不僅自己的數(shù)據(jù)被收集,就連Facebook好友的信息也被抓取。該丑聞爆發(fā)后,F(xiàn)acebook面臨了前所未有的審查,該公司的數(shù)據(jù)隱私政策和管理不當(dāng)受到嚴(yán)重處罰。


最后,以扎克伯格出面道歉、參加聽證會(huì)才收?qǐng)觥?/p>


高質(zhì)量數(shù)據(jù),是生成式AI領(lǐng)域的“黃金”


當(dāng)你向ChatGPT、Gemini、Claude等提問獲得文本答案時(shí),心里是否會(huì)想過,這種內(nèi)容的寫法好像在哪里見過?


居然可以輕松寫出古龍、金庸、莫言、莎士比亞、泰戈?duì)枴⒔娲堉椤⑾哪渴葒鴥?nèi)外知名作家風(fēng)格的內(nèi)容。


沒錯(cuò),大模型最擅長的便是抄襲然后二次創(chuàng)新,但整體框架、敘述方法還是以模仿為基石

如果只用一句大白話來解釋大模型的原理——通過海量預(yù)訓(xùn)練數(shù)據(jù)讓大模型學(xué)會(huì)人類的寫作技巧和習(xí)慣(視頻、音頻、圖片架構(gòu)會(huì)更復(fù)雜一些,但基本同理),然后進(jìn)行排列組合、預(yù)測生成全新的內(nèi)容(大模型的文本提示,相當(dāng)于搜索引擎的關(guān)鍵字)。


所以,相比幾千億甚至上萬億的參數(shù),在架構(gòu)、算法差不多的情況下,訓(xùn)練數(shù)據(jù)對(duì)于大模型更重要。微軟、Stability AI發(fā)布的Orca 2、Stable LM 2等模型也充分證明了——通過高質(zhì)量數(shù)據(jù)訓(xùn)練的小參數(shù)模型,性能可以強(qiáng)過大參數(shù)模型


就像上面的作家舉例一樣,A廠商的模型學(xué)習(xí)了夏目漱石的寫作數(shù)據(jù),而B沒有,兩家又都是基于Transformer架構(gòu),明顯A的寫作能力要大于B。


也可以把訓(xùn)練數(shù)據(jù)看成“內(nèi)功心法”,當(dāng)兩位劍客的招式幾乎差不多時(shí),在關(guān)鍵時(shí)刻比拼的就是誰的內(nèi)功高,誰便能技高一籌。


此外,為了獲取高質(zhì)量數(shù)據(jù),2023年7月5日,谷歌 修改了數(shù)據(jù)隱私條款,將會(huì)抓取用戶公開或來自其他公共來源的數(shù)據(jù),用于訓(xùn)練Gemini(當(dāng)時(shí)用名Bard)、谷歌翻譯和云AI等產(chǎn)品。

OpenAI曾轉(zhuǎn)錄100萬小時(shí)視頻數(shù)據(jù),訓(xùn)練GPT-4-AI.x社區(qū)

但好景不長,在公布消息的15天后,谷歌就接到了美國克拉克森律師事務(wù)所的起訴。在這份長達(dá)90頁的訴訟書中,指控谷歌從網(wǎng)絡(luò)秘密竊取大量數(shù)據(jù)來訓(xùn)練其AI產(chǎn)品。指控其疏忽、侵犯隱私、盜竊、侵犯版權(quán)以及從非法獲取的個(gè)人數(shù)據(jù)中獲利。


谷歌為了獲取高質(zhì)量數(shù)據(jù)鋌而走險(xiǎn),可見數(shù)據(jù)對(duì)于大模型的重要性。


合成數(shù)據(jù)正成為主流

?

4月2日,華爾街日?qǐng)?bào)在官網(wǎng)發(fā)布了一篇名為《對(duì)于大量消耗數(shù)據(jù)的AI企業(yè)來說,互聯(lián)網(wǎng)太小了》的內(nèi)容。


華爾街日?qǐng)?bào)指出,對(duì)于大模型廠商來說互聯(lián)網(wǎng)那點(diǎn)數(shù)據(jù),就像一口被挖干的油井根本不夠用


尤其是對(duì)于訓(xùn)練視頻、音頻、圖像這些比文本更復(fù)雜的模型,就像一個(gè)“數(shù)據(jù)黑洞”可以無限吸收各種數(shù)據(jù)。

OpenAI曾轉(zhuǎn)錄100萬小時(shí)視頻數(shù)據(jù),訓(xùn)練GPT-4-AI.x社區(qū)

但常在河邊走哪有不濕鞋的事,各家科技巨頭當(dāng)然也清楚,游走在灰色地帶只是無奈之舉。所以,他們想了一個(gè)新辦法使用合成數(shù)據(jù)。


合成數(shù)據(jù)是通過算法、機(jī)器學(xué)習(xí)模型自動(dòng)合成的“虛擬數(shù)據(jù)”,以模擬真實(shí)世界數(shù)據(jù)的統(tǒng)計(jì)特性。基本上也是以模仿為主,但在法律和應(yīng)用場景等方面有很多優(yōu)勢


良好的隱私保護(hù),合成數(shù)據(jù)可以在不暴露個(gè)人或敏感信息的情況下生成數(shù)據(jù),這對(duì)于遵守GDPR或HIPAA等隱私法規(guī)非常重要。


無限數(shù)據(jù)源,理論上,可以生成無限量的合成數(shù)據(jù),這對(duì)于需要大量數(shù)據(jù)但現(xiàn)實(shí)世界數(shù)據(jù)不足以支持的場景非常有用。


控制數(shù)據(jù)分布,可以精確控制合成數(shù)據(jù)的分布,能定制數(shù)據(jù)以探索特定的情況或增強(qiáng)模型在特定任務(wù)上的性能。


成本低,收集和標(biāo)注大量真實(shí)世界數(shù)據(jù)比較貴,而生成合成數(shù)據(jù)的成本通常較低,主要由AI自動(dòng)完成。


但合成數(shù)據(jù)也并非完美無缺,最致命的缺點(diǎn)便是過度擬合:如果合成數(shù)據(jù)過于簡化或未能捕捉到真實(shí)數(shù)據(jù)的關(guān)鍵特征、表示,用于訓(xùn)練AI模型可能會(huì)過度擬合輸出的內(nèi)容同質(zhì)化且繁重?zé)o用。


在合成數(shù)據(jù)應(yīng)用方面,OpenAI在今年2月15日重磅發(fā)布的視頻模型Sora,很多技術(shù)大咖就分析,Sora能生成如此高清的視頻和時(shí)長,可能使用了虛幻引擎5生成的合成數(shù)據(jù)。


事實(shí)上,根據(jù)內(nèi)測用戶發(fā)布Sora生成的視頻,然后與虛幻引擎5的示例視頻進(jìn)行了多維度對(duì)比,大概率是使用了合成的視頻數(shù)據(jù)來訓(xùn)練Sora。


所以,使用合成數(shù)據(jù)訓(xùn)練AI模型,將成為未來主要趨勢之一。


本文轉(zhuǎn)自  AIGC開放社區(qū) ,作者: AIGC開放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/D7eEvw4TRTBo97Belx-6DQ??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
欧美亚洲三区| 亚洲视频分类| 午夜成人在线视频| 蜜桃麻豆91| 中文字字幕在线观看| 中文字幕日韩一区二区不卡| 亚洲成色777777在线观看影院| 波多野结衣乳巨码无在线| 成人影院免费观看| 精品一区二区三区在线观看国产 | 91麻豆视频网站| 欧美日韩第一页| 欧美成人午夜精品免费| 亚洲热av色在线播放| 亚洲成av人片一区二区梦乃| 日日噜噜噜噜夜夜爽亚洲精品| 国产黄色大片网站| 老司机免费视频久久| 久久69精品久久久久久国产越南| 毛片网站免费观看| 亚洲五码在线| 欧美少妇一区二区| 久久久久久久久久网| 欧美性videos| 久久久久久一级片| 国产91精品入口17c| 五月天综合激情网| 欧美日本一区二区高清播放视频| 国产性猛交xxxx免费看久久| 无码人妻一区二区三区免费n鬼沢| 国产在线|日韩| 午夜精品免费在线| 黄色网址在线免费看| 二人午夜免费观看在线视频| 94色蜜桃网一区二区三区| 91久久精品www人人做人人爽| 天天综合久久综合| 国产欧美69| 国内免费久久久久久久久久久| 免费精品在线视频| 欧美男同视频网| 日韩av中文字幕在线播放| 日韩成人av影院| 久久免费精品| 91精品国产综合久久精品app| 日本888xxxx| 中文字幕影音在线| 亚洲成av人片一区二区梦乃| 日本香蕉视频在线观看| а√天堂8资源在线官网| 国产精品久久久一本精品| 日韩国产精品一区二区| 欧美挠脚心网站| 久久久国产午夜精品| 欧美亚洲精品日韩| 黄色电影免费在线看| 国产欧美日韩视频在线观看| 日本一区二区三区视频在线观看| 毛片在线播放网站| 久久综合色播五月| 欧美日韩在线一二三| 免费观看成年在线视频网站| 国产亚洲综合在线| 天堂社区 天堂综合网 天堂资源最新版| 欧美精品a∨在线观看不卡| av不卡在线观看| 久久久久九九九| 国产免费a∨片在线观看不卡| 国产精品网站一区| 一区二区三区的久久的视频| 精品国产丝袜高跟鞋| 伊人色综合久久天天人手人婷| 97久久国产亚洲精品超碰热| 波多野结衣在线高清| 欧美视频专区一二在线观看| 国产xxxxx在线观看| 久久91导航| 欧美久久久久久久久| www.四虎精品| 午夜欧洲一区| 日韩中文字幕第一页| 欧美特级一级片| 亚洲人体大胆视频| 日产精品99久久久久久| 在线观看亚洲一区二区| 国产精品66部| 欧美另类高清视频在线| 免费在线观看av片| 亚洲成人av中文| 免费看污污网站| 奇米一区二区| 亚洲欧美中文字幕| 在线观看亚洲网站| 中日韩男男gay无套| 国产精品高清在线观看| www黄色网址| 久久久久国产精品人| 超碰在线免费观看97| sm捆绑调教国产免费网站在线观看 | 国产在线乱码一区二区三区| 亚洲综合小说区| 三级国产在线观看| 亚洲摸摸操操av| 日本三级免费观看| 日韩成人综合网| 精品福利av导航| 91导航在线观看| 亚洲三级免费| 成人性生交大片免费看小说 | 爱情电影网av一区二区| 亚洲国产天堂网精品网站| 欧美日韩国产一二三区| 亚洲毛片视频| 91香蕉电影院| 国产粉嫩一区二区三区在线观看| 亚洲影视资源网| 一路向西2在线观看| 偷窥自拍亚洲色图精选| 美日韩精品免费视频| 国产一级一级国产| 成人黄色小视频在线观看| 不卡中文字幕在线| 日韩三区免费| 亚洲男人天堂网| 久久精品视频久久| 国产乱妇无码大片在线观看| 色综合电影网| 欧洲av不卡| 日韩电影大全免费观看2023年上| 激情五月少妇a| 韩国成人精品a∨在线观看| 欧美性xxxx69| 亚洲精品福利电影| 日韩精品中文字幕有码专区| 日韩成人免费在线观看| 国产成人精品一区二| 中国成人在线视频| 欧美aaaaaa| 中文字幕亚洲一区| 一区二区乱子伦在线播放| 久久综合色婷婷| 国产日产欧美视频| 秋霞影院一区二区三区| 国语自产精品视频在线看一大j8| 亚洲AV无码精品国产| 亚洲精品视频免费观看| 一级黄色大片儿| 亚洲精品国产偷自在线观看| 成人精品一区二区三区电影免费 | 孩娇小videos精品| 国内精品久久久久久99蜜桃| 国产不卡av在线| 国产中文在线视频| 欧美性大战久久| 貂蝉被到爽流白浆在线观看| 美女视频黄久久| 一区二区视频在线观看| 北岛玲精品视频在线观看| 日韩中文字幕av| 国产精品一区二区黑人巨大| 亚洲天堂免费看| 国产精品二区视频| 亚洲欧洲一级| 欧美激情第一页在线观看| 九九热线视频只有这里最精品| 一个人看的www久久| 夜夜狠狠擅视频| 亚洲欧美电影一区二区| 日本天堂在线播放| 亚洲一区不卡| 视频一区视频二区视频三区高| 欧美国产视频| 欧美—级a级欧美特级ar全黄| 天天爽夜夜爽夜夜爽| 91黄视频在线观看| 日韩精品久久久久久久的张开腿让| 精品午夜久久福利影院| www.avtt| 国产一区三区在线播放| 91精品免费久久久久久久久| 欧美人与性动交α欧美精品济南到 | 欧美人与动牲交xxxxbbbb| 怡红院在线播放| 亚洲大尺度美女在线| 波多野结衣av无码| 亚洲精品高清在线观看| 久久国产精品无码一级毛片| 青青国产91久久久久久| 精品人妻大屁股白浆无码| 特黄特色欧美大片| 国产一区私人高清影院| gratisvideos另类灌满| 在线激情影院一区| 欧美一级一区二区三区| 欧美日韩一区二区三区不卡| 黄色在线观看免费| 国产精品网站在线播放| 国产精品一区二区人妻喷水| 久久66热偷产精品| 鲁一鲁一鲁一鲁一色| 亚洲大全视频| 日韩欧美精品一区二区| 国产乱人伦丫前精品视频| 国产精品免费网站| av漫画网站在线观看| 日韩在线播放av| 黄色视屏网站在线免费观看| 精品国产一二三| 91精品国产乱码久久| 欧美视频一二三| 国产无遮挡裸体免费视频| 国产精品久久99| 中文字幕在线看高清电影| 蓝色福利精品导航| 日韩av片在线看| 国产综合视频| 黄色a级在线观看| av一区二区在线观看| 精品视频一区二区| 日本精品国产| 91沈先生在线观看| 成人黄色在线| 国产精品极品美女粉嫩高清在线| 理论片午夜视频在线观看| 久久999免费视频| 里番在线观看网站| 中文字幕在线观看日韩| 日本不卡免费播放| 亚洲激情在线观看视频免费| 午夜精品久久久久久久99老熟妇| 欧美精品日韩一区| 中文字幕在线播出| 欧美系列亚洲系列| 人人妻人人爽人人澡人人精品| 精品久久久久久久中文字幕| 四虎永久在线精品| 亚洲第一激情av| 久久婷婷一区二区| 亚洲一区二区3| 久久99久久98精品免观看软件 | 区一区二在线观看| 欧美日韩国产中文字幕| 国产精品第9页| 欧美日韩国产精品| 国产精品视频123| 色婷婷亚洲一区二区三区| 国产又大又黄又粗| 色妹子一区二区| 进去里视频在线观看| 欧美三级蜜桃2在线观看| 国产偷人爽久久久久久老妇app| 91传媒视频在线播放| 免费一级a毛片| 欧美日本韩国一区二区三区视频 | 中文字幕精品一区日韩| 久久精品欧美一区| 日本成人在线不卡| 亚洲国产91| 国产亚洲精品网站| 日本在线不卡一区| 欧美一级特黄aaa| 国产mv日韩mv欧美| 亚洲の无码国产の无码步美| 91亚洲国产成人精品一区二三 | 日本高清不卡的在线| 欧美色片在线观看| 成人中文字幕+乱码+中文字幕| 日本高清精品| 久久五月天婷婷| 久久伦理在线| 国产美女主播在线| 久久国产福利| 91插插插影院| 北条麻妃一区二区三区| 国产三级av在线播放| 中文字幕一区二区三区精华液| 可以直接看的黄色网址| 精品国产老师黑色丝袜高跟鞋| 天天综合久久综合| 日韩三级免费观看| 日韩福利一区二区| 中文亚洲视频在线| 新版中文在线官网| 欧亚精品在线观看| 91成人在线网站| 精品乱码一区二区三区| 999精品一区| 国产在线播放观看| 麻豆精品一区二区av白丝在线| av地址在线观看| 国产亚洲精品免费| 青青草手机视频在线观看| 色一区在线观看| 国产成人三级一区二区在线观看一| 亚洲精品小视频| 国产淫片在线观看| 日本国产精品视频| 精品视频91| 天堂精品一区二区三区| 亚洲欧洲一区二区天堂久久| 91看片在线免费观看| 99久久亚洲一区二区三区青草| 大吊一区二区三区| 五月天欧美精品| 国产精品久久影视| 亚洲欧美综合区自拍另类| 性欧美ⅴideo另类hd| 国产伦精品免费视频| 欧美成人一区在线观看| 亚洲天堂第一区| 青青草国产精品97视觉盛宴| 岛国精品资源网站| 亚洲欧美色图小说| 成人黄色免费网| 亚洲美女喷白浆| 九色porny丨首页入口在线| 亚洲999一在线观看www| 色天天综合网| 国产一区二区在线免费播放| 91在线丨porny丨国产| 国产亚洲第一页| 日韩一区二区三区高清免费看看| 日韩伦理在线电影| 欧美一区二区三区精品电影| eeuss国产一区二区三区四区| 国产对白在线播放| 美日韩一区二区| 娇妻被老王脔到高潮失禁视频| 日韩欧美在线免费| 天堂а√在线8种子蜜桃视频| 欧美精品18videosex性欧美| 无人区乱码一区二区三区| 992tv成人免费观看| 久久国产三级精品| 久久精品国产亚洲AV成人婷婷| 日本福利一区二区| 韩国中文免费在线视频| 热久久免费视频精品| 亚洲裸色大胆大尺寸艺术写真| 激情深爱综合网| 99久久精品国产观看| 伊人久久综合视频| 亚洲黄色www| 成人三级高清视频在线看| 国产福利一区二区三区在线观看| 午夜天堂精品久久久久| 亚洲少妇一区二区| 亚洲一级不卡视频| 人人妻人人澡人人爽久久av| 国内精品久久久久久| 国产精品香蕉| 免费成人在线视频网站| 久久奇米777| 波多野结衣电车| 久久精品最新地址| 欧美影院在线| 黄色一级视频片| 欧美激情中文不卡| 国产精品无码在线播放 | 日韩a级片在线观看| 欧美变态凌虐bdsm| 国产在线天堂www网在线观看| 鲁鲁狠狠狠7777一区二区| 日韩福利电影在线观看| 国精品人伦一区二区三区蜜桃| 日韩一区二区三区免费看 | 亚洲精品欧美日韩| 欧美日韩视频| 一本加勒比北条麻妃| 欧美日韩日日骚| 国精一区二区三区| 你懂的视频在线一区二区| 另类中文字幕网| 久久精品无码人妻| 国产一级揄自揄精品视频| 国产aa精品| 男人靠女人免费视频网站| 国产精品婷婷午夜在线观看| 亚洲av无码乱码国产精品| 欧美中文在线免费| 91久久夜色精品国产按摩| 日本道中文字幕| 欧美色老头old∨ideo| 蜜桃成人365av| 日本精品一区二区| 国产精品99久久久| 亚洲熟妇无码乱子av电影| 久久亚洲影音av资源网 | 亚洲s码欧洲m码国产av| 日韩中文在线中文网三级| 男人的天堂久久| 一区二区在线免费看| 午夜激情久久久| 欧美激情午夜| 免费中文日韩| 成人一区二区三区视频| 中文在线最新版天堂| 国模私拍视频一区| 91亚洲国产成人久久精品| 亚洲AV无码国产精品|