精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT要把數(shù)據(jù)標(biāo)注行業(yè)干掉了?比人便宜20倍,而且還更準(zhǔn)

人工智能 新聞
而且用的還是舊版本,GPT-4 都還沒出手。

沒想到,AI 進(jìn)化之后淘汰掉的第一批人,就是幫 AI 訓(xùn)練的人。

很多 NLP 應(yīng)用程序需要為各種任務(wù)手動進(jìn)行大量數(shù)據(jù)注釋,特別是訓(xùn)練分類器或評估無監(jiān)督模型的性能。根據(jù)規(guī)模和復(fù)雜程度,這些任務(wù)可能由眾包工作者在 MTurk 等平臺上以及訓(xùn)練有素的標(biāo)注人(如研究助理)執(zhí)行。

我們知道,語言大模型(LLM)在規(guī)模到達(dá)一定程度之后可以「涌現(xiàn)」—— 即獲得此前無法預(yù)料的新能力。作為推動 AI 新一輪爆發(fā)的大模型,ChatGPT 在很多任務(wù)上的能力也超出了人們的預(yù)期,其中就包括給數(shù)據(jù)集做標(biāo)注這種自己訓(xùn)練自己的工作。

近日,來自蘇黎世大學(xué)的研究者證明了 ChatGPT 在多項(xiàng)注釋任務(wù)(包括相關(guān)性、立場、主題和框架檢測)上優(yōu)于眾包工作平臺和人類工作助理。

此外,研究人員還做了計(jì)算:ChatGPT 的每條注釋成本不到 0.003 美元 —— 大約比 MTurk 便宜 20 倍。這些結(jié)果顯示了大型語言模型在大幅提高文本分類效率方面的潛力。

圖片

論文鏈接:?https://arxiv.org/abs/2303.15056?

研究細(xì)節(jié)

許多 NLP 應(yīng)用程序需要高質(zhì)量的標(biāo)注數(shù)據(jù),特別是用于訓(xùn)練分類器或評估無監(jiān)督模型的性能。例如,研究人員有時(shí)需要過濾嘈雜的社交媒體數(shù)據(jù)以獲得相關(guān)性,將文本分配給不同的主題或概念類別,或者衡量他們的情緒立場。無論用于這些任務(wù)的具體方法是什么(監(jiān)督、半監(jiān)督或無監(jiān)督學(xué)習(xí)),都需要準(zhǔn)確地標(biāo)注數(shù)據(jù)來構(gòu)建訓(xùn)練集,或用其作為評估性能的黃金標(biāo)準(zhǔn)。

對此,人們通常的處理方式是招募研究助理,或者使用 MTurk 這樣的眾包平臺。OpenAI 在打造 ChatGPT 時(shí),也將負(fù)面內(nèi)容問題分包給了肯尼亞的數(shù)據(jù)標(biāo)注機(jī)構(gòu),進(jìn)行了大量標(biāo)注訓(xùn)練才敢正式上線。

由瑞士蘇黎世大學(xué)提交的這篇報(bào)告探討了大語言模型(LLM)在文本標(biāo)注任務(wù)中的潛力,并重點(diǎn)關(guān)注了 2022 年 11 月發(fā)布的 ChatGPT。它證明了零樣本(即沒有任何額外訓(xùn)練)ChatGPT 在分類任務(wù)上優(yōu)于 MTurk 標(biāo)注 ,而成本僅需人工的幾十分之一。

研究人員使用了之前的研究收集的 2382 條推文樣本。這些推文由訓(xùn)練有素的注釋者(研究助理)標(biāo)記為五種不同的任務(wù):相關(guān)性、立場、主題和兩種框架檢測。實(shí)驗(yàn)中,研究者將任務(wù)作為零樣本分類提交給 ChatGPT,并同時(shí)給 MTurk 上的眾包工作者,然后根據(jù)兩個(gè)基準(zhǔn)評估了 ChatGPT 的性能:相對于眾包平臺上人類工作者的準(zhǔn)確性,以及相對于研究助理注釋者的準(zhǔn)確性。

結(jié)果發(fā)現(xiàn),在五分之四的任務(wù)上,ChatGPT 的零樣本準(zhǔn)確率高于 MTurk。對于所有任務(wù),ChatGPT 的編碼器協(xié)議都超過了 MTurk 和訓(xùn)練有素的注釋者。此外在成本上,ChatGPT 比 MTurk 便宜得多:五個(gè)分類任務(wù)在 ChatGPT(25264 個(gè)注釋)上的成本約為 68 美元,在 MTurk(12632 個(gè)注釋)上的成本約為 657 美元。

這么一算,ChatGPT 的每條注釋成本約為 0.003 美元,即三分之一美分 —— 比 MTurk 便宜約 20 倍,而且質(zhì)量更高。鑒于此,我們現(xiàn)在已有可能對更多樣本進(jìn)行注釋,或者為監(jiān)督學(xué)習(xí)創(chuàng)建大型訓(xùn)練集。根據(jù)現(xiàn)有的測試,10 萬個(gè)注釋的成本約為 300 美元。

研究人員表示,雖然需要進(jìn)一步研究以更好地了解 ChatGPT 和其他 LLM 如何在更廣泛的環(huán)境中發(fā)揮作用,但這些結(jié)果表明它們有可能改變研究人員進(jìn)行數(shù)據(jù)注釋的方式,并破壞 MTurk 等平臺的部分業(yè)務(wù)模型。

實(shí)驗(yàn)過程

研究人員使用了包含 2382 條推文的數(shù)據(jù)集,這些推文是之前針對內(nèi)容審核相關(guān)任務(wù)的研究手動注釋的。具體來說,訓(xùn)練有素的注釋者(研究助理)為五個(gè)具有不同類別數(shù)量的概念類別構(gòu)建了黃金標(biāo)準(zhǔn):推文與內(nèi)容審核問題的相關(guān)性(相關(guān) / 不相關(guān));關(guān)于第 230 條(美國 1996 年《通信規(guī)范法》的一部分)的立場,這是美國互聯(lián)網(wǎng)立法的一個(gè)關(guān)鍵部分;主題識別(六類);第一組框架(內(nèi)容審核作為問題、解決方案或中性);以及第二組框架(十四類)。

然后,研究人員使用 ChatGPT 和在 MTurk 上招募的眾包工作者進(jìn)行了這些完全相同的分類。對于 ChatGPT 進(jìn)行了四組標(biāo)注。為了探索控制輸出隨機(jī)程度的 ChatGPT 溫度參數(shù)的影響,這里使用默認(rèn)值 1 和 0.2 進(jìn)行注釋,這意味著隨機(jī)性較小。對于每個(gè)溫度值,研究人員進(jìn)行了兩組注釋來計(jì)算 ChatGPT 的編碼器協(xié)議。

對于專家,該研究找到了兩名政治學(xué)研究生,對所有五項(xiàng)任務(wù)對推文進(jìn)行注釋。對于每項(xiàng)任務(wù),編碼員都獲得了相同指令集,其被要求逐個(gè)任務(wù)獨(dú)立地注釋推文。為了計(jì)算 ChatGPT 和 MTurk 的準(zhǔn)確性,對比只考慮了兩個(gè)訓(xùn)練有素的注釋者都同意的推文。

對于 MTurk,研究的目標(biāo)是選擇最好的工作者群體,特別是通過篩選被亞馬遜歸類為「MTurk 大師」、好評超過 90% 且在美國的工作者。

該研究使用「gpt-3.5-turbo」版本的 ChatGPT API 對推文進(jìn)行分類。注釋于 2023 年 3 月 9 日至 3 月 20 日之間進(jìn)行。對于每個(gè)注釋任務(wù),研究人員有意避免添加任何特定于 ChatGPT 的提示(prompt),例如「讓我們逐步思考」,以確保 ChatGPT 和 MTurk 眾包工作者之間的可比性。

在測試了幾種變體之后,人們決定使用這樣的提示將推文一條一條地提供給 ChatGPT:「這是我選擇的推文,請將其標(biāo)記為 [任務(wù)特定說明(例如,說明中的主題之一)]。此外,該研究中每條推文收集了四個(gè) ChatGPT 響應(yīng),也為每條推文創(chuàng)建一個(gè)新的聊天會話,以確保 ChatGPT 結(jié)果不受注釋歷史記錄的影響。

圖片

圖 1. 與 MTurk 上高分標(biāo)注人相比,ChatGPT zero-shot 的文本標(biāo)注能力。ChatGPT 在五項(xiàng)任務(wù)中的四項(xiàng)中的準(zhǔn)確性優(yōu)于 MTurk。

在上圖中 ChatGPT 有優(yōu)勢的四項(xiàng)任務(wù)中,在一種情況下(相關(guān)性)ChatGPT 略有優(yōu)勢,但其性能與 MTurk 非常相似。其他三種情況下(frams I、frams II 和 Stance),ChatGPT 的性能比 MTurk 高 2.2 到 3.4 倍。此外,考慮到任務(wù)的難度、類的數(shù)量以及注釋是零樣本的事實(shí),ChatGPT 的準(zhǔn)確度總體來說綽綽有余。

對于相關(guān)性,有兩個(gè)類別(相關(guān) / 不相關(guān)),ChatGPT 的準(zhǔn)確率為 72.8%,而對于立場,有三個(gè)類別(正面 / 負(fù)面 / 中性)的準(zhǔn)確率為 78.7%。隨著類別數(shù)量的增加,準(zhǔn)確性會降低,盡管任務(wù)的內(nèi)在難度也有影響。關(guān)于編碼器協(xié)議,圖 1 顯示 ChatGPT 的性能非常高,當(dāng)溫度參數(shù)設(shè)置為 0.2 時(shí),所有任務(wù)的性能都超過 95%。這些值高于任何人類,包括訓(xùn)練有素的注釋者。即使使用默認(rèn)溫度值 1(這意味著更多的隨機(jī)性),編碼器間一致性始終超過 84%。編碼器間一致性和準(zhǔn)確性之間的關(guān)系是正的,但很弱(皮爾遜相關(guān)系數(shù):0.17)。盡管相關(guān)性僅基于五個(gè)數(shù)據(jù)點(diǎn),但它表明較低的溫度值可能更適合注釋任務(wù),因?yàn)樗坪蹩梢蕴岣呓Y(jié)果的一致性而不會大幅降低準(zhǔn)確性。

必須強(qiáng)調(diào)的是,對 ChatGPT 進(jìn)行測試非常困難。內(nèi)容審核是一個(gè)復(fù)雜的主題,需要大量資源。除了立場之外,研究人員還為特定研究目的開發(fā)了概念類別。此外,一些任務(wù)涉及大量類別,然而 ChatGPT 仍然達(dá)到了很高的準(zhǔn)確率。

使用模型來注釋數(shù)據(jù)并不是什么新鮮事,在使用大規(guī)模數(shù)據(jù)集的計(jì)算機(jī)科學(xué)研究中,人們經(jīng)常會標(biāo)注少量樣本然后用機(jī)器學(xué)習(xí)進(jìn)行擴(kuò)增。不過在表現(xiàn)超過人類之后,未來我們或許可以更加信任來自 ChatGPT 的判斷了。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-03-29 19:35:43

ChatGPT標(biāo)注數(shù)據(jù)

2023-03-31 13:23:31

ChatGPTNLPMTurk

2024-03-29 13:55:05

AI模型

2024-04-01 07:00:00

模型AI

2018-03-23 05:25:18

5GWiFi網(wǎng)絡(luò)

2020-12-28 13:43:03

MacWindowsSurface

2023-09-18 13:14:00

AI工具

2020-11-09 14:03:51

Spring BootMaven遷移

2018-05-23 14:22:27

機(jī)器口語AI

2022-04-26 14:13:26

物聯(lián)網(wǎng)IoT

2022-02-18 09:53:17

AI芯片設(shè)計(jì)

2017-02-08 10:56:32

光纖產(chǎn)能技術(shù)

2023-01-03 08:30:00

ChatGPT谷歌機(jī)器人

2023-06-14 12:35:57

2022-08-22 14:44:02

人工智能量子計(jì)算算法

2020-04-09 08:29:50

編程語言事件驅(qū)動

2021-03-11 06:16:17

谷歌 Cookie 瀏覽器

2019-11-26 10:07:10

業(yè)務(wù)開發(fā)邏輯

2025-10-21 12:29:37

2023-03-15 07:13:34

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

欧美好骚综合网| 日韩有码欧美| 国产婷婷一区二区| 成人精品视频在线| 日本三级中文字幕| 亚洲va久久| 7799精品视频| 成人免费观看视频在线观看| 在线a免费看| 成人午夜碰碰视频| 国产精品一区久久久| 久久久久国产精品夜夜夜夜夜| 亚洲成aⅴ人片久久青草影院| 欧美日韩一级片在线观看| 17c丨国产丨精品视频| 狠狠狠综合7777久夜色撩人| 国产精品一级二级三级| 国产精品黄色av| 日本在线视频免费| 91综合久久一区二区| 亚洲精品之草原avav久久| 污污网站免费观看| 裤袜国产欧美精品一区| 亚洲综合一区在线| 在线观看成人av| 毛片免费在线播放| 成人av在线资源网站| 国产日韩精品一区二区| 中文字幕在线欧美| 99精品国产在热久久| 欧美成人在线免费| frxxee中国xxx麻豆hd| 久久91麻豆精品一区| 亚洲精品www| 9.1在线观看免费| 国产精品日本一区二区不卡视频| 91成人免费在线| 国产成人亚洲精品无码h在线| www免费视频观看在线| 国产精品理论在线观看| 日本一区二区在线视频| 亚洲日本国产精品| 99久久99久久久精品齐齐| 产国精品偷在线| 国产高清第一页| 韩国成人精品a∨在线观看| 国产精品美女久久久久av超清| 天天干天天干天天操| 亚洲少妇自拍| 欧美亚洲免费电影| 91丝袜一区二区三区| 亚洲欧美清纯在线制服| 欧美性受xxxx黑人猛交| 日本一本高清视频| 国产婷婷精品| 欧美在线视频观看| 啦啦啦免费高清视频在线观看| 亚洲理论在线| 91av网站在线播放| www.欧美色| 青青草精品视频| 国产在线精品播放| 国产女人高潮时对白| 国产黄色精品视频| 国产精品久久久久免费| 亚洲欧美自偷自拍| 久久久国产精品麻豆| 亚洲精品乱码久久久久久蜜桃91| av电影在线观看| 亚洲欧美在线另类| av 日韩 人妻 黑人 综合 无码| 免费男女羞羞的视频网站在线观看| 一区二区久久久久| jizzjizz国产精品喷水| 老司机2019福利精品视频导航| 日本精品一区二区三区高清| www.日本一区| 日韩成人视屏| 亚洲精选中文字幕| 免费黄色国产视频| 伊人久久久大香线蕉综合直播| 海角国产乱辈乱精品视频| 国产黄色免费观看| 久久se精品一区精品二区| 成人免费视频观看视频| 免费毛片在线| 亚洲精品日韩一| 久久网站免费视频| 日韩毛片网站| 亚洲国产精久久久久久| 性猛交娇小69hd| 欧美成人首页| 国产精品福利观看| www.久久久久久| 久久久久久久久久久电影| 自拍另类欧美| 日本三级一区| 91精品国产综合久久国产大片| 色婷婷精品久久二区二区密| 欧美日韩激情| 高清欧美性猛交xxxx黑人猛交| 无码人妻丰满熟妇奶水区码| 国产美女精品人人做人人爽| 久久综合久久综合这里只有精品| 超碰在线网址| 色婷婷综合在线| 亚洲欧洲国产视频| 成人影院天天5g天天爽无毒影院| 海角国产乱辈乱精品视频| 亚洲视频在线免费播放| 99久久免费国产| 视频一区二区视频| 欧美日韩精品免费观看视完整| 欧美va在线播放| 亚洲女同二女同志奶水| 性欧美xxxx大乳国产app| 91视频在线免费观看| 69av在线| 色噜噜狠狠色综合欧洲selulu| 免费观看污网站| 伊人久久大香线| 国产精品永久免费| 美女欧美视频在线观看免费 | 姬川优奈av一区二区在线电影| 欧美成人激情免费网| 免费成人深夜蜜桃视频| 丝袜亚洲另类欧美| 久久99精品久久久久久秒播放器| 污污片在线免费视频| 欧美美女一区二区| 萌白酱视频在线| 青青青爽久久午夜综合久久午夜| 欧美亚洲免费高清在线观看 | 日韩女优在线播放| 四虎影院在线域名免费观看| 性感美女久久精品| 91视频在线免费| 亚洲经典三级| 国产精品一区二区三区四区五区 | av一区二区在线观看| 青青草精品毛片| 色视频在线观看福利| 精品国产31久久久久久| 亚洲精品乱码久久久久久不卡| 欧美久久成人| 成人在线视频网址| 2018av在线| 日韩高清不卡av| 六月丁香激情综合| 91麻豆免费视频| 久草青青在线观看| 精品一区在线| 国产精品91一区| 素人av在线| 欧美一区二区三区免费视频| 黄色片在线观看网站| 国产成人午夜精品5599| 欧美这里只有精品| 欧美电影完整版在线观看| 欧美亚洲在线视频| jizz在线免费观看| 欧美一级久久久| 精品一区在线视频| 久久久久亚洲综合| 超碰超碰在线观看| 欧美日韩国产一区精品一区| 国产精品裸体一区二区三区| 国产白丝在线观看| 国产丝袜精品第一页| 亚洲高清在线看| 亚洲欧洲中文日韩久久av乱码| 无套内谢丰满少妇中文字幕| 亚洲精品系列| 日韩动漫在线观看| 欧美一区一区| 2019精品视频| 91caoporm在线视频| 日韩精品中文字幕在线不卡尤物 | 久久精品观看| 在线视频不卡一区二区三区| 超碰在线成人| 国产精品久久久久77777| av在线免费网站| 日韩电影中文字幕av| 国产精品九九九九| 午夜精品福利视频网站 | 亚洲精品伦理在线| 亚洲精品乱码久久久久久久| 琪琪一区二区三区| 欧美在线一区视频| 青青草97国产精品麻豆| 成人9ⅰ免费影视网站| 日韩精品一区二区三区av| 久久99热精品| 国产youjizz在线| 亚洲成色777777在线观看影院| 91丨九色丨海角社区| 亚洲成人av免费| 欧美88888| 91丨porny丨国产| 中文字幕欧美视频| 日韩黄色小视频| 国产一级爱c视频| 天天做综合网| 日本不卡一区二区三区在线观看| 我要色综合中文字幕| 国产欧美日韩专区发布| 性国裸体高清亚洲| 欧美激情一级欧美精品| 最近高清中文在线字幕在线观看| 日韩av在线不卡| 国产sm主人调教女m视频| 欧美偷拍一区二区| 中文字幕超碰在线| 亚洲高清免费观看高清完整版在线观看| 亚洲av毛片基地| 91亚洲大成网污www| av影片在线播放| 精品制服美女丁香| 午夜激情在线观看视频| 亚洲欧美久久| 欧美成人一区二区在线观看| 欧美精品国产| 日韩精品一区二区三区电影| 成人久久综合| 神马影院一区二区三区| 一道在线中文一区二区三区| 国产日韩在线一区二区三区| 日本一区二区乱| 亚洲一区免费网站| 精品视频国内| 91九色精品视频| 亚洲伊人精品酒店| 成人精品久久久| 亚洲欧美专区| 成人在线视频网站| 亚洲老司机网| 亚洲xxxxx| 日韩区一区二| 成人动漫在线视频| 综合激情五月婷婷| 国产高清在线一区| 国产精品qvod| 国产区一区二区三区| 成午夜精品一区二区三区软件| 波多野结衣久草一区| 天堂av一区| 国产乱码一区| 亚洲aaa级| 欧美日韩在线高清| 成久久久网站| 在线综合视频网站| 自拍欧美日韩| 每日在线观看av| 亚洲在线观看| 在线视频日韩一区 | 午夜国产精品视频| 女人被男人躁得好爽免费视频| 欧美日韩影院| 伊人成色综合网| 青青青伊人色综合久久| 一区二区三区欧美精品| 国产精品1区2区| 亚洲少妇18p| 国产日产亚洲精品系列| fc2ppv在线播放| 亚洲国产日产av| 国产免费一区二区三区四区五区| 在线观看av一区| 国产按摩一区二区三区| 亚洲国产天堂久久综合网| 国产有码在线| 欧美精品在线视频观看| 成人免费网站观看| 国产成一区二区| 国内不卡的一区二区三区中文字幕 | 波多野结衣电影在线播放| 欧美乱妇一区二区三区不卡视频| 国产按摩一区二区三区| 精品亚洲男同gayvideo网站 | 国产精品久久久久三级| 久久久久成人片免费观看蜜芽| 日韩人在线观看| 国产三级按摩推拿按摩| 亚洲黄色av女优在线观看| 日本蜜桃在线观看| 久久久久久中文字幕| 97人人做人人爽香蕉精品| 999在线免费观看视频| 欧美老女人另类| 国产一区 在线播放| 久久一二三四| 中文字幕亚洲日本| 中文字幕av一区二区三区免费看 | 日本不卡三区| 亚洲**2019国产| 欧美成人福利| 欧美高清性xxxxhd| 好看的日韩av电影| 日韩大片一区二区| 91网页版在线| 美女的奶胸大爽爽大片| 在线中文字幕一区二区| 人妻少妇精品无码专区| 日韩中文在线观看| 中国色在线日|韩| 99热99热| 99久久婷婷| 黄色国产精品视频| 本田岬高潮一区二区三区| av最新在线观看| 欧美在线观看一区二区| 香蕉国产在线视频| 久久久久久久久久久成人| 久久久加勒比| 日韩色妇久久av| 欧美一级播放| 国产伦精品一区三区精东| 亚洲美女视频在线| 一区二区日韩视频| 中国日韩欧美久久久久久久久| 国产污视频在线播放| 成人精品一二区| 午夜激情一区| 婷婷中文字幕在线观看| 国产精品色哟哟| 青青国产在线视频| 亚洲人成电影在线观看天堂色| 高端美女服务在线视频播放| 成人欧美一区二区三区黑人免费| 欧美一区二区三区久久精品茉莉花| 欧美婷婷精品激情| 国产欧美日韩一区二区三区在线观看| 男人日女人网站| 亚洲女人被黑人巨大进入| 精精国产xxxx视频在线播放| 国产偷国产偷亚洲高清97cao| 国产综合网站| 最新版天堂资源在线| 亚洲一区二区三区美女| 亚洲av无码国产精品永久一区| 免费99精品国产自在在线| 电影中文字幕一区二区| 麻豆视频传媒入口| 国产精品88av| 久久综合综合久久| 亚洲精品一线二线三线| 69av成人| 欧美精品亚洲精品| 秋霞国产午夜精品免费视频 | 亚洲动漫第一页| 欧美一区二区三区黄片| 97色在线视频观看| 神马日本精品| 国产精品乱码久久久久| 国产精品美女久久福利网站| 一炮成瘾1v1高h| 欧美成人合集magnet| av成人综合| 免费高清在线观看免费| 国产蜜臀av在线一区二区三区| 亚洲一区二区三区网站| 成人97在线观看视频| 狼人精品一区二区三区在线| 成人精品视频一区二区| 中文字幕日韩一区| 亚洲第九十九页| 欧美亚洲视频一区二区| 日韩成人精品一区| 日本少妇一区二区三区| 午夜精品福利在线| av在线播放网| 成人av免费在线看| 日日夜夜一区二区| 91精品国产闺蜜国产在线闺蜜| 日韩三级精品电影久久久| 一区二区精品伦理... | 中文字幕在线观看网址| 欧洲色大大久久| 男插女视频久久久| 日韩成人av网站| 成人精品视频一区二区三区| 五月婷婷激情视频| 美女撒尿一区二区三区| 日韩丝袜视频| 色噜噜狠狠一区二区三区狼国成人| 亚洲一区二区三区视频在线播放| 精彩国产在线| 999精品视频一区二区三区| 久久久久久一区二区| 污软件在线观看| 亚洲欧美国产va在线影院| 成人影院网站ww555久久精品| 六月丁香激情网| 亚洲精品乱码久久久久久| 蜜桃成人在线视频| 国产 高清 精品 在线 a| 欧美aaa在线| 国产成人亚洲精品自产在线 | 国产一区二区播放|