精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文助你解決數據傾斜問題

開發 前端
雖然本文討論了概率問題,但最終的性能指標才是對業務最重要的指標。如果離線測試表明某個模型能增加價值,那么就在生產中進行測試。

在處理文本分類任務時,基準測試流行的自然語言處理架構的性能是建立對可用選項的理解的重要步驟。在這里,本文將深入探討與分類相關的最常見的挑戰之一——數據傾斜。如果你曾經將機器學習(ML)應用于真實世界的分類數據集,那么你可能已經很熟悉這個問題了。

了解數據分類中的不平衡問題

在數據分類中,我們經常關注數據點在不同類別中的分布情況。平衡的數據集在所有類別中的數據點數大致相同,因此更易于處理。然而,現實世界中的數據集往往是不平衡的。

不平衡數據可能會導致問題,因為模型可能會學習用最常見的類來標注所有內容,而忽略實際輸入。如果主要類別非常普遍,以至于模型不會因為將少數類別錯誤分類而受到太多懲罰這種情況。此外,代表性不足的類別可能沒有足夠的數據供模型學習有意義的模式。

不平衡是否需要糾正?不平衡是數據的一個特征,一個很好的問題是,我們是否要對其采取任何措施。有一些技巧可以讓模型的訓練過程變得更容易。我們可以選擇對訓練過程或數據本身進行操作,讓模型知道哪些類對我們來說特別重要,但這應該以業務需求或領域知識為依據。接下來,我們將詳細討論這些技巧和操作。

為了說明解決數據不平衡的不同技術的效果,我們將使用包含747條垃圾短信和4827條正常短信的sms-spam數據集。雖然只有兩類,但為了更好地泛化,我們將把該任務視為多類分類問題。我們將使用roberta-base模型。

【sms-spam數據集】:https://huggingface.co/datasets/sms_spam

請記住,這些技術在其他數據中可能會產生不同的結果。在特定數據集上測試它們至關重要。

在不做任何調整的情況下訓練分類模型時,我們會得到以下分類報告:

圖片圖片

“Safe” 技巧偏置初始化

本文的第一項技術是從一開始就讓模型了解數據分布。我們可以通過相應地初始化最終分類層的偏置來傳播這一知識。Andrej Karpathy在他的《訓練神經網絡的秘訣》(A Recipe for Training Neural Networks)中分享了這一技巧,它有助于模型從知情的角度出發。在我們的多分類案例中,我們使用softmax作為最終激活函數,我們希望模型在初始化時的輸出能夠反映數據分布。為了實現這一目標,我們需要解決以下問題:

【A Recipe for Training Neural Networks】:http://karpathy.github.io/2019/04/25/recipe/#2-set-up-the-end-to-end-trainingevaluation-skeleton--get-dumb-baselines:~:text=Huber%20losses%2C%20etc.-,init%20well.,-Initialize%20the%20final

圖片圖片

作為提醒,

圖片圖片

然后,

圖片圖片

其中,b0和b1分別為負類和正類的偏置,neg和pos分別為負類和正類中元素的數量。

通過這種初始化,所有指標都得到了簡單的改善!

圖片圖片

在貝葉斯術語中,這意味著手動設置先驗,并允許模型在訓練過程中學習調整它們。

下采樣和上加權/上采樣和下加權

這些技術也能有效解決類不平衡問題。二者的概念相似,但執行方式不同。下采樣和上加權涉及減少主要類的規模以平衡分布,同時在訓練過程中為該類的示例分配更大的權重。上加權可確保輸出概率仍然代表觀察到的數據分布。相反,上采樣和下加權則需要增加代表性不足的類別的規模,并按比例降低其權重。

下采樣和上加權的結果:

圖片圖片

上采樣和下加權的結果:

圖片圖片

在這兩種情況下,“垃圾郵件”的召回率都有所下降,這可能是因為“正常郵件”的權重是“垃圾郵件”權重的兩倍。

Focal loss

【Focal loss】:https://arxiv.org/abs/1708.02002

Focal loss是一種“動態縮放交叉熵損失”,是為了解決不平衡數據的訓練問題而引入的。它只適用于二元情況,幸運的是,我們的問題只涉及兩個類別。請看下面的公式:

圖片圖片

在該公式中,p是真實類別的概率,ɑ是加權系數,??控制著根據置信度(概率)對損失的懲罰程度。

這種設計可以確保概率較低的示例獲得指數級更大的權重,從而推動模型學習更具挑戰性的示例。α參數允許不同類別的示例獲得不同的權重。

通過調整α和??的組合,可以找到最佳配置。要消除明確的類別偏好,可將α設為0.5;但是,使用這一平衡因子會有微小的改進。

以下是使用Focal loss方法獲得的最佳結果:

圖片圖片

所有指標都優于基線,但需要調整一些參數。請記住,不一定總是這么順利。

“Not-so-safe”的技巧

眾所周知,存在著方法可以故意改變輸出概率分布,從而給代表性不足的類別帶來優勢。通過使用這些技術,我們明確地向模型發出信號,表明某些類別至關重要,不應被忽視。這通常是由業務需求驅動的,比如檢測金融欺詐或攻擊性評論,這比意外地錯誤標記好的示例更重要。當目標是提高特定類別的召回率時,即使犧牲其他指標也要應用這些技術。

加權

加權法是為不同類別的樣本損失值分配不同的權重。這是一種有效且適應性強的方法,因為它可以讓你指出每個類別對模型的重要性。以下是單個訓練樣本的多類別加權交叉熵損失公式:

圖片圖片

其中,pytrue表示真實類別的概率,wytrue是該類別的權重。

確定權重的一個很好的默認方法是使用類別頻率倒數:

圖片圖片

其中,N是數據集的總條目數,c是類別計數,ni是第i個類別的元素計數

權重計算如下:{'ham': 0.576, 'spam': 3.784}

以下是使用這些權重得出的指標:

圖片圖片

指標超過基線方案。雖然這種情況可能會發生,但并非總是如此。

不過,如果避免特定類的漏檢至關重要,可以考慮增加類別的權重,這樣可能會提高類別的召回率。讓我們嘗試使用權重{"ham": 0.576, "spam": 10.0}來查看結果。

結果如下:

圖片圖片

正如預期的那樣,“垃圾郵件”的召回率提高了,但精確度卻下降了。與使用類別頻率倒數權重相比,F1分數有所下降。這證明了基本損失加權的潛力。即使對于平衡數據,加權也可能有利于召回關鍵類別。

上采樣和下采樣。

雖然與前面討論的方法類似,但它們不包括加權步驟。下采樣可能會導致數據丟失,而上采樣可能會導致過度擬合上采樣類別。雖然這兩種方法都有幫助,但加權通常是更有效、更透明的選擇。

概率比較

本文將用一個很明顯的垃圾郵件示例來評估各種模型版本的可信度:“Call to claim your prize!”,結果見下表。

圖片圖片

正如預期的那樣,與基線相比,加權模型顯示出過度自信,而“下采樣+上加權”模型則信心不足(由于上加權的“正常郵件”)。值得注意的是,偏置初始化會增加模型對“垃圾郵件”類別的可信度,而焦點丟失則會降低模型對“垃圾郵件”類別的可信度。

總結

總之,必要時可以解決數據不平衡問題。請記住,有些技術會有意改變數據分布,只有在必要時才可使用。不平衡是一種特征,而不是錯誤!

雖然本文討論了概率問題,但最終的性能指標才是對業務最重要的指標。如果離線測試表明某個模型能增加價值,那么就在生產中進行測試。

在實驗中,本文使用了Toloka ML平臺。它提供了一系列隨時可用的模型,可以為ML項目提供一個良好的開端。

總的來說,考慮到訓練ML模型的數據分布至關重要。訓練數據必須代表真實世界的分布,模型才能有效工作。如果數據本身不平衡,模型應考慮到這一點,以便在實際場景中表現良好。

責任編輯:武曉燕 來源: Python學研大本營
相關推薦

2024-04-26 14:18:43

機器學習人工智能

2022-08-18 09:00:00

自動駕駛合成控制邁阿密

2020-05-12 15:40:06

MySQ數據庫索引

2017-10-22 06:05:28

語音識別深度學習ASR

2021-08-04 07:21:31

Hive 數據排查

2022-10-20 08:01:23

2022-12-12 08:13:27

Redis數據傾斜

2022-08-27 10:37:48

電子取證信息安全

2022-04-11 10:56:43

線程安全

2023-10-24 11:44:21

2017-06-02 15:32:09

大數據數據可視化

2023-06-19 13:57:00

數據系統

2023-01-14 15:32:00

云原生大數據架構

2020-05-15 16:37:13

PowerBI數據分析

2020-10-08 14:32:57

大數據工具技術

2018-04-03 13:08:31

2022-05-04 17:43:28

元數據大數據

2025-09-19 09:52:19

2025-08-25 09:12:48

2018-07-18 11:23:02

點贊
收藏

51CTO技術棧公眾號

91久久在线视频| 日韩中文娱乐网| 春日野结衣av| 在线观看二区| 国产成人av电影| 欧美在线性爱视频| 全网免费在线播放视频入口| 日本一道高清一区二区三区| 精品亚洲国产成人av制服丝袜| 欧美激情a在线| 波多野结衣av在线观看| 亚洲国产一区二区三区网站| 色综合久久久久综合体桃花网| 亚洲在线色站| 亚洲色偷精品一区二区三区| 国产美女精品在线| 欧美在线视频网站| 欧美黄色免费看| 国产欧美日韩电影| 色综合久久中文字幕综合网| 日韩最新中文字幕| 国产二区在线播放| www.成人网.com| 亚洲bt天天射| 伊人久久一区二区| 老鸭窝91久久精品色噜噜导演| 欧美成年人视频网站| 卡一卡二卡三在线观看| 少妇高潮一区二区三区| 欧美电影免费观看完整版| 日韩精品福利片午夜免费观看| 欧美男男同志| 97se狠狠狠综合亚洲狠狠| 91久久久一线二线三线品牌| 国产精品久久久久久久久毛片| 免费一级欧美片在线播放| 欧美极度另类性三渗透| 一区二区视频观看| 一区二区三区四区视频免费观看| 欧美精品九九99久久| 可以免费在线看黄的网站| 麻豆网站免费在线观看| 亚洲成av人片一区二区| 成年女人18级毛片毛片免费| 在线观看午夜av| 99久久国产综合色|国产精品| 99se婷婷在线视频观看| 国产精品一区二区av白丝下载| 麻豆免费看一区二区三区| 久久精品国亚洲| 免费精品在线视频| 91影院成人| 久久精品91久久香蕉加勒比| 久久久99999| 成人一级毛片| 最近2019中文免费高清视频观看www99 | 日韩免费在线电影| 91精选在线观看| 久久久天堂国产精品| 日本黄色片在线观看| 中文字幕在线视频一区| 在线无限看免费粉色视频| 久热国产在线| 亚洲综合成人在线| 91九色在线观看视频| 涩涩网在线视频| 日本久久一区二区| 精品国产一区二区三区在线| av超碰免费在线| 一区二区三区四区精品在线视频 | 欧美日韩aaaaaa| 日韩av影视大全| 国产精品流白浆在线观看| 亚洲国产成人91精品| 亚洲成人网在线播放| 日本大胆欧美| 久久99亚洲热视| 国产成人在线视频观看| 美国三级日本三级久久99| 91九色综合久久| 天天摸夜夜添狠狠添婷婷| 国产日韩欧美a| 特级黄色录像片| 久草在线资源福利站| 精品视频123区在线观看| 青草网在线观看| a欧美人片人妖| 亚洲成av人片在www色猫咪| 国产免费毛卡片| 欧美黄色网络| 精品国产露脸精彩对白 | 亚洲av无码国产精品永久一区| 99久久99久久综合| 亚洲国产欧洲综合997久久| 亚州男人的天堂| 亚洲国产精品v| 屁屁影院ccyy国产第一页| av综合电影网站| 欧美一区二区三区的| 成人影视免费观看| 亚洲欧美伊人| 国产精品自产拍在线观| 亚洲精品国产无码| 粉嫩aⅴ一区二区三区四区| 日韩一区二区电影在线观看| 国产三线在线| 夜夜夜精品看看| 免费黄色特级片| 6080亚洲理论片在线观看| 一本大道久久加勒比香蕉| 九九热精品在线观看| 毛片不卡一区二区| 免费看污久久久| 爱情岛亚洲播放路线| 欧美乱妇23p| 成人午夜剧场视频网站| 在线观看日韩av电影| 国产在线视频不卡| 国产三级在线看| 欧美日韩久久久久| 国产婷婷一区二区三区| 国产精品免费精品自在线观看| 国产视频久久久久| 日本网站免费观看| 国产在线日韩欧美| 伊人色综合影院| 亚洲资源一区| 欧美久久久影院| 亚洲精品成人无码| 美女尤物久久精品| 国产免费高清一区| 污视频网站在线免费| 欧美精品乱码久久久久久| 日韩丰满少妇无码内射| 亚洲欧美日韩综合国产aⅴ| 国产精品免费看一区二区三区| 大片免费在线看视频| 一区二区三区欧美日| 孩娇小videos精品| 激情综合婷婷| 美女久久久久久久久久久| 在线免费观看视频网站| 欧美激情一区不卡| 亚洲 激情 在线| 欧美熟乱15p| 国产剧情日韩欧美| 免费黄网站在线播放| 亚洲综合图片区| 999热精品视频| 最新欧美人z0oozo0| 91视频99| 成人影音在线| 日韩经典中文字幕| 秋霞欧美一区二区三区视频免费| 奇米一区二区三区| 午夜精品亚洲一区二区三区嫩草| 成人av色网站| 久久久精品一区二区| av中文字幕播放| 亚洲午夜久久久久久久久久久 | 99久久婷婷国产综合精品电影| 日韩xxxx视频| 精品视频一区二区三区四区五区| 日韩限制级电影在线观看| 草视频在线观看| 成人免费高清视频| 日本一本二本在线观看| 蜜桃国内精品久久久久软件9| 日本午夜精品理论片a级appf发布| 国产伦一区二区| 久久蜜桃av一区精品变态类天堂| 日av中文字幕| 999国产精品视频| 高清不卡一区二区三区| 特黄毛片在线观看| 中国人与牲禽动交精品| 国产suv一区二区| 精品久久久久久亚洲国产300| 国产成人强伦免费视频网站| 亚洲天堂成人| 日本一区二区精品| 美女高潮在线观看| 国产亚洲欧美日韩美女| 国产视频手机在线| 午夜视频久久久久久| 婷婷色一区二区三区| 国产一区二区三区在线观看免费| 人妻少妇精品无码专区二区| 精品国产99| 电影午夜精品一区二区三区| 性欧美超级视频| 久久99久久99精品免观看粉嫩| 欧美69xxxxx| 欧美撒尿777hd撒尿| 久久午夜鲁丝片午夜精品| 久久久久久久电影| 亚洲欧美激情一区二区三区| 视频一区欧美日韩| www.av91| 小说区亚洲自拍另类图片专区 | 日韩电影二区| 国产91在线播放| 最新国产露脸在线观看| 亚洲欧洲日产国码av系列天堂| 国产免费av电影| 欧美自拍丝袜亚洲| 久久夜色精品亚洲| 亚洲视频在线一区| 日韩女同一区二区三区| jlzzjlzz亚洲日本少妇| 欧美视频亚洲图片| 日韩在线一区二区三区| 欧美一区二区影视| 中文字幕一区二区三区四区久久| 国产精品丝袜视频| 天堂av在线网| 国内精品久久久久伊人av| 免费在线毛片网站| 亚洲视频在线观看免费| 欧美自拍偷拍一区二区| 91精品国产入口在线| 在线免费a视频| 日本韩国精品在线| 日韩免费视频网站| 亚洲精品v日韩精品| 女同久久另类69精品国产| 久久欧美一区二区| 黄色网址在线视频| 国产亚洲高清视频| 日韩xxxx视频| 国产精品红桃| 四虎4hu永久免费入口| 99免费精品| 一区在线电影| 91麻豆精品国产91久久久平台 | 欧美精品97| 裸体大乳女做爰69| 欧美jizz| 中文字幕一区二区三区在线乱码| 狠狠色丁香婷婷综合影院| 欧美国产视频在线观看| 欧美福利在线播放网址导航| 国产欧美一区二区视频 | 欧美精品欧美精品| 日韩人体视频| 蜜桃网站成人| 亚洲涩涩av| 日韩aⅴ视频一区二区三区| 亚洲免费观看高清完整版在线观| 久久综合婷婷综合| 国产一区二区三区不卡视频网站| 开心色怡人综合网站| 天天久久夜夜| 四虎一区二区| 国产精品精品| 国产精品av免费观看| 在线播放亚洲| 欧美综合在线观看视频| 日韩va欧美va亚洲va久久| 手机在线免费观看毛片| 黄色成人av网站| 国产3p露脸普通话对白| 麻豆久久婷婷| 四季av一区二区| 国产一区二区网址| 日本xxxx免费| 99久久久久久99| 亚洲AV无码成人精品区明星换面| 中文字幕免费不卡| 日本黄色片免费观看| 亚洲宅男天堂在线观看无病毒| 日韩精品一区三区| 在线日韩国产精品| 一本大道伊人av久久综合| 欧美一卡2卡三卡4卡5免费| 亚洲第九十九页| 亚洲天堂精品在线| 国产调教视频在线观看| 国产做受高潮69| 欧美日韩不卡| av成人免费观看| 偷窥自拍亚洲色图精选| 在线成人av电影| 999亚洲国产精| 中文字幕视频在线免费观看| 国产一区二区不卡在线| 亚洲の无码国产の无码步美| 国产精品嫩草影院com| 免费在线黄色片| 色综合网色综合| 国产精品人妻一区二区三区| 日韩黄在线观看| 日韩欧美小视频| 4444欧美成人kkkk| 国产日韩欧美中文在线| 欧美高清性xxxxhdvideosex| 亚洲精品2区| 午夜视频在线瓜伦| 成人网在线播放| 精品少妇一区二区三区密爱| 午夜精品久久久久久久99水蜜桃| 一区二区三区黄色片| 精品视频久久久久久久| av在线免费播放| 国产精品69精品一区二区三区| 豆花视频一区二区| 黄瓜视频免费观看在线观看www| 国产日韩欧美一区在线| 超碰在线超碰在线| 国产精品视频yy9299一区| 男人的天堂一区| 欧美一区三区四区| 国产尤物视频在线| 91高清在线免费观看| a级片在线免费观看| 97在线观看免费高清| 国产午夜亚洲精品一级在线| 日本一区二区不卡高清更新| 亚洲精品日本| 欧美成人精品一区二区综合免费| 国产精品国产精品国产专区不片| 日韩中文字幕在线观看视频| 精品久久国产老人久久综合| 国产秀色在线www免费观看| 国产精品久久久久99| 欧美网色网址| av女优在线播放| 国产成人免费在线视频| 日韩免费高清一区二区| 亚洲一区二区三区中文字幕在线| 国产一区二区三区中文字幕| 国产亚洲aⅴaaaaaa毛片| 亚洲人体影院| 麻豆精品传媒视频| 99亚洲视频| 三级视频网站在线观看| 午夜精品久久久久久久久| 少妇又色又爽又黄的视频| 久久久免费高清电视剧观看| 亚洲精品视频一二三区| 国产a级黄色大片| 国产一区美女在线| 美女的奶胸大爽爽大片| 欧美一区二区三区人| 岛国成人毛片| 成人欧美一区二区三区视频| 亚洲一级网站| 久久性爱视频网站| 精品日韩美女的视频高清| 亚洲欧洲视频在线观看| 51精品在线观看| 国产精品欧美在线观看| 人人干人人干人人| 国产精品日产欧美久久久久| 亚洲最大成人av| 欧美丰满少妇xxxxx做受| 粉嫩的18在线观看极品精品| 无码中文字幕色专区| 91看片淫黄大片一级| 久久永久免费视频| 视频在线观看99| 日本伊人久久| 日韩av黄色网址| 中文字幕久久午夜不卡| av网站在线观看免费| 久久久免费精品视频| 蜜臀av免费一区二区三区| 不卡av免费在线| 亚洲美女视频在线| 隣の若妻さん波多野结衣| 欧美在线一级va免费观看| 清纯唯美亚洲综合一区| 永久看看免费大片| 欧美日韩亚洲91| 91精彩在线视频| 97视频资源在线观看| 老司机一区二区三区| 日韩国产第一页| 日韩av中文字幕在线免费观看 | 91久久国产自产拍夜夜嗨| 99在线精品免费视频九九视| 中文字幕免费在线看线人动作大片| 91精品国产综合久久精品性色| 国产伦理精品| 亚洲国产激情一区二区三区| 国产99久久久国产精品| 欧美成人一区二区三区四区| 欧美成人免费小视频| 亚洲人成伊人成综合图片| 中文字幕 日韩 欧美| 欧美国产日韩a欧美在线观看| 97成人在线观看| 97人人爽人人喊人人模波多| 欧美日韩亚洲在线观看| 男人的天堂免费| 欧美网站大全在线观看| а√天堂8资源在线| 在线视频欧美一区| 97精品久久久久中文字幕| 国产片高清在线观看|