精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

三招提升數據不平衡模型的性能(附python代碼)

大數據
針對數據不平衡問題有相應的處理辦法,比如對多數樣本進行采樣使得其樣本數量級與少樣本數相近,或者是對少數樣本重復使用等。最近恰好在面試中遇到一個數據不平衡問題,這也是面試中經常會出現的問題之一,現向讀者分享此次解決問題的心得。

對于深度學習而言,數據集非常重要,但在實際項目中,或多或少會碰見數據不平衡問題。什么是數據不平衡呢?舉例來說,現在有一個任務是判斷西瓜是否成熟,這是一個二分類問題——西瓜是生的還是熟的,該任務的數據集由兩部分數據組成,成熟西瓜與生西瓜,假設生西瓜的樣本數量遠遠大于成熟西瓜樣本的數量,針對這樣的數據集訓練出來的算法“偏向”于識別新樣本為生西瓜,存心讓你買不到甜的西瓜以解夏天之苦,這就是一個數據不平衡問題。

針對數據不平衡問題有相應的處理辦法,比如對多數樣本進行采樣使得其樣本數量級與少樣本數相近,或者是對少數樣本重復使用等。最近恰好在面試中遇到一個數據不平衡問題,這也是面試中經常會出現的問題之一,現向讀者分享此次解決問題的心得。

數據集

訓練數據中有三個標簽,分別標記為[1、2、3],這意味著該問題是一個多分類問題。訓練數據集有17個特征以及38829個獨立數據點。而在測試數據中,有16個沒有標簽的特征和16641個數據點。該訓練數據集非常不平衡,大部分數據是1類(95%),而2類和3類分別有3.0%和0.87%的數據,如下圖所示。

 

算法

經過初步觀察,決定采用隨機森林(RF)算法,因為它優于支持向量機、Xgboost以及LightGBM算法。在這個項目中選擇RF還有幾個原因:

  1. 機森林對過擬合具有很強的魯棒性;
  2. 參數化仍然非常直觀;
  3. 在這個項目中,有許多成功的用例將隨機森林算法用于高度不平衡的數據集;
  4. 個人有先前的算法實施經驗;

為了找到***參數,使用scikit-sklearn實現的GridSearchCV對指定的參數值執行網格搜索,更多細節可以在本人的Github上找到。

為了處理數據不平衡問題,使用了以下三種技術:

A.使用集成交叉驗證(CV):

在這個項目中,使用交叉驗證來驗證模型的魯棒性。整個數據集被分成五個子集。在每個交叉驗證中,使用其中的四個子集用于訓練,剩余的子集用于驗證模型,此外模型還對測試數據進行了預測。在交叉驗證結束時,會得到五個測試預測概率。***,對所有類別的概率取平均值。模型的訓練表現穩定,每個交叉驗證上具有穩定的召回率和f1分數。這項技術也幫助我在Kaggle比賽中取得了很好的成績(前1%)。以下部分代碼片段顯示了集成交叉驗證的實現:

 

B.設置類別權重/重要性:

代價敏感學習是使隨機森林更適合從非常不平衡的數據中學習的方法之一。隨機森林有傾向于偏向大多數類別。因此,對少數群體錯誤分類施加昂貴的懲罰可能是有作用的。由于這種技術可以改善模型性能,所以我給少數群體分配了很高的權重(即更高的錯誤分類成本)。然后將類別權重合并到隨機森林算法中。我根據類別1中數據集的數量與其它數據集的數量之間的比率來確定類別權重。例如,類別1和類別3數據集的數目之間的比率約為110,而類別1和類別2的比例約為26。現在我稍微對數量進行修改以改善模型的性能,以下代碼片段顯示了不同類權重的實現:

 

C.過大預測標簽而不是過小預測(Over-Predict a Label than Under-Predict):

這項技術是可選的,通過實踐發現,這種方法對提高少數類別的表現非常有效。簡而言之,如果將模型錯誤分類為類別3,則該技術能***限度地懲罰該模型,對于類別2和類別1懲罰力度稍差一些。 為了實施該方法,我改變了每個類別的概率閾值,將類別3、類別2和類別1的概率設置為遞增順序(即,P3= 0.25,P2= 0.35,P1= 0.50),以便模型被迫過度預測類別。該算法的詳細實現可以在Github上找到。

最終結果

以下結果表明,上述三種技術如何幫助改善模型性能:

1.使用集成交叉驗證的結果:

 

2.使用集成交叉驗證+類別權重的結果:

 

3.使用集成交叉驗證+類別權重+過大預測標簽的結果:

 

結論

由于在實施過大預測技術方面的經驗很少,因此最初的時候處理起來非常棘手。但是,研究該問題有助于提升我解決問題的能力。對于每個任務而言,起初可能確實是陌生的,這個時候不要害怕,一次次嘗試就好。由于時間的限制(48小時),無法將精力分散于模型的微調以及特征工程,存在改進的地方還有很多,比如刪除不必要的功能并添加一些額外功能。此外,也嘗試過LightGBM和XgBoost算法,但在實踐過程中發現,隨機森林的效果優于這兩個算法。在后面的研究中,可以進一步嘗試一些其他算法,比如神經網絡、稀疏編碼等。

責任編輯:未麗燕 來源: 網絡大數據
相關推薦

2021-01-04 10:40:37

Python不平衡數據機器學習

2018-09-11 13:47:35

數據不平衡數據分布數據集

2016-12-13 11:48:05

數據處理不平衡數據

2023-09-29 22:51:22

數據不平衡Python機器學習

2018-04-20 11:33:22

不平衡數據數據集模型

2023-12-26 15:32:25

不平衡數據過采樣機器學習

2019-02-25 08:35:22

機器學習數據模型

2017-06-16 22:14:45

機器學習數據不平衡

2017-03-28 09:40:23

機器學習數據不平衡

2021-06-06 22:41:30

人才技術預測不平衡

2024-10-18 07:10:43

2020-09-21 09:02:56

AI機器學習類不平衡

2025-01-20 09:00:00

2020-10-06 10:44:16

機器學習不平衡數據算法

2022-05-06 09:48:56

機器學習樣本不平衡

2019-03-27 08:51:38

機器學習類失衡算法

2016-09-07 13:26:25

R語言不平衡數據

2017-03-20 09:25:10

機器學習采樣數據合成

2019-10-28 13:57:54

Windows 10Windows電腦性能

2025-09-28 01:10:00

大數據數據項目
點贊
收藏

51CTO技術棧公眾號

免费观看成人网| 国产综合色香蕉精品| 婷婷免费在线观看| 在线播放麻豆| 国产自产v一区二区三区c| 伦伦影院午夜日韩欧美限制| 午夜性福利视频| 欧美13videosex性极品| 久久久久久亚洲综合影院红桃| 日韩美女视频在线观看| 免费一级suv好看的国产网站 | 久久精品夜色噜噜亚洲aⅴ| 国产91精品在线播放| 亚洲国产无码精品| 色诱色偷偷久久综合| 亚洲专区一二三| 欧美12av| 国内精品偷拍视频| 国产精品一国产精品k频道56| 日韩av在线网| 久久撸在线视频| 国内老司机av在线| 国产精品久久久久婷婷| 国产精品青青草| 亚洲性猛交富婆| 亚洲视频综合| 日日噜噜噜夜夜爽亚洲精品| 国产黑丝一区二区| 四虎影视成人精品国库在线观看| 亚洲综合av网| 亚洲欧美日韩在线综合| 人人妻人人澡人人爽人人欧美一区| 日韩在线播放一区二区| 久久久久亚洲精品| 欧美老女人性生活视频| 丁香综合av| 91精品国产综合久久久久久久| a级黄色一级片| 久久77777| 久久久一区二区三区| 97免费资源站| 久久久久久无码午夜精品直播| 亚洲最大黄网| 伊人亚洲福利一区二区三区| 亚洲黄色小说在线观看| 中文字幕综合| 欧美亚洲高清一区| 国产超级av在线| 国产极品人妖在线观看| 国产精品免费看片| 久久久久久国产精品免费免费| 精品国产无码一区二区| 日本va欧美va瓶| 66m—66摸成人免费视频| 日本黄色小说视频| 亚洲精品成人| 欧美日韩国产成人在线观看| 欧美极品aaaaabbbbb| 欧美不卡在线| 欧美成人免费小视频| 国产a免费视频| 欧美在线免费| 欧美精品www| 国产无遮挡又黄又爽在线观看| 黄色精品一区| 91av在线免费观看视频| 综合网在线观看| 日日夜夜免费精品| 国产一区二区在线播放| 国产伦子伦对白视频| 国产精品一区在线| 国产伦视频一区二区三区| 欧美一级一区二区三区| 99re在线精品| 欧美日韩中文国产一区发布 | 久久国产精品美女| 亚洲精品在线一区二区| 中文字幕 亚洲一区| 欧美女优在线视频| 久久九九免费视频| 久久在线视频精品| 美女黄色成人网| 成人女保姆的销魂服务| 国产成人三级在线观看视频| 91在线观看污| 综合一区中文字幕| 91探花在线观看| 色成人在线视频| 亚洲精品乱码久久久久久动漫| xxxx日韩| 亚洲片在线资源| 波多野结衣亚洲一区二区| 黄色欧美日韩| 国产精品永久免费| 四虎免费在线观看| 欧美高清一级片在线观看| 中文字幕欧美日韩一区二区| www.综合| 欧美日本高清视频在线观看| 日本性生活一级片| 黑丝美女一区二区| 欧美丰满老妇厨房牲生活| 国产黄网在线观看| 福利视频网站一区二区三区| 欧美在线一区二区三区四区| 亚洲电影视频在线| 一本大道久久a久久综合婷婷| 日韩成人av免费| 天天久久夜夜| 欧美疯狂做受xxxx高潮| 亚洲婷婷久久综合| 成a人片国产精品| 亚洲欧美99| 麻豆国产在线| 日韩一二三区视频| 中国美女黄色一级片| 一本色道久久综合亚洲精品不| 国产综合久久久久久| 噜噜噜噜噜在线视频| 亚洲一级在线观看| 999在线精品视频| 精品日韩毛片| 热久久这里只有精品| 殴美一级特黄aaaaaa| 最新中文字幕一区二区三区| 免费裸体美女网站| 久久久久高潮毛片免费全部播放| 超碰97人人做人人爱少妇| 波多野结衣激情视频| caoporen国产精品视频| 日韩极品视频在线观看| 国产精品欧美一区二区三区不卡 | 免费人成在线观看播放视频| 色噜噜狠狠一区二区三区果冻| 李丽珍裸体午夜理伦片| 午夜久久99| 51成人做爰www免费看网站| av片在线看| 在线亚洲精品福利网址导航| 国产精品无码永久免费不卡| 亚洲激情女人| 国产精品av一区| 欧美人与性动交α欧美精品济南到 | 这里精品视频免费| 中文字幕精品无| 久久久久久综合| 无遮挡又爽又刺激的视频| 亚洲va久久| **欧美日韩vr在线| 深夜福利视频在线免费观看| 午夜精品久久久久久久蜜桃app| 欧美xxxxx少妇| 国产综合久久| 国产伦精品一区二区三区四区免费 | 国产精品45p| 国内精品免费午夜毛片| 人妻无码中文字幕免费视频蜜桃| 午夜成人在线视频| 三上悠亚ssⅰn939无码播放| 首页国产欧美久久| 日韩亚洲不卡在线| 久久久加勒比| 免费av一区二区| 你懂的网站在线| 狠狠综合久久av一区二区小说| 谁有免费的黄色网址| 全国精品久久少妇| 一区二区三区国产福利| 精品一区二区三区中文字幕| 久久91精品国产| 日批视频在线播放| 欧美性猛交xxxxx免费看| 国产一区二区三区精品在线| 老司机午夜精品99久久| 韩国黄色一级大片| 中文字幕日韩在线| 奇米一区二区三区四区久久| 成全电影播放在线观看国语| 91麻豆精品久久久久蜜臀| 久久99久久98精品免观看软件| 99在线精品观看| 日韩视频在线免费看| 图片小说视频色综合| 国产一区二区三区高清视频| 日韩在线影院| 欧美不卡视频一区发布| 亚洲 精品 综合 精品 自拍| 欧美亚洲国产一区二区三区| 久久久一二三区| 久久久精品国产免大香伊| 17c国产在线| 久久aⅴ国产紧身牛仔裤| 中文字幕一区二区三区5566| 欧美18xxxx| 成人国产在线激情| www.com.cn成人| 久久福利网址导航| 精品av中文字幕在线毛片| 91精品国产麻豆国产自产在线 | 日韩激情美女| 国产一区二区三区毛片| 国内爆初菊对白视频| 欧美色中文字幕| 国产无码精品一区二区| 国产精品久久久一区麻豆最新章节| 精品无码人妻少妇久久久久久| 蜜臀av亚洲一区中文字幕| 男人添女人下部高潮视频在观看 | 最近2019中文免费高清视频观看www99| jizz中国女人| 精品视频免费看| 国产午夜在线播放| 亚洲男人的天堂av| 91麻豆精品国产91久久综合| 97久久人人超碰| 国产又粗又猛又爽又黄| 蜜臀av亚洲一区中文字幕| 成年人视频网站免费观看| 欧美三区在线| 国产手机视频在线观看| 不卡日本视频| 欧美成人第一区| 日本久久成人网| 国产福利久久精品| 欧美高清免费| 热久久免费视频精品| 美女在线视频免费| 欧美肥老妇视频| 性国产高清在线观看| 久久精品国产视频| 日本高清视频在线观看| 一个人www欧美| 精品亚洲成a人片在线观看| 亚洲国产天堂网精品网站| 亚洲国产一二三区| 日韩精品中文字幕一区二区三区| 亚洲天堂网视频| 欧洲国内综合视频| 欧美人一级淫片a免费播放| 欧美性猛交xxxx黑人猛交| 国产精品一区二区三区四| 午夜久久久久久久久| 日韩伦理在线视频| 亚洲大片免费看| 黄色激情视频在线观看| 亚洲福利视频一区| 日本五十熟hd丰满| 欧美日韩免费在线| 午夜婷婷在线观看| 色一情一伦一子一伦一区| 日韩综合在线观看| 欧美在线视频你懂得| 国产又大又粗又爽| 日本韩国欧美在线| 中文字幕码精品视频网站| 欧美图区在线视频| 国产精品人人妻人人爽| 欧美一区二区免费观在线| 亚洲精品久久久久久无码色欲四季 | 人人干人人视频| 老**午夜毛片一区二区三区| 国产aaaaa毛片| 国产自产v一区二区三区c| 女同性αv亚洲女同志| 白白色 亚洲乱淫| 中文字幕丰满乱子伦无码专区| 久久久久一区二区三区四区| 国精产品久拍自产在线网站| 亚洲欧美日本韩国| 日本少妇毛茸茸高潮| 日韩欧美一区二区三区| 一区二区三区精| 欧美成人国产一区二区| 六月婷婷综合网| 国产香蕉97碰碰久久人人| 久久bbxx| 欧洲s码亚洲m码精品一区| 黄色成人小视频| av资源站久久亚洲| 亚洲国产最新| 中文字幕久久一区| 在线视频日韩| 国产精品久久a| 丁香婷婷综合色啪| 天天干天天舔天天操| 一区二区在线观看视频| 99精品在线播放| 欧美一区二区免费| 国产女人在线观看| 欧美精品成人在线| 日本黄色一区| 国产精品久久久久久久久婷婷| 精品视频99| 免费超爽大片黄| 麻豆高清免费国产一区| 影音先锋黄色资源| 最新久久zyz资源站| 国产精品美女久久久久av爽| 91精品国产一区二区三区蜜臀| 四虎精品在永久在线观看 | 久久免费一区| 欧美私人啪啪vps| 天天综合网日韩| 99久久婷婷国产综合精品电影| 男人av资源站| 色欧美日韩亚洲| 天天综合网天天综合| 插插插亚洲综合网| 成人高清一区| 麻豆久久久9性大片| 黄色在线一区| 亚洲制服在线观看| 国产精品午夜免费| 亚洲图片在线视频| 亚洲电影免费观看高清完整版在线| 欧美三级黄网| 国产精国产精品| 日韩大片在线免费观看| 99热都是精品| 美女网站视频久久| 在线国产视频一区| 狠狠久久五月精品中文字幕| 后进极品白嫩翘臀在线视频| 久久精品中文字幕免费mv| 色猫猫成人app| 欧美激情论坛| 国产欧美91| 在线黄色免费网站| 一区二区在线观看av| 国产精品欧美综合亚洲| 日韩视频在线免费观看| 日韩精品第二页| 神马影院我不卡午夜| 天堂av在线一区| 亚洲AV无码国产成人久久| 欧美日韩美女在线观看| 日本大片在线观看| 欧美怡红院视频一区二区三区 | 亚洲激情一区二区三区| 久久久噜噜噜久久狠狠50岁| 成人乱码一区二区三区av| 精品露脸国产偷人在视频| 日韩在线观看视频网站| 午夜精品久久久久久久99热浪潮| 99国产精品久久一区二区三区| 草草草视频在线观看| 丁香桃色午夜亚洲一区二区三区| 久热精品在线观看| 亚洲第一页在线| 日韩脚交footjobhd| 欧美午夜精品久久久久久蜜| 老司机精品导航| 日韩影视一区二区三区| 91.com视频| 日本大胆在线观看| 国产偷国产偷亚洲高清97cao| 亚洲三级视频| 精品少妇人妻一区二区黑料社区 | 国产伦精品一区二区三区免.费 | 欧美暴力调教| 中文字幕99| 成人综合激情网| 视频一区二区三区四区五区| 亚洲人成绝费网站色www| 欧美韩国日本| 国产一二三四区在线观看| 波多野结衣91| 无码视频在线观看| 久久精品人人爽| 91免费精品国偷自产在线在线| 黄色一级在线视频| 国产精品无人区| 国产成人毛毛毛片| 欧美亚洲视频在线看网址| 日韩精品二区| 国产免费无码一区二区| 一本色道**综合亚洲精品蜜桃冫 | 久久久久久久成人| 尤物tv在线精品| 天堂av.com| 欧美日韩国产在线播放| 无遮挡的视频在线观看| 国产精品一区视频网站| 日韩av网站在线观看| 国产亚洲精品久久久久久打不开 | 黄av在线免费观看| 精品免费视频123区| 久久av老司机精品网站导航| 日韩精品一区二区av| 深夜成人在线观看| 日韩大尺度在线观看| 91亚洲精品久久久蜜桃借种| 亚洲成人av一区二区| 日本www在线观看| 九色视频成人porny| 国产主播一区二区三区| 人妻 日韩精品 中文字幕| 九九久久精品一区| 精品国产乱码久久久| 国产不卡一二三|