精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

技術分享:數據不平衡問題

大數據
在學術研究與教學中,很多算法都有一個基本假設,那就是數據分布是均勻的。當我們把這些算法直接應用于實際數據時,大多數情況下都無法取得理想的結果。因為實際數據往往分布得很不均勻,都會存在“長尾現象”,也就是數據不平衡”。

在學術研究與教學中,很多算法都有一個基本假設,那就是數據分布是均勻的。當我們把這些算法直接應用于實際數據時,大多數情況下都無法取得理想的結果。因為實際數據往往分布得很不均勻,都會存在“長尾現象”,也就是數據不平衡”。

[[243245]]

以下幾種方法是針對數據不平衡問題所做的處理,具體包括:

  1. smote采樣
  2. adasyn采樣
  3. 欠采樣
  4. 一分類
  5. 改進的adaboost方法

一、smote采樣

SMOTE全稱是Synthetic Minority Oversampling Technique即合成少數類過采樣技術,它是基于隨機過采樣算法的一種改進方案,由于隨機過采樣采取簡單復制樣本的策略來增加少數類樣本,這樣容易產生模型過擬合的問題,即使得模型學習到的信息過于特別(Specific)而不夠泛化(General),SMOTE算法的基本思想是對少數類樣本進行分析并根據少數類樣本人工合成新樣本添加到數據集中,算法流程如下。

  1. 對于少數類中每一個樣本x,以歐氏距離為標準計算它到少數類樣本集中所有樣本的距離,得到其k近鄰。
  2. 根據樣本不平衡比例設置一個采樣比例以確定采樣倍率N,對于每一個少數類樣本x,從其k近鄰中隨機選擇若干個樣本,假設選擇的近鄰為xn。
  3. 對于每一個隨機選出的近鄰xn,分別與原樣本按照如下的公式構建新的樣本 xnew=x+rand(0,1)∗|x−xn|

部分代碼如下: 

  1. df=get_data()  
  2. x, y = load_creditcard_data(df)  
  3. X_resampled_smote, y_resampled_smote = SMOTE().fit_sample(x, y) # print(y_resampled_smote)  
  4. X_train, X_test, y_train, y_test = train_test_split(X_resampled_smote, y_resampled_smote, test_size=0.3,random_state=0) 

二、adasyn采樣

本文介紹的是 ADASYN: 自適應綜合過采樣方法。

算法步驟如下:

(1)計算不平衡度

記少數類樣本為ms,多數類為ml,則不平衡度為 d = ms / ml,則d∈(0,1]。(作者在這里右邊用了閉區間,我覺得應該用開區間,若是d = 1,則少數類與多數類樣本數量一致,此時數據應該平衡的)

(2)計算需要合成的樣本數量

G = (ml - ms)* b,b∈[0,1],當b = 1時,即G等于少數類和多數類的差值,此時合成數據后的多數類個數和少數類數據正好平衡

(3)對每個屬于少數類的樣本用歐式距離計算k個鄰居,為k個鄰居中屬于多數類的樣本數目,記比例r為r = / k,r∈[0,1]

(4)在(3)中得到每一個少數類樣本的 ri ,

用 計算每個少數類樣本的周圍多數類的情況

(5)對每個少數類樣本計算合成樣本的數目 (6)在每個待合成的少數類樣本周圍k個鄰居中選擇1個少數類樣本,根據下列等式進行合成

重復合成直到滿足需要步驟(5)合成的數目為止。

部分代碼如下: 

  1. df=get_data()  
  2. x, y = load_creditcard_data(df)  
  3. X_resampled_smote, y_resampled_smote = ADASYN().fit_sample(x, y) 

三、欠采樣

以下兩種方法都屬于欠抽樣,不同于直接欠抽樣,他們將信息的丟失程度盡量降低。兩者的核心思想為:

1. EasyEnsemble 核心思想是:

  • 首先通過從多數類中獨立隨機抽取出若干子集
  • 將每個子集與少數類數據聯合起來訓練生成多個基分類器
  • 最終將這些基分類器組合形成一個集成學習系統

EasyEnsemble 算法被認為是非監督學習算法,因此它每次都獨立利用可放回隨機抽樣機制來提取多數類樣本

2. BalanceCascade 核心思想是:

  • 使用之前已形成的集成分類器來為下一次訓練選擇多類樣本
  • 然后再進行欠抽樣

四、一分類

對于正負樣本極不平衡的場景,我們可以換一個完全不同的角度來看待問題:把它看做一分類(One Class Learning)或異常檢測(Novelty Detection)問題。這類方法的重點不在于捕捉類間的差別,而是為其中一類進行建模,經典的工作包括One-class SVM等。

我們只對一類進行訓練,模型的結果會聚集在某個范圍內,測試集進行測試,則模型的輸出結果為1和-1兩種,當落在這個區間,結果為1,不在這個區間,則結果為-1

部分代碼如下: 

  1. def MechanicalRupture_Model():  
  2. train = pd.read_excel(normal)  
  3. test = pd.read_excel(unnormal)  
  4. clf = svm.OneClassSVM(nu=0.1, kernel=rbf, gamma=0.1)  
  5. clf.fit(train)  
  6. y_pred_train = clf.predict(train)  
  7. y_pred_test = clf.predict(test) 

五、改進的adaboost方法

AdaCost算法修改了Adaboost算法的權重更新策略,其基本思想是對于代價高的誤分類樣本大大地提高其權重,而對于代價高的正確分類樣 本適當地降低其權重,使其權重降低相對較小。總體思想是代價高樣本權重增加得大降低得慢。

具體adacost代碼如下: 

  1. #!/usr/bin/env python3# -*- coding:utf-8 -*-import numpy as npfrom numpy.core.umath_tests import inner1dfrom sklearn.ensemble import AdaBoostClassifierclass AdaCostClassifier(AdaBoostClassifier):#繼承AdaBoostClassifier 
  2. def _boost_real(self, iboost, X, y, sample_weight, random_state):  
  3. implement a single boost using the SAMME.R real algorithm.  
  4. :param iboost:  
  5. :param X:  
  6. :param random_state:  
  7. :param y: 
  8.  :return:sample_weight,estimator_error  
  9. estimator = self._make_estimator(random_state=random_state)  
  10. estimator.fit(X, y, sample_weight=sample_weight)  
  11. y_predict_proba = estimator.predict_proba(X) if iboost == 0:  
  12. self.classes_ = getattr(estimator, 'classes_', None)  
  13. self.n_classes_ = len(self.classes_)  
  14. y_predict = self.classes_.take(np.argmax(y_predict_proba, axis=1),axis=0)  
  15. incorrect = y_predict != y  
  16. estimator_error = np.mean(np.average(incorrect, weights=sample_weight, axis=0)) if estimator_error = 0: return sample_weight, 1., 0.  
  17. n_classes = self.n_classes_ 
  18.  classes = self.classes_  
  19. y_codes = np.array([-1. / (n_classes - 1), 1.])  
  20. y_coding = y_codes.take(classes == y[:, np.newaxis])  
  21. proba = y_predict_proba # alias for readability  
  22. proba[proba np.finfo(proba.dtype).eps] = np.finfo(proba.dtype).eps  
  23. estimator_weight = (-1. * self.learning_rate * (((n_classes - 1.) / n_classes) *  
  24. inner1d(y_coding, np.log(y_predict_proba)))) # 樣本更新的公式,只需要改寫這里  
  25. if not iboost == self.n_estimators - 1:  
  26. sample_weight *= np.exp(estimator_weight *  
  27. ((sample_weight 0) |  
  28. (estimator_weight 0)) *  
  29. self._beta(y, y_predict)) # 在原來的基礎上乘以self._beta(y, y_predict),即代價調整函數  
  30. return sample_weight, 1., estimator_error def _beta(self, y, y_hat):  
  31. adjust cost function weight  
  32. :param y:  
  33. :param y_hat:  
  34. :return:res  
  35. res = [] for i in zip(y, y_hat): if i[0] == i[1]:  
  36. res.append(1) # 正確分類,系數保持不變,按原來的比例減少  
  37. elif i[0] == 0 and i[1] == 1: # elif i[0] == 1 and i[1] == -1:  
  38. res.append(1) # 將負樣本誤判為正樣本代價應該更大一些,比原來的增加比例要高  
  39. elif i[0] == 1 and i[1] == 0: # elif i[0] == -1 and i[1] == 1:  
  40. res.append(1.25) # 將正列判為負列,代價不變,按原來的比例增加  
  41. else: print(i[0], i[1]) return np.array(res) 

總結:

其中

smote采樣 、adasyn采樣、欠采樣、一分類是針對數據集做出處理。

改進的adaboost方法是對模型方法進行的改進。

具體采用哪種方式,需要結合具體情況。

責任編輯:未麗燕 來源: 搜狐
相關推薦

2021-01-04 10:40:37

Python不平衡數據機器學習

2023-12-26 15:32:25

不平衡數據過采樣機器學習

2017-03-28 09:40:23

機器學習數據不平衡

2016-12-13 11:48:05

數據處理不平衡數據

2021-06-06 22:41:30

人才技術預測不平衡

2017-06-16 22:14:45

機器學習數據不平衡

2019-02-25 08:35:22

機器學習數據模型

2018-04-20 11:33:22

不平衡數據數據集模型

2023-09-29 22:51:22

數據不平衡Python機器學習

2020-10-06 10:44:16

機器學習不平衡數據算法

2018-06-11 16:20:22

數據不平衡數據集算法

2022-05-06 09:48:56

機器學習樣本不平衡

2025-01-20 09:00:00

2024-10-18 07:10:43

2017-03-20 09:25:10

機器學習采樣數據合成

2020-09-21 09:02:56

AI機器學習類不平衡

2019-03-27 08:51:38

機器學習類失衡算法

2016-09-07 13:26:25

R語言不平衡數據

2016-09-19 14:52:12

Hadoophdfs磁盤

2013-04-23 11:17:47

Hadoop
點贊
收藏

51CTO技術棧公眾號

天天射综合网视频| 精品日本视频| av在线不卡网| 日韩免费在线观看视频| 黄免费在线观看| 国产亚洲欧美日韩精品一区二区三区 | 日韩国产一区| 日韩欧美一级片| www.99热这里只有精品| jizz在线观看中文| 国产一区二区三区四区五区美女| 午夜欧美不卡精品aaaaa| 亚洲精品国产一区黑色丝袜| 免费欧美网站| 欧美视频在线免费| 久久久国产精华液999999| 亚洲精品字幕在线观看| 日韩黄色免费电影| 欧美高清在线观看| 美国黄色特级片| 都市激情亚洲| 欧美丰满嫩嫩电影| 黄在线观看网站| 伊人在我在线看导航| 国产校园另类小说区| 国产日韩欧美中文| 国产又爽又黄的视频| 婷婷六月综合| 亚洲天堂免费在线| av在线播放网址| 日韩美女在线| 91成人免费网站| 国产在线播放观看| 青青青国内视频在线观看软件| 久久久99精品久久| 国产伦理久久久| 国产又黄又爽视频| 天堂成人免费av电影一区| 欧美交受高潮1| 极品魔鬼身材女神啪啪精品| 精品一二三区| 精品在线小视频| 亚洲激情 欧美| 亚洲三级av| 欧美一级淫片007| 国产日韩欧美久久| 欧美日韩在线精品一区二区三区激情综合| 午夜婷婷国产麻豆精品| 在线观看污视频| 日本电影全部在线观看网站视频| 99久久国产综合色|国产精品| 亚洲自拍偷拍网址| 91丨九色丨丰满| 精品一区二区三区香蕉蜜桃| 国产精品久久中文| 免费一级a毛片| 日韩影院免费视频| 国产精品第一页在线| 黄色在线免费观看| 一本色道久久综合| 91国产美女视频| 日本熟妇毛茸茸丰满| 亚洲第一黄色| 午夜精品久久久久久久99黑人| 久草成人在线视频| 国内精品美女在线观看| 欧美大荫蒂xxx| 久久精品99久久久久久| 韩国欧美一区| 97精品一区二区三区| 久久夜色精品亚洲| 午夜亚洲性色视频| 国产精品爱啪在线线免费观看| 无码人妻精品一区二区50| 久久精品五月| 国产一区二区丝袜高跟鞋图片| 国产精品久久久久久久免费看| 精久久久久久久久久久| 999国产在线| 天天综合天天综合| 国产日韩欧美综合一区| 一区二区三区四区欧美| 中日韩高清电影网| 欧美色视频日本版| 日韩一区二区三区不卡视频| 国产亚洲久久| 亚洲精品不卡在线| 欧洲美熟女乱又伦| 欧美黄色大片网站| 欧美一级电影久久| 一区二区自拍偷拍| 成人一区二区视频| 日本10禁啪啪无遮挡免费一区二区 | 精品一区二区三区在线观看国产 | 国产成人三级在线播放 | 18禁裸乳无遮挡啪啪无码免费| 亚洲男人都懂第一日本| 中文字幕日韩高清| 久久久久久久久久91| 久久国产福利| 91香蕉亚洲精品| 午夜视频免费在线| 亚洲欧美在线观看| 波多野结衣之无限发射| 亚洲精品aa| 亚洲精品少妇网址| 91porn在线视频| 久久久久国产精品一区三寸 | 国产91在线免费| 日韩成人免费av| 国产视频精品在线| 亚洲最大的黄色网址| 乱人伦精品视频在线观看| 亚洲va男人天堂| 九色视频在线播放| 亚洲国产精品久久一线不卡| 五月婷婷狠狠操| ccyy激情综合| 色婷婷av一区二区三区久久| 国产一级做a爱片久久毛片a| 国产老女人精品毛片久久| 欧美亚州在线观看| 91福利区在线观看| 日韩一二三四区| 香蕉久久久久久久| 久久亚洲一区| 激情视频一区二区| 女囚岛在线观看| 欧美丰满少妇xxxbbb| 色欲狠狠躁天天躁无码中文字幕| 亚洲美女啪啪| 成人综合色站| 免费观看在线午夜影视| 在线亚洲一区观看| 中文字幕一区二区三区人妻| 狠狠综合久久av一区二区老牛| 国产三级精品网站| 东凛在线观看| 91电影在线观看| 免费看黄色aaaaaa 片| 亚洲视频碰碰| 91手机在线播放| 日本小视频在线免费观看| 欧美疯狂性受xxxxx喷水图片| 亚洲欧美va天堂人熟伦| 日韩高清一级片| 日本成人黄色| 五月激情久久| 亚洲日韩欧美视频一区| 亚洲不卡在线视频| 国产视频一区二区在线| av免费网站观看| 精品国产乱码久久久久久果冻传媒| 91精品国产91久久久久久久久| 色窝窝无码一区二区三区成人网站| 亚洲激情中文1区| 欧美一级片在线免费观看| 午夜天堂精品久久久久| 成人在线看片| 成人在线高清免费| 日韩久久免费视频| 久久久久久久久久一级| 国产女人18毛片水真多成人如厕 | 国产欧美日韩电影| 久久91精品国产| 亚洲国产精品久久久久爰性色| 亚洲精品国产a| 亚洲欧美高清在线| 妖精视频成人观看www| 欧美日韩另类综合| 日韩一区精品| 久久久国产一区| 精品久久久久成人码免费动漫| 亚洲一区二区三区视频在线播放 | 亚洲午夜精品一区| 这里只有精品在线| 国产日韩欧美精品| 日韩av超清在线观看| 中文字幕精品在线视频| 国产熟女一区二区三区四区| 一区二区久久久| 给我免费观看片在线电影的| 在线三级电影| 欧美成人女星排名| 五月婷婷亚洲综合| 国产精品每日更新在线播放网址| 色姑娘综合天天| 国产日韩欧美| 制服国产精品| 菁菁伊人国产精品| 国产精品美女主播| 色图在线观看| 亚洲日韩欧美视频一区| www.五月婷婷| 色香色香欲天天天影视综合网| 三级黄色免费观看| 成人h动漫精品| 激情五月俺来也| 亚洲久久成人| 一本色道久久综合亚洲二区三区 | 欧美老肥妇做.爰bbww| 黄色一级免费视频| 国产日韩精品一区| www男人天堂| 久久99精品久久久久久国产越南| 亚洲色成人www永久在线观看| 欧美日韩性在线观看| 成人免费在线看片| 欧美www.| 欧美精品video| 日韩在线资源| 亚洲精品视频免费在线观看| 国产又粗又长又黄| 91国在线观看| 五月婷婷激情网| 亚洲一区在线电影| 艳妇荡乳欲伦69影片| 久久久久久久久久久久久久久99| 欧美xxxx黑人| 激情六月婷婷综合| 97公开免费视频| 国产欧美欧美| 日韩精品在线中文字幕| 亚洲精品tv久久久久久久久久| 日韩欧美一区二区在线观看| 欧美精品密入口播放| 99久久精品免费看国产四区 | 欧美美女一区二区| 天天爽夜夜爽人人爽| 亚洲成人av一区二区| 欧美日韩在线视频免费| 国产精品成人一区二区三区夜夜夜| 爱爱的免费视频| 91一区在线观看| 精品人妻一区二区三区日产| 国产成人精品午夜视频免费| 色播五月激情五月| 蜜桃av一区二区在线观看| 999精品网站| 日韩高清在线一区| 人妻丰满熟妇av无码区app| 性感少妇一区| 日本三级免费网站| 国产精品久久777777毛茸茸 | 性欧美精品一区二区三区在线播放 | 老司机精品久久| 情侣黄网站免费看| 久久男女视频| 午夜dv内射一区二区| 日本免费在线视频不卡一不卡二| 日韩avxxx| 日本不卡不码高清免费观看| 看欧美ab黄色大片视频免费| 日韩av一二三| 亚洲人视频在线| 国产乱一区二区| 精品人妻在线视频| 成人avav影音| 日韩人妻一区二区三区| 91啪亚洲精品| 一级黄色毛毛片| 亚洲婷婷综合色高清在线| www.色小姐com| 亚洲v日本v欧美v久久精品| 日韩精品人妻中文字幕| 欧美视频二区36p| 国产情侣小视频| 欧美乱妇15p| 成人免费视频国产| 日韩激情视频在线播放| 二区三区在线播放| 欧美精品在线免费播放| cao在线视频| 国产精品69av| 久久在线观看| 久久国产精品久久精品国产| 欧美美女视频| 精品无码av无码免费专区| 国模 一区 二区 三区| 成年人免费在线播放| 免费av成人在线| 久草免费资源站| 久久精品亚洲精品国产欧美| 成人黄色短视频| 天天做天天摸天天爽国产一区 | 麻豆传媒一区二区| 成人黄色小视频| 久久久久久久久久久综合| 新狼窝色av性久久久久久| 在线一区二区不卡| 26uuu亚洲| 男人操女人的视频网站| 岛国av在线不卡| 国产乱子伦精品无码码专区| 亚洲精品美女久久| 麻豆tv入口在线看| 欧美一区第一页| 秋霞影院一区| 欧美一区亚洲二区| 国内精品美女在线观看| 鲁一鲁一鲁一鲁一av| 成人深夜在线观看| 欧美xxxooo| 色综合天天综合| 亚洲第一视频在线| www.亚洲一区| 日韩av中字| 国产精品手机视频| 国产精品毛片久久| 日本男人操女人| av一区二区三区| 欧美精品99久久久| 欧美精品免费视频| 国产在线高清| 欧美一级大胆视频| 哺乳一区二区三区中文视频| 伊人久久大香线蕉成人综合网 | 久久综合在线观看| 国产三级一区二区三区| 日韩欧美a级片| 日韩一区二区视频| 日本最黄一级片免费在线| 日韩av大片免费看| 欧美人与动xxxxz0oz| 少妇久久久久久被弄到高潮| 蜜乳av一区二区| 亚洲精品国产熟女久久久| 精品久久久久久中文字幕一区奶水| 99精品久久久久久中文字幕| 最新69国产成人精品视频免费| 天堂√8在线中文| 国产精品自拍首页| 欧美日韩三级| 四虎1515hh.com| 1024精品合集| 国产精品毛片久久久久久久av | 男人的天堂av网| 色综合久久久久| 巨骚激情综合| 国产999在线观看| 视频一区中文| 农村妇女精品一二区| 久久奇米777| 五月天婷婷导航| 国产一区二区激情| 国产一区一一区高清不卡| 日本在线播放不卡| 日韩高清一级片| 国产大屁股喷水视频在线观看| 在线看日韩精品电影| av资源种子在线观看| 国产精品久久久久久超碰| 日本一二区不卡| 午夜一级免费视频| 亚洲天堂a在线| www.我爱av| 97久久伊人激情网| 日韩有码中文字幕在线| 虎白女粉嫩尤物福利视频| 久久精品亚洲精品国产欧美kt∨ | 欧美大片拔萝卜| wwww在线观看免费视频| 久久精品国产综合精品| 久久久人人人| 久久午夜精品视频| 51精品秘密在线观看| 亚洲性图自拍| 九九九九久久久久| 男女激情视频一区| 午夜爱爱毛片xxxx视频免费看| 欧美一二三区精品| 波多野一区二区| 日韩精品资源| 韩国av一区二区| 日本视频免费在线| 夜夜嗨av色综合久久久综合网| 亚洲欧洲专区| 人人干视频在线| 中文字幕不卡在线播放| 国产欧美日韩成人| 国内精品在线一区| 成久久久网站| 欧美日韩一区二区区| 在线一区二区视频| 香蕉成人app免费看片| 久久久久久久有限公司| 蜜臀久久久久久久| 国产在线精品观看| 深夜福利91大全| 久久国产精品色av免费看| 亚洲老女人av| 亚洲国产综合人成综合网站| 九九在线视频| 97中文在线观看| 毛片基地黄久久久久久天堂| 国产性猛交普通话对白| 中文字幕精品国产| 少妇久久久久| 日本成人在线免费观看| 在线观看亚洲一区|