精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器學習中處理缺失值的9種方法

人工智能 機器學習
數據科學就是關于數據的。它是任何數據科學或機器學習項目的關鍵。在大多數情況下,當我們從不同的資源收集數據或從某處下載數據時,幾乎有95%的可能性我們的數據中包含缺失的值。

 數據科學就是關于數據的。它是任何數據科學或機器學習項目的關鍵。在大多數情況下,當我們從不同的資源收集數據或從某處下載數據時,幾乎有95%的可能性我們的數據中包含缺失的值。我們不能對包含缺失值的數據進行分析或訓練機器學習模型。這就是為什么我們90%的時間都花在數據預處理上的主要原因。我們可以使用許多技術來處理丟失的數據。在這個文章中,我將分享處理數據缺失的9種方法,但首先讓我們看看為什么會出現數據缺失以及有多少類型的數據缺失。

[[349856]]

 

不同類型的缺失值

缺失的值主要有三種類型。

  • 完全隨機缺失(MCAR):當數據為MCAR時,如果所有觀測的缺失概率都相同,則一個變量完全隨機缺失,這意味著數據缺失與數據集中任何其他觀察到的或缺失的值完全沒有關系。換句話說,那些缺失的數據點是數據集的一個隨機子集。
  • 丟失數據不是隨機的(MNAR):顧名思義,丟失的數據和數據集中的任何其他值之間存在某種關系。
  • 隨機丟失(MAR):這意味著數據點丟失的傾向與丟失的數據無關,但與數據集中其他觀察到的數據有關。

數據集中缺少值的原因有很多。例如,在數據集的身高和年齡,會有更多年齡列中缺失值,因為女孩通常隱藏他們的年齡相同的如果我們準備工資的數據和經驗,我們將有更多的薪水中的遺漏值因為大多數男人不喜歡分享他們的薪水。在更大的情況下,比如為人口、疾病、事故死亡者準備數據,納稅人記錄通常人們會猶豫是否記下信息,并隱藏真實的數字。即使您從第三方資源下載數據,仍然有可能由于下載時文件損壞而丟失值。無論原因是什么,我們的數據集中丟失了值,我們需要處理它們。讓我們看看處理缺失值的9種方法。

這里使用的也是經典的泰坦尼克的數據集

讓我們從加載數據集并導入所有庫開始。

 

  1. import pandas as pd 
  2. df=pd.read_csv("data/titanic.csv",usecols=['Age','Cabin','Survived']) 
  3. df.isnull().mean() 
  4. df.dtypes 

 

運行上述代碼塊后,您將看到Age、Cabin和裝載裝載包含空值。Age包含所有整數值,而Cabin包含所有分類值。

1、均值、中值、眾數替換

在這種技術中,我們將null值替換為列中所有值的均值/中值或眾數。

平均值(mean):所有值的平均值

 

  1. def impute_nan(df,column,mean): 
  2.     df[column+'_mean']=df[column].fillna(mean) ##NaN -> mean 
  3.      
  4. impute_nan(df,'Age',df.Age.mean()) ##mean of Age(29.69) 

 

機器學習中處理缺失值的9種方法

 

 

中值(median):所有值的中心值

 

  1. def impute_nan(df,column,median): 
  2.     df[column+'_mean']=df[column].fillna(median) 
  3. impute_nan(df,'Age',df.Age.median()) ##median of Age(28.0) 

 

 

機器學習中處理缺失值的9種方法

 

眾數(mode):最常見的值

 

  1. def impute_nan(df,column,mode): 
  2.     df[column+'_mean']=df[column].fillna(mode) 
  3. impute_nan(df,'Age',df.Age.mode()) ##mode of Age(24.0) 

 

 

機器學習中處理缺失值的9種方法

 

優點

  • 易于實現(對異常值健壯)
  • 獲得完整數據集的更快方法

缺點

  • 原始方差的變化或失真
  • 影響相關性
  • 對于分類變量,我們需要眾數。平均值和中位數都不行。

2、隨機樣本估算

在這種技術中,我們用dataframe中的隨機樣本替換所有nan值。它被用來輸入數值數據。我們使用sample()對數據進行采樣。在這里,我們首先取一個數據樣本來填充NaN值。然后更改索引,并將其替換為與NaN值相同的索引,最后將所有NaN值替換為一個隨機樣本。

優點

  • 容易實現
  • 方差失真更小

缺點

  • 我們不能把它應用于每一種情況

用隨機樣本注入替換年齡列NaN值

 

  1. def impute_nan(df,variable): 
  2.     df[variable+"_random"]=df[variable] 
  3.     ##It will have the random sample to fill the na 
  4.     random_sample=df[variable].dropna().sample(df[variable].isnull().sum(),random_state=0) 
  5.     ##pandas need to have same index in order to merge the dataset 
  6.     random_sample.index=df[df[variable].isnull()].index #replace random_sample index with NaN values index 
  7.     #replace where NaN are there 
  8.     df.loc[df[variable].isnull(),variable+'_random']=random_sample 
  9.     col=variable+"_random" 
  10.     df = df.drop(col,axis=1) 
  11.  
  12. impute_nan(df,"Age"

 

 

機器學習中處理缺失值的9種方法

 

3、用新特性獲取NAN值

這種技術在數據不是完全隨機丟失的情況下最有效。在這里,我們在數據集中添加一個新列,并將所有NaN值替換為1。

優點

  • 容易實現
  • 獲取了了NaN值的重要性

缺點

  • 創建額外的特性(維度詛咒)

 

  1. import numpy as np 
  2. df['age_nan']=np.where(df['Age'].isnull(),1,0) 
  3. ## It will create one new column that contains value 1 in the rows where Age value is NaN, otherwise 0.  

 

4、End of Distribution

在這種技術中,我們用第3個標準偏差值(3rd standard deviation)替換NaN值。它還用于從數據集中刪除所有異常值。首先,我們使用std()計算第3個標準偏差,然后用該值代替NaN。優點

  • 容易實現。
  • 抓住了缺失值的重要性,如果有的話。

缺點

  • 使變量的原始分布失真。
  • 如果NAN的數量很大。它將掩蓋分布中真正的異常值。
  • 如果NAN的數量較小,則替換后的NAN可以被認為是一個離群值,并在后續的特征工程中進行預處理。

 

  1. def impute_nan(df,variable,median,extreme): 
  2.     df[variable+"_end_distribution"]=df[variable].fillna(extreme) 
  3.      
  4. extreme=df.Age.mean()+3*df.Age.std() ##73.27--> 3rd std deviation  
  5. impute_nan(df,'Age',df.Age.median(),extreme) 

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

5、任意值替換

在這種技術中,我們將NaN值替換為任意值。任意值不應該更頻繁地出現在數據集中。通常,我們選擇最小離群值或最后離群值作為任意值。

優點

  • 容易實現
  • 獲取了缺失值的重要性,如果有的話

缺點

  • 必須手動確定值。

 

  1. def impute_nan(df,var): 
  2.     df[var+'_zero']=df[var].fillna(0) #Filling with 0(least outlier) 
  3.     df[var+'_hundred']=df[var].fillna(100) #Filling with 100(last
  4.  
  5. impute_nan(df,'Age'

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

6、頻繁類別歸責

該技術用于填充分類數據中的缺失值。在這里,我們用最常見的標簽替換NaN值。首先,我們找到最常見的標簽,然后用它替換NaN。

優點

  • 容易實現

缺點

  • 由于我們使用的是更頻繁的標簽,所以如果有很多NaN值,它可能會以一種過度表示的方式使用它們。
  • 它扭曲了最常見的標簽之間的關系。

 

  1. def impute_nan(df,variable): 
  2.     most_frequent_category=df[variable].mode()[0] ##Most Frequent 
  3.     df[variable].fillna(most_frequent_category,inplace=True
  4.      
  5. for feature in ['Cabin']:           ##List of Categorical Features 
  6.     impute_nan(df,feature) 

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

7、nan值視為一個新的分類

在這種技術中,我們只需用一個新的類別(如Missing)替換所有NaN值。

 

  1. df['Cabin']=df['Cabin'].fillna('Missing') ##NaN -> Missing 

8、使用KNN填充

在這項技術中,我們使用sklearn創建一個KNN imputer模型,然后我們將該模型與我們的數據進行擬合,并預測NaN值。它被用來計算數值。這是一個5步的過程。

  • 創建列列表(整數、浮點)
  • 輸入估算值,確定鄰居。
  • 根據數據擬合估算。
  • 轉換的數據
  • 使用轉換后的數據創建一個新的數據框架。

優點

  • 容易實現
  • 結果一般情況下會最好

缺點

  • 只適用于數值數據

我們在上篇文章中已經有過詳細的介紹,這里就不細說了

在python中使用KNN算法處理缺失的數據

9、刪除所有NaN值

它是最容易使用和實現的技術之一。只有當NaN值小于10%時,我們才應該使用這種技術。

優點:

  • 容易實現
  • 快速處理

缺點:

  • 造成大量的數據丟失

 

  1. df.dropna(inplace=True) ##Drop all the rows that contains NaN 

總結

還有更多處理丟失值的其他技術。我們的目標是找到最適合我們的問題的技術,然后實施它。處理丟失的值總是一個更好的主意,但有時我們不得不刪除所有的值。它基本上取決于數據的類型和數量。

責任編輯:華軒 來源: 今日頭條
相關推薦

2020-10-31 17:16:31

機器學習數據缺失數據科學

2024-10-18 07:10:43

2024-07-29 08:00:00

2021-04-12 09:00:00

機器學習深度學習技術

2022-08-30 00:31:12

機器學習超參數調優算法

2020-11-27 15:57:28

Github應用速度

2022-09-20 23:38:24

機器學習工具數字優化

2023-03-16 15:13:41

缺失值據集中數據分析

2022-01-16 09:30:34

Ansible自動化工具開源

2023-09-25 15:08:43

Python方離群值

2020-08-10 00:30:55

備份密碼iPhone移動安全

2021-04-01 22:19:54

機器學習模型數據

2021-11-02 07:54:40

List分片Java

2016-03-31 14:16:56

2021-01-20 15:43:01

機器學習深度學習科學

2022-08-30 18:13:38

機器學習

2023-10-30 17:41:29

機器人自動化

2023-05-16 17:00:06

機器人人工智能

2019-03-27 08:51:38

機器學習類失衡算法

2010-09-08 13:29:48

CSS
點贊
收藏

51CTO技術棧公眾號

国产黄在线观看| 日韩精品在线播放| 成人97在线观看视频| 日本免费a视频| 欧美激情 一区| 亚洲七七久久综合桃花剧情介绍| av不卡在线看| 尤物视频一区二区| 热草久综合在线| 亚洲少妇一区二区三区| 午夜毛片在线| 久久综合亚州| 日韩成人在线网站| 麻豆映画在线观看| 中文av免费观看| 日韩a级大片| 亚洲午夜电影网| 7777奇米亚洲综合久久| 成人18视频免费69| 国产精品高清乱码在线观看| 成人免费毛片嘿嘿连载视频| 中文字幕视频在线免费欧美日韩综合在线看 | 欧美一级二级三级蜜桃| 热舞福利精品大尺度视频| 久草免费新视频| 欧美成人精品一级| 国产精品护士白丝一区av| 日本一区二区三区四区视频| 亚洲 欧美 日韩在线| 国产中文字幕在线视频| 亚洲影院免费| 亚洲免费一在线| 丁香啪啪综合成人亚洲| 四虎精品成人免费网站| av成人黄色| 欧美激情videoshd| 国产乱国产乱老熟300部视频| 欧美日韩经典丝袜| 成人动漫一区二区| 人九九综合九九宗合| 欧美成人黄色网| 国产精品毛片av| 岛国av在线不卡| 日韩av不卡播放| 亚洲视屏在线观看| 欧美r级电影| 91精品久久久久久久久99蜜臂| www.黄色网址.com| 蜜桃av中文字幕| 亚洲精品黄色| 亚洲小视频在线观看| 日本激情视频在线播放| 欧美a在线看| 国产a级毛片一区| 欧美最顶级丰满的aⅴ艳星| 久久黄色免费网站| 国产综合激情| 亚洲欧洲一区二区三区在线观看 | 久草精品在线观看| 久久高清视频免费| 91av在线免费| 黄色精品视频| 又紧又大又爽精品一区二区| 国产又粗又爽又黄的视频| 欧美日韩欧美| 亚洲欧洲综合另类| 精品亚洲第一| 中日精品一色哟哟| 韩国精品在线观看| 日本中文字幕不卡免费| 天码人妻一区二区三区在线看| 欧美一区二区三| 精品成人一区二区| 中文字幕网av| 国产成人久久精品一区二区三区| 午夜伊人狠狠久久| 一区二区视频在线免费| 少妇精品视频一区二区| 久久99国产乱子伦精品免费| 成人精品视频久久久久| 天堂中文字幕在线观看| 亚洲乱码免费伦视频| 亚洲精品少妇网址| 亚洲av熟女国产一区二区性色| 亚洲综合色婷婷在线观看| 日本久久精品电影| 成人手机在线播放| 2020国产在线| 亚洲少妇最新在线视频| 国产美女永久无遮挡| xxxxx性欧美特大| 亚洲妇熟xx妇色黄| 三级在线免费观看| 女海盗2成人h版中文字幕| 国产精品久久久久久久久免费桃花| 一区二区在线高清视频| 高清在线视频不卡| 亚洲尤物在线视频观看| 免费观看中文字幕| www视频在线观看| 欧美无砖砖区免费| 欧美视频免费播放| zzzwww在线看片免费| 欧美性受xxxx黑人xyx性爽| 香蕉视频在线观看黄| 国产一区二区久久久久| 亚洲精品国产福利| 制服丝袜av在线| 青青一区二区三区| 亚州成人av在线| 男人操女人的视频网站| 久久精品av| 97香蕉超级碰碰久久免费的优势| 亚洲天堂中文在线| 久久99久国产精品黄毛片色诱| 国产成人精品自拍| 亚洲成人一级片| 国产精品亚洲а∨天堂免在线| 91精品久久久久久久久中文字幕| 神马午夜一区二区| 亚洲精品一二三四区| 玖玖精品在线视频| 精品欧美日韩精品| 亚洲精品电影网在线观看| 污软件在线观看| 97在线精品| 热草久综合在线| 偷拍精品一区二区三区| 久久青草欧美一区二区三区| 欧美日韩免费精品| 国产乱视频在线观看| 午夜视频一区在线观看| 国产xxxxhd| 久久365资源| 亚洲色图偷窥自拍| 精品欧美一区二区三区免费观看 | 一区二区三区在线免费观看视频| 不卡av电影在线播放| 996这里只有精品| 先锋成人av| 91精品免费在线观看| 国产大屁股喷水视频在线观看| 久久久夜夜夜| 欧美国产综合视频| 中老年在线免费视频| 欧美网站一区二区| 亚洲区自拍偷拍| 99热国内精品| 亚州成人av在线| 黄色aaa大片| 日本一区免费视频| 国产成人在线小视频| 一区二区三区欧洲区| 欧美激情精品久久久久久| 精品国产亚洲一区二区麻豆| 99re热这里只有精品视频| 日韩久久精品一区二区三区| 不卡一二三区| 伊人伊成久久人综合网小说| 波多野结衣喷潮| 国产日韩欧美三级| 亚洲一区二区三区乱码aⅴ| 亚洲精品一区二区三区不卡| 亚洲在线观看免费视频| 性囗交免费视频观看| 国产精品主播| 色综合久久88色综合天天提莫| 在线中文免费视频| 一本色道久久综合狠狠躁的推荐| 国产免费中文字幕| 婷婷综合成人| 国产精品大陆在线观看| 亚洲不卡免费视频| 午夜精品久久久久久久99樱桃 | 久久久激情视频| 日本a级片在线播放| 日韩中文字幕无砖| 中文字幕欧美国内| 国产伦子伦对白视频| 2021中文字幕一区亚洲| 热久久精品免费视频| 超碰一区二区三区| 久久成人在线视频| 人人妻人人澡人人爽人人欧美一区 | 日韩精品欧美专区| 免费精品一区| 日本久久中文字幕| a黄色片在线观看| 色激情天天射综合网| 来吧亚洲综合网| 成人av免费观看| 美女网站视频黄色| 激情自拍一区| 96sao精品视频在线观看| 6699嫩草久久久精品影院| 亚洲丝袜av一区| 午夜精品一二三区| 在线一区二区视频| 性欧美13一14内谢| 最新成人av网站| 亚洲精品成人自拍| 欧美三级网址| 亚洲欧美一区二区三区四区| 国产农村老头老太视频| 欧美体内谢she精2性欧美| 久久福利小视频| 激情综合网激情| 黄色片视频在线播放| 欧美三区在线| 成人在线观看网址| 99久久亚洲国产日韩美女| 一区二区三区精品99久久| 丰满人妻熟女aⅴ一区| 欧美日韩一级二级| 欧美88888| 久久综合精品国产一区二区三区| 性色av浪潮av| 看国产成人h片视频| 中文字幕一区二区三区有限公司 | 国产一区二区视频在线观看免费| 99国产精品久久久久久久久久久| 黄色片免费网址| 欧美freesex交免费视频| 97欧洲一区二区精品免费| 成人1区2区| 国产成人91久久精品| 成年人视频网站在线| 欧美日韩久久一区二区| 卡通动漫亚洲综合| 欧美激情综合五月色丁香小说| 日本黄色录像片| 成人精品电影在线观看| 超碰人人cao| 国产剧情在线观看一区二区| 色一情一区二区三区| 午夜精品剧场| 椎名由奈jux491在线播放| 欧美a级片视频| 亚洲欧美精品| 日本精品黄色| 亚洲一区二三| 国产精品2023| 国产超碰91| 国产精品黄网站| 国产精品免费一区二区三区观看| 亚洲黄色中文字幕| 2021久久精品国产99国产精品| 久久国产精品高清一区二区三区| 亚洲成人精品久久| 中文字幕777| 欧美私人免费视频| 亚洲在线观看av| 在线成人小视频| 五月婷婷视频在线| 色婷婷一区二区| 国产精品成人久久久| 欧美日韩一区二区三区高清| 888奇米影视| 一本大道久久a久久综合| 天干夜夜爽爽日日日日| 一区二区成人在线视频| 久久综合加勒比| 中文字幕av一区二区三区高| 日本一区二区免费视频| caoporn国产精品| 亚洲色图偷拍视频| 国产乱子伦视频一区二区三区| 韩国三级丰满少妇高潮| 成人性生交大片免费看中文| 亚洲天堂资源在线| 国产人成一区二区三区影院| 亚洲色图第四色| 亚洲色图欧洲色图婷婷| 日本免费在线播放| 国产精品三级av| 超碰97人人干| 成人97人人超碰人人99| 伊人网伊人影院| 国产精品人妖ts系列视频| 综合五月激情网| 精品福利在线看| 久久久久黄色片| 懂色av影视一区二区三区| 亚洲中文无码av在线| 日韩一级黄色片| 免费在线稳定资源站| 亚洲成色777777女色窝| 精品视频二区| 久久影视电视剧免费网站清宫辞电视 | 国产一区二区在线不卡| 精品久久久久一区二区国产| 一级久久久久久久| 亚洲国产精品久久91精品| 国产黄色片在线观看| 欧美激情二区三区| 国产精品第一国产精品| 国产精品一区二区三区免费| 青青草成人影院| 俄罗斯av网站| 亚洲国产专区| 欧美午夜aaaaaa免费视频| 伊人久久综合| www亚洲成人| 99精品在线观看视频| 人人干在线观看| 欧美视频在线观看免费网址| 国产片在线播放| 亚洲视频在线播放| 99色在线观看| 亚洲专区中文字幕| 色偷偷综合网| 人人妻人人澡人人爽精品欧美一区| 成人精品中文字幕| 日本少妇高潮喷水视频| 国产一区在线观看麻豆| 午夜免费视频网站| 中文字幕乱码久久午夜不卡| 日韩精品久久久久久久酒店| 都市激情亚洲色图| 国产超碰人人模人人爽人人添| 欧美刺激午夜性久久久久久久| 性少妇videosexfreexxx片| 亚洲人成伊人成综合网久久久| 另类视频在线| 99精彩视频| 男人的天堂久久| 欧美日韩一区综合| 在线精品在线| 野花视频免费在线观看| 日韩一区中文字幕| 国产亚洲精品女人久久久久久| 欧美日韩一二三| avtt亚洲| 欧美日韩成人网| 午夜影院在线播放| 鬼打鬼之黄金道士1992林正英| 一区二区电影在线观看| 亚洲精品第三页| 国产精品第五页| 一级黄色片网站| yellow中文字幕久久| 高清电影在线观看免费| 国产91在线播放| 久久91精品| 永久免费精品视频网站| 美洲天堂一区二卡三卡四卡视频| 午夜免费视频网站| 亚洲美女屁股眼交| 国产不卡精品视频| 久久免费精品日本久久中文字幕| 久久sese| 日产中文字幕在线精品一区 | 国产91精品青草社区| 日韩美女国产精品| 黑人糟蹋人妻hd中文字幕| 91免费小视频| 午夜爽爽爽男女免费观看| 欧美高清你懂得| 亚洲男同gay网站| 国产伦精品一区二区| 亚洲影院一区| 91成人在线免费视频| 欧美片网站yy| 三级资源在线| 久久精品99| 午夜亚洲福利| 日韩www视频| 91精品91久久久中77777| 日本a级在线| 国产精品国产三级欧美二区| 99热免费精品在线观看| 亚洲自拍偷拍图| 5858s免费视频成人| 丁香花电影在线观看完整版| 蜜桃91精品入口| 国产精品v日韩精品v欧美精品网站 | 日本人体一区二区| 久久99精品久久久久| 久久国产精品波多野结衣av| 亚洲精品成a人在线观看| 香蕉视频亚洲一级| 女同性恋一区二区| 2021中文字幕一区亚洲| 国产又黄又粗又长| 国产亚洲欧美aaaa| 国产一区二区三区免费观看在线 | www色aa色aawww| 亚洲国产日韩精品在线| 国产精品原创视频| 久久久久久久有限公司| 麻豆一区二区三区| 日本网站免费观看| 精品久久久久久亚洲综合网| 成人爱爱网址| 日本三级中文字幕在线观看| www国产成人| 不卡视频在线播放| 国产精品入口免费视| 国产精品一区2区3区| 人人妻人人添人人爽欧美一区|