精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用可視化工具和統計方法檢測異常值

人工智能 機器學習
異常值(離群值)是指距離其他數據值太遠的數據值。數據異常值可能是自然產生的,也可能是由于測量不準確、或系統故障造成的。與缺失值類似,異常值會破壞數據科學項目并返回錯誤的結果或預測。異常值也可能出現在傾斜數據中,這些類型的異常值被認為是自然異常值。

異常值(離群值)是指距離其他數據值太遠的數據值。數據異常值可能是自然產生的,也可能是由于測量不準確、或系統故障造成的。與缺失值類似,異常值會破壞數據科學項目并返回錯誤的結果或預測。異常值也可能出現在傾斜數據中,這些類型的異常值被認為是自然異常值。

異常值會影響數據的平均值、標準差和四分位范圍。如果我們在去除異常值之前和之后計算這些統計數據,我們會得到不同的結果。

圖片

Carla Martins


異常值如何影響機器學習模型?

如果我們的異常值是自然的而不是由于測量誤差,則應該將它保留在數據集中,并執行數據轉換來對其進行規范化處理。如果我們的數據集很大,但異常值很少,我們應該保留這些異常值,因為它們不會顯著影響結果,并且可以為我們的模型帶來泛化的效果。

如果我們非常確定我異常值是由于測量誤差帶來的,則應該從數據集中刪除它們。去除異常值的將減少數據集的大小,并可以讓我們的模型的適用到所包含的度量范圍。但是要記住去掉自然異常值可能導致模型不準確。

使用可視化工具檢測異常值

異常值是不容易被“肉眼”發現的,但是有一些可視化工具可以幫助完成這項任務。最常見的是箱形圖和直方圖。

和往常一樣,我們第一步是加載必要的庫和導入/加載數據集。這里將使用??insurance.csv??。

import numpy as np
import pandas as pd
import seaborn as sns
import statistics

df = pd.read_csv('insurance.csv')
df

圖片

我們將檢查age,bmi和expenses的異常值。

第一種方法是用box - plot表示數據分布:

sns.boxplot(y="age", data=df)
sns.boxplot(y="bmi", data=df)
sns.boxplot(y="expenses", data=df)

圖片

從箱線圖我們可以看到age沒有異常值bmi在上界有一些異常值,而expenses在上界有很多異常值,這表明了這是一個偏態分布。為了檢查這個偏態分布的傾斜程度,我們將使用直方圖。

sns.histplot(df, x="age", kde=True)
sns.histplot(df, x="bmi", kde=True)
sns.histplot(df, x="expenses", kde=True)

圖片

從直方圖中可以看出,年齡變量均勻分布,bmi接近正態分布,expenses偏態分布。通過分析這兩種圖形表示,我們可以決定要排除那些數據。對于年齡不排除任何值。對于bmi我們將排除高于47的值,對于費用,我們將排除高于50000的值。

df.drop(df[df['bmi'] >= 47].index, inplace = True)
df.drop(df[df['expenses'] >= 50000].index, inplace = True)

現在如果再次檢查箱線圖和直方圖:

圖片

用統計方法檢測異常值

有兩種主要的統計方法可以檢測異常值:使用z分數和使用四分位范圍。

1、使用Z-score檢測異常值

Z-score是一種數學變換,根據其與均值的距離對每個觀察結果進行分類。與平均值之間的距離用標準差(SD)來衡量。如果得到的數值為1.59,我們就知道觀察值比平均值高出1.59個標準差。同理如果得到-2.4的Z-score,我們就會知道觀察值比平均值低-2.4個標準差。高于3SD或低于-3SD的觀測值一般會被認為是異常值。

下面我們用代碼實現,首先查看age:

df = pd.read_csv('insurance.csv')
mean_age = statistics.mean(df['age'])
stdev_age = statistics.stdev(df['age'])

age_z_score = (df['age']-mean_age)/stdev_age
df['age_z_score'] = age_z_score.tolist()

現在查看是否有低于-3SD的值:

df.sort_values(by=['age_z_score'], ascending=True)

圖片

可以看到沒有低于-3SD的值。現在檢查3SD以上的值:

圖片

我們可以看到沒有高于3SD的值。也就是說age沒有異常值。現在對變量bmi做同樣的操作:

mean_bmi = statistics.mean(df['bmi'])
stdev_bmi = statistics.stdev(df['bmi'])
bmi_z_score = (df['bmi']-mean_bmi)/stdev_bmi
df['bmi_z_score'] = bmi_z_score.tolist()

df.sort_values(by=['bmi_z_score'], ascending=True)
df.sort_values(by=['bmi_z_score'], ascending=False)

查看3SD以上的值:

圖片

將這些值刪除:

df.drop(df[df[‘bmi_z_score’] >= 3].index, inplace = True)

下一步用同樣的方法計算expenses:

mean_expenses = statistics.mean(df['expenses'])
stdev_expenses = statistics.stdev(df['expenses'])
expenses_z_score = (df['expenses']-mean_expenses)/stdev_expenses
df['expenses_z_score'] = expenses_z_score.tolist()

df.sort_values(by=['expenses_z_score'], ascending=True)
df.sort_values(by=['expenses_z_score'], ascending=False)
df.drop(df[df[‘expenses_z_score’] >= 3].index, inplace = True)

刪除了數據以后,我們再次可視化數據:

圖片

可以看到,一些值已經被移除了

2、使用四分位距檢測異常值

四分位距將數據分布到四個部分,并且從低到高排序,如下圖所示,每個部分包含相同數量的樣本。第一個四分位(Q1)是邊界上的數據點的值。Q2和Q3也是如此。四分位距(IQR)是兩個中間部分的數據點(代表50%的數據)。四分位距包含所有高于Q1低于Q3的數據點。如果該點高于Q3 + (1.5 x IQR),則表示包含較高數值離群值,如果Q1?(1.5 x IQR)則存在較低數值的離群值。

圖片

代碼如下:

df = pd.read_csv('insurance.csv')
q75_age, q25_age = np.percentile(df['age'], [75 ,25])
iqr_age = q75_age - q25_age
iqr_age

age_h_bound = q75_age+(1.5*iqr_age)
age_l_bound = q25_age-(1.5*iqr_age)
print(age_h_bound)
print(age_l_bound)

圖片

這樣就知道了異常值位于87以上或-9以下:

df.sort_values(by=['age'], ascending=True)

圖片

可以看到沒有下異常值,現在我們將檢查上異常值:

df.sort_values(by=['age'], ascending=False)

也沒有上異常值。

下面對bmi執行同樣的操作:

q75_bmi, q25_bmi = np.percentile(df['bmi'], [75 ,25])
iqr_bmi = q75_bmi - q25_bmi
iqr_bmi

bmi_h_bound = q75_bmi+(1.5*iqr_bmi)
bmi_l_bound = q25_bmi-(1.5*iqr_bmi)
print(bmi_h_bound)
print(bmi_l_bound)

df.sort_values(by=['bmi'], ascending=True)
df.sort_values(by=['bmi'], ascending=False)

df.drop(df[df['bmi'] >= 47.3].index, inplace = True)
df.drop(df[df['bmi'] <= 13.7].index, inplace = True)

expenses也是用相同的方法進行處理,我們對結果進行可視化:

圖片

可以看到異常值也被刪除了。


責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2017-07-03 16:44:10

數據庫MongoDBNoSQL

2017-07-27 09:49:37

Python工具Matplotlib

2017-07-04 16:00:16

PythonMatplotlib可視化工具

2022-10-21 15:47:59

測試工具鴻蒙

2021-03-30 10:10:37

PyTorch可視化工具命令

2020-07-16 15:10:46

工具可視化Python

2021-04-11 09:51:25

Redis可視化工具

2021-03-18 09:07:13

日志可視化工具Devops

2015-12-02 09:44:04

Python視化工具

2019-10-14 15:51:40

可視化技術微軟數據庫

2017-07-25 13:42:00

大數據可視化工具

2020-04-20 08:22:41

SOC安全工具網絡攻擊

2018-05-31 08:25:13

誤區工具可視化

2022-05-07 09:02:27

數據可視化工具庫

2022-11-15 15:14:05

2020-11-15 18:00:49

開源可視化工具Python

2021-09-18 08:02:49

Go程序工具

2018-08-16 10:05:07

2017-09-01 10:11:04

深度學習可視化工具

2019-09-27 09:12:18

開源數據可視化大數據
點贊
收藏

51CTO技術棧公眾號

91亚洲成人| av漫画网站在线观看| 久久99热狠狠色一区二区| 日韩在线视频中文字幕| 男插女视频网站| 都市激情久久综合| 久久色在线观看| 日韩av片电影专区| 成人精品一二三区| 亚洲国产aⅴ精品一区二区| 亚洲一区二区三区爽爽爽爽爽| 国产美女精品在线观看| 中文字幕精品视频在线观看| 蜜桃精品噜噜噜成人av| 欧美夫妻性生活| 草草视频在线免费观看| 黄色av免费在线看| 国产一区二区视频在线播放| 91精品国产色综合| 美国美女黄色片| 91精品啪在线观看国产手机| 一本一本大道香蕉久在线精品| 日韩久久不卡| 亚洲国产日韩在线观看| 日韩av不卡一区二区| 日韩亚洲综合在线| 日韩成人av一区二区| 欧美美女福利视频| 福利视频一区二区| 成人污网站在线观看| 黄色在线网站| 国产成人午夜99999| 国产精品久久久久久久av大片| 欧美另类视频在线观看| 国产一区二区三区四区大秀| 精品国产免费人成在线观看| 国内外成人免费在线视频| 欧美黑人猛交的在线视频| 国产精品免费丝袜| 欧美 日韩 国产在线| 精品人妻一区二区三区含羞草| 久久一区精品| 久久青草福利网站| 永久免费看mv网站入口| 精品高清在线| 亚洲毛茸茸少妇高潮呻吟| 中文字幕 欧美 日韩| 久久69成人| 在线国产电影不卡| 男女超爽视频免费播放| 97超碰在线公开在线看免费| 亚洲国产高清在线| 日本一区二区三区www| 亚洲av无码乱码国产精品| 美女一区二区视频| 国产91亚洲精品| 日日噜噜噜噜人人爽亚洲精品| 国语自产精品视频在线看8查询8| www.久久久久| 亚洲天堂精品一区| 米奇777超碰欧美日韩亚洲| 亚洲激情视频网| 欧美xxxx×黑人性爽| 久久综合五月婷婷| 亚洲精品一区av在线播放| 中文字幕一区二区三区人妻电影| 国产影视一区| www.亚洲天堂| 青青草手机视频在线观看| 精品99视频| 欧美影院在线播放| 伊人久久中文字幕| 国产毛片精品视频| 国产精品久久一区二区三区| 天堂成人在线视频| 国产午夜亚洲精品理论片色戒| 视频在线精品一区| av毛片在线播放| 欧美日韩久久久久| 青青青国产在线视频| 电影中文字幕一区二区| 精品播放一区二区| 最近中文字幕在线mv视频在线| 久久福利影院| 欧美精品国产精品日韩精品| 探花视频在线观看| 久久电影国产免费久久电影| 成人一区二区在线| 免费动漫网站在线观看| 亚洲欧美在线aaa| 日韩欧美一区二| 九九久久国产| 亚洲精品国产欧美| 老司机成人免费视频| 夜夜嗨网站十八久久| 国产女人精品视频| 色一情一乱一乱一区91av| 国产日韩欧美a| 777久久精品一区二区三区无码 | 天堂成人娱乐在线视频免费播放网站| 亚洲欧美一区二区三区四区| 一区视频免费观看| 米奇777在线欧美播放| 91免费在线视频| 人成免费电影一二三区在线观看| 成人免费一区二区三区视频| 丰满爆乳一区二区三区| 999精品视频在线观看| 日韩精品视频三区| 九九九免费视频| 美女网站在线免费欧美精品| 国内精品久久国产| 成人在线观看免费网站| 欧美亚洲自拍偷拍| 女同性恋一区二区三区| 综合av在线| 国产免费观看久久黄| 九九热视频在线观看| 亚洲成人动漫在线观看| 天堂av.com| 欧美一级本道电影免费专区| 国内精品久久久久影院 日本资源| 一二三区中文字幕| 国产欧美精品一区| 国产成人a亚洲精v品无码| 国产精品任我爽爆在线播放| 久久天天躁狠狠躁夜夜躁| 99re这里只有精品在线| 99久久精品一区二区| 亚洲天堂第一区| 色综合久久久| 日韩在线视频国产| jizz国产在线观看| 2024国产精品| 1024av视频| 久久丝袜视频| 91国产视频在线播放| 国产 日韩 欧美 综合| 亚洲精品成a人| 成人在线短视频| 亚洲国产精品久久久久蝴蝶传媒| 国产精品午夜国产小视频| 毛片免费在线观看| 在线中文字幕一区| 男人舔女人下部高潮全视频| 日韩精品久久理论片| 欧美亚洲丝袜| 奇米777日韩| 一本一本久久a久久精品牛牛影视| 精品一区二三区| 亚洲国产成人在线| 最新天堂中文在线| 久久精品青草| 亚洲自拍中文字幕| 日韩伦理电影网站| 欧美成人一区二区三区片免费 | 调教视频免费在线观看| 欧美人妖巨大在线| 国产极品国产极品| 国产成人精品三级麻豆| 97免费视频观看| 麻豆精品av| 国产成人啪精品视频免费网| 成在在线免费视频| 在线播放国产精品二区一二区四区| 成人信息集中地| 国产一区二区三区黄视频 | 日韩精品一二三| 色综合久久久久久久久五月| 国产欧美自拍| 久久综合色88| 日本国产在线观看| 日韩欧美福利视频| 欧美视频一区二区在线| 国产69精品久久久久毛片| 动漫av网站免费观看| 成人看的视频| 99视频免费观看| 在线高清av| 久久深夜福利免费观看| 亚洲卡一卡二卡三| 色婷婷国产精品久久包臀| 免费一级特黄3大片视频| 国产激情91久久精品导航| 青青青青草视频| 久久亚洲精品中文字幕蜜潮电影| 99re在线| 国产精品亚洲d| 欧美激情第1页| 成人免费在线视频网| 欧美一级片在线观看| 免费黄色网址在线| 亚洲男人的天堂在线aⅴ视频| 毛茸茸free性熟hd| 麻豆精品久久精品色综合| 日本免费a视频| 日韩一级毛片| 久中文字幕一区| 久久久精品区| 国产精品69精品一区二区三区| 菠萝菠萝蜜在线视频免费观看 | 性欧美13一14内谢| 激情综合一区二区三区| 免费成人午夜视频| 牛牛国产精品| 亚洲国产精品一区在线观看不卡| 露出调教综合另类| 亚洲aa中文字幕| 日韩在线观看不卡| 午夜精品久久久久久久久久久久| 久操视频在线免费播放| 亚洲免费电影在线观看| 精品国产乱码一区二区三| 欧美图区在线视频| 在线观看国产亚洲| 一区二区高清免费观看影视大全| 69xxx免费| 久久夜色精品国产欧美乱极品| 自拍偷拍激情视频| 国产呦萝稀缺另类资源| 成人性生生活性生交12| 亚洲欧美日韩国产| 成人在线国产视频| 中国精品18videos性欧美| 亚欧精品在线| 精品少妇av| 欧美久久综合性欧美| 久久亚州av| 精品国产乱码久久久久| 亚洲精品a区| 91福利入口| 国产精品一区二区美女视频免费看 | 亚洲国产精品成人av| 国产肥老妇视频| 欧美久久久久久蜜桃| 91成年人视频| 欧美久久久久久久久久| 在线观看国产精品入口男同| 在线免费观看日本欧美| 黄色av一级片| 91国偷自产一区二区开放时间| 国产精品久久久久久久妇| 亚洲第一搞黄网站| 日本少妇激情视频| 亚洲国产美女搞黄色| 久久精品无码人妻| 亚洲成在线观看| 日韩精品在线观看免费| 亚洲国产一区二区视频| 日本熟妇成熟毛茸茸| 欧美日韩国产区| 看黄色一级大片| 欧美日韩亚洲综合在线 欧美亚洲特黄一级 | 91成人在线免费观看| 老熟妇一区二区三区| 在线观看免费亚洲| 中文字幕码精品视频网站| 欧美日韩另类一区| 91丨porny丨在线中文 | 国产成人精品电影| 亚洲伦理影院| 国产色综合天天综合网 | 小h片在线观看| 国产精品高潮在线| va天堂va亚洲va影视| 成人3d动漫一区二区三区91| 欧美美女黄色| 日韩欧美三级一区二区| 亚洲精品一区二区妖精| www.日本三级| 中日韩视频在线观看| 亚洲精品高清无码视频| 久久成人久久鬼色| 免费黄色在线播放| 91丨porny丨最新| 精品日韩在线视频| 亚洲欧美另类小说| 五月天综合激情网| 欧美日韩激情在线| 午夜精品久久久久久久爽 | 3d动漫精品啪啪1区2区免费| 成 人片 黄 色 大 片| 亚洲精品天天看| 国产美女福利在线| 97在线观看免费| 国产精品麻豆成人av电影艾秋| 91精品国产一区二区三区动漫| 久久午夜影院| 伊人久久大香线蕉成人综合网 | 国产九九热视频| 国产风韵犹存在线视精品| 国产精品揄拍100视频| 中文在线一区二区 | 成人国产免费电影| 91精品国产91久久久久福利| 日韩一级特黄| 久久精品人人做人人爽电影| 99精品小视频| av天堂永久资源网| 国产**成人网毛片九色 | 91精品在线影院| 香蕉视频一区二区三区| 日本久久高清视频| 久色成人在线| 国产伦精品一区二区三区88av| 国产精品全国免费观看高清 | 日韩一区二区电影| 草草影院在线观看| 国内精品久久久久久久久| 亚洲免费一区| 日韩精品国内| 国产一区二区精品| 黄页网站在线看| 国产精品成人一区二区三区夜夜夜| 国产专区第一页| 精品国产一区二区亚洲人成毛片| 瑟瑟视频在线| 日韩免费中文字幕| 欧美aaaaa级| 日韩亚洲欧美视频| 国产精品一区在线| 亚洲 欧美 国产 另类| 色婷婷av一区二区三区大白胸| 欧美一级一区二区三区| 欧美精品一区二区免费| 国产激情久久| 亚洲欧洲国产精品久久| 日韩av一区二区三区四区| 亚洲午夜福利在线观看| 婷婷久久综合九色综合绿巨人 | 中文字幕日韩欧美| 在线观看的黄色| 欧美精品七区| 久久久人人人| 成人精品999| 一本一道久久a久久精品综合蜜臀| 亚洲色图另类小说| 4438全国亚洲精品在线观看视频| 91精品丝袜国产高跟在线| 神马影院一区二区| 日韩综合小视频| 国产综合精品在线| 欧美午夜电影网| 免费观看成人高潮| 成人久久久久久| 小小影院久久| 一级黄色大片儿| 一区二区三区免费网站| 亚洲精品国产片| 久久久久久久久久久亚洲| 成人中文字幕视频| 精品少妇人妻av免费久久洗澡| 99re热这里只有精品视频| 久久久久久少妇| 亚洲男人的天堂在线播放| 粉嫩一区二区三区| 亚洲啪啪av| 中文字幕系列一区| 91福利资源站| 手机在线观看毛片| 国产69精品久久久久久| 国产精品最新| 黄色小视频免费网站| 亚洲乱码国产乱码精品精的特点 | 日韩成人在线网站| 在线观看欧美日韩电影| 天堂va久久久噜噜噜久久va| 麻豆精品久久精品色综合| 69av视频在线| 日韩高清a**址| 精品久久久网| 久久亚洲a v| 91天堂素人约啪| 在线视频你懂得| 欧美精品精品精品精品免费| 日韩av字幕| 三年中国国语在线播放免费| 亚洲欧美综合另类在线卡通| 日本激情一区二区| 国产精品福利在线观看网址| 欧美在线国产| 男生裸体视频网站| 欧美日韩一本到| 福利影院在线看| 亚洲三区在线观看| 成人午夜在线免费| 中文字幕永久在线| 欧美国产视频一区二区| 欧美久久精品一级c片| 337p日本欧洲亚洲大胆张筱雨| 欧美日韩中文在线观看| 日本在线免费| 欧美日韩一区二区三区在线视频| 狠狠狠色丁香婷婷综合激情 | 久久影视中文粉嫩av| 精品写真视频在线观看| 波多野结衣视频网站| 久国内精品在线| 全球成人免费直播| 强迫凌虐淫辱の牝奴在线观看|