精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Python中進行特征重要性分析的九個常用方法

人工智能 機器學習
特征重要性分析用于了解每個特征(變量或輸入)對于做出預測的有用性或價值。目標是確定對模型輸出影響最大的最重要的特征,它是機器學習中經(jīng)常使用的一種方法。

特征重要性分析用于了解每個特征(變量或輸入)對于做出預測的有用性或價值。目標是確定對模型輸出影響最大的最重要的特征,它是機器學習中經(jīng)常使用的一種方法。

為什么特征重要性分析很重要?

如果有一個包含數(shù)十個甚至數(shù)百個特征的數(shù)據(jù)集,每個特征都可能對你的機器學習模型的性能有所貢獻。但是并不是所有的特征都是一樣的。有些可能是冗余的或不相關的,這會增加建模的復雜性并可能導致過擬合。

特征重要性分析可以識別并關注最具信息量的特征,從而帶來以下幾個優(yōu)勢:

  • 改進的模型性能
  • 減少過度擬合
  • 更快的訓練和推理
  • 增強的可解釋性

下面我們深入了解在Python中的一些特性重要性分析的方法。

特征重要性分析方法

1、排列重要性 PermutationImportance

該方法會隨機排列每個特征的值,然后監(jiān)控模型性能下降的程度。如果獲得了更大的下降意味著特征更重要

from sklearn.datasets import load_breast_cancer
 from sklearn.ensemble import RandomForestClassifier
 from sklearn.inspection import permutation_importance 
 from sklearn.model_selection import train_test_split
 import matplotlib.pyplot as plt
 
 cancer = load_breast_cancer()
 
 X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, random_state=1)
 
 rf = RandomForestClassifier(n_estimators=100, random_state=1)
 rf.fit(X_train, y_train) 
 
 baseline = rf.score(X_test, y_test)
 result = permutation_importance(rf, X_test, y_test, n_repeats=10, random_state=1, scoring='accuracy')
 
 importances = result.importances_mean
 
 # Visualize permutation importances
 plt.bar(range(len(importances)), importances)
 plt.xlabel('Feature Index')
 plt.ylabel('Permutation Importance')
 plt.show()

2、內(nèi)置特征重要性(coef_或feature_importances_)

一些模型,如線性回歸和隨機森林,可以直接輸出特征重要性分數(shù)。這些顯示了每個特征對最終預測的貢獻。

from sklearn.datasets import load_breast_cancer
 from sklearn.ensemble import RandomForestClassifier
 
 X, y = load_breast_cancer(return_X_y=True)
 
 rf = RandomForestClassifier(n_estimators=100, random_state=1)
 rf.fit(X, y)
 
 importances = rf.feature_importances_
 
 # Plot importances
 plt.bar(range(X.shape[1]), importances)
 plt.xlabel('Feature Index') 
 plt.ylabel('Feature Importance')
 plt.show()

3、Leave-one-out

迭代地每次刪除一個特征并評估準確性。

from sklearn.datasets import load_breast_cancer
 from sklearn.model_selection import train_test_split
 from sklearn.ensemble import RandomForestClassifier
 from sklearn.metrics import accuracy_score
 import matplotlib.pyplot as plt
 import numpy as np
 
 # Load sample data
 X, y = load_breast_cancer(return_X_y=True)
 
 # Split data into train and test sets
 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1) 
 
 # Train a random forest model
 rf = RandomForestClassifier(n_estimators=100, random_state=1)
 rf.fit(X_train, y_train)
 
 # Get baseline accuracy on test data
 base_acc = accuracy_score(y_test, rf.predict(X_test))
 
 # Initialize empty list to store importances
 importances = []
 
 # Iterate over all columns and remove one at a time
 for i in range(X_train.shape[1]):
    X_temp = np.delete(X_train, i, axis=1)
    rf.fit(X_temp, y_train)
    acc = accuracy_score(y_test, rf.predict(np.delete(X_test, i, axis=1)))
    importances.append(base_acc - acc)
     
 # Plot importance scores    
 plt.bar(range(len(importances)), importances)
 plt.show()

4、相關性分析

計算各特征與目標變量之間的相關性。相關性越高的特征越重要。

import pandas as pd
 from sklearn.datasets import load_breast_cancer
 
 X, y = load_breast_cancer(return_X_y=True)
 df = pd.DataFrame(X, columns=range(30))
 df['y'] = y
 
 correlations = df.corrwith(df.y).abs()
 correlations.sort_values(ascending=False, inplace=True)
 
 correlations.plot.bar()

5、遞歸特征消除 Recursive Feature Elimination

遞歸地刪除特征并查看它如何影響模型性能。刪除時會導致更大下降的特征更重要。

from sklearn.ensemble import RandomForestClassifier
 from sklearn.feature_selection import RFE
 import pandas as pd
 from sklearn.datasets import load_breast_cancer
 import matplotlib.pyplot as plt
 
 X, y = load_breast_cancer(return_X_y=True)
 df = pd.DataFrame(X, columns=range(30))
 df['y'] = y
 
 rf = RandomForestClassifier()
 
 rfe = RFE(rf, n_features_to_select=10) 
 rfe.fit(X, y)
 
 print(rfe.ranking_)

輸出為[6 4 11 12 7 11 18 21 8 16 10 3 15 14 19 17 20 13 11 11 12 9 11 5 11]

6、XGBoost特性重要性

計算一個特性用于跨所有樹拆分數(shù)據(jù)的次數(shù)。更多的分裂意味著更重要。

import xgboost as xgb
 import pandas as pd
 from sklearn.datasets import load_breast_cancer
 import matplotlib.pyplot as plt
 
 X, y = load_breast_cancer(return_X_y=True)
 df = pd.DataFrame(X, columns=range(30))
 df['y'] = y
 
 model = xgb.XGBClassifier()
 model.fit(X, y)
 
 importances = model.feature_importances_
 importances = pd.Series(importances, index=range(X.shape[1])) 
 importances.plot.bar()

7、主成分分析 PCA

對特征進行主成分分析,并查看每個主成分的解釋方差比。在前幾個組件上具有較高負載的特性更為重要。

from sklearn.decomposition import PCA
 import pandas as pd
 from sklearn.datasets import load_breast_cancer
 import matplotlib.pyplot as plt
 
 X, y = load_breast_cancer(return_X_y=True)
 df = pd.DataFrame(X, columns=range(30))
 df['y'] = y
 
 pca = PCA()
 pca.fit(X)
 
 plt.bar(range(pca.n_components_), pca.explained_variance_ratio_) 
 plt.xlabel('PCA components')
 plt.ylabel('Explained Variance')

8、方差分析 ANOVA

使用f_classif()獲得每個特征的方差分析f值。f值越高,表明特征與目標的相關性越強。

from sklearn.feature_selection import f_classif
 import pandas as pd
 from sklearn.datasets import load_breast_cancer
 import matplotlib.pyplot as plt
 
 X, y = load_breast_cancer(return_X_y=True)
 df = pd.DataFrame(X, columns=range(30))
 df['y'] = y
 
 fval = f_classif(X, y)
 fval = pd.Series(fval[0], index=range(X.shape[1]))
 fval.plot.bar()

9、卡方檢驗

使用chi2()獲得每個特征的卡方統(tǒng)計信息。得分越高的特征越有可能獨立于目標。

from sklearn.feature_selection import chi2
 import pandas as pd
 from sklearn.datasets import load_breast_cancer
 import matplotlib.pyplot as plt
 
 X, y = load_breast_cancer(return_X_y=True)
 df = pd.DataFrame(X, columns=range(30))
 df['y'] = y
 
 chi_scores = chi2(X, y)
 chi_scores = pd.Series(chi_scores[0], index=range(X.shape[1]))
 chi_scores.plot.bar()

為什么不同的方法會檢測到不同的特征?

不同的特征重要性方法有時可以識別出不同的特征是最重要的,這是因為:

1、他們用不同的方式衡量重要性:

有的使用不同特特征進行預測,監(jiān)控精度下降

像XGBOOST或者回國模型使用內(nèi)置重要性來進行特征的重要性排列

而PCA著眼于方差解釋

2、不同模型有不同模型的方法:

線性模型傾向于線性關系、樹模型傾向于接近根的特征

3、交互作用:

有的方法可以獲取特征之間的相互左右,而有一些則不行,這就會導致結果的差異

3、不穩(wěn)定:

使用不同的數(shù)據(jù)子集,重要性值可能在同一方法的不同運行中有所不同,這是因為數(shù)據(jù)差異決定的

4、Hyperparameters:

通過調整超參數(shù),如PCA組件或樹深度,也會影響結果

所以不同的假設、偏差、數(shù)據(jù)處理和方法的可變性意味著它們并不總是在最重要的特征上保持一致。

選擇特征重要性分析方法的一些最佳實踐

  • 嘗試多種方法以獲得更健壯的視圖
  • 聚合結果的集成方法
  • 更多地關注相對順序,而不是絕對值
  • 差異并不一定意味著有問題,檢查差異的原因會對數(shù)據(jù)和模型有更深入的了解
責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2021-04-16 20:46:21

PythonXGBoost 特征

2009-12-25 15:00:48

WPF軟件

2018-11-06 09:31:34

物聯(lián)網(wǎng)分析AoT物聯(lián)網(wǎng)

2009-11-25 17:36:38

PHP函數(shù)includ

2019-09-27 09:56:31

軟件技術硬件

2009-09-28 13:23:00

CCNA學習方法CCNA

2010-07-30 16:28:06

2023-10-24 11:07:57

2009-08-05 15:26:23

需求分析

2021-02-04 06:30:26

Python編程語言

2025-10-16 08:55:00

2009-09-14 15:50:17

CCNA學習方法

2011-07-05 18:30:44

站內(nèi)優(yōu)化

2017-12-29 10:14:48

IT項目

2013-08-08 10:10:06

備份策略全備份增量備份

2020-08-27 07:00:00

代碼軟件應用程序

2024-08-27 11:35:49

2011-07-03 19:58:34

SEO

2024-06-24 21:18:48

2020-04-27 21:44:39

物聯(lián)網(wǎng)開發(fā)物聯(lián)網(wǎng)IOT
點贊
收藏

51CTO技術棧公眾號

亚洲成人一二三| 小泽玛利亚一区二区三区视频| 国产精品久久久久久免费免熟 | 国产精品久久久久精k8| 欧美在线观看一二区| 古典武侠综合av第一页| 91人妻一区二区三区蜜臀| 欧美91看片特黄aaaa| 成人做爰69片免费看网站| 日韩在线播放av| 国产一区视频免费观看| 深夜福利视频网站| 亚洲特色特黄| 精品国产乱码久久久久久夜甘婷婷 | 中文字幕精品视频在线观看| 91欧美极品| 亚洲一卡二卡三卡四卡无卡久久| 96sao精品视频在线观看| 1024手机在线观看你懂的| 精品国产第一福利网站| 久久综合久久综合九色| 欧美在线一区二区视频| 久久久精品人妻无码专区| 精精国产xxxx视频在线播放| 精品成人久久| 亚洲电影av在线| 18禁裸男晨勃露j毛免费观看| 亚洲黄色在线观看视频| 国内激情久久| www.亚洲免费视频| 中文字幕免费高清| 欧美成人福利| 亚洲欧美一区二区久久| 亚洲最大福利网站| 国产一级av毛片| 极品国产人妖chinesets亚洲人妖 激情亚洲另类图片区小说区 | 亚洲一区二区三区在线免费观看| 在线观看 亚洲| 欧美一二区在线观看| 精品视频全国免费看| 一区精品视频| 亚洲福利在线观看视频| 久久99精品久久久| 欧美黑人国产人伦爽爽爽| 成人在线电影网站| 人人鲁人人莫人人爱精品| 中文字幕精品一区| 91av免费看| 一区二区三区免费在线视频| 欧美在线黄色| 日韩激情在线视频| 久久这里只精品| 污污的网站在线免费观看| 99九九99九九九视频精品| 国产成人精品在线播放| 亚洲欧美精品aaaaaa片| 成人亚洲一区二区| 中文字幕一区二区精品| 亚洲欧洲日韩综合| 日韩在线影院| 色综合久久中文字幕| 99精品视频网站| 天堂av2024| av中文字幕亚洲| 国产欧美精品日韩精品| 日本少妇吞精囗交| 日韩欧美午夜| 日韩精品亚洲元码| 佐山爱在线视频| 欧美大片1688| 欧美中文字幕不卡| 日韩小视频在线播放| 在线观看免费高清完整| 99视频一区二区| 久久大片网站| 亚洲黄色小说网| 北条麻妃国产九九精品视频| 国产伦精品免费视频| 一区二区三区午夜| 国产精品一二一区| 国产精品视频色| 好吊妞视频一区二区三区| 天堂网在线观看国产精品| 日韩精品黄色网| 老头老太做爰xxx视频| 都市激情亚洲欧美| 欧美一区欧美二区| 日本美女高潮视频| 中国色在线日|韩| 亚洲午夜久久久久久久久电影网| 免费看日本毛片| 久久久成人av毛片免费观看| 亚洲成人动漫精品| 88av.com| 成人爱爱网址| 制服丝袜中文字幕一区| 四季av一区二区| 国产精品视频一区视频二区| 欧美日韩一级黄| 永久av免费在线观看| 日韩极品在线| 日韩av在线高清| 在线视频这里只有精品| 精品国内自产拍在线观看视频 | 神马一区二区三区| 国产精品欧美一区二区三区| 欧美系列一区| 青春草在线观看| 91美女视频网站| 久久爱av电影| 成人在线观看亚洲| 亚洲摸摸操操av| 国产一二三四区在线观看| 国产在线看片| 亚洲精品免费在线播放| 午夜啪啪福利视频| 日韩欧美一起| 欧美日韩一级视频| 无码h肉动漫在线观看| 天堂俺去俺来也www久久婷婷| 日韩视频―中文字幕| 国产高清中文字幕| 日本伊人精品一区二区三区观看方式| 欧美性视频精品| 午夜精品久久久久久久蜜桃| 琪琪一区二区三区| 久久久人人爽| 51漫画成人app入口| 亚洲高清免费在线| 久久出品必属精品| 久久精品亚洲成在人线av网址| 色噜噜狠狠狠综合曰曰曰| 国产一区第一页| 久久免费高清| 91久久久久久久久久久久久| 国产成人精品a视频| 国产98色在线|日韩| 国产在线一区二区三区四区| 日本人妖在线| 亚洲第一久久影院| 中文字幕一二三区| 日韩精品免费一区二区夜夜嗨| 欧美成年人在线观看| 久久精品国产亚洲av麻豆色欲| 亚洲欧洲一级| 国产精品嫩草影院一区二区| 日韩大胆视频| 欧美性jizz18性欧美| 国产又大又黄又猛| 国产96在线亚洲| 久久99久久99精品免观看粉嫩| 天天爽夜夜爽夜夜爽精品| 成人性视频网站| 九色自拍视频在线观看| 成人在线高清| 亚洲精品在线三区| 久久婷婷一区二区| av电影在线观看一区| 欧美v在线观看| 精品91福利视频| 精品亚洲aⅴ在线观看| 国产精品免费av一区二区| 美女在线一区二区| 国产一区二区在线观看免费播放| 蜜桃传媒在线观看免费进入| 欧美日韩在线亚洲一区蜜芽| 成人黄色a级片| 国产自产v一区二区三区c| 蜜桃麻豆91| 欧美激情成人动漫| 亚洲国产精品网站| tube国产麻豆| 麻豆极品一区二区三区| 精品伊人久久大线蕉色首页| 操你啦在线视频| 精品久久国产老人久久综合| 少妇高潮在线观看| 麻豆成人在线| 久久国产主播精品| 亚洲成人人体| 久久精品国产96久久久香蕉| 国产男人搡女人免费视频| 国产精品日韩成人| 免费看的av网站| 另类av一区二区| 国产精品久久成人免费观看| 精品自拍偷拍| 国产免费亚洲高清| 男男gaygays亚洲| 亚洲人成在线观看网站高清| 日产精品久久久久久久| 久久综合九色综合97婷婷| 91女神在线观看| 亚洲视频观看| 亚洲精品一区二| 亚洲成人激情社区| 另类专区欧美制服同性| 11024精品一区二区三区日韩| 亚洲三级在线看| 久久丫精品国产亚洲av不卡| 国产在线日韩欧美| 免费日韩视频在线观看| 日韩精品丝袜美腿| 国产日本欧美一区| 日本精品在线| 欧美人牲a欧美精品| 四虎国产成人精品免费一女五男| 性一交一乱一区二区洋洋av| 久久99精品久久久久久秒播放器 | 91精品一区二区三区综合| 国产精品成熟老女人| 国产一二三区在线| 91成人在线观看喷潮| 亚洲欧洲久久久| 国产成人啪午夜精品网站男同| 欧美性受黑人性爽| 久草成人资源| 国产精品小说在线| 国产ktv在线视频| 日韩一级裸体免费视频| 欧美女v视频| 欧美日韩亚洲综合一区二区三区| 免费一级特黄特色大片| √…a在线天堂一区| 久久发布国产伦子伦精品| 日韩精品每日更新| 一本一道久久久a久久久精品91| 欧美美女被草| 国产xxx69麻豆国语对白| 俺来也官网欧美久久精品| 亚洲国产一区二区三区四区| 国产视频手机在线| 亚洲一区二区三区爽爽爽爽爽| www中文在线| 久久精品免视看| 午夜免费福利网站| 精品一区二区av| 成人午夜免费在线| 欧美日韩综合| 久久久av水蜜桃| 国产欧美啪啪| 国产精品一区二区不卡视频| 欧美电影网站| 欧洲精品在线视频| 亚洲最大网站| 国产va免费精品高清在线观看| 亚洲十八**毛片| 国产97色在线| av网址在线| 精品亚洲一区二区三区在线观看 | 天天操夜夜操视频| 日韩欧美亚洲成人| 无码人妻精品一区二区三区9厂 | 亚洲免费在线播放| 五月天丁香激情| 日韩精品在线免费观看| 欧美一区二区.| 五月天婷婷视频| 懂色aⅴ精品一区二区三区蜜月| 日韩中文字幕电影| 久久综合九色综合久久久精品综合| 香蕉视频污视频| 91丨porny丨中文| 国产精久久一区二区三区| 26uuu国产一区二区三区| 成年人在线免费看片| 国产精品久久午夜夜伦鲁鲁| 国产91在线播放九色| 亚洲老司机在线| 日韩精品一区二区不卡| 色综合天天做天天爱| 在线观看免费中文字幕| 亚洲大尺度视频在线观看| 日产电影一区二区三区| 色综合色狠狠综合色| 亚洲天堂自拍偷拍| 日韩精品中文字幕在线不卡尤物 | 亚洲精品一区二区在线看| 91久色国产| 极品一区美女高清| 日本成人三级| 欧美一区 二区| 91手机在线播放| 露出调教综合另类| 天天久久人人| 久久最新网址| 中文字幕中文字幕99| 极品中文字幕一区| 手机在线看福利| 国产福利一区在线观看| 男女做爰猛烈刺激| 亚洲激情第一区| 亚洲av无码精品一区二区| 日韩一区二区在线看| 国产精品久久久国产盗摄| 欧美大片在线观看一区| 可以在线观看的av| 久久久久久久97| 欧美78videosex性欧美| 日本道色综合久久影院| 欧美成人三级| 久久精品国产美女| 亚洲女同中文字幕| 成人免费毛片播放| 国产69精品久久777的优势| 国产三级在线观看完整版| 亚洲午夜精品在线| 国产精品区在线观看| 亚洲精品一区二区网址| 97影院秋霞午夜在线观看| 国产成人精品久久二区二区91| 亚洲大奶少妇| 国产精品视频一区二区三区经| 欧美日韩在线播放视频| 乱妇乱女熟妇熟女网站| 鲁大师影院一区二区三区| 熟妇女人妻丰满少妇中文字幕| 欧美激情在线免费观看| 欧美成人另类视频| 午夜a成v人精品| 一级黄色在线视频| 亚洲国产小视频在线观看| 在线观看操人| 成人做爰www免费看视频网站| 国产日产精品_国产精品毛片| 日本在线一区| 久久久久蜜桃| 国产日韩欧美久久| 久久久国产综合精品女国产盗摄| 中文字幕有码在线播放| 性久久久久久久| www.我爱av| 亚洲免费av电影| 免费日本一区二区三区视频| 免费不卡在线观看av| 色婷婷成人网| 国产免费一区| 欧美精品一卡| 超碰91在线播放| 亚洲欧美日韩国产综合在线 | 天堂av在线电影| 91亚洲精品久久久| 天天做天天爱天天综合网2021| 五月婷婷之综合激情| 亚洲国产精华液网站w| 色老头一区二区| 亚洲性视频网址| 国产鲁鲁视频在线观看特色| 国产女精品视频网站免费| 久久中文字幕av一区二区不卡| 欧洲精品在线播放| 日韩国产成人精品| xxxxx在线观看| 欧美图区在线视频| 秋霞午夜理伦电影在线观看| 国产日韩在线播放| 欧美va天堂| 欧美xxxxx精品| 国产精品传媒入口麻豆| 国产精品国产三级国产aⅴ | 日本精品在线免费观看| 91精品在线麻豆| 免费不卡av| 欧美黄色直播| 美女www一区二区| 99热精品免费| 亚洲国产一区二区三区四区| 婷婷激情一区| 精品一区二区成人免费视频| 国产成人综合视频| 天堂а√在线中文在线新版| 这里只有精品在线播放| 精品午夜视频| a级黄色一级片| 国产精品久久久久久亚洲毛片| 国产xxxx孕妇| 97在线精品国自产拍中文| 欧美天堂一区| 成年在线观看视频| 麻豆成人久久精品二区三区红 | 亚洲成人av一区二区| 欧美日韩在线中文字幕| 国产精品最新在线观看| 一区在线视频观看| 国产亚洲精品精品精品| 精品日韩欧美在线| 三级成人在线| 欧美中文字幕在线观看视频 | 精品久久一二三区| 视频二区不卡| 高清无码一区二区在线观看吞精| 99久久精品免费看国产免费软件| 国产真人无遮挡作爱免费视频| 久久香蕉国产线看观看av| 免费成人蒂法| www.午夜av| 欧美性大战久久久久久久蜜臀| 日本孕妇大胆孕交无码| 日本一区二区三区视频免费看| 成人深夜视频在线观看|