精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

終于把機器學習中的特征選擇搞懂了!!!

人工智能 機器學習
特征選擇是機器學習中的重要步驟,其目的是從高維特征空間中選擇對模型性能最有價值的特征。通過減少冗余和無關的特征,特征選擇可以提高模型的訓練效率、減少過擬合并提升模型的泛化性能。

今天給大家分享機器學習中的一個關鍵概念:特征選擇。

特征選擇是機器學習中的重要步驟,其目的是從高維特征空間中選擇對模型性能最有價值的特征。

通過減少冗余和無關的特征,特征選擇可以提高模型的訓練效率、減少過擬合并提升模型的泛化性能。

特征選擇的重要性

  1. 提高模型性能:通過去除冗余或無關的特征,可以減少噪聲,提高模型的準確性和穩定性。
  2. 減少計算成本:較少的特征意味著更低的計算復雜度,加快訓練和預測速度。
  3. 防止過擬合:去除不相關特征有助于減少模型的復雜度,降低過擬合風險。
  4. 提高模型可解釋性:更少的特征使得模型更容易理解和解釋,有助于發現數據中的關鍵因素。

特征選擇的方法

特征選擇通常分為三種主要方法:

  • 過濾法
  • 包裹法
  • 嵌入法

過濾法

過濾法基于統計指標對特征進行評分,并根據評分選擇特征。

這類方法與具體的機器學習算法無關,通常作為預處理步驟。

常見技術

  • 相關系數,衡量每個特征與目標變量之間的線性相關性。例如,皮爾遜相關系數。
  • 卡方檢驗,適用于分類問題,評估特征與目標變量的獨立性。
  • 信息增益,基于信息理論,衡量特征提供的信息量。
  • 互信息,衡量特征與目標變量之間的非線性依賴關系。
  • 方差選擇法,去除方差低于某一閾值的特征,認為這些特征變化較小,信息量不足。

優缺點

  • 優點:計算速度快,適用于高維數據。
  • 缺點:忽略特征之間的相關性,可能無法捕捉到特征與目標變量之間的復雜關系。

包裝法

包裝法將特征選擇視為一個搜索問題,通過訓練模型評估特征子集的性能,選擇最優子集。這類方法與具體的機器學習算法緊密相關。

常見技術

  • 遞歸特征消除
    遞歸地訓練模型,移除最不重要的特征,直到達到預定的特征數量。
  • 前向選擇
    從空特征集開始,逐步添加對模型性能提升最大的特征。
  • 后向消除
    從所有特征開始,逐步移除對模型性能影響最小的特征。

優缺點

  • 優點:能夠考慮特征之間的相互作用,通常能獲得更好的模型性能。
  • 缺點:計算成本高,尤其在高維數據中,可能不適用。

嵌入法

嵌入法在模型訓練過程中進行特征選擇,將特征選擇嵌入到模型的訓練過程中。

這類方法結合了過濾法和包裝法的優點。

常見技術

  • Lasso回歸:通過 L1 正則化,將不重要的特征系數壓縮為零,實現特征選擇。
  • 決策樹及其集成方法:例如,隨機森林和梯度提升樹可以基于特征重要性進行特征選擇。
  • 彈性網絡:結合 L1 和 L2 正則化,兼具 Lasso和嶺回歸的優點。

優缺點

  • 優點:與模型訓練相結合,能夠自動選擇重要特征,計算效率較高。
  • 缺點:依賴于具體的模型選擇。

案例分享

下面我將通過 Python 代碼展示如何在機器學習中應用不同的特征選擇方法,包括過濾法、包裝法和嵌入法。

這里,我們以經典的乳腺癌數據集為例進行說明。

數據加載與預處理

首先,我們導入相關的庫,并加載數據集。

# 導入必要的庫
import pandas as pd
import numpy as np
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
import seaborn as sns

# 加載乳腺癌數據集
data = load_breast_cancer()
X = pd.DataFrame(data.data, columns=data.feature_names)
y = pd.Series(data.target)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

過濾法

過濾法基于統計指標對特征進行評分和選擇。

這里我們使用 SelectKBest 結合卡方檢驗和互信息兩種方法。

使用卡方檢驗選擇特征

from sklearn.feature_selection import SelectKBest, chi2
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 由于卡方檢驗要求非負特征,我們確保數據為非負
X_train_chi2 = X_train_scaled - X_train_scaled.min()
X_test_chi2 = X_test_scaled - X_train_scaled.min()

# 選擇k個最佳特征
k = 2
selector = SelectKBest(score_func=chi2, k=k)
X_train_selected = selector.fit_transform(X_train_chi2, y_train)
X_test_selected = selector.transform(X_test_chi2)

# 查看選擇的特征
selected_features = X.columns[selector.get_support()]
print(f"選擇的特征(卡方檢驗): {list(selected_features)}")

# 使用邏輯回歸進行訓練和評估
model = LogisticRegression(max_iter=200)
model.fit(X_train_selected, y_train)
y_pred = model.predict(X_test_selected)
accuracy = accuracy_score(y_test, y_pred)
print(f"過濾法(卡方檢驗)后的準確率: {accuracy:.4f}")

#選擇的特征(卡方檢驗): ['mean concave points', 'worst concave points']
#過濾法(卡方檢驗)后的準確率: 0.9386

使用互信息選擇前10個特征

from sklearn.feature_selection import mutual_info_classif

# 選擇前10個互信息最高的特征
selector_mi = SelectKBest(score_func=mutual_info_classif, k=10)
X_train_mi_selected = selector_mi.fit_transform(X_train_scaled, y_train)
X_test_mi_selected = selector_mi.transform(X_test_scaled)

# 查看選擇的特征
selected_features_mi = X.columns[selector_mi.get_support()]
print("互信息選擇的特征:\n", selected_features_mi)

# 訓練模型
model.fit(X_train_mi_selected, y_train)
y_pred = model.predict(X_test_mi_selected)

# 評估模型
accuracy = accuracy_score(y_test, y_pred)
print("互信息后的模型準確率:", accuracy)

#互信息后的模型準確率: 0.9824561403508771

包裝法

包裝法將特征選擇視為一個搜索問題。

這里我們使用遞歸特征消除(RFE)方法。

from sklearn.feature_selection import RFE

# 使用邏輯回歸作為基模型
model = LogisticRegression(max_iter=200)
# 選擇k個特征
k = 2
rfe = RFE(estimator=model, n_features_to_select=k)
rfe.fit(X_train_scaled, y_train)

# 查看選擇的特征
selected_features = X.columns[rfe.support_]
print(f"選擇的特征(RFE): {list(selected_features)}")

# 訓練并評估模型
X_train_rfe = rfe.transform(X_train_scaled)
X_test_rfe = rfe.transform(X_test_scaled)

model.fit(X_train_rfe, y_train)
y_pred = model.predict(X_test_rfe)
accuracy = accuracy_score(y_test, y_pred)
print(f"包裝法(RFE)后的準確率: {accuracy:.4f}")

#選擇的特征(RFE): ['worst area', 'worst concave points']
#包裝法(RFE)后的準確率: 0.9561

嵌入法

嵌入法在模型訓練過程中進行特征選擇,常見的方法包括Lasso回歸和基于樹的特征重要性。

使用 Lasso 回歸進行特征選擇

from sklearn.linear_model import LassoCV

# 使用Lasso進行特征選擇
lasso = LassoCV(cv=5, random_state=42)
lasso.fit(X_train_scaled, y_train)

# 獲取非零系數的特征
coef = pd.Series(lasso.coef_, index=X.columns)
selected_features_lasso = coef[coef != 0].index
print("Lasso選擇的特征:\n", selected_features_lasso)

# 訓練模型
X_train_lasso_selected = X_train_scaled[:, coef != 0]
X_test_lasso_selected = X_test_scaled[:, coef != 0]
model.fit(X_train_lasso_selected, y_train)
y_pred = model.predict(X_test_lasso_selected)
y_pred = (y_pred > 0.5).astype(int)

# 評估模型
accuracy = accuracy_score(y_test, y_pred)
print("Lasso后的模型準確率:", accuracy)

#Lasso后的模型準確率: 0.9824561403508771

使用隨機森林進行特征重要性排序

from sklearn.ensemble import RandomForestClassifier

# 訓練隨機森林模型
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)

# 獲取特征重要性
importances = pd.Series(rf.feature_importances_, index=X.columns)
importances_sorted = importances.sort_values(ascending=False)
print("特征重要性排名:\n", importances_sorted)

# 選擇前10個重要特征
selected_features_rf = importances_sorted.head(10).index
print("隨機森林選擇的特征:\n", selected_features_rf)

# 訓練模型
X_train_rf_selected = X_train[selected_features_rf]
X_test_rf_selected = X_test[selected_features_rf]
model.fit(X_train_rf_selected, y_train)
y_pred = model.predict(X_test_rf_selected)

# 評估模型
accuracy = accuracy_score(y_test, y_pred)
print("隨機森林后的模型準確率:", accuracy)

# 隨機森林后的模型準確率: 0.9912280701754386

# 可視化特征重要性
plt.figure(figsize=(10,6))
sns.barplot(x=importances_sorted.values[:10], y=importances_sorted.index[:10])
plt.title("隨機森林特征重要性")
plt.xlabel("重要性分數")
plt.ylabel("特征")
plt.show()

圖片圖片

綜合比較

為了比較不同特征選擇方法對模型性能的影響,我們可以匯總各方法的準確率。

# 匯總準確率
accuracy_results = {
    "卡方檢驗": 0.9386,
    "互信息": 0.9824561403508771,
    "RFE": 0.9561,
    "Lasso": 0.9824561403508771,
    "隨機森林": 0.9912280701754386
}

accuracy_df = pd.DataFrame(list(accuracy_results.items()), columns=["特征選擇方法", "模型準確率"])
print(accuracy_df)

# 可視化比較
plt.figure(figsize=(8,6))
sns.barplot(x="模型準確率", y="特征選擇方法", data=accuracy_df, palette="viridis")
plt.title("不同特征選擇方法的模型準確率比較")
plt.xlabel("準確率")
plt.ylabel("特征選擇方法")
plt.xlim(0.9, 1.0)
plt.show()

圖片圖片


責任編輯:武曉燕 來源: 程序員學長
相關推薦

2025-01-20 09:21:00

2024-10-08 10:16:22

2024-10-08 15:09:17

2024-10-28 15:52:38

機器學習特征工程數據集

2024-10-28 00:00:10

機器學習模型程度

2025-01-15 11:25:35

2024-10-30 08:23:07

2024-11-05 12:56:06

機器學習函數MSE

2024-08-23 09:06:35

機器學習混淆矩陣預測

2024-10-14 14:02:17

機器學習評估指標人工智能

2024-09-18 16:42:58

機器學習評估指標模型

2024-11-25 08:20:35

2025-01-20 09:00:00

2025-01-07 12:55:28

2025-02-17 13:09:59

深度學習模型壓縮量化

2024-07-17 09:32:19

2024-09-23 09:12:20

2024-12-03 08:16:57

2024-10-16 07:58:48

2025-07-15 10:41:44

點贊
收藏

51CTO技術棧公眾號

26uuu另类欧美亚洲曰本| 欧美在线亚洲综合一区| 一本色道久久综合精品竹菊| 精品乱色一区二区中文字幕| 91在线视频在线观看| 国产欧美日韩精品高清二区综合区| 日本韩国一区二区三区| 亚洲综合五月天| 亚洲伦理在线观看| 天堂蜜桃一区二区三区 | 国产九九在线视频| 二区三区在线观看| gogo大胆日本视频一区| 国产精品igao视频| 国产盗摄x88av| 国产成人ay| 欧美一级淫片007| 国产a级一级片| 精品麻豆一区二区三区| 99久久久精品免费观看国产蜜| 国产精品久久久999| 国产一级aa大片毛片| 成人写真视频| 亚洲国产欧美日韩精品| 三上悠亚av一区二区三区| aa国产成人| 亚洲人成精品久久久久| 精品视频偷偷看在线观看| 九九热在线免费| a天堂资源在线| 亚洲特级片在线| 欧洲一区二区日韩在线视频观看免费 | 欧美日韩一区二区在线免费观看| 国产淫片在线观看| 国产视频一区二区在线观看| 国产女主播一区二区| 国产精品伊人久久 | 五月天av在线播放| 日韩精品专区| 天天av天天翘天天综合网色鬼国产 | 蜜臀av中文字幕| 国产一区二区女| 国产精品久久久久免费a∨大胸| 精品少妇theporn| 亚洲深深色噜噜狠狠爱网站| 在线亚洲国产精品网| 日本黄色特级片| 欧美成人基地| 精品成a人在线观看| 免费人成视频在线播放| 亚洲毛片在线免费| 欧美久久久一区| 少妇黄色一级片| 日产精品一区| 欧洲一区二区三区免费视频| 国内外成人激情视频| 欧美激情护士| 精品福利在线看| 国产免费观看高清视频| 高清毛片在线观看| 五月天久久比比资源色| 黄色免费福利视频| 三级在线观看视频| 精品欧美一区二区三区| 国产精品无码av在线播放| av女在线播放| 偷拍与自拍一区| 国产老熟妇精品观看| 黄在线观看免费网站ktv| 午夜精品成人在线视频| 97成人在线免费视频| 草草视频在线| 大荫蒂欧美视频另类xxxx| 男人天堂999| jizzyou欧美16| 欧美丰满美乳xxx高潮www| 日本在线播放一区二区| 精品国产亚洲一区二区三区在线 | 最新国产精品视频| 亚洲偷熟乱区亚洲香蕉av| 性猛交ⅹxxx富婆video| 日韩在线二区| 免费av一区二区| 国产亚洲欧美精品久久久久久| 悠悠资源网久久精品| 97视频免费在线看| 伊人久久久久久久久久久久| 麻豆精品久久精品色综合| 成人国产在线视频| 日本高清视频www| 久久久精品黄色| 亚洲一区二区高清视频| 蜜桃视频网站在线观看| 亚洲自拍欧美精品| 激情五月开心婷婷| 成人毛片免费| 精品乱人伦小说| 日本aaa视频| 中文字幕亚洲综合久久五月天色无吗''| 欧美国产在线视频| 久久中文字幕免费| 韩国av一区二区三区四区| 国产一区再线| 91在线播放网站| 一区二区三区不卡视频 | 国产欧洲在线| 欧美日韩一区二区不卡| 性感美女一区二区三区| 国产永久精品大片wwwapp| 欧美日韩高清区| 日本一区二区三区久久| 成人一道本在线| 亚洲精蜜桃久在线| 国产99在线观看| 欧美久久一区二区| 女人又爽又黄免费女仆| 午夜久久久久| 国产精品久久久久久亚洲影视| 亚洲男人天堂久久| 中文字幕制服丝袜一区二区三区| 激情综合在线观看| xxxxxhd亚洲人hd| 中文字幕在线看视频国产欧美在线看完整 | 欧美高清无遮挡| 中文在线观看免费高清| 成人免费黄色在线| 在线无限看免费粉色视频| 理论不卡电影大全神| 91精品国产欧美一区二区成人| 国产免费一区二区三区网站免费| 伊人激情综合| 91精品国产91久久久久青草| lutube成人福利在线观看| 欧美日韩国产色| 少妇伦子伦精品无吗| 国产精品99视频| 国产精品极品在线| 欧美日韩在线中文字幕| 亚洲一区二区欧美| 国产精品igao网网址不卡| jiujiure精品视频播放| 日本久久亚洲电影| 四虎免费在线观看| 亚洲成人av中文| 91精品国产高清91久久久久久| 51精产品一区一区三区| 国产精品视频99| 国产在线视频福利| 一本一道波多野结衣一区二区| bl动漫在线观看| 亚洲电影av| 国产区欧美区日韩区| 国产美女情趣调教h一区二区| 欧美一区二区三级| 欧美日韩一级大片| 高清不卡在线观看| 久久久久99精品成人片| 福利在线一区| 91av在线播放视频| 亚洲人成色777777精品音频| 天天影视网天天综合色在线播放| 玖玖爱在线精品视频| 亚洲精品在线国产| 久久久精品2019中文字幕神马| 亚洲一级片免费看| 亚洲私人影院在线观看| 小早川怜子一区二区三区| 91精品国产91久久综合| 亚洲影视中文字幕| 成人在线免费观看黄色| 精品999在线播放| 日韩精品手机在线| 久久久一区二区| 午夜免费高清视频| 亚洲欧美在线专区| 不卡视频一区二区| 自拍一区在线观看| 夜夜嗨av色综合久久久综合网| 曰批又黄又爽免费视频| 亚洲色欲色欲www在线观看| 性生活一级大片| 亚洲国产精品第一区二区| 久久久久久精| 高清av一区二区三区| 北条麻妃在线一区二区| 亚洲精品成人电影| 欧美视频在线免费| 农村老熟妇乱子伦视频| 国产成人综合在线| 一本大道熟女人妻中文字幕在线| 日韩国产欧美| 国产高清一区视频| 精品国产免费人成网站| 久久精品91久久香蕉加勒比| 日批视频在线播放| 欧美丝袜丝交足nylons| 美女视频黄免费| 久久久www成人免费无遮挡大片| 性chinese极品按摩| 亚洲一级电影| 亚洲精品白虎| 丁香五月缴情综合网| 国产精品久久久久久久9999| 色www永久免费视频首页在线| 精品在线欧美视频| 国产日韩欧美一区二区东京热| 五月天激情综合| 成人免费视频国产免费观看| 91影院在线免费观看| 182午夜视频| 国产日产一区| 91中文在线观看| 国模套图日韩精品一区二区| 久久躁日日躁aaaaxxxx| 神马电影在线观看| 欧美视频一区二| 欧美三级午夜理伦| 亚洲欧美电影院| 五月天精品在线| 成人激情视频网站| 亚洲网中文字幕| 日韩黄色免费电影| 黄色网页免费在线观看| 国产一区日韩一区| 亚洲无玛一区| 欧美极品在线观看| 精品一区二区三区国产| 视频一区日韩精品| 91在线视频导航| 成人在线不卡| 日韩av理论片| 男人的天堂免费在线视频| 欧美高清激情视频| 91麻豆免费在线视频| 日韩在线视频一区| 爱爱爱免费视频在线观看| 亚洲精品永久免费| 性感美女一级片| 亚洲激情自拍图| 亚洲乱熟女一区二区| 日韩三级中文字幕| 国产喷水吹潮视频www| 欧美三级乱人伦电影| 超碰在线观看91| 色婷婷久久一区二区三区麻豆| 国产成人亚洲精品自产在线| 亚洲午夜久久久久久久久电影院 | 国产精品入口久久| 久久久久资源| 欧美巨大xxxx| 精品一区二区国产| 中文精品一区二区| 欧美男人的天堂| 欧美日韩国产一区二区三区不卡| 欧美国产综合视频| 啄木系列成人av电影| 欧美日韩免费精品| 神马电影久久| 视频一区在线免费观看| 日韩1区在线| 亚洲国产精品一区二区第一页 | 成人午夜视频在线观看| 亚洲精品无码一区二区| av中文一区二区三区| 草草地址线路①屁屁影院成人| 2023国产精品| 日本一道本视频| 亚洲欧美一区二区三区久本道91| 黄色香蕉视频在线观看| 一区二区三区四区精品在线视频 | 制服丝袜第一页在线观看| 99视频精品在线| 久久只有这里有精品| 亚洲国产精品高清| 成年人二级毛片| 亚洲一级二级在线| 精品国产一区二区三区四| 欧美主播一区二区三区| 国产精品久久久久久久久久久久久久久久久久 | 国产69精品一区二区亚洲孕妇| 欧美一区二区免费在线观看| 久久综合久色欧美综合狠狠| 国产综合精品久久久久成人av| 亚洲日本在线看| 国产成人在线免费观看视频| 欧美专区日韩专区| 精品人妻一区二区三区日产乱码| 亚洲国产成人精品久久| 国内精品在线视频| 免费不卡在线观看av| 久久久男人天堂| 国产欧美日韩中文字幕在线| 成全电影大全在线观看| 日本国产欧美一区二区三区| 欧美成人黄色| 国产精品日韩一区二区三区| 精品成人影院| 成人一区二区av| 久久先锋影音| 中文字幕乱妇无码av在线| 91美女视频网站| 侵犯稚嫩小箩莉h文系列小说| 偷拍日韩校园综合在线| 888奇米影视| 亚洲美女喷白浆| 哥也色在线视频| 日韩av片电影专区| 91成人精品在线| 伊人情人网综合| 亚洲综合二区| 中文字幕在线观看视频www| 久久精品亚洲麻豆av一区二区 | 香蕉视频在线观看黄| 久久久精品黄色| 国产成人自拍视频在线| 在线播放中文字幕一区| 九色国产在线观看| 久久久亚洲成人| 疯狂欧洲av久久成人av电影| 欧美一级爽aaaaa大片| 在线精品一区| 妖精视频在线观看| 亚洲欧洲性图库| 国产三级理论片| 亚洲精品少妇网址| 国产乱码在线| 97久久夜色精品国产九色| 日韩一区三区| 人妻无码视频一区二区三区| 成人ar影院免费观看视频| 久久精品黄色片| 欧美精品在线观看一区二区| 狠狠狠综合7777久夜色撩人| 97视频com| 欧美三级午夜理伦三级在线观看| 国产爆乳无码一区二区麻豆| 久久www免费人成看片高清| 中文字幕免费视频| 欧美性xxxxx| 亚洲aⅴ乱码精品成人区| 欧美极品欧美精品欧美视频| 精品中文字幕一区二区三区四区| 一区不卡视频| 久久福利视频一区二区| 美国一级黄色录像| 欧美中文字幕一区二区三区亚洲| 国产区视频在线播放| 日韩av免费网站| 亚洲瘦老头同性70tv| 日本a级片免费观看| 91视频com| 国产婷婷色一区二区在线观看| 亚洲码在线观看| 国产高清不卡| 日韩久久久久久久久久久久久| 玖玖在线精品| 色欲AV无码精品一区二区久久| 欧美午夜宅男影院| 久久bbxx| 999精品视频一区二区三区| 欧美日韩在线大尺度| 丰满少妇xbxb毛片日本| 亚洲电影一区二区三区| 偷拍25位美女撒尿视频在线观看| 4p变态网欧美系列| 精品日本12videosex| 日本新janpanese乱熟| 国产精品免费视频网站| 国产美女精品视频国产| 欧美激情a在线| 亚洲伊人春色| 天堂网在线免费观看| 一区二区视频在线看| 成人高潮片免费视频| 2018中文字幕一区二区三区| 国产99久久| 亚洲免费av一区| 一区二区三区日本| 天天摸天天干天天操| 国产国语刺激对白av不卡| 久久影院一区| 91传媒理伦片在线观看| 欧美性xxxx极品hd满灌| 日本激情在线观看| 91九色对白| 午夜亚洲视频| 性生交大片免费全黄| 亚洲第一精品夜夜躁人人躁| 日韩性xxx| 国产一二三四五| 91农村精品一区二区在线| 亚洲 小说区 图片区| 欧美激情视频免费观看| 欧美精品momsxxx| 久久精品视频在线观看免费| 婷婷综合在线观看| 免费的黄网站在线观看| 精品高清视频| 国产专区综合网| 狠狠人妻久久久久久综合|