精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

機器學習模型中特征貢獻度分析：預測貢獻與錯誤貢獻

作者：佚名 2024-09-20 15:44:45

人工智能機器學習

在機器學習領域，特征重要性分析是一種廣泛應用的模型解釋工具。但是特征重要性并不等同于特征質量。本文將探討特征重要性與特征有效性之間的關系，并引入兩個關鍵概念：預測貢獻度和錯誤貢獻度。

在機器學習領域，特征重要性分析是一種廣泛應用的模型解釋工具。但是特征重要性并不等同于特征質量。本文將探討特征重要性與特征有效性之間的關系，并引入兩個關鍵概念：預測貢獻度和錯誤貢獻度。

核心概念

預測貢獻度：衡量特征在模型預測中的權重，反映模型在訓練集上識別的模式。這與傳統的特征重要性概念相似。
錯誤貢獻度：衡量特征在模型在驗證集上產生錯誤時的權重。這更能反映特征在新數據上的泛化能力。

本文將詳細闡述這兩個概念的計算方法，并通過實例展示基于錯誤貢獻度的特征選擇如何優于傳統的基于預測貢獻度的方法。

基礎概念示例

考慮一個二元分類問題：預測個人年收入是否超過10萬美元。假設我們已有模型預測結果：

預測貢獻度和錯誤貢獻度的計算主要基于兩個要素：

模型對每個樣本的預測誤差
每個樣本的SHAP（SHapley Additive exPlanations）值

接下來，我們將深入探討這兩個關鍵問題：

分類模型中應采用何種誤差度量？
如何處理分類模型中的SHAP值？

分類模型中的錯誤度量選擇

在分類模型中，選擇合適的誤差度量至關重要。我們需要一個能在樣本級別計算并可在整個數據集上聚合的度量指標。

對數損失（又稱交叉熵）是分類問題中常用的損失函數，其數學表達式如下：

對數損失適合我們的需求，因為：

公式外部是簡單的平均操作
作為損失函數，其值越低越好，符合誤差的概念

為了更直觀地理解對數損失，我們可以關注單個樣本的貢獻：

在二元分類問題中，y只能取0或1，因此可以簡化為：

通過可視化可以更好地理解對數損失的特性：

預測概率越偏離真實值（0或1），損失越大。且當預測嚴重偏離時（如預測0.2而實際為1，或預測0.8而實際為0），損失增長速度超過線性。

以下是計算單樣本對數損失的Python實現：

def individual_log_loss(y_true, y_pred, eps=1e-15):  
     """計算單個樣本的對數損失"""
     y_pred = np.clip(y_pred, eps, 1 - eps)  
     return -y_true * np.log(y_pred) - (1 - y_true) * np.log(1 - y_pred)

應用到我們的示例數據集：

可以觀察到，樣本1和2的對數損失較小，因為預測接近實際值；而樣本0的對數損失較大。

分類模型中SHAP值的處理方法

在樹模型（如XGBoost、LightGBM和CatBoost）中，計算SHAP值相對簡單：

from shap import TreeExplainer
 
 shap_explainer = TreeExplainer(model)
 shap_values = shap_explainer.shap_values(X)

假設我們得到以下SHAP值：

SHAP值的基本解釋：

正值表示該特征增加了預測概率
負值表示該特征降低了預測概率

SHAP值之和與模型預測直接相關，但并不等于預測概率（介于0和1之間）。所以我們需要一個函數將SHAP值之和轉換為概率，該函數應滿足：

將任意實數映射到[0,1]區間
嚴格單調遞增

Sigmoid函數滿足這些要求。因此模型對特定樣本的預測概率等于該樣本SHAP值之和的Sigmoid函數值。

Sigmoid函數圖像：

Python實現：

def shap_sum2proba(shap_sum):
     """將SHAP值之和轉換為預測概率"""
     return 1 / (1 + np.exp(-shap_sum))

下圖示例中的樣本在Sigmoid曲線上的位置：

接下來，我們將詳細討論預測貢獻度和錯誤貢獻度的計算方法。

預測貢獻度的計算

預測貢獻度反映了特征對模型最終預測的影響程度。當一個特征的SHAP值絕對值較大時，表明該特征對預測結果有顯著影響。因此可以通過計算特征SHAP值的絕對值平均來量化預測貢獻度。

實現代碼如下：

prediction_contribution = shap_values.abs().mean()

應用到我們的示例數據集，得到以下結果：

從結果可以看出，就特征重要性而言，job是最主要的特征，其次是nationality，然后是age。

錯誤貢獻度的計算

錯誤貢獻度旨在評估移除某個特征后模型錯誤的變化。利用SHAP值，我們可以模擬特征缺失的情況：從SHAP值總和中減去特定特征的SHAP值，然后應用Sigmoid函數，即可得到模型在缺少該特征時的預測概率。

實現代碼如下：

y_pred_wo_feature = shap_values.apply(lambda feature: shap_values.sum(axis=1) - feature).applymap(shap_sum2proba)

應用到示例數據集的結果：

解讀結果：

如果沒有job特征，模型對三個樣本的預測概率分別為71%、62%和73%。
如果沒有nationality特征，預測概率分別為13%、95%和0%。

可以看出，預測結果對特征的依賴程度各不相同。接下來我們計算移除特征后的對數損失：

ind_log_loss_wo_feature = y_pred_wo_feature.apply(lambda feature: individual_log_loss(y_true=y_true, y_pred=feature))

結果如下：

對第一個樣本而言，移除job特征會導致對數損失增加到1.24，而移除nationality特征只會使對數損失增加到0.13。

為了評估特征的影響，我們可以計算完整模型的對數損失與移除特征后對數損失的差值：

ind_log_loss = individual_log_loss(y_true=y_true, y_pred=y_pred)  
 ind_log_loss_diff = ind_log_loss_wo_feature.apply(lambda feature: ind_log_loss - feature)

結果如下：

結果解讀如下：

負值表示特征的存在減少了預測錯誤，對該樣本有積極影響。
正值表示特征的存在增加了預測錯誤，對該樣本有消極影響。

最后計算每個特征的錯誤貢獻度，即這些差值的平均值：

error_contribution = ind_log_loss_diff.mean()

結果如下：

結果解讀：

負值表示特征總體上有積極影響，減少了模型的平均錯誤。
正值表示特征總體上有消極影響，增加了模型的平均錯誤。

在這個例子中，job特征的存在平均減少了0.897的對數損失，而nationality特征的存在平均增加了0.049的對數損失。盡管nationality是第二重要的特征（根據預測貢獻度），但它實際上略微降低了模型性能。

實際數據集應用案例

我們將使用一個名為"Gold"的金融時間序列數據集來演示這些概念的實際應用。該數據集來源于Pycaret庫。

特征說明：

所有特征都表示為百分比回報率
特征包括金融資產在觀察時刻前22、14、7和1天的回報率（分別標記為"T-22"、"T-14"、"T-7"、"T-1"）

完整的預測特征列表如下：

總共有120個特征。

預測目標：預測22天后黃金回報率是否會超過5%。因此，這是一個二元分類問題：

0：22天后黃金回報率小于或等于5%
1：22天后黃金回報率大于5%

實驗步驟：

隨機劃分數據集：33%用于訓練，33%用于驗證，34%用于測試。
使用訓練集訓練LightGBM分類器。
在訓練、驗證和測試集上進行預測。
使用SHAP庫計算各數據集的SHAP值。
計算每個特征在各數據集上的預測貢獻度和錯誤貢獻度。

分析結果：

圖：驗證集上的預測貢獻度vs錯誤貢獻度

主要發現：

美國債券ETF在T-22時點是最重要的特征，但它并未帶來顯著的錯誤減少。
3個月Libor在T-22時點是最有效的特征，因為它最大程度地減少了錯誤。
玉米價格在T-1和T-22時點都是重要特征，但T-1時點的特征存在過擬合現象（增加了預測錯誤）。
總體而言，T-1或T-14時點的特征錯誤貢獻度較高，而T-22時點的特征錯誤貢獻度較低。這表明較近期的特征可能更容易導致過擬合，而較早期的特征可能具有更好的泛化能力。

這些發現為我們提供了寶貴的模型洞察，并為特征選擇提供了新的思路。下一節我們將探討如何利用錯誤貢獻度進行特征選擇。

驗證：基于錯誤貢獻度的遞歸特征消除

遞歸特征消除（Recursive Feature Elimination，RFE）是一種迭代式特征選擇方法，通過逐步移除特征來優化模型性能。本節將比較基于預測貢獻度和錯誤貢獻度的RFE方法。

RFE算法概述：

初始化特征集
使用當前特征集訓練模型
評估各特征的重要性或貢獻度
移除"最差"特征
重復步驟2-4，直到達到預定的特征數量或性能標準

傳統RFE vs. 基于錯誤貢獻度的RFE：

傳統RFE：移除預測貢獻度最低的特征
基于錯誤貢獻度的RFE：移除錯誤貢獻度最高的特征

實驗結果

驗證集上的對數損失比較：

基于錯誤貢獻度的RFE在驗證集上顯著優于傳統RFE。

測試集上的對數損失比較：

盡管差異相對減小，但基于錯誤貢獻度的RFE在測試集上仍然優于傳統RFE，證明了其更好的泛化能力。

驗證集上的平均精度比較：

盡管錯誤貢獻度是基于對數損失計算的，但在平均精度這一不同的評估指標上，基于錯誤貢獻度的RFE仍然表現出色。

根據驗證集性能，我們選擇：

基于錯誤貢獻度的RFE：19個特征的模型
基于預測貢獻度的RFE：14個特征的模型

測試集上的平均精度比較：

最終結果：

基于錯誤貢獻度的RFE（19個特征）：72.8%的平均精度
基于預測貢獻度的RFE（14個特征）：65.6%的平均精度

基于錯誤貢獻度的RFE在測試集上獲得了7.2個百分點的性能提升，這是一個顯著的改進。

總結

本研究深入探討了機器學習模型中特征重要性的概念，并提出了區分特征重要性和特征有效性的新方法。

引入了預測貢獻度和錯誤貢獻度兩個概念，為特征評估提供了新的視角。
詳細闡述了基于SHAP值計算這兩種貢獻度的方法，為實踐應用提供了可操作的指導。
通過金融數據集的案例分析，展示了錯誤貢獻度在特征選擇中的實際應用價值。
證明了基于錯誤貢獻度的遞歸特征消除方法可以顯著提高模型性能，在測試集上實現了7.2%的平均精度提升。

通過深入理解特征的預測貢獻和錯誤貢獻，數據科學家可以構建更加穩健和高效的機器學習模型，為決策制定提供更可靠的支持。

責任編輯：華軒來源： DeepHub IMBA

機器學習模型解釋工具人工智能

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

欧美24videosex性欧美| 亚洲不卡视频在线观看| 91视频亚洲| 亚洲欧美激情在线| 成人18视频| 久久青青草视频| 免费毛片在线不卡| 制服丝袜亚洲精品中文字幕| 警花观音坐莲激情销魂小说| 成人免费视频国产| 色狮一区二区三区四区视频| 欧美一区二区精品在线| 久久国产午夜精品理论片最新版本| 乱色精品无码一区二区国产盗| a91a精品视频在线观看| 精品福利在线导航| 波多野结衣天堂| av电影高清在线观看| 国产成人午夜高潮毛片| 欧美性资源免费| 麻豆精品国产免费| 乱亲女h秽乱长久久久| 欧美午夜电影网| 亚洲五码在线观看视频| 青青草娱乐在线| 久久99精品久久久久久| 欧美日韩国产999| 全黄一级裸体片| 日韩成人视屏| 欧美在线观看你懂的| 国产在线无码精品| 极品美乳网红视频免费在线观看| 极品少妇xxxx偷拍精品少妇| 性色av一区二区咪爱| 免费91在线观看| 欧美黑白配在线| 色欧美日韩亚洲| 蜜臀精品一区二区| 久久黄色美女电影| 99精品1区2区| 91在线免费网站| 天天爱天天做天天爽| 国产精品hd| 日韩中文字幕在线| av免费观看不卡| 亚洲国产天堂| 欧美中文字幕一区二区三区| 亚洲熟妇无码另类久久久| 久久bbxx| 久久精品日产第一区二区三区高清版| 69174成人网| 亚洲中文字幕在线观看| 免费看黄裸体一级大秀欧美| 欧美精品激情在线| 内射一区二区三区| 日韩欧美午夜| 亚洲一区二区福利| v8888av| 国产伦精品一区二区三区免费优势| 欧美丝袜第三区| 日韩毛片在线免费看| 高潮在线视频| 亚洲一二三四区| 国产奶头好大揉着好爽视频| 大地资源中文在线观看免费版| 成人免费视频网站在线观看| 亚洲最大激情中文字幕| 国产精品呻吟久久| 老司机午夜精品99久久| 国产精品日本精品| 中文文字幕一区二区三三| 久久久久国产精品一区三寸| 5252色成人免费视频| 日本少妇毛茸茸高潮| 中文字幕日韩一区二区不卡 | 夜夜春亚洲嫩草影视日日摸夜夜添夜 | 亚洲欧洲视频在线观看| 99视频一区二区| 久久精品国产第一区二区三区最新章节 | 日韩一级免费视频| 国产乱人伦偷精品视频不卡| 91成人免费观看| www.日韩在线观看| 粉嫩嫩av羞羞动漫久久久| 国产高清精品在线 a| 丰满人妻一区二区三区免费视频| 国产精品资源网| 99在线视频首页| 三级网站免费观看| 久久久噜噜噜久久中文字幕色伊伊 | 色综合久久88色综合天天6| aa免费在线观看| 51一区二区三区| 制服丝袜一区二区三区| 日韩黄色一区二区| 伊人久久大香线蕉无限次| 亚洲香蕉成人av网站在线观看 | 久久久久久av无码免费网站下载| 日韩成人伦理| 欧美性xxxxx极品| 男人舔女人下面高潮视频| 国产精品美女午夜爽爽| 欧美一卡在线观看| 精品人妻伦一二三区久| 欧美猛男同性videos| 色婷婷av一区二区三区在线观看| 精品国产乱码久久久久久鸭王1| 亚洲狠狠婷婷| 国产精品老女人视频| 国产chinasex对白videos麻豆| 粉嫩一区二区三区性色av| 欧美日本韩国国产| 久cao在线| 亚洲精选一二三| 黄网站欧美内射| 丰满少妇一区| 亚洲国产欧美日韩精品| 精品手机在线视频| 女人色偷偷aa久久天堂| 5566成人精品视频免费| 在线播放国产一区| www.成人在线| 亚洲看片网站| 亚洲同志男男gay1069网站| 日韩欧美国产午夜精品| 人妻无码一区二区三区免费| 亚洲综合不卡| 精品国产91亚洲一区二区三区www| 麻豆91在线| 欧美怡红院视频| 国产免费看av| 亚洲综合不卡| 蜜桃在线一区二区三区精品| 2020国产在线| 精品国产一区二区三区忘忧草| 亚洲波多野结衣| 美美哒免费高清在线观看视频一区二区| 久久国产精品国产精品| 国精一区二区三区| 精品国产免费久久| 久久综合色综合| 成人一区二区视频| 免费特级黄色片| 在线一区二区三区视频| 九九综合九九综合| www.蜜臀av| xxx在线播放| 欧美视频二区欧美影视| 日韩天堂在线视频| 一级黄色片网站| 中文字幕在线观看一区| 一起操在线视频| 97精品视频| 91精品视频免费看| 99在线视频观看| 欧美α欧美αv大片| 精品无码久久久久久久| www.日韩在线| 日韩免费高清在线| 日韩久久精品| 91热精品视频| 成人超碰在线| 亚洲天堂2020| 88av在线视频| 一区二区三区在线免费视频| 制服丝袜在线第一页| 中日韩视频在线观看| 欧美日韩精品不卡| 国产精品久久久久久吹潮| 精品国产一区二区三区四区在线观看 | 欧美日韩另类在线| 国产又爽又黄无码无遮挡在线观看| 亚洲欧美高清| 手机成人av在线| 成人自拍在线| 奇米4444一区二区三区| 成人福利在线| 欧美一级理论片| 在线观看亚洲欧美| 亚洲国产精品成人综合 | www.欧美日韩| 波多结衣在线观看| 国产精品激情电影| 欧洲一区二区在线| 91视频成人| 2020久久国产精品| 97视频精彩视频在线观看| 欧美一二三区精品| 毛片毛片女人毛片毛片| 国产精品乱人伦| 中国免费黄色片| 热久久免费视频| 精品国产一区二区三区无码| 精品国产一区二区三区噜噜噜| 91理论片午午论夜理片久久| 日韩激情电影免费看| 久久精品国产一区二区电影| 日本高清视频网站| 欧美日韩国产经典色站一区二区三区| 国产精品theporn动漫| 国产精品丝袜久久久久久app| 日本一区二区免费视频| 免费美女久久99| 国产精品333| 亚洲成av人片一区二区密柚| 欧美精品在线一区| 祥仔av免费一区二区三区四区| 欧美乱大交xxxxx| 国产高清自拍视频在线观看| 欧美精品一区二区三区久久久| 中文字幕+乱码+中文乱码www| 亚洲国产精品欧美一二99| 三级黄色片在线观看| 91蜜桃免费观看视频| 性xxxxxxxxx| 精品在线免费观看| 毛片av免费在线观看| 亚洲小说欧美另类婷婷| 自拍偷拍一区二区三区| av中文字幕一区二区| 激情一区二区三区| 国产精品tv| 91在线在线观看| 国产专区精品| 国产精品最新在线观看| 亚洲成人人体| 欧美在线视频观看免费网站| 免费在线中文字幕| 蜜月aⅴ免费一区二区三区| 91在线网址| 亚洲色图第三页| 每日更新在线观看av| 亚洲国模精品一区| 刘亦菲毛片一区二区三区| 日韩一卡二卡三卡| 国产免费无遮挡| 欧美日韩国产免费| 一卡二卡在线观看| 欧美日韩日日摸| 中文字幕人妻色偷偷久久| 欧美视频中文一区二区三区在线观看| 欧美h在线观看| 色婷婷精品久久二区二区蜜臂av | 亚洲一区二区三区精品动漫| 欧美日韩激情在线一区二区三区| 久久久久久九九九九| 久久国产精品色av免费看| 国产原创精品| 午夜欧洲一区| 欧美凹凸一区二区三区视频| 网友自拍区视频精品| 久久青青草原| 伊人久久大香线蕉无限次| 欧美国产一二三区| 你懂的视频欧美| 色一情一乱一伦一区二区三欧美| 精品99在线| 在线精品日韩| 欧美国产三区| 日韩av综合在线观看| 亚洲欧美高清| 中日韩av在线播放| 国产精品羞羞答答xxdd| 国产婷婷在线观看| 久久久国产一区二区三区四区小说| 好吊视频在线观看| √…a在线天堂一区| 久草中文在线视频| 福利视频一区二区| 中文字幕精品在线观看| 日韩一区二区三区四区五区六区| www.久久久久久久久久| 精品一区二区三区四区在线| 成人不用播放器| xvideos国产精品| 国产夫妻在线播放| 国产精品久久久久av| 欧美高清hd| 欧美一二三四五区| 一区二区三区四区日韩| 国产欧美日韩网站| 老司机免费视频一区二区| 美女黄色一级视频| 日本一区免费视频| 91日韩中文字幕| 色中色一区二区| 97人妻精品一区二区三区| 精品国产乱码91久久久久久网站| 免费国产在线观看| 色综合天天综合网国产成人网| 牛牛精品一区二区| 91在线免费网站| 国产传媒欧美日韩成人精品大片| 米仓穗香在线观看| 日韩在线卡一卡二| 最新国产精品自拍| 一区二区中文视频| 可以免费看的av毛片| 在线电影一区二区三区| 日韩毛片在线一区二区毛片| 美女撒尿一区二区三区| 福利精品一区| 开心色怡人综合网站| 欧美一区久久| 色啦啦av综合| 久久精品视频网| 久久久精品人妻一区二区三区四| 欧洲视频一区二区| 神马久久久久久久久久| 久久在线精品视频| 全球最大av网站久久| 久久综合九色综合久99| 国产精品草草| 一本之道在线视频| 国产精品久久久99| 欧美一级做a爰片免费视频| 亚洲国产精品久久| 99视频免费在线观看| 国产热re99久久6国产精品| 亚洲桃色综合影院| 狠狠干狠狠操| 粉嫩久久99精品久久久久久夜| av资源在线免费观看| 色婷婷综合久久久中文字幕| 婷婷综合激情网| 欧美激情精品久久久久久免费印度| 国产三级一区| 三区精品视频| 日产欧产美韩系列久久99| 日韩人妻一区二区三区| 精品久久久视频| 亚洲AV无码成人片在线观看| 久热精品视频在线观看一区| 日本免费在线一区| 亚洲国产精品www| 免费成人在线观看视频| 中文字幕免费视频| 欧亚洲嫩模精品一区三区| 日韩a级作爱片一二三区免费观看| 性欧美在线看片a免费观看| 国内自拍欧美| 麻豆tv在线播放| 91偷拍与自偷拍精品| 精品成人av一区二区在线播放| 亚洲国产成人精品女人久久久 | 免费在线观看黄色小视频| 欧美日韩国产精品自在自线| 欧洲日本在线| 亚洲综合大片69999| 国产精品激情| 韩国无码一区二区三区精品| 午夜av区久久| 成人一区二区av| 超碰99在线| 精品午夜一区二区| 久久精品中文| 亚洲高潮女人毛茸茸| 欧美人与禽zozo性伦| 91高清在线观看视频| 国产精品一区二区在线观看| 夜夜夜久久久| jizz18女人高潮| 欧美一区三区二区| 暖暖在线中文免费日本| 麻豆成人小视频| 欧美aⅴ一区二区三区视频| 国产探花在线视频| 精品奇米国产一区二区三区| 色综合桃花网| 中文字幕久久综合| 国产成人免费网站| 成年人免费高清视频| 亚洲天堂影视av| 韩国一区二区三区视频| 日韩精品视频在线观看视频| 久久久久久久久久久久久女国产乱 | 欧美欧美全黄| 粉嫩av蜜桃av蜜臀av| 欧美剧在线免费观看网站| 成人三级小说| 亚洲精品国产精品国自产观看| 国产成人精品www牛牛影视| 99精品人妻国产毛片| 久久精品视频在线| 欧美亚洲色图校园春色| 五月激情婷婷在线| 亚洲成av人片观看| 视频三区在线| 精品一区二区三区视频日产| 精品在线免费观看| 国产精品自拍99| 久久久精品免费视频| 日韩在线你懂的| 韩国一区二区在线播放| 狠狠久久亚洲欧美专区| www.在线视频| 亚洲欧美精品| 91蝌蚪porny| 国产草草影院ccyycom| 国产精品高精视频免费|