kaiyun下載app下載安裝手機版 XGBoost中特征重要性計算方法對比
XGBoost作為競賽殺手锏kaiyun官方網(wǎng)app下載app,內(nèi)置了若干重要性函數(shù)kaiyun官方網(wǎng)app下載app,今天我們來梳理一下本文中三種常見的特征重要性計算方式kaiyun下載app下載安裝手機版,并思考它們的使用場景。
xgboost.plot_importance(booster, ax=None, height=0.2, xlim=None, ylim=None,
title='Feature importance', xlabel='F score', ylabel='Features', fmap='',
importance_type='weight', max_num_features=None, grid=True,
show_values=True, **kwargs)
在上面的函數(shù)中,我們可以通過修改importance_type參數(shù)來改變?nèi)绾斡嬎闾卣髦g的重要性。可選值為:“weight”、“gain”、“cover”
重量
“權(quán)重”是特征在樹中出現(xiàn)的次數(shù)
獲得
“增益”是使用該特征的分割的平均增益
覆蓋
“覆蓋率”是使用該特征的分割的平均覆蓋率,其中覆蓋率定義為受分割影響的樣本數(shù)量
總結(jié)
如果有下游業(yè)務(wù)方,建議使用覆蓋特征重要性計算方法。當(dāng)然如果只是模型調(diào)優(yōu),g??ain可以指出最重要的特征。這些特征在某些場景下也可以歸納成硬規(guī)則。
我要評論