我的数据框中有 50 个变量。46 个是因变量,4 个是自变量(降水、温度、露水、雪)。我想计算我的因变量与我的独立变量的互信息。
现在我正在使用以下方法计算它,但这需要很长时间,因为我每次都必须更改我的y
X = df[['Temperature', 'Precipitation','Dew','Snow']] # Features
y = df[['N0037']] #target
from sklearn.feature_selection import mutual_info_regression
mi = mutual_info_regression(X, y)
mi /= np.max(mi)
mi = pd.Series(mi)
mi.index = X.columns
mi.sort_values(ascending=False)
mi