1

我必须计算连续/数字特征的互信息。我想基于此应用特征选择。功能集描述如下

特征1:可以假设1 - 10000之间的任何值特征2:测量花费在某事上的时间-因此可以假设除整数(大)之外的任何值....我有这些特征。

我对此应用互信息公式感到困惑。维基百科说集成是必需的连续变量。

在应用 MI 之前我需要离散化特征吗?

4

1 回答 1

0

我认为您需要在应用 MI 之前离散化特征

当在连续变量中应用信息增益进行特征选择时,选择一个分割点将变量的值空间分割成独立的部分,这需要评估所有可能的分割点以获得特征的最佳分割点。我认为特征选择的互信息是相同的,您可以选择将连续空间离散化为某个离散化值,如果值空间平滑,我认为也会这样做

于 2014-04-22T08:17:45.437 回答