-1

我正在尝试建立一个逻辑回归模型,并且我的许多功能都对分类变量进行了排序。我认为虚拟变量可能没有用,因为它以相同的权重对待每个类别。那么,我是否需要处理像 numeric 这样的有序分类变量?

提前致谢 。

4

1 回答 1

1

有序分类值在数据挖掘中被称为“有序”属性,其中一个值小于或大于另一个值。您可以将这些值视为标称值或连续值(数字)。将它们视为数字(连续)的一些优点和缺点是:

优点:

  • 这为您选择分析提供了很大的灵活性,并保留了排序中的信息。对许多分析师来说更重要的是,它可以让您轻松分析数据。

缺点:

  • 这种方法需要假设每组后续类别之间的数值距离相等。否则,根据域,您可以使间隔变大。
于 2018-11-19T05:35:16.040 回答