1

我有一个包含 1000 个样本的 l2 维数据集,由 5 个温度值、5 个价格值、一个代表人类专家判断的整数值(未决定=0、好=1、坏=2、危险=4)和我想学习预测的二元决策变量。

我怎样才能找到一个分类器来处理这种异构数据?

我正在考虑为每个可能的人类判断(0、1、2、4)构建一个分类器,所以是 4 个分类器。因此,对于每个人类判断值,我会: - 居中并降低温度和价格值 - 可能使用 PCA 删除一些不相关的特征 - 使用机器学习方法进行分类(如多层神经网络或 SVM)

我的方法正确吗?(如果有 1000 个可能的人类判断而不是 4 个呢?)

4

1 回答 1

2

SVM 或 ANN 编码类别的典型方法是 1-of-C 编码:

一般来说,几乎每个分类器都可以处理异构数据。但是您必须对输入进行预处理(缩放、归一化……)。我给你的链接中应该有很多提示。

于 2012-04-27T15:44:59.997 回答