machine-learning - 具有异构数据的分类器

Question

我有一个包含 1000 个样本的 l2 维数据集，由 5 个温度值、5 个价格值、一个代表人类专家判断的整数值（未决定=0、好=1、坏=2、危险=4）和我想学习预测的二元决策变量。

我怎样才能找到一个分类器来处理这种异构数据？

我正在考虑为每个可能的人类判断（0、1、2、4）构建一个分类器，所以是 4 个分类器。因此，对于每个人类判断值，我会： - 居中并降低温度和价格值 - 可能使用 PCA 删除一些不相关的特征 - 使用机器学习方法进行分类（如多层神经网络或 SVM）

我的方法正确吗？（如果有 1000 个可能的人类判断而不是 4 个呢？）

score 2 · Accepted Answer

SVM 或 ANN 编码类别的典型方法是 1-of-C 编码：

一般来说，几乎每个分类器都可以处理异构数据。但是您必须对输入进行预处理（缩放、归一化……）。我给你的链接中应该有很多提示。

1 回答 1