我有一个包含 1000 个样本的 l2 维数据集,由 5 个温度值、5 个价格值、一个代表人类专家判断的整数值(未决定=0、好=1、坏=2、危险=4)和我想学习预测的二元决策变量。
我怎样才能找到一个分类器来处理这种异构数据?
我正在考虑为每个可能的人类判断(0、1、2、4)构建一个分类器,所以是 4 个分类器。因此,对于每个人类判断值,我会: - 居中并降低温度和价格值 - 可能使用 PCA 删除一些不相关的特征 - 使用机器学习方法进行分类(如多层神经网络或 SVM)
我的方法正确吗?(如果有 1000 个可能的人类判断而不是 4 个呢?)