machine-learning - 稀疏二元矩阵的二元分类

Question

我的犯罪分类数据集具有指标特征，例如has_rifle.

工作是训练和预测数据点是否是罪犯。该指标是加权平均绝对误差，如果这个人是罪犯，并且模型预测他/她不是，那么权重很大5。如果此人不是罪犯并且模型预测他/她是，那么权重为1。否则模型会正确预测，权重为0。

我已经使用classif:multinominmlr中的方法R，并将阈值调整为1/6。结果不是那么好。Adaboost稍微好一点。虽然两者都不是完美的。

我想知道在这种稀疏{0,1}矩阵的二元分类问题中通常使用哪种方法？以及如何提高加权平均绝对误差度量的性能？

score 0 · Accepted Answer

处理稀疏数据并非易事。缺乏信息使得难以捕捉诸如方差之类的特征。我建议您搜索子空间聚类方法或更具体的软子空间聚类。最后一个通常标识相关/不相关的数据维度。当您想要提高分类准确性时，这是一个很好的方法。

1 回答 1