我想在任何分类算法(如 KNN 或 J48)中使用特征之前给数据集的特征赋予权重,但我不知道如何评估加权特征向量。
是否有任何分类算法接受权重作为输入,而不仅仅是“0”和“1”?
特别是,Weka 的任何现成分类函数是否能够使用权重(不是 0 和 1 作为过滤器)?
问问题
669 次
2 回答
0
在大多数情况下,您可以根据您的权重缩放数据集。对于诸如欧几里得距离之类的 Minkowski 距离,这很容易证明。
于 2012-07-16T06:03:01.057 回答
0
并非所有 weka 的分类算法都支持权重,但有些支持。
您需要在加载数据集后设置权重信息,请参阅weka wiki 中的示例代码。我记得 Weka J48 决策树在开发者版本中支持权重但找不到参考。虽然有一个补丁。
在 weka wiki 中搜索特征权重可能会有所帮助。
我建议尝试为数据集添加权重并在您的数据中进行训练。
于 2012-07-16T09:05:32.587 回答