5

关于 Weka 的重量,我需要你的帮助。我正在对大规模数据进行一些实验:我正在将数据转换为实例并使用不同的分类器进行研究。现在我想研究赋予实例权重如何影响学习——有时我想赋予实例权重,有时不。我的问题是:

  1. 可能的权重范围是多少?
  2. 权重的效果是否因分类器而异?
  3. 是否有默认权重(我在某处看到它可能是 1,但我想向它保证)?
  4. 任何对相关信息的参考将不胜感激:)
4

1 回答 1

7

问题 2 的答案是“是”,这也会影响问题 1 的答案。基本上,Weka 只将权重传递给实际的分类算法。允许的权重范围以及它们的使用方式完全取决于分类器的实现。关于问题3,默认权重将赋予所有实例相同的权重,实际数量并不那么重要。

例如,最近邻分类器完全忽略权重,即使它很乐意采用任何权重值。理论上,可以实现最近邻分类器来考虑权重,但这个特定的分类器没有。所以问题 2 的答案是它实际上取决于分类器的特定实现,甚至比分类器算法更多。

于 2012-10-09T15:56:01.980 回答