1

我有两个数据集,一个用于训练,一个用于测试。我将预测测试数据集中具有数值类型的列的值。为了预测一个实例的值,我必须在训练数据集中找到该实例的 k 个最近邻居,并计算值的平均值。(等待也可以使用)。

例如:

列 0 列 1 列 2

……………………………………………………………………………………………………………………………………………………………………………………………………………………………………
10 ....................b.......................12
...... c.......................d.......................16

……………………………………………………………………………………………………………………………………………………………………

我需要一种数据挖掘方法来给我结果 = (10+12)/2 = 11 我应该使用哪种方法来获得这样的结果?您是否知道任何解释如何使用该方法的好文档?

4

1 回答 1

5

Weka 中的 KNN 实现为 IBk。它能够预测数值和标称值。

如果您使用的是 Weka Explorer (GUI),您可以通过查找分类选项卡下的“选择”按钮来找到它。在那里导航文件夹:

分类器 -> 懒惰 -> IBk

选择 IBk 后,单击按钮右侧的框。这将打开大量的选项。如果您然后单击选项窗口中的“更多”按钮,您将看到所有选项的解释。如果您需要对分类器的更多解释,他们甚至会列出分类器所基于的学术论文。您可以对所有分类器执行此操作以获取附加信息。

于 2013-11-13T18:54:37.627 回答