我有两个数据集,一个用于训练,一个用于测试。我将预测测试数据集中具有数值类型的列的值。为了预测一个实例的值,我必须在训练数据集中找到该实例的 k 个最近邻居,并计算值的平均值。(等待也可以使用)。
例如:
列 0 列 1 列 2
……………………………………………………………………………………………………………………………………………………………………………………………………………………………………
10 ....................b.......................12
...... c.......................d.......................16
……………………………………………………………………………………………………………………………………………………………………
我需要一种数据挖掘方法来给我结果 = (10+12)/2 = 11 我应该使用哪种方法来获得这样的结果?您是否知道任何解释如何使用该方法的好文档?