我无法理解变量在knn()
R 函数上下文中的含义,因为我不是来自统计学背景。
假设我正在尝试预测每个池 A、B 和 C 的池比赛结果。
我知道参加比赛的每位参赛选手的身高和体重。假设每年竞争的候选人都是一样的,我也知道过去30年谁赢了。
我如何预测今年谁将在 A、B 和 C 组中获胜?
我猜:
参数是一个数据框,其中train
包含他为每个参赛者竞争的体重、身高和泳池列。这是过去的 29 年。
参数是一个数据框,其中test
包含他为每个参赛者竞争的体重、身高和泳池列。这是最后一年。
cl
参数是每年哪个竞争对手赢得比赛的向量。
这knn()
是打算如何使用的吗?
参考:
http://stat.ethz.ch/R-manual/R-patched/library/class/html/knn.html