首先让我说我一般没有 R、KNN 或数据科学方面的经验。我最近发现了Kaggle,并且一直在玩数字识别竞赛/教程。
在本教程中,他们提供了一些示例代码来帮助您开始基本提交:
# makes the KNN submission
library(FNN)
train <- read.csv("c:/Development/data/digits/train.csv", header=TRUE)
test <- read.csv("c:/Development/data/digits/test.csv", header=TRUE)
labels <- train[,1]
train <- train[,-1]
results <- (0:9)[knn(train, test, labels, k = 10, algorithm="cover_tree")]
write(results, file="knn_benchmark.csv", ncolumns=1)
我的问题是:
- 如何查看为特定测试行选择的最近邻居?
- 如何修改为我选择的这十个中的哪一个
results
?
这些问题可能过于宽泛。如果是这样,我会欢迎任何可以为我指明正确道路的链接。
我很可能在这里说了一些没有意义的话。如果是这种情况,请纠正我。