我想从中创建训练和测试数据mydata
,其中包含 2673 个观察值和 23 个变量。但是,我无法仅通过简单地减去训练数据来创建测试集。
dim(mydata)
## [1] 2673 23
set.seed(1)
train = mydata[sample(1:nrow(mydata), 1000, replace=FALSE), ]
dim(train)
## [1] 1000 23
当我运行以下命令时,我收到了 19 个警告,结果有 20,062 个观察值:
test = mydata[!train, ]
## There were 19 warnings (use warnings() to see them)
dim(test)
## [1] 20062 23
我究竟做错了什么?