我正在使用 RTextTools 来训练和分类来自 MySQL 表的数据。我有一个名为的字段id
,用于标识数据库中的每个文档。但是,使用以下代码后,该id
字段不再存在。
matrix <- create_matrix(cbind(data$text,data$id),
language="english", removeNumbers=TRUE,
removeSparseTerms=.998)
corpus <- create_corpus(matrix,
as.numeric(data$valid),
trainSize=1:750, testSize=751:1000,
virgin=FALSE)
SVM <- train_model(corpus,"SVM")
SVM_CLASSIFY <- classify_model(corpus, SVM)
如上所述,data$id
在此过程中似乎丢失了。知道如何保持 ID 与数据相关联吗?