1

我正在使用 RTextTools 来训练和分类来自 MySQL 表的数据。我有一个名为的字段id,用于标识数据库中的每个文档。但是,使用以下代码后,该id字段不再存在。

matrix <- create_matrix(cbind(data$text,data$id),
language="english", removeNumbers=TRUE,
removeSparseTerms=.998)

corpus <- create_corpus(matrix,
as.numeric(data$valid),
trainSize=1:750, testSize=751:1000,
virgin=FALSE)

SVM <- train_model(corpus,"SVM")

SVM_CLASSIFY <- classify_model(corpus, SVM)

如上所述,data$id在此过程中似乎丢失了。知道如何保持 ID 与数据相关联吗?

4

1 回答 1

0

您可以使用该cbind命令将 ID 列添加回输出。例如:

output <- cbind(data$id,SVM_CLASSIFY)
于 2012-06-17T00:50:36.837 回答