1

我可以在创建tm::TermDocumentMatrix对象时删除稀疏术语吗?

我试过:

TermDocumentMatrix(file.corp, control = list(removeSparseTerms=0.998))

但它不起作用。

4

1 回答 1

1

不,您不能使用该TermDocumentMatrix函数删除这样的稀疏术语。如果您使用 来查看该功能的帮助,?TermDocumentMatrix您会看到 的选项control列在 的帮助中 termFreq,当您使用 来查看该功能的帮助时?termFreq,您会发现removeSparseTerms那里没有列出。虽然你有bounds哪个可以做相关的工作。

如果您只想要一个组合TermDocumentMatrixremoveSparseTerms的单线,您只需将您的线从里到外翻转,这样就可以正常工作:

removeSparseTerms(TermDocumentMatrix(file.corp), 0.998)

我建议您仔细查看该tm软件包的文档,它是文档完善的贡献软件包的更好示例之一。它可能会节省您等待有人在这里回答您的问题的时间!

于 2014-11-02T03:50:38.990 回答