我可以在创建tm::TermDocumentMatrix
对象时删除稀疏术语吗?
我试过:
TermDocumentMatrix(file.corp, control = list(removeSparseTerms=0.998))
但它不起作用。
我可以在创建tm::TermDocumentMatrix
对象时删除稀疏术语吗?
我试过:
TermDocumentMatrix(file.corp, control = list(removeSparseTerms=0.998))
但它不起作用。
不,您不能使用该TermDocumentMatrix
函数删除这样的稀疏术语。如果您使用 来查看该功能的帮助,?TermDocumentMatrix
您会看到 的选项control
列在 的帮助中 termFreq
,当您使用 来查看该功能的帮助时?termFreq
,您会发现removeSparseTerms
那里没有列出。虽然你有bounds
哪个可以做相关的工作。
如果您只想要一个组合TermDocumentMatrix
和removeSparseTerms
的单线,您只需将您的线从里到外翻转,这样就可以正常工作:
removeSparseTerms(TermDocumentMatrix(file.corp), 0.998)
我建议您仔细查看该tm
软件包的文档,它是文档完善的贡献软件包的更好示例之一。它可能会节省您等待有人在这里回答您的问题的时间!