我有一个有点大的文档,想用 Python 对这个文档的单词进行停用词消除和词干处理。有谁知道这些的货架包装?如果不是对大型文档足够快的代码,也欢迎使用。谢谢
问问题
2250 次
2 回答
8
NLTK支持这一点。
于 2010-10-07T14:56:33.003 回答
4
如果由于某种原因你不想使用 NLTK,你可以试试 PyStemmer。对于停用词,只需下载一个列表(谷歌搜索)并将它们过滤掉。
于 2010-10-07T16:00:57.653 回答