4

我有一个有点大的文档,想用 Python 对这个文档的单词进行停用词消除和词干处理。有谁知道这些的货架包装?如果不是对大型文档足够快的代码,也欢迎使用。谢谢

4

2 回答 2

8

NLTK支持这一点。

于 2010-10-07T14:56:33.003 回答
4

如果由于某种原因你不想使用 NLTK,你可以试试 PyStemmer。对于停用词,只需下载一个列表(谷歌搜索)并将它们过滤掉。

于 2010-10-07T16:00:57.653 回答