3

请告诉我如何更好地解决这个问题。

我有俄语的文本,我想找到 10 个最常见的词法词。也许有任何开源库可以在python中解决这个问题?

4

2 回答 2

4

您可以使用俄语的 Python 形态分析器之一来规范化单词:

在https://github.com/nltk/nltk中还有一个用于俄语的 Porter 词干分析器。此外,您可以从命令行使用http://company.yandex.ru/technologies/mystem/ 。

我会为你的任务推荐 pymorphy2,但我有点偏颇:)

于 2013-04-12T12:52:12.463 回答
2

PyStemmerNLTK是这里最明显的两个库。

于 2013-04-12T12:51:48.817 回答