7

我确实知道如何在一个单词上执行 SnowballStemmer(在我的例子中,在俄语上)。做接下来的事情:

from nltk.stem.snowball import SnowballStemmer 

stemmer = SnowballStemmer("russian") 
stemmer.stem("Василий")
'Васил'

如果我有一个像 ['Василий', 'Геннадий', 'Виталий'] 这样的单词列表,我该怎么做?

我使用 for 循环的方法似乎不起作用:(

l=[stemmer.stem(word) for word in l]
4

1 回答 1

7

您的变量l未预定义,导致名称错误。请参阅我的最后两行进行修复。

>>> from nltk.stem.snowball import SnowballStemmer
>>> stemmer = SnowballStemmer("russian") 
>>> my_words = ['Василий', 'Геннадий', 'Виталий']
>>> l=[stemmer.stem(word) for word in l]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'l' is not defined
>>> l=[stemmer.stem(word) for word in my_words]
>>> l
['васил', 'геннад', 'витал']
于 2017-08-15T15:28:08.460 回答