1

我想使用这里提供的加泰罗尼亚语词干分析器:http: //snowball.tartarus.org/algorithms/catalan/stemmer.html

但是,当我这样做时:

from nltk.stem.snowball import SnowballStemmer   
stemmer = SnowballStemmer("catalan")

它说:

不支持加泰罗尼亚语

有人可以帮助我吗?我究竟做错了什么?

对于西班牙语,当我输入时它确实有效:

from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("spanish")

非常感谢!

4

1 回答 1

1

你没有做错任何事。SnowballStemmer 支持的语言可在源代码中找到,但不包括加泰罗尼亚语:

class SnowballStemmer(StemmerI):

    """
    Snowball Stemmer

    The following languages are supported:
    Danish, Dutch, English, Finnish, French, German,
    Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian,
    Spanish and Swedish.

在这里找到:http ://www.nltk.org/_modules/nltk/stem/snowball.html

于 2016-03-11T18:54:29.127 回答