2

为什么波特词干算法在线

http://text-processing.com/demo/stem/

friedfri不干fry

我不记得ied在英语中有任何以过去时结尾的单词有一个以.结尾的主格形式i

这是一个错误吗?

4

2 回答 2

4

Porter Stemmer 返回的词干不一定是动词的基本形式,也不一定是有效词。如果你正在寻找那个,你需要寻找一个词形还原器。

于 2014-12-26T16:35:15.203 回答
2

首先,词干分析器不是词形还原器,另请参阅Stemmers vs Lemmatizers

>>> from nltk.stem import PorterStemmer, WordNetLemmatizer
>>> porter = PorterStemmer()
>>> wnl = WordNetLemmatizer()
>>> fried = 'fried'
>>> porter.stem(fried)
u'fri'
>>> wnl.lemmatize(fried)
'fried'

接下来,词形还原器对词性 (POS) 敏感:

>>> wnl.lemmatize(fried, pos='v')
u'fry'
于 2014-12-26T18:01:22.180 回答