为什么波特词干算法在线
http://text-processing.com/demo/stem/
干fried
到fri
不干fry
?
我不记得ied
在英语中有任何以过去时结尾的单词有一个以.结尾的主格形式i
。
这是一个错误吗?
为什么波特词干算法在线
http://text-processing.com/demo/stem/
干fried
到fri
不干fry
?
我不记得ied
在英语中有任何以过去时结尾的单词有一个以.结尾的主格形式i
。
这是一个错误吗?
Porter Stemmer 返回的词干不一定是动词的基本形式,也不一定是有效词。如果你正在寻找那个,你需要寻找一个词形还原器。
首先,词干分析器不是词形还原器,另请参阅Stemmers vs Lemmatizers:
>>> from nltk.stem import PorterStemmer, WordNetLemmatizer
>>> porter = PorterStemmer()
>>> wnl = WordNetLemmatizer()
>>> fried = 'fried'
>>> porter.stem(fried)
u'fri'
>>> wnl.lemmatize(fried)
'fried'
接下来,词形还原器对词性 (POS) 敏感:
>>> wnl.lemmatize(fried, pos='v')
u'fry'