我使用nltk
3.0.4 并注意到单词的引理boss
是bosses
不同的。
from nltk.stem.wordnet import WordNetLemmatizer
wnl = WordNetLemmatizer()
print wnl.lemmatize("boss", "n")
# returns "bos"
print wnl.lemmatize("bosses", "n")
# returns "boss"
从我的角度来看,这是一种奇怪的行为,尤其boss
是 WordNet 中的一个已知单词,并且有一个规则要保留ss
。
有没有人有解释或者这只是一个错误?我应该如何处理?