我想在python中找到输入词的基本形式
就像是
get_base_form({running, best, eyes, moody})
--> run, good, eye, mood
一个只处理常规形式的解决方案就可以了。但是,也可以处理不规则的答案将是完美的。
如果没有库可以做到这一点,那么 Web 服务也可以。
我想在python中找到输入词的基本形式
就像是
get_base_form({running, best, eyes, moody})
--> run, good, eye, mood
一个只处理常规形式的解决方案就可以了。但是,也可以处理不规则的答案将是完美的。
如果没有库可以做到这一点,那么 Web 服务也可以。
使用nltk
自然语言工具包中的 SnowballStemmer:
from nltk.stem.snowball import SnowballStemmer
stemmer = SnowballStemmer("english")
print(stemmer.stem("generalized"))
print(stemmer.stem("generalization"))
输出:
general
general
顺便说一下,你可以阅读 nltk 的文档@https ://www.nltk.org/