我试图找到一种更快的方法来使用 NLTK Word Net Lemmatizer对列表(命名为text )中的单词进行词形还原。显然这是我整个程序中最耗时的步骤(使用 cProfiler 找到相同的步骤)。
以下是我试图优化速度的一段代码 -
def lemmed(text):
l = len(text)
i = 0
wnl = WordNetLemmatizer()
while (i<l):
text[i] = wnl.lemmatize(text[i])
i = i + 1
return text
使用 lemmatizer 将我的性能降低了 20 倍。任何帮助,将不胜感激。