我想在 R 中使用 Wordnet 的 getLemma 函数对语料库进行词形还原。但我不太确定如何使用它。
这是使用 R. 中的 wordnet 包进行词形还原的文档。
filter <- getTermFilter("StartsWithFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter)
sapply(terms, getLemma)
我的问题是我有一个包含 5000 个单词的文档,在这种情况下,我想将每个单词转换为其基本/根单词。例如:发烧->发烧;发烧-->发烧
我想对语料库中的所有单词进行词形还原,并且不会将其限制为单词 StartingWith...,我也不明白数字 5 在terms <- getIndexTerms("NOUN", 5, filter)
如果有人可以为我解决这个问题,那就太好了。
谢谢