0

我想在 R 中使用 Wordnet 的 getLemma 函数对语料库进行词形还原。但我不太确定如何使用它。

这是使用 R. 中的 wordnet 包进行词形还原的文档。

filter <- getTermFilter("StartsWithFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter)
sapply(terms, getLemma) 

我的问题是我有一个包含 5000 个单词的文档,在这种情况下,我想将每个单词转换为其基本/根单词。例如:发烧->发烧;发烧-->发烧

我想对语料库中的所有单词进行词形还原,并且不会将其限制为单词 StartingWith...,我也不明白数字 5 在terms <- getIndexTerms("NOUN", 5, filter)

如果有人可以为我解决这个问题,那就太好了。

谢谢

4

1 回答 1

0

5 指的是 maxLimit,这是您想要的最大结果数... http://cran.r-project.org/web/packages/wordnet/wordnet.pdf <--这就是解决问题所需的一切

于 2013-09-25T15:52:42.513 回答