1

首先,对不起我的英语,我的英语说得很糟糕。

所以,我有一个关于 R 上 koRpus 包中的 treetag 函数的问题。我想对文本进行词形还原,使用 Treetagger 对我来说没问题。我使用了treetag函数:

treetag(file, treetagger = "manual", lang = "fr",
        TT.options = list(path, preset="fr")) 

我获得了令牌,标签...

但是在此 Lemmatization 之后,我想获得标记的文本,但我没有解决方案来做到这一点。我想在我的文本中用他的引理替换每个标记。

那么,你有我的解决方案吗?

非常感谢 !

4

1 回答 1

1
Proof next steps:

txt1 <- treetag(c(“played”, “saw”),
treetagger=”manual”, lang=”en”,
encoding = “UTF-8″,
TT.options=list(path=”C:/TreeTagger”, preset=”en”),
format = “obj”)

text2 <- slot(txt1 , "TT.res")

text3<- ifelse(text2$lemma == "<unknown>", text2 $token, 
                           text2$lemma)
于 2017-06-29T06:10:47.040 回答