我想将GermaNetgetLemma()
用于列表(实际上是DTM
术语——用于提高文本分类性能)的词形还原(对应于 WordNet 中)。但是,我找不到 GermaNet 的任何提示或 R 包。是否有可能在 R 中仍然使用它?
问问题
1312 次
1 回答
1
我假设您可以访问存储 wordnet 数据的原始文件(Germanet 似乎允许免费许可)。您可以解析它们(只需使用一些漂亮的正则表达式)并提取您需要的信息(我不确切知道 DTM 是什么,但我想这与当时的同义词集或链接有关)。我工作的一个wordnet(不是德语)被组织在多个文件中,一些包含链接,一些信息的形式如下
0 @1@ WORD_MEANING
1 PART_OF_SPEECH "v"
1 VARIANTS
2 LITERAL "someverb"
3 SENSE 7
3 DEFINITION "adefinition"
3 EXAMPLES
4 EXAMPLE "anexample"
3 EXTERNAL_INFO
...
这不应该太难解析。
于 2015-07-09T16:02:33.407 回答