6

我想将GermaNetgetLemma()用于列表(实际上是DTM术语——用于提高文本分类性能)的词形还原(对应于 WordNet 中)。但是,我找不到 GermaNet 的任何提示或 R 包。是否有可能在 R 中仍然使用它?

4

1 回答 1

1

我假设您可以访问存储 wordnet 数据的原始文件(Germanet 似乎允许免费许可)。您可以解析它们(只需使用一些漂亮的正则表达式)并提取您需要的信息(我不确切知道 DTM 是什么,但我想这与当时的同义词集或链接有关)。我工作的一个wordnet(不是德语)被组织在多个文件中,一些包含链接,一些信息的形式如下

0 @1@ WORD_MEANING
  1 PART_OF_SPEECH "v"
  1 VARIANTS
    2 LITERAL "someverb"
      3 SENSE 7
      3 DEFINITION "adefinition"
      3 EXAMPLES
        4 EXAMPLE "anexample"
      3 EXTERNAL_INFO
...

这不应该太难解析。

于 2015-07-09T16:02:33.407 回答