4

我一直在使用许多不同的语料库进行自然语言处理,并且一直在寻找一个使用 Wordnet Word Senses 注释的语料库。

我知道可能没有包含这些信息的大型语料库,因为语料库需要手动建立,但必须有一些东西可以解决。

此外,如果不存在语料库,是否至少有一个带有语义注释的 ngram 数据库(一个词的每个定义占多少时间,或者每个 wordnet 定义的数字计数取决于词义的常见程度是)?

4

3 回答 3

8

为 WordNet 注释的三个著名语料库:

于 2012-01-11T17:03:08.380 回答
1

Some of the SENSEVAL (now SEMEVAL) data is annotated with WordNet.

于 2012-01-11T17:07:15.813 回答
0

您可以使用 senseval2,对于 java,有 semcor 格式和 (jSemcor API) 以及 senseval3。这两个语料库用于词义消歧。

于 2018-02-05T11:40:54.130 回答