我一直在使用许多不同的语料库进行自然语言处理,并且一直在寻找一个使用 Wordnet Word Senses 注释的语料库。
我知道可能没有包含这些信息的大型语料库,因为语料库需要手动建立,但必须有一些东西可以解决。
此外,如果不存在语料库,是否至少有一个带有语义注释的 ngram 数据库(一个词的每个定义占多少时间,或者每个 wordnet 定义的数字计数取决于词义的常见程度是)?
我一直在使用许多不同的语料库进行自然语言处理,并且一直在寻找一个使用 Wordnet Word Senses 注释的语料库。
我知道可能没有包含这些信息的大型语料库,因为语料库需要手动建立,但必须有一些东西可以解决。
此外,如果不存在语料库,是否至少有一个带有语义注释的 ngram 数据库(一个词的每个定义占多少时间,或者每个 wordnet 定义的数字计数取决于词义的常见程度是)?