1

我尝试使用 SourceForge 的 OpenNLP Tools 1.5 从文本中获取命名实体。我确实在 OpenNLP 下载中找到了一个 JWNL 文件。这是否意味着 OpenNLP 反过来使用 WordNet 进行命名实体识别。(具体来说,这是否意味着名称模型文件是使用 WordNet 生成的)?

4

2 回答 2

2

据我所知,OpenNLP 使用最大熵包来提供他们所有的统计模型——pos 标记、句子检测、NER 甚至标记化。Wordnet 集成不是 OpenNLP 的一部分,所以我认为它的功能没有用于训练模型。

于 2011-04-28T07:04:15.317 回答
2

不,OpenNLP 仅使用 WordNet 进行共同参考解析,例如在单独的句子中将“He”与“Steve Jones”相关联。

WordNet 不用于命名实体识别。命名实体训练文件是来自各种会议/测试的手动注释字段,例如 CoNLL。

来源: http: //opennlp.sourceforge.net/README.html

于 2011-04-28T18:24:09.630 回答