5

在自然语言处理中,命名实体识别是识别诸如组织、地点和最重要的名称等命名实体的挑战。

尽管我称之为同义词,但其中有一个重大挑战:伯爵德古拉实际上指的是同一个人,但可能从未在文本中直接讨论过。

解决这些同义词的最佳算法是什么?


如果任何基于 Python 的库中有此功能,我渴望接受教育。我正在使用 NLTK。

4

1 回答 1

6

您正在描述共指解析和命名实体链接的问题。我提供了单独的链接,因为我不完全确定您的意思。

  • Coreference :Stanford CoreNLP目前拥有最好的实现之一,但它是在 Java 中实现的。我使用了python 绑定,但我不太高兴——我最终只通过斯坦福管道运行了所有数据,然后在 python 中加载处理后的 XML 文件。显然,如果您必须实时处理,那是行不通的。
  • 命名实体链接:查看Apache Stanbol和以下Stackoverflow 帖子中的链接。
于 2013-04-05T16:30:27.160 回答