-1

如何从文本中提取人名?

我为此应用了一些 NLP 工具包,特别是我使用斯坦福 NER 工具包从文本中提取名称。有了它,我可以从文本中提取人名,但是当我希望程序提取诸如“程序员”、“讲师”或“工程师”之类的词时,库无法提取这些词。有没有办法从文本中提取这些?

4

1 回答 1

1

由于“程序员、讲师和工程师”不是命名实体,您可能必须维护这些词的列表。我认为您可以从 Wordnet 中的单词派生关系中获得它们,例如“sing”(动词)和“singer”或“lecture”(动词)和“lecturer”(名词)。

SuperSense 标记器也可以用作 NER,我认为它可以将您提到的那些单词标记为“noun.person”,这正是您所需要的。ArkRef (Java) 是一个使用它的共指工具(通过 Java 端口的 supersense 标记器,捆绑),那里有一个在线演示,所以你可以检查你的目标词是否被标记在方括号中。

于 2012-03-05T04:32:31.913 回答