5

我想用它的代词替换句子中的名词。我将使用它为 NLP 任务创建数据集。例如,如果我的句子是 -->

“杰克和瑞恩是朋友。杰克也是米歇尔的朋友。”

然后我想用“He”替换第二个 Jack(斜体和粗体)。我已经完成了 POS 标记以在我的句子中找到名词。但我不知道如何从这里开始。如果我有一个可以使用的所有可能代词的列表,是否有语料库或系统可以告诉我这个词最合适的代词?

4

1 回答 1

2

你几乎可以使用斯坦福 CoreNLP 中的工具来做到这一点。如果您运行“coref”注释器,那么它将尝试确定代词对文本中其他实体提及的引用。还有一个“性别”注释器,它可以将(二进制)性别分配给英文名称(仅基于整体频率统计)。(这个性别注释器目前只能以编程方式访问;它的输出不会出现在我们的标准输出格式中。)

然而,共指解析和自动性别分配都是具有中等准确性的任务,而第二个任务有进一步的假设,使其普遍存在问题。我很难相信自动执行此操作将是自动为 NLP 任务生成数据的有用策略。

于 2020-10-04T19:46:31.603 回答