0

我试图从文本中识别命名实体并将它们分类为人物、地点和组织。我正在使用 Google 的 Cloud Natural Language API 和 Open Calais API 来识别命名实体。

  1. 当我输入包含“中国”一词的文本时,Google NL API 将其识别为“人”类型。然而,它在文件中的上下文含义将其作为一个国家来处理。Google NL API 是否能够根据文本上下文提供实体?如果是这样,请让我知道我错过了什么。

  2. 如果文本包含单词“obama”,则 google NL API 将“Obama”输出为 Person,而 Open Calais API 将“Barak Obama”标识为 Person。为什么会这样?还有什么其他方法可以从文本中的术语中获取确切的命名实体,比如 Open Calais 返回的那个?

4

1 回答 1

0

关于(1),你能分享一下你的句子吗?我尝试了一些句子,例如“我要去中国旅行”或“你认识中国的任何人”,它确实返回 Location 作为中国的类型(您可以在https://cloud.google 快速尝试。 com/自然语言/

关于 (2),NL API 从文本中提取实体。所以,如果文本有“奥巴马”,它会提取“奥巴马”,如果是“巴拉克奥巴马”,它会这样提取。但是,它会将这两种情况正确解析到正确的维基百科页面,并为两种情况返回相同的 MID。因此,您也可以从中提取信息。

于 2018-08-06T21:54:03.683 回答