1

我正在使用 Google-Vision API 从图像中获取文本并将其结果用于 NLP API。到目前为止,我打算在扫描名片时获取姓名、位置、地址、电子邮件、联系电话、职位、公司名称等。到目前为止的结果并不准确,因为有时结果太模糊,还有 NLP API为相同的内容文本返回多个条目,即名称字段中的多个值,位置字段有时也分类不正确。关于如何改进其结果的任何建议?

参考

  1. 谷歌视觉 API
  2. 谷歌语言处理 API

    说这张名片 在此处输入图像描述

    VISION API 结果为在此处输入图像描述

    NLP 结果为在此处输入图像描述

4

1 回答 1

1

Cloud Vision API 从图像中返回原始文本,而 NL API 专注于检测已知实体,因此有两种可能的方式来实现您正在寻找的内容:

  1. 构建 AutoML 自然语言实体提取模型 - 您希望将电话和传真号码以不同方式标记为自定义标签

  2. 编写一些自定义逻辑以将已识别的实体从 NL API 定位回 Vision 输出,以查看它是“T”还是“F”。

  3. 位置是一个模糊的术语,它可能是地址、国家、州等,所以如果您要查找地址,请使用地址。同样对于假地址,API 不会返回实体

于 2020-04-23T18:59:58.327 回答