我想为使用 Amazon Textract 进行 OCR 和使用 Amazon Comprehend 进行实体提取的图像创建人工审核循环。
我的流程是:
- 将图像发送到 Textract 以提取文本
- 向 Comprehend 发送文本以提取实体
- 在 Textract 的 Comprehend 提取的实体的输出中找到块 ID
- 根据文档将新的类型块添加
KEY_VALUE_SET
到 textract 的 JSON 输出 - 使用模板中的元素创建一个人工任务
crowd-textract-analyze-document
并将修改后的文本输出提供给它
在此过程中失败的是第 5 步。我的自定义实体未正确呈现。“无法工作”是指当我在侧边栏上单击实体时,实体没有在图像上突出显示。浏览器的控制台没有错误。
有没有人尝试过这样的事情?
很抱歉没有包括示例。我将从我的文件中删除机密/PII 并将它们附加到问题中