amazon-web-services - Amazon Textract 与 Amazon Rekognition DetectText

Question

我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的TextDetect方法？

我的用例是点击手机中的图片并将图像数据转换为文本并存储到 AWS RDS。

score 14 · Accepted Answer

在端到端问题解决方面，Textract 将表现更好，因为它更全面地用于 OCR。如果您只是想从野外拍摄的图片中提取一两行文本，例如路牌或广告牌（即：不是文档或表格），我建议您使用 Amazon Rekognition。

Amazon Textract是一种较新的 AWS 服务，它是为解决文档和 PDF 图像中的 OCR（光学字符识别）问题而专门构建的解决方案。虽然 Rekognition 是一种更通用的计算机视觉服务，但 Textract 具有更多面向 OCR 的调整参数，以优化准确有效地提取文本的过程。

开箱即用，如果您要做的只是检测文本和相关元数据（坐标、角度、置信度值），RekognitionDetectText方法的执行可能与 Textract 中的等效analyze_document方法类似，但是 Textract 提供了有助于帮助的进一步语义结构文本管理/格式化抽象了开发人员传统上需要自己编写的其他形式的后处理。

最后，在比较两种 Detect Text 方法的成本时，Textract 的成本（1.50 美元/1k 图像）与 Rekognition（1.00 美元/1k 图像）相比要高一些。

score 12 · Accepted Answer

如果图片中只是随机文本，则使用Amazon Rekognition。它会在任何位置找到文本。

Amazon Textract旨在将纸质文档转换为有组织的数据。它可能不适用于随机图片（尽管我没有尝试过，所以我不能确定！）。

amazon-web-services - Amazon Textract 与 Amazon Rekognition DetectText

2 回答 2

Related

Reference