我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的TextDetect
方法?
我的用例是点击手机中的图片并将图像数据转换为文本并存储到 AWS RDS。
我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的TextDetect
方法?
我的用例是点击手机中的图片并将图像数据转换为文本并存储到 AWS RDS。
在端到端问题解决方面,Textract 将表现更好,因为它更全面地用于 OCR。如果您只是想从野外拍摄的图片中提取一两行文本,例如路牌或广告牌(即:不是文档或表格),我建议您使用 Amazon Rekognition。
Amazon Textract是一种较新的 AWS 服务,它是为解决文档和 PDF 图像中的 OCR(光学字符识别)问题而专门构建的解决方案。虽然 Rekognition 是一种更通用的计算机视觉服务,但 Textract 具有更多面向 OCR 的调整参数,以优化准确有效地提取文本的过程。
开箱即用,如果您要做的只是检测文本和相关元数据(坐标、角度、置信度值),RekognitionDetectText
方法的执行可能与 Textract 中的等效analyze_document
方法类似,但是 Textract 提供了有助于帮助的进一步语义结构文本管理/格式化抽象了开发人员传统上需要自己编写的其他形式的后处理。
最后,在比较两种 Detect Text 方法的成本时,Textract 的成本(1.50 美元/1k 图像)与 Rekognition(1.00 美元/1k 图像)相比要高一些。
如果图片中只是随机文本,则使用Amazon Rekognition。它会在任何位置找到文本。
Amazon Textract旨在将纸质文档转换为有组织的数据。它可能不适用于随机图片(尽管我没有尝试过,所以我不能确定!)。