回答https://stackoverflow.com/a/62174368/8117673
进一步的问题是 - 它会影响Amazon Textract文本检测的准确性吗?
我是否需要对图像进行预处理才能从 Amazon Textract 获得更好的结果?
回答https://stackoverflow.com/a/62174368/8117673
进一步的问题是 - 它会影响Amazon Textract文本检测的准确性吗?
我是否需要对图像进行预处理才能从 Amazon Textract 获得更好的结果?
我使用命令pdftoppm将 PDF 转换为 PNG 。在 Python -> subprocess.Popen(['pdftoppm -png Sample.pdf Sample'])
Amazon Textract 在 PDF 文件上的准确性超过了 PNG 格式。因为PDF是原始文档。