0

我正在使用 Amazon Textract 进行文本检测或原始文本、表单和表格。

我正在为此上传 PDF。

我正在使用坐标从原始文本中获取值。我成功地获得了价值。但是几天后,该特定块的边界框坐标发生了变化。然后,我的逻辑不起作用。

你们知道为什么这些坐标会改变吗?

这就是我在确定坐标后应用我的逻辑的方式。

if ((item.Geometry.BoundingBox.Top >= 0.92379182 && item.Geometry.BoundingBox.Top <= 0.96)
        && (item.Geometry.BoundingBox.Left >= 0.02470588 && item.Geometry.BoundingBox.Left <= 0.29)
        && (item.Geometry.BoundingBox.Height >= 0.001 && item.Geometry.BoundingBox.Height <= 0.054545)
        && (item.Geometry.BoundingBox.Width >= 0.001 && item.Geometry.BoundingBox.Width <= 0.16))
            {
                text = text + " " + item.Text;
            }
4

1 回答 1

0

Textract 背后的机器学习模型可能会发生变化。尽管进行了回归测试以确保整体质量不会变差,但这并不是说结果永远不会改变。尤其是边界框之类的东西,只要兴趣区域的边界仍然正确,坐标的微小变化可能不会被视为回归。

于 2020-11-18T04:12:31.463 回答