我正在尝试确定从扫描文档中提取手写数据的最佳方法。
手写数据位于特定的加框区域。我生成了文档的数字版本,因此我知道加框区域的坐标,并且如果需要,还可以生成文档的其他变体(即,被屏蔽以使字段更易于提取的版本)
我不能只使用文档生成中的坐标提取字段的原因是在扫描过程中发生了移位/缩放/透视修改,这可以不同地推/拉每个单独框的坐标(扫描的文档确实有用于对齐的角标记,但即使如此,通常也会发生意外的转换)。
我假设有两种方法可以解决这个问题:逐步检查页面上每个框的坐标,并尝试用一些技术/算法“纠正”它们,或者将完成的表格与空白表格进行比较(蒙面? ) 并尝试以这种方式提取正确的字段。
什么是最有效的技术/算法来调整这些修改并准确提取包含手写的区域?还有其他选择吗?