我希望我的应用程序在以黑白图像文件形式存在的表单中填写单个字段。表单总是以相同的纸质版本开始,但是当我的应用程序从我的用户那里获得它时,它可能已经被扫描或传真了不止一次。因此,我需要的字段不在每个文件中的相同位置。
我的用户并不总是从我这里得到空白表单,因此我无法打印以后可以识别的标记或占位符。
原来的空白表格上有文字,但因为可能是传真过来的,所以我只有 200 dpi 的分辨率。文本总是足够大,可供人类阅读,但我对 OCR 持怀疑态度。
我有一些预算,所以我不需要免费的解决方案……让我们说 2000 美元。
也就是说,我正在考虑
获取 OCR 解决方案以在我需要的字段上查找文本标签。我认为我没有资源或专业知识来自己动手。我不需要完美的识别,因为我已经知道文字说了什么。但我确实需要知道 X 坐标和 Y 坐标。有没有这样的软件?还是编程比我想象的要容易?
构建或购买软件来识别表格的边缘。从那里,我可以得到我需要的字段的相对位置。我在想我的扫描仪软件在小文档图像周围放置的虚线。这是一个已知的算法还是有可用的解决方案?
识别我需要的领域的其他方式。尝试使用 google 表单填写软件给了我数百个匹配的 web 表单、pdf 表单等,这些都不能满足我的需要。
我对语言不挑剔。我的应用程序在 Linux 上运行,但如果最好的解决方案是 Microsoft,我可能会成功。
我很感激你的想法。