我需要创建一个工具,该工具将使用高质量的相机来扫描文档中的特定文本块并对其进行 OCR。每个文档都匹配相同的模板,其中包含几个填满数据的表格。我需要从每个扫描文档的一个特定单元格中提取数据。
我需要考虑图像的旋转和微小变换。整个工作流程应如下所示:
- 文档“显示”到相机。软件制作文件的图片。
- 软件会考虑一些较小的旋转和其他转换(由于文档被握在手中,可能会发生较小的剪切、缩放、旋转)。
- 软件识别正在显示的正确模板文档并从特定单元格中提取图像。
- 然后对图像进行 OCR 处理。
基本上,我不需要最终的解决方案,而是需要一些关于从哪里开始寻找的方向。我知道如何对纯文本进行 OCRing,但我不知道如何实现第 2 步和第 3 步。
提前致谢。