我猜算法应该由 followig stemps 组成(示例位于底部):
- 信息区域检测(文字、图像)。
- 寻找最接近顶部位置的邮票张贴而不与元素区域重叠,这在第一步已经检测到(这一步可以用蒙特卡洛方法实现)。
我也有以下关于文本和图像区域检测的想法:
- 使用 tesseract 或其他 OCR。这种方法的缺点是某些页面元素(线条、图片等)无法被检测到。文本识别也是这项任务的开销。
- 使用 OpenCV 或其他计算机视觉库(但我不知道具体如何)。
有没有人可以建议更多更好的方法、算法或库来找到文档上的最佳印章位置。