问候溢出者,
我需要一种算法来围绕扫描文档图像中的单词绘制矩形。无论如何,这个算法不需要是 100% 准确的。不过,最好在工作期间要求最少的人为干预。对手前扫描的文档没有任何假设(未知字体和语言,可能包括表格和图形)
关于此事有任何现成的解决方案或资源吗?
问候
问候溢出者,
我需要一种算法来围绕扫描文档图像中的单词绘制矩形。无论如何,这个算法不需要是 100% 准确的。不过,最好在工作期间要求最少的人为干预。对手前扫描的文档没有任何假设(未知字体和语言,可能包括表格和图形)
关于此事有任何现成的解决方案或资源吗?
问候
大多数 OCR 引擎都提供此类信息。但是,如果您不想使用引擎,则可以使用 OpenCV,但这需要模型构建和调整。
OpenCV 中的 OCR http://blog.damiles.com/?p=93
这是一大步。简而言之,这是一个很难解决的问题,如果您想自己解决问题,则需要很长时间才能使其正常工作。您很可能应该考虑使用第 3 方 OCR 包。就像细微差别。我已经使用过它,并且可以验证它是否具有这种类型的信息以及更多信息。
http://www.nuance.com/for-individuals/by-product/omnipage/index.htm