我在 15:33 左右观看了来自 pycon http://youtu.be/B1d9dpqBDVA?t=15m34s的演讲,演讲者谈到从图像(收据)中提取线条,然后将其馈送到 OCR 引擎,以便文本可以以更好的方式提取。
我有类似的需求,我将图像传递给 OCR 引擎。但是,我不太明白他从图像中提取线条是什么意思。我可以使用哪些开源工具从图像中提取线条?
我在 15:33 左右观看了来自 pycon http://youtu.be/B1d9dpqBDVA?t=15m34s的演讲,演讲者谈到从图像(收据)中提取线条,然后将其馈送到 OCR 引擎,以便文本可以以更好的方式提取。
我有类似的需求,我将图像传递给 OCR 引擎。但是,我不太明白他从图像中提取线条是什么意思。我可以使用哪些开源工具从图像中提取线条?
直接回答:您使用霍夫变换从图像中提取线条。您可以在此处找到分析指南。也可以检测到文本行。Karlphillip 的回答也是基于霍夫变换。
我可以告诉你一个简单的技术将图像提供给 OCR.. 只需执行一些操作来获取你图像的 ROI(感兴趣区域),并在二值化后定位图像所在的区域.. 然后你可能会找到轮廓,并且通过保持阈值并设置所需的轮廓区域,您可以将生成的图像提供给 OCR :) .. (抱歉,解释方式不好)