我目前正在做一个项目,我的目标是在图像中定位文本。到目前为止,我还没有对文本进行 OCR 处理。我想基本上获得图像中文本的边界。我正在使用 AForge.Net 成像组件进行操作。在某种意义上有任何帮助吗?
2009 年 2 月 5 日更新:从那以后,我在我的项目中走上了另一条路线。但是,我确实尝试使用 MODI(Microsoft Office Document Imaging)获取文本。它允许您轻松地对图像进行 OCR 并从中提取文本。
我目前正在做一个项目,我的目标是在图像中定位文本。到目前为止,我还没有对文本进行 OCR 处理。我想基本上获得图像中文本的边界。我正在使用 AForge.Net 成像组件进行操作。在某种意义上有任何帮助吗?
2009 年 2 月 5 日更新:从那以后,我在我的项目中走上了另一条路线。但是,我确实尝试使用 MODI(Microsoft Office Document Imaging)获取文本。它允许您轻松地对图像进行 OCR 并从中提取文本。
这是一个活跃的研究领域。确实有大量关于该主题的学术论文。很难给你提供帮助,尤其是没有更多细节的情况下。您在寻找特定类型的文本吗?字体?仅限英语?你熟悉学术文献吗?
“文本检测”是任何 OCR(光学字符识别)系统中的标准问题,因此在处理它的互联网上有大量代码。
我可以开始列出来自谷歌的大量链接,但我建议您搜索“文本检测”并开始阅读:)。也有充足的示例代码可用。
识别图像中的文本确实是该领域研究人员的热门话题,但只是在验证码成为防御垃圾邮件机器人的“规范”时才开始失控。为什么使用验证码作为保护?好吧,因为很难/很难在图像中找到(和阅读)文本!
我提到验证码的原因是因为最大的进步*是在那个小区域内取得的,我认为你的解决方案最好在那里找到。特别是因为验证码确实是关于在杂乱的图像中定位文本(或类似于文本的东西),然后尝试正确读取字母。
所以如果你能找到一个很好的开源验证码破解工具,你可能拥有继续你的任务所需的一切......
你甚至可以丢弃处理字符识别本身的最困难的代码,因为这些 OCR 用于阅读扭曲的文字,你不必做的事情。
*: “非研究人员”在可见、可用和实用信息方面的进步
If you're ok with using an online API for this, the API at http://www.wisetrend.com/wisetrend_ocr_cloud.shtml can do text detection in addition to just OCR.
Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/