c# - 在图像中定位文本

Question

我目前正在做一个项目，我的目标是在图像中定位文本。到目前为止，我还没有对文本进行 OCR 处理。我想基本上获得图像中文本的边界。我正在使用 AForge.Net 成像组件进行操作。在某种意义上有任何帮助吗？

2009 年 2 月 5 日更新：从那以后，我在我的项目中走上了另一条路线。但是，我确实尝试使用 MODI（Microsoft Office Document Imaging）获取文本。它允许您轻松地对图像进行 OCR 并从中提取文本。

score 14 · Accepted Answer

这是一个活跃的研究领域。确实有大量关于该主题的学术论文。很难给你提供帮助，尤其是没有更多细节的情况下。您在寻找特定类型的文本吗？字体？仅限英语？你熟悉学术文献吗？

“文本检测”是任何 OCR（光学字符识别）系统中的标准问题，因此在处理它的互联网上有大量代码。

我可以开始列出来自谷歌的大量链接，但我建议您搜索“文本检测”并开始阅读:)。也有充足的示例代码可用。

score 3 · Accepted Answer

识别图像中的文本确实是该领域研究人员的热门话题，但只是在验证码成为防御垃圾邮件机器人的“规范”时才开始失控。为什么使用验证码作为保护？好吧，因为很难/很难在图像中找到（和阅读）文本！

我提到验证码的原因是因为最大的进步*是在那个小区域内取得的，我认为你的解决方案最好在那里找到。特别是因为验证码确实是关于在杂乱的图像中定位文本（或类似于文本的东西），然后尝试正确读取字母。

所以如果你能找到一个很好的开源验证码破解工具，你可能拥有继续你的任务所需的一切......
你甚至可以丢弃处理字符识别本身的最困难的代码，因为这些 OCR 用于阅读扭曲的文字，你不必做的事情。

*： “非研究人员”在可见、可用和实用信息方面的进步

score 0 · Accepted Answer

If you're ok with using an online API for this, the API at http://www.wisetrend.com/wisetrend_ocr_cloud.shtml can do text detection in addition to just OCR.

score 0 · Accepted Answer

Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/

4 回答 4