16

我一直在审查 Office 2007 MODI OCR 的替代品(OneNote 的 2010 解决方案的质量/结果低于 2007 :-( )。我注意到,一旦您安装了可选的 tiff 过滤器,Windows 7 就会包含一个 OCR 库

OCR 组件安装到

%programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll 

但我没有看到任何 API?

有谁知道如何最好在 C# 中进行接口?

回答:找到解决方案,一旦安装了可选的 tiff ifilter win7 功能,我就可以使用http://www.codeproject.com/KB/cs/IFilter.aspx上的代码/exe 获取屏幕截图的文本输出。此外,如果为 .png 和 .jpg 添加相同的 [HKEY_CLASSES_ROOT.tiff\PersistentHandler],则 OCR 也适用于 jpg 和 png。

4

3 回答 3

4
  1. Tessnet OCR 是一个很好的解决方案,但相当陈旧(2009 年的最新版本)。有几个非常好的免费 OCR 解决方案可用于 .NET:
  2. Asprise C# OCR SDK . 非常好和快速的一个。
  3. Microsoft Research Project Hawaii 基于 Web(云)的 OCR 解决方案,包含完整的文档和示例(2013 年停产)
  4. 必应 OCR 基于 Web(云)的 OCR 替代品。(2014 年 3 月停产)
于 2011-06-13T13:46:35.100 回答
2

尝试 TessNet,使用我在这篇文章中对海报提出的建议(放大图像,使用单独的过程):
c# OCR 无法识别数字(tesseract 2)

于 2011-06-02T18:33:47.587 回答
1

我正在探索 Windows 7 dll,发现 3 个可能有用的库:thocr.psp.dll、xocr3.psp.dll 和 ximage3b.dll。在这个网站和其他类似网站我发现 ximage3b 是一个 Windows 系统的 ocr 引擎。我一直在网上寻找文档,但我没有成功,但是,嘿!至少我知道它在那里,如果我知道如何在 C#/C/C++ 中使用它,我会给你们一个更新。

于 2012-08-05T15:35:06.687 回答