0

我正在使用 MODI 来读取 tiff 图像并对文本做我需要做的事情。有些图像工作正常,然后其他 tiff 图像总是导致该方法,

OCR(MODI.MiLANGUAGES.miLANG_ENGLISH,真,真)

失败。我对此进行了研究,并在参数列表中尝试了不同的变体,例如“假”、“假”。我也尝试过 SYSDEFAULT 而不是英语,但我仍然得到错误。谁能告诉我为什么它会在某些 tiff 图像上失败而不在其他图像上失败?

我做了一些研究并找到了这个答案:

一个可能的原因是 MODI 试图处理没有任何可识别文本的文件。空白文档,或只有图纸/涂鸦并且实际上是空白的文档,将导致此异常。

显然这还不够好,因为我无法拥有一个决定 OCR 某些图像而不是其他图像的应用程序。我处理了异常,但是 OCR 对象没有被初始化,所以我不能从那里做我需要做的事情。

这是一场血腥的噩梦!为什么该方法不能完成它的血腥工作,如果图像有一些不可读的页面,那么就忽略它们?我正在使用 Windows 7 Ultimate 和 Office 2007 Ultimate。

Visual Studio 版本是 2008 谢谢,

信息战

4

1 回答 1

1
OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true)

而不是上面的代码,你可以使用

OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, false, false)

因为 tiff 图像可能是 2400*2496。

于 2011-04-06T10:46:45.810 回答