3

我在 google 上找到了示例项目并下载并编译了示例 .net 项目。

  1. 是否有可以找到填充的 tessdata 文件夹的位置,或者我必须训练图书馆?正如我正在评估的那样,如果我能找到一个预先填充的英语 tessdata 文件夹,我会更喜欢。

  2. 示例项目确实打开了我的示例 jpeg 文件,但是它没有自动旋转。我认为这可能是因为 tessdata 文件夹中没有文件。这是一个正确的假设还是 tesseract dll 应该在加载图像时执行自动旋转

  3. 我尝试打开灰度图像,但未能说明该像素不受支持。我找不到任何列出此类限制的文档。谁能帮我验证一下?

  4. 基本上,我希望自动旋转通过传真/扫描等方式发送的文档——因此,如果有另一个我可以在 C# 项目中使用的开源替代方案,我也愿意接受这个想法。

更新 1:我 在谷歌上得到了这个 tesseract

启动 cmd 提示符并启动 tesseract.exe,如下所示

>tesseract.exe myimage.tiff -l eng 

收到以下错误

Tesseract Open Source OCR Engine v3.01 with Leptonica
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
Page 0

更新 2:解决了错误的问题,但是自动旋转似乎不会自动发生

4

0 回答 0