c# - Tesseract OCR 可以识别少于 4 个字符的图像吗？

翻译自：https://stackoverflow.com/questions/16724901 2013-05-23T22:25:25.597

577 次

0

我正在获取一个 PDF 并将其切割成 400 多个部分并将这些单独的部分提供给 Tesseract。这是完美的工作。具有 1、2 或 3 个字符的字段除外。如果它有 4 个或更多，或者 Tesseract 认为有 4 个或更多，它工作正常。

我在GitHub 上使用 CharlesW 的 C# 包装器。

1 回答 1

0

正如 nguyenq 所建议的，更改 PageSegMode 解决了这个问题。我正在使用的包装器.DefaultPageSegMode有一个名为的属性，可以让我解决这个问题。

于 2013-05-29T17:25:13.813 回答