Tesseract 支持指定字符集白名单和黑名单,还支持使用 UNVL 的 UZN 文件格式指定区域。
但是,我现在需要扫描一个包含 2 个区域的文档,一个仅包含数字,一个包含普通文本。我可以在不执行 Tesseract 两次的情况下为 2 个区域指定不同的字符集吗?
如果没有,我可能会尝试修改UNICHARSET
类的代码以某种方式做到这一点。
Tesseract 支持指定字符集白名单和黑名单,还支持使用 UNVL 的 UZN 文件格式指定区域。
但是,我现在需要扫描一个包含 2 个区域的文档,一个仅包含数字,一个包含普通文本。我可以在不执行 Tesseract 两次的情况下为 2 个区域指定不同的字符集吗?
如果没有,我可能会尝试修改UNICHARSET
类的代码以某种方式做到这一点。