我正在尝试将某些车牌图像训练为特定字体。我想知道在训练时我应该把 unicharambigs 文件放在哪里。我有一个没有 unicharambigs 文件的数据集。但是当我在我的代码中包含 tessdata 文件夹时,它在运行时抛出了一个异常,说“尝试读取或写入受保护的内存。这通常表明其他内存已损坏。”。我是使用 tesseract 的新手 我有几个问题需要澄清,因为我相信上述异常是由于以下问题之一而发生的
1) 必须拥有 unicharambigs 文件吗?如果是这样,在创建最终训练数据之前我应该把这个文件放在哪里?
2) 与 C# 代码集成时,tessdata 文件夹中应考虑哪些文件?
我一直在使用预训练的数据集进行测试,但我想拥有自己的数据集,并且当我使用该 tessdata 文件夹时,应用程序不会因上述运行时异常而退出。因此我相信这与我自己的 tessdata 文件夹有关。
更新
只是为了补充这个问题。当我使用由 tesseract 安装创建的默认 tessdata 文件夹时,应用程序工作正常,但结果错误。我再次训练了 tesseract 并将现有的训练数据文件替换为训练后生成的新训练数据文件,我的应用程序再次崩溃。
我正在使用 C# 和 tesseract 点网包装器。