2

我正在使用 tesseract 作为我的 ANPR 应用程序的 OCR 引擎。我已经用车牌字体训练了 tesseract 3.01v。但我需要知道:

  1. tessdata 文件夹中应包含哪些文件?
  2. 我应该使用安装 tesseract 3.01v 的同一个 tessdata 文件夹吗?
  3. 我已经使用 tesseract 3.01v 进行了培训,并且在我的代码中使用了 tessnet2,所以这会是一个问题吗?

以下是我尝试过的代码,但它不断退出 DoOcr() 方法。

List<tessnet2.Word> ocrText = new List<tessnet2.Word>();
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.Init(@"C:\Program Files (x86)\Tesseract-OCR\tessdata", "eng", true);
ocrText = ocr.DoOCR(bmpGrayScale, new Rectangle(rect.X, rect.Y, rect.Width, rect.Height));

foreach (tessnet2.Word word in ocrText)
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);

有谁知道出了什么问题?

4

1 回答 1

1

“3.01 不向后兼容 2.04。数据文件不同。”

http://code.google.com/p/tesseract-ocr/wiki/ReadMe

对于与 3.01 兼容的 .NET 库,请查看位于http://code.google.com/p/tesseractdotnet/https://github.com/charlesw/tesseract-ocr-dotnet的项目。

于 2012-07-27T04:31:06.600 回答