我正在尝试编写将文本从 jpg 更改为控制台的代码。我曾经写过:tessnet2 和 Tesseract-OCR(在 c# 中)。现在,当我有纯文本时,一切都可以正常工作,但问题是当文本像这样在圆圈中时:
实际上控制台返回我这个:
118 : Text
61 : 1
219 : @
有时它会将 @ 更改为 ~(取决于圆圈的大小)。有我的代码:
var image = new Bitmap(@"D:\OCR\texttoread.bmp");
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.Init(@"C:\tessdata", "eng", false);
List<tessnet2.Word> result = ocr.DoOCR(image, Rectangle.Empty);
foreach (tessnet2.Word word in result)
{
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
}
Console.Read();
有人能告诉我我应该怎么做才能阅读这篇文章吗?