1

我正在尝试编写将文本从 jpg 更改为控制台的代码。我曾经写过:tessnet2 和 Tesseract-OCR(在 c# 中)。现在,当我有纯文本时,一切都可以正常工作,但问题是当文本像这样在圆圈中时:

在此处输入图像描述

实际上控制台返回我这个:

118 : Text
61 : 1
219 : @

有时它会将 @ 更改为 ~(取决于圆圈的大小)。有我的代码:

  var image = new Bitmap(@"D:\OCR\texttoread.bmp");
            tessnet2.Tesseract ocr = new tessnet2.Tesseract();
            ocr.Init(@"C:\tessdata", "eng", false);
            List<tessnet2.Word> result = ocr.DoOCR(image, Rectangle.Empty);
            foreach (tessnet2.Word word in result)
            {
                Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
                }
                Console.Read();

有人能告诉我我应该怎么做才能阅读这篇文章吗?

4

1 回答 1

0

尝试 Ironocr 插件并使用以下内容。我认为它具有更高的准确性,希望这会对您有所帮助。请找到以下代码以供阅读。

var Ocr = new AutoOcr();
var Result = Ocr.Read(bmpCrop);
string text = Result.Text; 
return text;
于 2018-05-23T12:44:32.423 回答