我设计了一个简单的代码来从图像中提取文本。图像仅包含数字。这是图像,我要转换:
OCR转换的结果总是~
对于这两个图像,OCR 转换给出的结果有一些错误:
这是我的代码:
using Tes = tessnet2;
private const string TesIni = @"C:\Program Files (x86)\Tesseract\tessdata";
static void Main(string[] args)
{
System.Drawing.Bitmap TextImg = new System.Drawing.Bitmap(@"C:\HomeC\RPA_Prozesse\BOB_NPM_Retour\btnImages\TestTextImage.png");
Tes.Tesseract ocr = new Tes.Tesseract();
ocr.Init(TesIni, "eng", true);
System.Collections.Generic.List<Tes.Word> Result = ocr.DoOCR(TextImg, System.Drawing.Rectangle.Empty);
foreach(Tes.Word wrd in Result)
{
System.Console.WriteLine(wrd.Text);
}
System.Console.WriteLine("Application finished. Press any key to exit...");
System.Console.ReadLine();
}
在文档中,“Tesseract”是最好的开源 OCR 库,Google 几乎没有改进 - 但结果极差。
是否有一些设置,我可以更改以获得更好的结果?