c# - Tessnet2 OCR 只返回数字

Question

我正在尝试在 ac# 应用程序中使用 tessnet2 从图像中读取文本。这是我的代码：

string valoare="";
lblOCR.Text = "";

Bitmap image = new Bitmap(@"C:\Stamp\test.png");
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.Init(@"F:\Manipulare pdf\bin(1)\Release32\tessdata", "eng", false); 
var rect = new System.Drawing.Rectangle();
List<tessnet2.Word> result = ocr.DoOCR(image, rect);

int lc = tessnet2.Tesseract.LineCount(result);
foreach (tessnet2.Word word in result)
{
lblOCR.Text += word.Text+" "+word.Confidence+"<br/>";
}

结果字符串只包含数字，但我的图片包含字母，我不明白为什么。

谢谢

score 0 · Accepted Answer

0

尝试再次放置语言包。

Tessnet2 适用于语言包 2 及更高版本。

于 2013-04-05T14:06:42.083 回答

score 0 · Accepted Answer

我知道我来晚了。我在其他地方找到了解决方案。

我的 ocr 被配置为只看到数字。但我看到你没有这条线：

ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digits only

对我来说，删除它就可以了。也许您需要进行类似的配置。

c# - Tessnet2 OCR 只返回数字

2 回答 2

Related

Reference