我需要建议。我正在尝试使用 Tessnet2 lib 来识别图像文本。
图像由一个包含五个字符(字符和数字)的字符串组成。
我从http://www.pixel-technology.com/freeware/tessnet2/下载了 lib 。
在我的项目中添加对这个库的引用。
然后我下载了语言数据定义文件(来自http://code.google.com/p/tesseract-ocr/downloads/list)并将它放在tessdata目录中。
数据定义文件与 exe 文件位于同一目录中。
这是我的代码:
try
{ //download image from server
System.Net.WebRequest request =
System.Net.WebRequest.Create(
textBox1.Text);
System.Net.WebResponse response = request.GetResponse();
System.IO.Stream responseStream =
response.GetResponseStream();
Bitmap image = new Bitmap(responseStream);
pictureBox1.Image =image;
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789");
ocr.Init(@"C:\Users\Tan\Documents\Visual Studio 2010\Projects\TestProject\bin\Release", "eng", false); // To use correct tessdata
List<tessnet2.Word> result = ocr.DoOCR(image, Rectangle.Empty);
foreach (tessnet2.Word word in result)
{
richTextBox1.Text = string.Format("{0} : {1}", word.Confidence, word.Text);
}
}
catch (System.Net.WebException)
{
MessageBox.Show("There was an error opening the image file."
+ "Check the URL");
}
问题是,如果我调用此代码,应用程序将关闭。我没有收到任何错误消息。我不知道为什么。有谁能够帮我?谢谢你。