好吧,我正在使用此 OCR 的已编译 .NET 版本,可以在 @ http://www.pixel-technology.com/freeware/tessnet2/找到
我有它的工作,但是这样做的目的是翻译车牌,遗憾的是引擎真的不能准确翻译一些字母,例如这是我扫描以确定字符问题的图像
结果:
12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ
因此,以下字符被错误地翻译:
1、O、Q、W
这似乎还不错,但是在我的车牌上,结果并不是那么好:
= H4 ODM
= LDH IFW
假测试
= NR4 y2k
正如您可能会说的那样,我已经尝试过降噪、增加对比度和移除不是绝对黑色的像素,但没有真正的改进。
显然你可以“学习”引擎的新字体,但我认为我需要为.NET重新编译库,而且这似乎是在我没有的 Linux 操作系统上执行的。
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
所以我不知道接下来要尝试什么,如果有人想尝试,我编写了一个纯粹用于测试目的的快速控制台应用程序。如果有人有任何想法/图形处理/图书馆想法,我会很高兴听到他们的声音。