0

我有文档 OCR 在图像上工作,当页面上有“咖啡”或“432”之类的词时工作正常,但是当我尝试对“abc123”之类的词进行 OCR 时,我收到“OCR 运行错误” .

MODI.Document md = new MODI.Document();

md.Create("c:\\temp\\mpk.tiff");

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);  // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0]; 

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);

StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();

md.Close();

当然 MS 没有建立这个库来识别基于语言的单词?还是他们?我是否缺少 MODI.document 设置或其他内容?

任何帮助,将不胜感激,

4

1 回答 1

2

是的,他们确实。如果没有相关的字典和不提供上下文的片段,OCR 会变得非常不准确。人类也是如此:ABC123、ABCI23、ABCl23。三个不同的字符串。这在实践中通过使用特殊字体来解决,这些字体可以最大限度地减少字母和数字不明确的可能性,您在银行支票上看到的那种。

于 2011-03-05T22:06:24.040 回答