c# - 处理 OCRed 文本

翻译自：https://stackoverflow.com/questions/3070732 2010-06-18T15:02:06.300

2001 次

4

我正在使用库从 OCRed Tiff 文件中提取文本并将其转储到数据库中。我提取的文本实际上是具有 NAME、DOB、COUNTRY 等字段的表单。由于 OCR 没有实际值和标签之间的差异，它只是转储所有文本。现在我在 DB 中有以下格式的文本：

姓名：我的姓名地址：我的地址

ETC

现在下一步是从数据库中提取值lile MyName和MyAddrss。文档类型可能会有所不同，因此通用解析器可能不起作用。

你会建议如何处理这种情况？我应该编写不同的解析器吗？ANTLR可以帮助我吗？如果是，那怎么办？请指导我。

我正在研究.NET

0 回答 0