任何人都可以提供一些关于如何从图像中捕获数据的示例代码或想法。我的图像是扫描的 OMR 表,我想阅读内容文本输入以及标记的气泡。这样我就可以评估 omr 表的答案。我不想*使用已经可用的 ocr 工具或 ocr 阅读器。* 我想创建自己的 omr 阅读器和检查器。所以请帮助我。先感谢您。
问问题
4916 次
2 回答
1
我认为您必须获得像ImageJ这样的现有库的支持。
在库中,大部分常用的图像处理功能都已实现和优化,因此您无需担心功能的实现。
于 2012-09-27T12:24:35.983 回答
0
我可以给你一个想法。
祝你好运实现这个想法,因为很难正确地进行光学字符识别 (OCR)。像 IBM 这样的大公司几十年来一直致力于 OCR,而准确率几十年来一直停滞在 90% 的中高水平。
你想做两件事。
首先,您要将文本图像转换为文本。那就是光学字符识别(OCR)。这是一篇关于光学字符识别的 Wikipedia 文章,可帮助您入门。
其次,您要确定人们提供了哪些答案,也称为光学标记识别 (OMR)。这是一个更容易解决的问题。基本上,您可以在 OMR 表单上找到对齐标记。这些对齐标记将对应于Rectangle
具有 x、y 原点以及宽度和高度的特定标记。您在对齐标记之间找到图像上的其他标记,并计算标记对应的答案。这是一篇关于光学标记识别的 Wikipedia 文章,可帮助您入门。
于 2012-09-27T13:57:33.817 回答