我有兴趣做一些基于蜗牛邮件的调查,但我正在寻找快速的方法来数字化他们发回的调查。
因此,如果我有一个问题和它下面的 5 个框,您可以通过选中相应的框来表明您的意见,那么是否存在我可以扫描它并通过一个吐出响应的软件运行它的地方。
编辑说明:
我正在询问论文数字化后我需要做什么。我想编写一些代码来查看图像文件并识别已标记的框并输出受访者答案的表示。
我会查看从桌面扫描仪或类似设备扫描的页面。
据我所知,您并不真正需要 ICR(智能字符识别,用于手写和手印文本),但您需要的是 OMR - 光学标记识别(从调查和测试等文档形式中捕获人工标记的数据)。
坏消息是你几乎找不到 Python 的开源库。但是有一个解决方案 - 您可以使用云 SDK,它是一个网站,可让您上传图像并将 OCR 数据发回给您。试试www.ocrsdk.com,它是 ABBYY 最近推出的基于云的 OCR SDK。它现在处于封闭测试阶段,因此完全免费使用。
它具有ICR和OMR api 方法和一组python 代码示例。
我真的不明白这与 python 有什么关系,当然,除非您已经将结果数字化并且现在正在计算结果。听起来你仍然需要扫描结果,据我所知,python 没有任何直接的能力来做这样的事情。您将必须首先使用扫描仪,然后才能使用 python 读取数据。
SDAPS项目( repo ) 可能值得一看。它可能无法处理任意扫描的图像,因为它似乎期望在过程开始时有一个 ODT 或 LaTeX 文档。
SDAPS 是一个开源(GPLv3、LPPL)光学标记识别(OMR)程序。它是用 python 编写的,并具有与 LibreOffice 和 LaTeX 集成的工作流程来创建问卷。
通过 SDAPS,您可以使用 LibreOffice 或 LaTeX 创建问卷。在此之后进行一些处理以收集有关调查的信息(问题和答案)并创建可打印的 PDF。填写的问卷只需在(示例)中进行扫描。SDAPS 将进行光学标记识别,并可以创建 PDF 报告(示例)或导出数据。或者,可以使用图形用户界面手动更正结果。