我正在研究手写表单识别系统,直到现在我已经到了这一步,我已经能够使用带有 openCV 的 java 检测文本,但现在我想从每个边界框中读取文本点击打开图像
我一直在研究使用 java 和 openCV 来找出相同的过程,但我找不到任何东西。
建议我一些链接、技术、方法或流程来使用“JAVA”执行此特定任务。
我正在研究手写表单识别系统,直到现在我已经到了这一步,我已经能够使用带有 openCV 的 java 检测文本,但现在我想从每个边界框中读取文本点击打开图像
我一直在研究使用 java 和 openCV 来找出相同的过程,但我找不到任何东西。
建议我一些链接、技术、方法或流程来使用“JAVA”执行此特定任务。
这个答案比具体问题更笼统。我会尽量坚持问题陈述。
尽管有很多关于手写文本识别的研究正在进行,但没有完全证明的方法可以解决所有可能的问题。
您在此处发布的示例图像相对嘈杂,同一字母的字体之间的差异非常大。这正是它变得棘手的地方。
我个人建议,一旦你有文本周围的边界框(你已经这样做了),在所有这些边界框中运行轮廓提取以提取单个字母。拥有它们后,您需要找出可以代表特定字母的最大方差(或至少 95% 置信区间)的相关特征。
使用此/ese 功能,您需要训练一个有监督的算法,将字母作为训练数据,并将其对应的值(例如实际值)作为标签。一旦你有了它,给它一些数据(最简单和最困难的情况)来分析准确性。
这些链接可以帮助您开始:
我在开始编码之前使用我使用的一组功能检查准确性的第一个工具之一:Weka
阅读有关机器学习及其工作原理的基本教程 -个人最爱
你可以试试TensorFlow。
OpenCV-Python 中的简单数字识别 OCR - 非常适合初学者。
希望能帮助到你!