我想编写一个程序,它使用 Kinect 捕捉运动,然后保存运动路径,然后将创建的图像转换为文本。
我不确定 OCR 是否是最好的方法,因为图像质量很可能会很低。
有没有人可以建议的系统。还有关于如何实现它的任何提示。干杯
编辑:
Windows Journal 几乎完全符合我的要求。
你需要一个像 Kinect 这样的传感器并使用它的 API 来捕捉动作。这对于传感器和动作捕捉技术来说是非常具体的。我认为你不能使用 C# 编写没有第三方 API 的动作捕捉技术。
我看不到 Kinect 在这里能给你带来的好处。
您必须首先定义该系统将具有什么样的输入:例如是字符的 RGB 图像还是更复杂的东西,例如随时间跟踪的手部位置?
如果您想将 Kinect 用于其深度图,那么您尝试做的似乎更像是手势识别(并将每个手势映射到字符)而不是 OCR。
编辑手势识别方式:
我自己还没有在这方面实施任何事情,所以我真的不能给你明确的方向或建议。有几篇关于该主题的论文(谷歌学者搜索)利用可用的深度信息而不是使用 2D 图像。我猜想 DIY 方法是为每个手势获取尽可能多的训练样本,训练你的分类器(关于监督学习的维基百科),然后测试你的新样本。
如果您不喜欢冒险,可以从测试一些现有的代码示例开始:
我可以看到手势识别方法非常棘手。手势之间必须存在显着差异,否则,考虑到 Kinect 低分辨率和噪音问题,即使您获得大量训练样本,它仍然可能失败。例如,想象一下写“i”或“l”。或者'o'和'a'之间的区别(当然取决于你的笔迹)。规模如此之小,手的移动如此微不足道,以至于我不知道一个分类器——即使是一个强大的分类器——是否能捕捉到这种变化。