2

我想编写一个程序,它使用 Kinect 捕捉运动,然后保存运动路径,然后将创建的图像转换为文本。

我不确定 OCR 是否是最好的方法,因为图像质量很可能会很低。

有没有人可以建议的系统。还有关于如何实现它的任何提示。干杯

编辑:

Windows Journal 几乎完全符合我的要求。

4

2 回答 2

1

你需要一个像 Kinect 这样的传感器并使用它的 API 来捕捉动作。这对于传感器和动作捕捉技术来说是非常具体的。我认为你不能使用 C# 编写没有第三方 API 的动作捕捉技术。

于 2012-10-12T00:29:43.040 回答
1

我看不到 Kinect 在这里能给你带来的好处。

您必须首先定义该系统将具有什么样的输入:例如是字符的 RGB 图像还是更复杂的东西,例如随时间跟踪的手部位置?

如果您想将 Kinect 用于其深度图,那么您尝试做的似乎更像是手势识别(并将每个手势映射到字符)而不是 OCR。

编辑手势识别方式:

我自己还没有在这方面实施任何事情,所以我真的不能给你明确的方向或建议。有几篇关于该主题的论文(谷歌学者搜索)利用可用的深度信息而不是使用 2D 图像。我猜想 DIY 方法是为每个手势获取尽可能多的训练样本,训练你的分类器(关于监督学习的维基百科),然后测试你的新样本。

如果您不喜欢冒险,可以从测试一些现有的代码示例开始:

  • OpenNI的手部跟踪示例——你可以在这里看到一个例子,我认为它也可以识别一些手势——。
  • Candescent NUI “使用 Kinect 深度数据进行手和手指跟踪”,我认为它不包含任何识别,但也许它可以帮助您获得更好的数据。
  • Kinect for Windows Developer Kit可能包含一些有用的东西,但说实话我还没有检查过。

我可以看到手势识别方法非常棘手。手势之间必须存在显着差异,否则,考虑到 Kinect 低分辨率和噪音问题,即使您获得大量训练样本,它仍然可能失败。例如,想象一下写“i”或“l”。或者'o'和'a'之间的区别(当然取决于你的笔迹)。规模如此之小,手的移动如此微不足道,以至于我不知道一个分类器——即使是一个强大的分类器——是否能捕捉到这种变化。

于 2012-10-12T15:29:55.840 回答