c# - 捕获笔迹并将其转换为输入文本的最佳方法

Question

我想编写一个程序，它使用 Kinect 捕捉运动，然后保存运动路径，然后将创建的图像转换为文本。

我不确定 OCR 是否是最好的方法，因为图像质量很可能会很低。

有没有人可以建议的系统。还有关于如何实现它的任何提示。干杯

编辑：

Windows Journal 几乎完全符合我的要求。

score 1 · Accepted Answer

你需要一个像 Kinect 这样的传感器并使用它的 API 来捕捉动作。这对于传感器和动作捕捉技术来说是非常具体的。我认为你不能使用 C# 编写没有第三方 API 的动作捕捉技术。

score 1 · Accepted Answer

我看不到 Kinect 在这里能给你带来的好处。

您必须首先定义该系统将具有什么样的输入：例如是字符的 RGB 图像还是更复杂的东西，例如随时间跟踪的手部位置？

如果您想将 Kinect 用于其深度图，那么您尝试做的似乎更像是手势识别（并将每个手势映射到字符）而不是 OCR。

编辑手势识别方式：

我自己还没有在这方面实施任何事情，所以我真的不能给你明确的方向或建议。有几篇关于该主题的论文（谷歌学者搜索）利用可用的深度信息而不是使用 2D 图像。我猜想 DIY 方法是为每个手势获取尽可能多的训练样本，训练你的分类器（关于监督学习的维基百科），然后测试你的新样本。

如果您不喜欢冒险，可以从测试一些现有的代码示例开始：

OpenNI的手部跟踪示例——你可以在这里看到一个例子，我认为它也可以识别一些手势——。
Candescent NUI “使用 Kinect 深度数据进行手和手指跟踪”，我认为它不包含任何识别，但也许它可以帮助您获得更好的数据。
Kinect for Windows Developer Kit可能包含一些有用的东西，但说实话我还没有检查过。

我可以看到手势识别方法非常棘手。手势之间必须存在显着差异，否则，考虑到 Kinect 低分辨率和噪音问题，即使您获得大量训练样本，它仍然可能失败。例如，想象一下写“i”或“l”。或者'o'和'a'之间的区别（当然取决于你的笔迹）。规模如此之小，手的移动如此微不足道，以至于我不知道一个分类器——即使是一个强大的分类器——是否能捕捉到这种变化。

c# - 捕获笔迹并将其转换为输入文本的最佳方法

2 回答 2

Related

Reference