我有一些在线手写样本的 xy 坐标,我从中计算一些统计参数,我想使用这些参数制作基于 HMM 的识别器。
由于 HMM 工具包或 HTK 最初是为语音识别而设计的,所以我无法理解如何使用 HTK 执行在线单词识别。
有人可以帮我理解如何将我的参数作为该工具包的输入以及它将给出什么输出??????
我有一些在线手写样本的 xy 坐标,我从中计算一些统计参数,我想使用这些参数制作基于 HMM 的识别器。
由于 HMM 工具包或 HTK 最初是为语音识别而设计的,所以我无法理解如何使用 HTK 执行在线单词识别。
有人可以帮我理解如何将我的参数作为该工具包的输入以及它将给出什么输出??????
正如您所说,HTK 是为语音识别而开发的。HTK 工具包是一组可以协同工作的专用程序。
这是手册的一个版本,描述了每个程序的设计目的,包括预期的输入和输出。
不过我会警告你,尝试使用 HTK 进行手写识别你将面临一场艰苦的战斗。它根本没有考虑到这一点。链接手册的开头段落说:
HMM 可用于对任何时间序列进行建模,HTK 的核心同样具有通用性。然而,HTK 主要设计用于构建基于 HMM 的语音处理工具,尤其是识别器。因此,HTK 中的许多基础设施支持都专门用于此任务。