0

我有一个软件合同请求,该合同要求从非常有限的集合中识别语音命令,例如“向上”、“向下”、“关闭”、“打开”等。

我似乎不需要全面的语音识别,即我不必进行波形到文本的转换。我可以用谷歌搜索一个特定的术语吗?

我只是对这个主题知之甚少,无法自己编写代码。如果我想完全解决这个问题,我需要一个相当成熟的库来解决这个子问题,最好是开源的。

目标平台是某种运行 Linux 的工业 PC,我会使用 C 或 Python 来编写应用程序。

4

2 回答 2

1

这看起来像一个合适的候选人:CMU Sphinx

不过没试过。

于 2011-03-14T14:46:45.600 回答
0

您可以查看 pyspeech,但我认为它仅适用于 Windows。请参阅Python 中的语音处理库以将语音转换为文本

于 2011-03-14T20:57:59.730 回答