2

从音频文件中检测特定单词的解决方案是什么?

我有很多音频文件(相同的编解码器),每个文件只有大约 15 秒长。(注:所有音频文件都是同一人/同一口音)

例如:

test1.mp3播放Hello Tom, what are you doing today?

test2.mp3播放Hello Paul, what are you doing today?

test3.mp3播放Good morning John - It is lovely weather today

我需要一种方法来检测可爱的天气或每个音频文件中的单词。

我可能有 100 个音频文件说“你今天在做什么”,而其他文件说“你今天在做什么?” - 我只需要知道每个文件的状态/类型是什么..

检查频率位是否存在而不是使用语音识别工具的解决方案是什么。

4

1 回答 1

2

您本质上是在问“我怎样才能进行通用语音识别”?

解决方案是:

如果您的平台提供开箱即用的语音识别,请使用它。例如,Microsoft Windows 就是这样做的。 http://msdn.microsoft.com/en-us/library/hh323805.aspx

如果您的平台没有,那么您需要集成第三方语音识别包,例如 Lernaut & Hauspie(现为 Nuance)、Dragon 等。这可能需要付费。

编辑:我已将此标记为文本到语音(语音生成)和语音到文本(语音识别)API 的副本?,其中对“如何进行语音识别”有全面的回答。

于 2012-05-03T15:45:17.633 回答