c# - 声音频率检测？

Question

从音频文件中检测特定单词的解决方案是什么？

我有很多音频文件（相同的编解码器），每个文件只有大约 15 秒长。（注：所有音频文件都是同一人/同一口音）

例如：

test1.mp3播放Hello Tom, what are you doing today?

test2.mp3播放Hello Paul, what are you doing today?

test3.mp3播放Good morning John - It is lovely weather today

我需要一种方法来检测可爱的天气或每个音频文件中的单词。

我可能有 100 个音频文件说“你今天在做什么”，而其他文件说“你今天在做什么？” - 我只需要知道每个文件的状态/类型是什么..

检查频率位是否存在而不是使用语音识别工具的解决方案是什么。

score 2 · Accepted Answer

您本质上是在问“我怎样才能进行通用语音识别”？

解决方案是：

如果您的平台提供开箱即用的语音识别，请使用它。例如，Microsoft Windows 就是这样做的。 http://msdn.microsoft.com/en-us/library/hh323805.aspx

如果您的平台没有，那么您需要集成第三方语音识别包，例如 Lernaut & Hauspie（现为 Nuance）、Dragon 等。这可能需要付费。

编辑：我已将此标记为文本到语音（语音生成）和语音到文本（语音识别）API 的副本？，其中对“如何进行语音识别”有全面的回答。

1 回答 1