从音频文件中检测特定单词的解决方案是什么?
我有很多音频文件(相同的编解码器),每个文件只有大约 15 秒长。(注:所有音频文件都是同一人/同一口音)
例如:
test1.mp3播放Hello Tom, what are you doing today?
test2.mp3播放Hello Paul, what are you doing today?
test3.mp3播放Good morning John - It is lovely weather today
我需要一种方法来检测可爱的天气或每个音频文件中的单词。
我可能有 100 个音频文件说“你今天在做什么”,而其他文件说“你今天在做什么?” - 我只需要知道每个文件的状态/类型是什么..
检查频率位是否存在而不是使用语音识别工具的解决方案是什么。