audio - 创建自定义声音识别软件以切换音频的建议

Question

我需要开发一个程序，当它识别出鹦鹉的尖叫声或尖叫声时，它会打开或关闭特定的音轨。该软件需要识别特定范围的声音并允许该范围内的一些变化（因为鹦鹉可能不会每次都准确地复制它的尖叫声）。

示例：鸟鸣，没有声音。鸟停止尖叫五秒钟，播放赞美鸟的音轨。经常聊天需要完全忽略，因为它不气馁。

我听说过 Java 库具有内置字典的语音识别功能，但是需要教该软件我的特定鹦鹉发出的特定声音 - 而不是单词或任何随机的鸟声。此外，正如我上面提到的，它需要允许声音的细微变化，因为尖叫声可能永远不会 100% 与录制的版本相同。

解决这个问题的最佳方法是什么/我应该研究什么语言？

编辑：或者（也许这将是一个更简单的解决方案），有没有办法根据输入音量进行音频切换？所以鹦鹉发出什么样的声音并不重要，只是声音有多大？

score 0 · Accepted Answer

这个问题似乎与语音识别密切相关。我建议看看这篇文章：如何将人声转换为数字格式？

1 回答 1