我需要开发一个程序,当它识别出鹦鹉的尖叫声或尖叫声时,它会打开或关闭特定的音轨。该软件需要识别特定范围的声音并允许该范围内的一些变化(因为鹦鹉可能不会每次都准确地复制它的尖叫声)。
示例:鸟鸣,没有声音。鸟停止尖叫五秒钟,播放赞美鸟的音轨。经常聊天需要完全忽略,因为它不气馁。
我听说过 Java 库具有内置字典的语音识别功能,但是需要教该软件我的特定鹦鹉发出的特定声音 - 而不是单词或任何随机的鸟声。此外,正如我上面提到的,它需要允许声音的细微变化,因为尖叫声可能永远不会 100% 与录制的版本相同。
解决这个问题的最佳方法是什么/我应该研究什么语言?
编辑:或者(也许这将是一个更简单的解决方案),有没有办法根据输入音量进行音频切换?所以鹦鹉发出什么样的声音并不重要,只是声音有多大?