python - C 或 Python 中的声音识别和分类库

Question

...

大家好！

我是一名学生，试图制作一个关于声音识别的“自己动手”设备。不像语音识别那么精确和复杂，我只是想为我的小应用程序采用和使用一些简单的识别库。

换句话说，我想要做的是“大范围”的声音识别。即，如果有声音“轰！轰！” 然后我真的不必识别诸如“好吧，那是雪佛兰克尔维特 Z06 的某种发动机声音。不错的机器，嗯？” (X) 而是将其识别为类似“汽车。向我驶来。响亮而嘈杂。” （O）这就够了。

或者，如果有声音“Ka-boom！” “嘭！”，我不用认出来，“北桥放烟花，这个冬天？说不定外面有智障。” (X) 但是，“火爆。我永远不会去那里。奇怪。” （O）这就够了。... 等等。也就是说，我想用匿名库对声音进行“分类”，并将其用作我的应用程序给出的指南的有用信息。

有什么有用的信息，或者我可以参考的推荐库吗？我会等待你的好建议。谢谢你。

问候，

J.公园

score 0 · Accepted Answer

如果您愿意使用 C++ 库（不是真正的 C）：

但是您需要自己开发reco，它是通过使用标记为它们所做的噪声的样本库来完成的。这是一个长期的项目，您是否熟悉傅里叶、DTW 等信号处理？有标准的流程可以做到这一点。

1 回答 1