-2

...

大家好!

我是一名学生,试图制作一个关于声音识别的“自己动手”设备。不像语音识别那么精确和复杂,我只是想为我的小应用程序采用和使用一些简单的识别库。

换句话说,我想要做的是“大范围”的声音识别。即,如果有声音“轰!轰!” 然后我真的不必识别诸如“好吧,那是雪佛兰克尔维特 Z06 的某种发动机声音。不错的机器,嗯?” (X) 而是将其识别为类似“汽车。向我驶来。响亮而嘈杂。” (O)这就够了。

或者,如果有声音“Ka-boom!” “嘭!”,我不用认出来,“北桥放烟花,这个冬天?说不定外面有智障。” (X) 但是,“火爆。我永远不会去那里。奇怪。” (O)这就够了。... 等等。也就是说,我想用匿名库对声音进行“分类”,并将其用作我的应用程序给出的指南的有用信息。

有什么有用的信息,或者我可以参考的推荐库吗?我会等待你的好建议。谢谢你。

问候,

J.公园

4

1 回答 1

0

如果您愿意使用 C++ 库(不是真正的 C):

天鹰座

但是您需要自己开发reco,它是通过使用标记为它们所做的噪声的样本库来完成的。这是一个长期的项目,您是否熟悉傅里叶、DTW 等信号处理?有标准的流程可以做到这一点。

于 2016-04-04T07:05:57.277 回答