...
大家好!
我是一名学生,试图制作一个关于声音识别的“自己动手”设备。不像语音识别那么精确和复杂,我只是想为我的小应用程序采用和使用一些简单的识别库。
换句话说,我想要做的是“大范围”的声音识别。即,如果有声音“轰!轰!” 然后我真的不必识别诸如“好吧,那是雪佛兰克尔维特 Z06 的某种发动机声音。不错的机器,嗯?” (X) 而是将其识别为类似“汽车。向我驶来。响亮而嘈杂。” (O)这就够了。
或者,如果有声音“Ka-boom!” “嘭!”,我不用认出来,“北桥放烟花,这个冬天?说不定外面有智障。” (X) 但是,“火爆。我永远不会去那里。奇怪。” (O)这就够了。... 等等。也就是说,我想用匿名库对声音进行“分类”,并将其用作我的应用程序给出的指南的有用信息。
有什么有用的信息,或者我可以参考的推荐库吗?我会等待你的好建议。谢谢你。
问候,
J.公园