我正在寻找一些关于对音效库进行分类的建议。我有大量随机音效(想想口哨声、爆裂声、咆哮声、吱吱声、枪声等)。我希望能够以咆哮为例,并找到下一个听起来最接近原声的咆哮。
给定一个声音,我的设置中的哪个声音听起来最接近它。
我已经进行了大量的谷歌搜索,并找到了两条我仍在研究的途径。一个是使用 echonest,尽管他们的“最佳匹配”支持对于公共用户来说看起来并不乐观。另一种选择是深入研究 FFT 并构建我自己的匹配算法。这是一个不错的选择,也是一次很好的学习体验,但我想从其他可能对声音处理了解更多的人那里获得一些意见;尤其是短片 0.5 秒 - 3 秒的范围,而不是完整长度的音乐。
谢谢!