0

我正在寻找一些关于对音效库进行分类的建议。我有大量随机音效(想想口哨声、爆裂声、咆哮声、吱吱声、枪声等)。我希望能够以咆哮为例,并找到下一个听起来最接近原声的咆哮。

给定一个声音,我的设置中的哪个声音听起来最接近它。

我已经进行了大量的谷歌搜索,并找到了两条我仍在研究的途径。一个是使用 echonest,尽管他们的“最佳匹配”支持对于公共用户来说看起来并不乐观。另一种选择是深入研究 FFT 并构建我自己的匹配算法。这是一个不错的选择,也是一次很好的学习体验,但我想从其他可能对声音处理了解更多的人那里获得一些意见;尤其是短片 0.5 秒 - 3 秒的范围,而不是完整长度的音乐。

谢谢!

4

2 回答 2

0

我从事电影后期制作多年,据我所知,没有办法自动做到这一点。每个文件的文件头中都有描述声音的元信息。然后,您实际上不是在搜索文件名,而是在元字符串中搜索。

我认为以编程方式对效果进行排序并非易事,因为如果您查看波形,听起来相似的两种效果可能完全不同。您需要提取有关声音的重要信息,然后进行比较。我也不是 DSP 专家,也许有办法做到这一点

于 2012-02-18T11:43:40.773 回答
0

如果您有兴趣尝试构建自己的系统来执行此操作,我可以建议一些可能有助于优化您的 Google 搜索的关键字。在学术研究社区中,您所描述的任务通常称为“基于内容的音频搜索”。我知道在这方面已经做了很多工作,虽然大部分都与音乐有关,但音效肯定是许多研究的重点。

您可能想从Pedro Cano 的工作开始。

另外,我最近听说一家公司也在做类似的工作。您可能想查看Imagine Research的产品。

这些只是我脑海中的一些想法。我不 %100 确定他们会有所帮助。如果是,请告诉我!

于 2012-02-18T16:12:59.910 回答