audio - 实现音效的“最佳匹配”

Question

我正在寻找一些关于对音效库进行分类的建议。我有大量随机音效（想想口哨声、爆裂声、咆哮声、吱吱声、枪声等）。我希望能够以咆哮为例，并找到下一个听起来最接近原声的咆哮。

给定一个声音，我的设置中的哪个声音听起来最接近它。

我已经进行了大量的谷歌搜索，并找到了两条我仍在研究的途径。一个是使用 echonest，尽管他们的“最佳匹配”支持对于公共用户来说看起来并不乐观。另一种选择是深入研究 FFT 并构建我自己的匹配算法。这是一个不错的选择，也是一次很好的学习体验，但我想从其他可能对声音处理了解更多的人那里获得一些意见；尤其是短片 0.5 秒 - 3 秒的范围，而不是完整长度的音乐。

谢谢！

score 0 · Accepted Answer

我从事电影后期制作多年，据我所知，没有办法自动做到这一点。每个文件的文件头中都有描述声音的元信息。然后，您实际上不是在搜索文件名，而是在元字符串中搜索。

我认为以编程方式对效果进行排序并非易事，因为如果您查看波形，听起来相似的两种效果可能完全不同。您需要提取有关声音的重要信息，然后进行比较。我也不是 DSP 专家，也许有办法做到这一点

score 0 · Accepted Answer

如果您有兴趣尝试构建自己的系统来执行此操作，我可以建议一些可能有助于优化您的 Google 搜索的关键字。在学术研究社区中，您所描述的任务通常称为“基于内容的音频搜索”。我知道在这方面已经做了很多工作，虽然大部分都与音乐有关，但音效肯定是许多研究的重点。

您可能想从Pedro Cano 的工作开始。

另外，我最近听说一家公司也在做类似的工作。您可能想查看Imagine Research的产品。

这些只是我脑海中的一些想法。我不 %100 确定他们会有所帮助。如果是，请告诉我！

audio - 实现音效的“最佳匹配”

2 回答 2

Related

Reference