1

我对音频文件应用了 FFT,显示了播放音频文件时传播的频率。

有没有一种科学的方法可以根据频率分布快照或一系列快照来寻找欣快/悲伤/忧郁等情绪?

我的想法:

超过某个阈值(大约是最高峰的 20%)的最大值的数量大于或小于某个值会导致欣快或不欣快。该理论认为,欣快的音乐部分通常伴随着许多和弦/不同的乐器,因此当同时播放许多不同的频率时,它很可能是欣快的。

虽然有很多误报。

4

2 回答 2

1

您查看峰值与背景的强度的想法将告诉您音乐的“嘈杂”与“音调”的程度,这可能会告诉您它的乐器与打击乐的程度,尽管该技术可能会将打击乐曲解为其他类型的噪音,例如环境/环境噪音和声音效果。我不认为这会赢得你太多。

从 FFT 中,您还可以导出其他参数,例如与我们对亮度的感知密切相关的光谱质心等。

然而,仅 FFT 并不能开始捕捉我们可能称之为音乐的“情绪”或“情感内容”。未捕获信息的一些示例:

  • 音乐的关键。仅仅因为一首歌是小调并不会让它“悲伤”,但它在歌曲的情绪中起着重要作用。
  • 节奏。歌曲的节奏是情感内容的主要指标。
于 2013-10-23T14:15:57.047 回答
0

您可以在谷歌中进行更多研究,但不仅仅是频率可以告诉音乐的情绪,还有很多因素
根据上述因素您可以设置音乐的特定情绪,
例如:节拍很慢但频率很高/音符非常高,可能会强调非常深的悲伤。

您可以在互联网上查找不同的音乐情绪,然后确定它们的速度、频率、音符、音色,它们的模式将匹配特定类型的音乐。您可以使用神经网络来熟悉您的系统,以根据您研究的模式确定声音的情绪。

于 2013-10-23T02:31:57.303 回答