我对音频文件应用了 FFT,显示了播放音频文件时传播的频率。
有没有一种科学的方法可以根据频率分布快照或一系列快照来寻找欣快/悲伤/忧郁等情绪?
我的想法:
超过某个阈值(大约是最高峰的 20%)的最大值的数量大于或小于某个值会导致欣快或不欣快。该理论认为,欣快的音乐部分通常伴随着许多和弦/不同的乐器,因此当同时播放许多不同的频率时,它很可能是欣快的。
虽然有很多误报。
我对音频文件应用了 FFT,显示了播放音频文件时传播的频率。
有没有一种科学的方法可以根据频率分布快照或一系列快照来寻找欣快/悲伤/忧郁等情绪?
我的想法:
超过某个阈值(大约是最高峰的 20%)的最大值的数量大于或小于某个值会导致欣快或不欣快。该理论认为,欣快的音乐部分通常伴随着许多和弦/不同的乐器,因此当同时播放许多不同的频率时,它很可能是欣快的。
虽然有很多误报。