我想在公共数据集中测试我的音乐流派算法,以与其他预先存在的算法进行比较。在 MIREX 的情况下,所有数据都不可用。我发现 GTZAN 数据集在链接中可用(marsyas.info/download/data_sets)但是,我现在不可用。
你知道我怎样才能得到这些数据吗?因为我使用 MFCC 以外的其他功能,所以我需要流派注释以及音乐。
提前致谢。
我想在公共数据集中测试我的音乐流派算法,以与其他预先存在的算法进行比较。在 MIREX 的情况下,所有数据都不可用。我发现 GTZAN 数据集在链接中可用(marsyas.info/download/data_sets)但是,我现在不可用。
你知道我怎样才能得到这些数据吗?因为我使用 MFCC 以外的其他功能,所以我需要流派注释以及音乐。
提前致谢。
编辑:现在看来,Marsyas 页面托管在marsyasweb.appspot.com 上,您可以在数据集子页面中找到 GTZAN 数据库的链接。
我还在为我的大学项目寻找 GTZAN 数据集,但我发现它http://marsyas.info
已经关闭,所以我使用了 marsyas.info/download/data_sets 的谷歌网络缓存(查看更多信息)。幸运的是,GTZAN 数据集托管在http://opihi.cs.uvic.ca
,您可以下载它们!
但在使用数据集之前要注意许可(来自缓存的 marsyas 下载页面的信息):
该数据集用于 G. Tzanetakis 和 P. Cook 在 2002 年 IEEE Transactions on Audio and Speech Processing 中的流派分类“音频信号的音乐流派分类”中的著名论文。
不幸的是,数据库是在我研究的早期逐渐收集的,所以我没有标题(显然没有版权许可等)。这些文件是在 2000-2001 年从各种来源收集的,包括个人 CD、收音机、麦克风录音,以代表各种录音条件。尽管如此,我一直应要求将其提供给研究人员,主要用于比较等目的。如果您打算使用此数据集发布实验结果,请联系 George Tzanetakis (gtzan@cs.uvic.ca)。
该数据集由每 30 秒长的 1000 个音轨组成。它包含 10 个流派,每个流派由 100 首曲目表示。曲目均为 .wav 格式的 22050Hz 单声道 16 位音频文件。
也许您还会对 Magnatagatune - 等其他数据集感兴趣http://tagatune.org/Magnatagatune.html
。
我意识到很久以前就已经回答了这个问题,但我觉得有必要用我的答案更新这个线程。
根据您的流派分类实现,我假设它是基于内容的(频谱图在深度学习方法中广泛使用,但是,您确实提到了 MFCC),您可能会发现很容易找到已经从音频中提取的特征的数据集. 这可能是直接将您的结果与其他方法进行比较的最简单方法。
为此,您可以使用拉丁音乐数据库,您可以从这里获得,免费音乐档案,您可以从这里获得,希腊音乐或音频数据集,您可以从这里获得,CAL10k/CAL500 数据集,你可以从这里得到,几乎所有你可以从这个网站上抓取的其他数据集。
否则,我建议您自己提取这些特征,使用一些特征提取库或工具箱,这样就可以使用 GTZAN或Ballroom数据集(或其他任何有音频文件的数据集)。betatester07的链接目前仍然有效!
我发现最容易使用的特征提取方法是jAudio或LibROSA,分别用于 Java 和 Python。使用 jAudio,您还可以从命令行调用它,或者只使用 gui,它还接受批处理文件,因此您可以一次处理一大堆音频文件。使用这些提取方法,如果它们在您尝试实现或比较的论文中抬起丑陋的头脑,您可以获得与那些标准特征相匹配的所有特征。
小心使用这些标准的“基准”数据集,因为它们仍然存在缺陷。为此,您想查看 Sturm 的工作。
希望有帮助:)
我也在寻找这样的基准。
我在一篇名为“From Sound to 'Sense' via Feature Extraction and Machine Learning - Deriving High-Level Descriptors for Characterizing Music”的论文中找到了这一点:
音乐信息检索社区目前正在努力编译标记音乐的大型存储库,所有感兴趣的研究人员都可以在没有版权问题的情况下使用这些存储库。这方面值得注意的例子是 Masataka Goto 的 RWC 音乐数据库 (http://staff.aist.go.jp/m.goto/RWC-MDB)、美国大学的 IMIRSEL(国际音乐信息检索系统评估实验室)项目伊利诺伊州厄巴纳-香槟分校 (http://www.music-ir.org/evaluation — 另见 [12]),以及新的 FreeSound Initiative (http://freesound.iua.upf.edu)。
但我找不到任何有用的东西。这里描述了获取第一个提到的数据库副本的过程,但它看起来非常复杂!
听起来您可能想要百万歌曲数据集,其中有一百万首歌曲,带有音频功能、标签、歌词等,由 Echonest 和 Labrosa 发布。当然,这是假设您正在处理音乐元数据和转录。
如果您正在寻找原始音频……那是另一回事。我不知道您是否想发表,在这种情况下,知识产权法可能是一个更重要的因素。但是对于私人测试,我怀疑你可以只使用你自己的音乐库中的文件(例如,iTunes 下载已经有一个流派标签来测试你的算法)。
免责声明:我不是律师。接受我的法律建议,风险自负。