我一直在尝试训练一个模型来从单音乐谱中生成序列。在互联网上,我发现了一些使用字符级 lstm 网络和音乐 ABC 表示法的人的例子(很多使用 karpathy 在 Torch 中的实现:http: //karpathy.github.io/2015/05/21/rnn-effectiveness /)。
虽然这看起来相当有效,但序列并没有包含尽可能紧凑的音乐信息。我的想法是将音乐信息直接表示为一系列音符。但是,一个音符有多个特征:音高、八度、持续时间、是否连接到下一个音符等。我不确定如何将这些信息正确表示为特征向量,也没有找到很多关于这个主题的信息.
我的数据集在音符音高和长度方面的多样性非常有限。它可能包含 3 个八度,10 个不同的音符时长,只有 4/4 拍号。然而,代表这些音符的每个不同组合会得到一个巨大的输入特征向量。
任何建议将不胜感激!