我想创建一个将接受音乐训练的 LSTM 模型(使用 Keras),但我在对 midi 输入进行矢量化时遇到了困难。我尝试在 python 中使用“Mido”库,从中可以提取以下格式的数据:
note_on channel=0 note=72 velocity=50 time=0
note_on channel=0 note=38 velocity=50 time=0.1171875
note_off channel=0 note=80 velocity=0 time=0.1171875
note_off channel=0 note=41 velocity=0 time=0
我正在将其转换为数组
[note_number, velocity, time]
其中velocity表示速度以及是否为note_on\note_off。现在的问题是我如何在这里输入时间,我的意思是时间以刻度为单位(我猜)。我如何将这些滴答声转换为秒,并且我将这个数组提供给顺序模型,我将如何再次将时间转换为输出中的滴答声?