我想为我自己的研究项目尝试不同的方法来调节 Google Magenta 项目的变分自动编码器模型的解码过程。据我所知,MusicVAE 已经被作者以和弦为条件(例如,对于'hier-multiperf_vel_1bar_med_chords' 模型)。我还想尝试其他方法,例如样式标签或全音阶等。但是,我很难弄清楚在分层解码器的训练过程中在哪里使用了各个张量(我认为是单热编码和弦)。相同的条件张量是否连接到每个解码步骤?还是只有第一个?或者是其他东西?因为通过查看代码和论文很难弄清楚这一点(https://arxiv.org/pdf/1803.05428.pdf)没有提到这个架构问题,我想也许相关的人可以为我解决这个问题。这是刚刚提到的论文中描述的 MusicVAE 架构的图片。