我有 1000 个不同的用户,数据集包含这些用户在过去 1 年的活动。总记录超过 300K。LSTM RNN 的输入具有与这些用户对应的特征向量。还包括用户,因为每个用户的行为可能因人而异。网络应该学习每个用户的行为,并且应该能够根据同一用户的过去信息预测下一个行为。如何在 LSTM RNN 中为每个用户维护单独的隐藏状态。
以下博客文章与我的问题类似:
https://towardsdatascience.com/multi-state-lstms-for-categorical-features-66cc974df1dc
更新
我的数据集如下所示:
我将我的数据集转换为 3D numpy 数组并将其重塑为(记录数、时间步长、n_features)。
问题是:
1)是否有必要对“用户”属性进行编码?
2)这个问题的正确批量大小是多少?是批次 = 1000(不同用户的数量)吗?
3)我需要在模型的每批输入中包含每个用户的数据吗?
或者
请建议这个问题的正确实现。