1

为简单起见,假设我试图预测一系列单值变量的第二天,因此我的数据集将采用以下形式:

input    label
   x1       x2
   x2       x3
   x3       x4
  ...      ...
   xt      xt+1

但是,对于许多不同的用户,我的数据在时间上具有相同的序列,因此它采用以下形式:

input    label
 u1x1     u1x2
 u1x2     u1x3
 u1x3     u1x4
  ...      ...
 u1xt   u1xt+1
 u2x1     u2x2
 u2x2     u2x3
 u2x3     u2x4
  ...      ...
 u2xt   u2xt+1
  ...      ...
 unx1     unx2
 unx2     unx3
 unx3     unx4
  ...      ...
 unxt   unxt+1

什么是一种可接受的方式来构建这些数据并将其输入 DAI,这样它就不会被视为一个完整的长序列,而是一堆不直接相关的序列,它们在时间上是平行的?

编辑:数据有一个“用户 ID”列。DAI 可以自动使用它来克服我正在解释的问题吗?

4

1 回答 1

1

要格式化数据以进行预测,您需要汇总每个感兴趣组和特定时间段(在您的情况下为一天)的数据。

因此,如果您的预测范围是一天,您需要按用户、您的单值变量和按天进行汇总,以便您有一个目标(标签)作为每天的总量。您可以在此处此处找到有关如何为无人驾驶设置数据的文档。

编辑 回应评论:

下面是另一个示例来解释预期数据格式,假设每个用户都应该在日级别进行聚合:

如果您有 5 个用户一天的数据,您的数据集应该只有 5 行,但如果您有 5 个用户的 10 天数据,您应该有 50 行数据。

然后在无人驾驶 AI 中,当您设置实验时,您会将您的时间组设置为用户列

于 2018-08-17T21:54:46.467 回答