0

这是我关于stackoverflow的第一个问题,如果问题提出不好,对不起。

我目前正在开发一个项目,我可以预测一个人每天喝多少。我目前有如下数据:

1 天样品。

menge列表示一个人在 30 分钟内实际喝了多少水(所以第一个值表示从 8:00 到 8:30 之前的量等)。这是来自 3 个月数据的 1 天样本。这一天从早上 8 点开始,到晚上 8 点结束。

我正在尝试预测每天的时间序列。例如,给定前一两个时间步长,我们将预测一整天,然后我们知道这个人在晚上 8 点之前总共喝了多少酒。我正在尝试将此数据建模为 R(Google Colab)中的时间序列对象,以便使用 Croston 方法进行预测。使用该ts()功能,我应该如何设置频率才能知道:

  1. 数据为半小时
  2. 数据为每天 8:00 至 20:00(不跨越全天)

我是否需要通过添加 0 个值来使数据跨越一整天?有没有更好的方法呢?先感谢您。

4

1 回答 1

0

使用该ts()函数时,frequency用于定义给定时间段内(通常是规则间隔的)观测值的数量。对于您的示例,您的观察是在上午 8 点到晚上 8 点之间每 30 分钟进行一次,您的时间段是 1 天。1 天的时间段假设每天的模式在这里最受关注,您也可以在这里使用 1 周。

因此,在您的数据的每一天(上午 8 点至晚上 8 点)内,您有 24 次观察(24 个半小时)。因此,此数据的合适频率为 24。

您也可以用 0 值填充数据,但这不是必需的,并且会使模型复杂化。如果您填充数据以使其具有一天中所有半小时的观测值,则频率将为 48。

于 2021-07-19T23:50:50.280 回答