我正在研究python包飞镖。我认为它是时间序列分析的非常好的工具。但我对以下内容感到困惑:
import pandas as pd
import numpy as np
from darts import TimeSeries
from darts.models.forecasting.rnn_model import RNNModel
train=pd.DataFrame({'a1':np.random.normal(size=500),
'a2':np.random.normal(size=500)})
series1 = TimeSeries.from_dataframe(train, time_col=None, value_cols=['a1','a2'])
train1, val1 = series1[:-50], series1[-50:]
model = RNNModel(model='GRU', input_chunk_length=30,random_state=1980,n_epochs =30)
model.fit(train1)
prediction = model.predict(n=len(val1))
您可以看到我随机生成两列作为两个时间序列(train),然后将其转移到 darts 时间序列(series1)。然后,将其拆分为训练和验证(train1,val1)。train1 包括 450 个时间点,val1 有 50 个。然后,我使用 RNNModel 来训练模型。但是信息输出是:
您可以在图片中看到“训练数据集包含 426 个样本”。所以我现在明白这个 426 来自哪里?我的理解是训练数据集应该包含 450 个数据点?