我只见过以二维表格格式显示的时间序列数据。但是,sktime 是一个新的但流行的 python 包,它使用嵌套的 pandas 数据框,我无法理解他们对它所代表的含义的解释。
它看起来像这样。
DataFrame:
index | dim_0 | dim_1 | ... | dim_c-1
0 | pd.Series | pd.Series | pd.Series | pd.Series
1 | pd.Series | pd.Series | pd.Series | pd.Series
... | ... | ... | ... | ...
n | pd.Series | pd.Series | pd.Series | pd.Series
这打破了我对数据的理解。什么东西在这里代表什么?这有什么意义?我一直在试图找到某种解释,解释为什么这种格式有意义或为什么有用,但是所有的 sktime 文档都只是跳过了这一点,就像它是微不足道的一样。
假设我有一些看起来像我通常使用的时间序列数据:
DataFrame:
time |col1|col2| ...|coln
0 | 1 | 10 | a | z
1 | 2 | 11 | b | x
... | ...| ...| ...| ...
n | 4 | 23 | z | a
这里的第三维在哪里?第三维度甚至来自哪里?这在 sktime 使用的嵌套数据框中会是什么样子?此外,sktime 似乎将其称为单变量时间序列,但这打破了我对单变量一词的理解,因为它显然具有多个变量。