我有许多时间序列记录有时会重叠,并且不一定具有相同的开始日期和结束日期。每行代表一个不同的时间序列。我使它们都具有相同的长度以保持数据收集的实际时间。
例如,在 t(1,2,3,4,5,6):
Station 1: nan, nan, 2, 4, 5, 10
Station 2: nan, 1, 4, nan, 10, 8
Station 3: 1, 9, 4, 7, nan, nan
我正在尝试在 Python 中运行聚类分析,以对具有相似行为的站点进行分组,其中行为的时机很重要,所以我不能仅仅摆脱 nans。(据我所知)。
有任何想法吗?