我有一个相对较大的时间序列数据,其中包含 10000 个观察值(行)和 200 个变量(列)R
dataframe
。我想对我的数据运行聚类算法,特别是基于动态时间规整 (DTW) 的层次聚类。
在运行层次聚类之前,我需要计算距离矩阵。我实现它的方式R
如下:
library(dtw)
d = dist(df, method = "DTW") # df is my data (10000 by 200)
但是,我想知道是否有一种方法可以大致估计在运行代码之前该计算需要多长时间。这将帮助我决定是否值得尝试。
PS 我运行了代码,但几分钟后我不得不停止它,因为我不知道它需要多长时间(几分钟、几小时、几天等)