4

我有一个时间序列数据集作为具有以下列的 csv 文件-

ID,TIMESTAMP,MEASUREMENTS[10]

对于一个 ID,在进行这些测量时有多个测量值以及相关的时间戳。列测量值包含 10 个测量值的列表。一条记录(与特定时间戳关联)中的测量以某种方式取决于先前的记录。

例如。数据集:

ID,TIMESTAMP,MEASUREMENTS
1,0,[123,456,567.....]
1,100,[....]
1,350,[....]
2,0,[....]
2,200,[.....]

此外,测量数组在某些索引处包含 NaN。最后,我有一些与每个 ID 相关联的标签,这是在该 ID 的最后一个时间戳之前执行的测量结果。我的目标是将这些数据拟合到 HMM 模型中,然后预测相同格式的测试数据集的标签。如何将此模型拟合到sklearn/hmmlearn的 HMM 模型中?sklearns 文档没有达到模型的标准,没有解释参数。

4

1 回答 1

2

由于您的问题需要预测序列的标签。您应该使用序列分类工具seqlearn 。

此外,在 HMM 中拟合数据需要一些预处理,因为它接受数组列表。您可以按时间升序连接时间戳和与每个 id 关联的三个测量值。这将为您提供每个 ID 的长度为 33 的序列。

如果您需要进一步的帮助,请告诉我。我最近将 HMMLearn 用于一个项目。

于 2015-12-03T12:15:47.093 回答