3

我正在尝试在 python 中使用 hmmlearn 来拟合隐藏的马尔可夫模型。我假设我的数据格式不正确,但是文档对于 hmmlearn 来说很简单。直观地说,我会将数据格式化为 n_observations x n_time_points x n_features 的 3 维数组,但 hmmlearn 似乎想要一个 2d 数组。

import numpy as np
from hmmlearn import hmm
X = np.random.rand(10,5,3)
clf = hmm.GaussianHMM(n_components=3, n_iter=10)
clf.fit(X)

这给出了以下错误:

ValueError: Found array with dim 3. Estimator expected <= 2.

有谁知道如何格式化数据以构建我所追求的 HMM?

4

2 回答 2

4

注意:以下所有内容都与当前未发布的 0.2.0 版本相关hmmlearn。PyPI 上可用的 0.1.0 版本使用从sklearn.hmm.

要将模型拟合到多个序列,您必须提供两个数组:

  • X--- 来自所有序列的数据的串联,
  • lengths--- 序列长度数组。

我将尝试用一个例子来说明这些约定。考虑两个一维序列

X1 = [1, 2, 0, 1, 1]
X2 = [42, 42]

要将这两个序列传递给.fit方法,我们需要首先将它们连接成一个数组,然后计算一个长度数组

X = np.append(X1, X2)
lengths = [len(X1), len(X2)]
于 2016-01-27T13:28:55.683 回答
1

在单个时间序列观察的情况下,hmmlearn 拟合方法期望数据位于二维列向量中,可以使用 reshape(-1,1) 获得:

X = np.array([1, 1, 0, -1, -1])
model = hmm.GaussianHMM(n_components=2, n_iter=100)
model.fit(X.reshape(-1,1))
于 2016-04-15T01:56:30.300 回答