2

我相信我理解 HMM 的核心。通过 HMM,我们解决了评估(发射序列的概率)、解码(最可能的隐藏序列)和学习问题(从观察到的发射序列集中学习转换和发射概率矩阵)。

我的问题与学习问题有关。我有发射序列,但我也有每个序列的相关特征(意味着隐藏状态值,但隐藏状态的数量未知)。在 HMM 的学习问题中,我们估计隐藏序列(大小和概率矩阵),为此我们只需要发射序列(如果事先不知道隐藏序列的大小可以优化)。

我正在使用 HMM进行计算。当然,它没有我想要的选项。

import numpy as np
import pandas as pd

from hmmlearn import hmm

filenames =  [f for f in os.listdir(dir_path) if '.csv' in f.lower()]
d1 = pd.read_csv(dir_path + filenames[0]).as_matrix() # Shape = [m, 3] => first two column is featute and last is the emission-state 
d2 = pd.read_csv(dir_path + filenames[1]).as_matrix() # Shape = [m, 3]


##
remodel = hmm.GaussianHMM(n_components=4, covariance_type="full", n_iter=100)

remodel.fit(d1[:, 0:2])  # Problem would have been solved if there was supervised option to pass the states as well 

pred_1 = remodel.predict(d1[:, 0:2])
true_1 = d1[:, -1] # Last column is state of the feature in 1, 2 column.

pred_2 = remodel.predict(d2[:, 0:2])
true_2 = d2[:, -1]

有没有办法在 HMM 中进行监督学习,如果是,那么如何?如果没有,我还能用 HMM 解决我的问题吗?如果有可能那怎么办?

4

1 回答 1

5

hmmlearn不实施监督学习(hmmlearn#109)。

seqlearn库实现了有监督的 HMM,但似乎没有实现 GMM。

然而,图书馆pomegranate似乎使用高斯混合模型实现了有监督的隐马尔可夫模型。像这样的东西:

import pomegranate as pg

X = ...
y = ...
distribution = pg.MultivariateGaussianDistribution
model = pg.HiddenMarkovModel.from_samples(distribution, n_components=5, X=X, labels=y, algorithm='labeled')
于 2019-03-29T23:06:19.340 回答