1

因此,我正在尝试为隐藏马尔可夫模型训练一个非常大的特征数组:700 x (400 x 4122),其中每个 400x4122 迷你数组是一个跨 400 个具有 4122 个特征的时间戳的观察样本序列。总共有 700 个这样的序列,当连接起来时,相当于约 45GB 的内存。我的问题是:你如何使用这种大小的数组?

hmmlearn python 包中,通常使用多个序列,如下所示:

x1 -> 400x4122 序列

x2 -> 另一个 400x4122 序列

...

xn -> 第 700 个 400x4122 序列

X = np.concatenate(x1, x2, ..., xn)

长度 = [len(x1), len(x2),..., len(xn)]

模型 = GaussianHMM(n_component = 6, ...).fit(X, length = lengths)

换句话说,需要连接整个序列数组并输入到训练函数中。但是,我想知道是否有一种方法可以一次输入一个 400x4122 序列,因为整个串联数组太大而无法使用。

提前致谢。

4

0 回答 0