因此,我正在尝试为隐藏马尔可夫模型训练一个非常大的特征数组:700 x (400 x 4122),其中每个 400x4122 迷你数组是一个跨 400 个具有 4122 个特征的时间戳的观察样本序列。总共有 700 个这样的序列,当连接起来时,相当于约 45GB 的内存。我的问题是:你如何使用这种大小的数组?
在hmmlearn python 包中,通常使用多个序列,如下所示:
x1 -> 400x4122 序列
x2 -> 另一个 400x4122 序列
...
xn -> 第 700 个 400x4122 序列
X = np.concatenate(x1, x2, ..., xn)
长度 = [len(x1), len(x2),..., len(xn)]
模型 = GaussianHMM(n_component = 6, ...).fit(X, length = lengths)
换句话说,需要连接整个序列数组并输入到训练函数中。但是,我想知道是否有一种方法可以一次输入一个 400x4122 序列,因为整个串联数组太大而无法使用。
提前致谢。