0

我有一系列数据(类似于蛋白质数据),我想使用隐藏马尔可夫模型(mhmm)的混合来对它们进行聚类。我选择seqHMM包来做。但是当我想训练一个 mhmm 模型时,它给出了这个错误:

build_mhmm(observations = dat, n_states = c(4, 4, 6))

FUN(X[[i]], ...) 中的错误:seqdata 应该是状态序列对象、事件序列对象或后缀树。使用 seqdef 或 seqecreate。

我试图为dat. 一个是正​​常序列,另一个是序列矩阵。例如:

dat<-data.frame(matrix(c("e","f","j","o","d","o","p","k","k","a","d","c"),ncol = 4,nrow = 3))
#  X1 X2 X3 X4
#1  e  o  p  a
#2  f  d  k  d
#3  j  o  k  c

matrix(paste(dat$X1,dat$X2,dat$X3,dat$X4),nrow = nrow(dat))
#1 "eopa"
#2 "fdkd"
#3 "jokc"

我应该如何更改数据的格式以使其具有可读性build_mhmm?数据已经存在,我不想使用任何包重新创建它们。我想操纵它们并将它们作为正确的输入。

4

1 回答 1

1

我找到了答案。我应该使用seqdef(dat)表单包TraMineR而不是函数datbuild_mhmm

于 2018-03-04T16:45:53.193 回答