我有一系列数据(类似于蛋白质数据),我想使用隐藏马尔可夫模型(mhmm)的混合来对它们进行聚类。我选择seqHMM
包来做。但是当我想训练一个 mhmm 模型时,它给出了这个错误:
build_mhmm(observations = dat, n_states = c(4, 4, 6))
FUN(X[[i]], ...) 中的错误:seqdata 应该是状态序列对象、事件序列对象或后缀树。使用 seqdef 或 seqecreate。
我试图为dat
. 一个是正常序列,另一个是序列矩阵。例如:
dat<-data.frame(matrix(c("e","f","j","o","d","o","p","k","k","a","d","c"),ncol = 4,nrow = 3))
# X1 X2 X3 X4
#1 e o p a
#2 f d k d
#3 j o k c
和
matrix(paste(dat$X1,dat$X2,dat$X3,dat$X4),nrow = nrow(dat))
#1 "eopa"
#2 "fdkd"
#3 "jokc"
我应该如何更改数据的格式以使其具有可读性build_mhmm
?数据已经存在,我不想使用任何包重新创建它们。我想操纵它们并将它们作为正确的输入。