我想使用 biopython 的 Bio.MarkovModel.train_visible() 为核苷酸序列训练二阶马尔可夫模型。那是,alphabet=["A","T","G","C"], states=["AA","AT","TT"...]
但是,我收到一个错误:
474 states_indexes = itemindex(states)
475 outputs_indexes = itemindex(alphabet)
--> 476 for toutputs, tstates in training_data:
477 if len(tstates) != len(toutputs):
478 raise ValueError("states and outputs not aligned")
ValueError: too many values to unpack (expected 2)
表明我可能已经尝试将我的 training_data 作为一对列表提供:
training_data=(['A','T'...],['AA','AT'...])
并作为此列表对的压缩列表:
training_data=[('A','AA'),('T','AT')...]
但无济于事。什么是正确的格式training_set
?谢谢!