所以我目前正在对一组手术数据训练一个隐马尔可夫模型,如下所示:
nltkTrainer = nltk.tag.hmm.HiddenMarkovModelTrainer(range(15),range(90))
model = nltkTrainer.train_unsupervised(data, max_iterations=3)
如果有帮助,“模型”将作为“HiddenMarkovModelTagger 15 个状态和 90 个输出符号”给出
然而,在我的机器上运行这个完整的训练需要将近一个小时。我希望能够序列化 nltk 模型输出“模型”以在会话之间加载和保存。我已经阅读过,每个人似乎都使用 Python 内置的 pickle,它对于已知的数据类型工作得很好而且很花哨。我什至可以使用以下代码腌制我训练有素的模型变量:
f = open('my_classifier.pickle', 'wb')
pickle.dump(model, f)
f.close()
但是当尝试加载腌制文件时,我收到错误:
/usr/local/lib/python2.7/dist-packages/nltk/probability.pyc in __init__(self, probdist_dict)
1971 """
1972 defaultdict.__init__(self, DictionaryProbDist)
-> 1973 self.update(probdist_dict)
1974
1975 ##//////////////////////////////////////////////////////
TypeError: 'type' object is not iterable
有没有人找到解决这个问题的方法?NLTK 有问题吗?