我正在使用 HMM 进行场景文本识别。与 HTK 相比,我怀疑 scikit-learn HMM 代码用于训练和预测的速度,因为 sklearn HMM 是用 Python 编写的。
我的数据非常庞大(数十 GB),因此速度是一个关键问题。
希望有人可以分享一些经验。
我正在使用 HMM 进行场景文本识别。与 HTK 相比,我怀疑 scikit-learn HMM 代码用于训练和预测的速度,因为 sklearn HMM 是用 Python 编写的。
我的数据非常庞大(数十 GB),因此速度是一个关键问题。
希望有人可以分享一些经验。
HMM的sklearn实现已经外化为:https ://github.com/hmmlearn/hmmlearn
还有:https ://github.com/jmschrei/yahmm
我不知道哪个更快,也不知道它们是否可以与 HTK 相提并论。