作为一个附带项目,我想为我的 NVidia 显卡实现一个隐马尔可夫模型,这样我就可以让它快速执行并使用多个内核。
我正在查看 Forward-Backward 算法,想知道我可以在这里并行处理什么?例如,如果你看一下算法的前向部分,矩阵乘法可以划分为并行完成,但是依赖于上一步的算法的迭代部分可以以任何方式并行化吗?是否有某种数学技巧可以在这里应用?
谢谢,
米
http://en.wikipedia.org/wiki/Forward%E2%80%93backward_algorithm#Example