我正在研究马尔可夫随机场,显然,MRF 中的推理很难/计算成本很高。具体来说,Kevin Murphy 的《机器学习:概率视角》一书说:
“在第一项中,我们将 y 固定为其观察值;这有时称为钳位项。在第二项中,y 是自由的;这有时称为未钳位项或对比项。请注意,计算未钳位项需要推理在模型中,这必须在每个梯度步骤中完成一次。这使得训练无向图模型比训练有向图模型更难。
为什么我们在这里进行推理?我知道我们正在对所有 y 求和,这似乎很昂贵,但我看不出我们实际上在哪里估计任何参数。Wikipedia 还讨论了推理,但只讨论了计算条件分布,以及需要对所有未指定的节点求和……但是……这不是我们在这里要做的,是吗?
或者,任何人都对为什么 MRF 中的推理很困难有很好的直觉?
资料来源:ML:PP 第 19 章:https ://www.cs.ubc.ca/~murphyk/MLbook/pml-print3-ch19.pdf
具体部分见下文