0

我有一个大的马尔可夫链和一个样本,我想计算它的可能性。问题是样本中的某些观察或转换不会发生在马尔可夫链中,这使得总可能性为 0(或对数似然 - 无穷大)。不可能使用更多的数据来构建马尔可夫链。我想知道是否有办法仍然有一个有意义的可能性。

我已经尝试过滤掉样本中的这些“未知”观察结果并单独报告它们。但问题是我想将样本的可能性与同一样本的可能性进行比较,但在转换之后。转换后的样本具有不同数量的“未知”观察值。所以我认为我不能比较这两种可能性,因为它们是用不同数量的观察值计算出来的。

有没有办法仍然计算可以比较的有意义的可能性?我正在考虑对样本中观察的概率进行平均,但我找不到任何关于正确的信息。

提前致谢!

4

1 回答 1

2

简而言之 - 概率模型中的关键是概率分布估计器。似乎您使用了最琐碎的可能 - 经验估计器,形式为

p(event) = count(event) / [count(event) + count(not-event)]

对于未见过的事件估计为 0 概率,这会导致明显的问题。有几十个估计器没有这个问题,最简单的估计器之一是拉普拉斯平滑,您假设对于看不见的事件存在一定数量的概率限制

p(event) = [count(event) + alpha] / [count(event) + count(not-event) + alpha * #event-types]

这样,即使是未发生的事件也具有非零概率。

于 2015-08-14T15:51:06.933 回答