1

我试图了解 NLP 中的最大可能性是什么。我在看这个演示文稿:

http://www.phontron.com/slides/nlp-programming-en-01-unigramlm.pdf(第 9 页)

我在 Manning 和 Schütze 的《统计语言处理基础》中看到了相同的方程式。

现在,我理解 MLE 的方式是这样的:

我知道实验的结果,我知道潜在的分布,但我不知道单个事件的概率。MLE 通过查找在我的观察中最有可能的概率值来帮助我找到概率(或更一般的未知参数)。

所以 MLE 告诉我,当任何单个事件的概率为 x 时,观察某个事件的概率最高。

现在,如果这是真的,为什么那张幻灯片上没有微积分?为什么在这种情况下 MLE 是用一个简单的分数计算的?我不明白这与 MLE 有什么关系?

我想,MLE 是一个最大化问题......?

4

1 回答 1

1

MLE 确实是一个最大化问题。在幻灯片中,他们跳过了计算,只是指出了 MLE 的结果。如果您想查看完整的推导,可以查看此处的第 3 页,例如 http://statweb.stanford.edu/~susan/courses/s200/lectures/lect11.pdf

此链接解释了如何找到多项分布参数的最大似然估计,并且相同类型的计算也会导致您在幻灯片中看到的结果。

nin 链接对应于您的c(w1,…,wi−1)幻灯片(因为这是案例总数),x_iin 链接对应c(w1,…,wi)于您的幻灯片(因为这是您要计算的特定案例的总数,在所有案例中)。

于 2017-03-15T20:55:49.750 回答