我正在从这个网站学习自然语言处理。
我被困在插值视频中。
教授说:P'(W n | W n-1 , W n-2 ) = λ 1 * P(W n | W n-1 , W n-2 ) + λ 2 * P(W n | W n-1 ) + λ 3 * P(W n )
然后他说:要设置 lambda,你需要一个“保留”的数据集,然后找到使该组数据的概率最大化的 lambda。
这是否意味着您遍历所有可能的数字(无穷大),然后找到其中哪一个使概率最大化?
那是不可能的吧?那么你如何选择lambdas。找到增加概率的 lambda 很容易,找到概率也很容易,但是选择 lambda 是一件大事。
请帮助我选择 lambdas!
先感谢您!!