language-model - 语言模型评估如何处理未知单词？

Question

因此，为了构建语言模型，将超出词汇量的频率较低的单词替换为“UNK”。

我的问题是，如何评估这种基于“UNK”评估概率的语言模型？假设我们想在测试集上评估这种语言模型的困惑度，对于模型未知的单词，我们得到的概率是基于未知单词的“包”来评估的。

这似乎有问题，因为如果我们将词汇量设置为 1，即所有单词都是未知的，那么这个无所事事的语言模型的 perplexity 将是 1。

score 0 · Accepted Answer

这个文件很好地解释了这个问题：

简而言之，困惑度应该只在具有相同词汇的语言模型之间进行比较。

1 回答 1