Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
因此,为了构建语言模型,将超出词汇量的频率较低的单词替换为“UNK”。
我的问题是,如何评估这种基于“UNK”评估概率的语言模型?假设我们想在测试集上评估这种语言模型的困惑度,对于模型未知的单词,我们得到的概率是基于未知单词的“包”来评估的。
这似乎有问题,因为如果我们将词汇量设置为 1,即所有单词都是未知的,那么这个无所事事的语言模型的 perplexity 将是 1。
这个文件很好地解释了这个问题:
https://web.stanford.edu/~jurafsky/slp3/4.pdf
简而言之,困惑度应该只在具有相同词汇的语言模型之间进行比较。