您好,我接到了有关信息检索的任务,但我不知道如何创建该部分规范,我的意思是像这里这样的词的价值:http: //nlp.stanford.edu/IR-book/html/htmledition/finite-自动机和语言模型 1.html
= 0.2
a = 0.1
青蛙 = 0.01... 等等。如果有人解释如何计算这些值,我将不胜感激。
了解语言模型!
a) 解释这个想法!
b) 考虑以下文档集合:
D1:今天是晴天。阳光明媚的柏林!生存还是毁灭。
D2:她今天在柏林。她是一个阳光明媚的女孩。柏林总是令人兴奋!
计算每个文档对应的一元语言模型!假设停止概率在模型之间是固定的(并且等于 0:2)。使用这些模型对给定查询 \sunny Berlin" 的文档进行排名!