我已经研究这篇论文(http://www.siefkes.net/papers/mrf-spamfiltering.pdf)超过几天了,但无法理解其中的任何公式第 3 节或之后。
特别是,我不明白这些部分是什么意思:
P(w|C(w) = s) /* 以给定单词为垃圾邮件为条件的文档为垃圾邮件的概率?*/
P(w|C(w) = spam) /* 这和前面的表达式的概率一样吗?为什么是“垃圾邮件”而不是“s”,反之亦然?*/
{带下标“cliques c”的乘积运算符}({带下标c的乘积运算符}(w,垃圾邮件))
/* 论文中说最里面的表达式是局部概率,但是符号我看不懂。跟在乘积算子后面的 (w, spam) 是有序集还是函数?它的功能是什么?*/
我也不理解其中包含二项式系数的任何公式,但至少对于那些我认为我知道我应该开始阅读什么的人。