我遇到了几种使用 WordNet 的结构和层次结构来测量语义相似度的方法,例如,Jiang and Conrath measure (JNC)、Resnik measure (RES)、Lin measure (LIN) 等。
使用 NLTK 测量它们的方式是:
sim2=wn.jcn_similarity(entry1,entry2,brown_ic)
sim3=entry1.res_similarity(entry2, brown_ic)
sim4=entry1.lin_similarity(entry2,brown_ic)
如果 WordNet 是计算语义相似度的基础,那么 Brown Corpus 在这里有什么用呢?