我正在尝试使用 lesk 查找两个单词(例如“home”和“house”)之间的相似性。
我执行了用于查找此处给出的 lesk 值的演示代码,我还使用此处的在线 ws4j 演示找到了该值
他们都给出不同的值,即
Values by executing demo code given in ws4j :
WuPalmer = 0.4
JiangConrath = 0.08467941109843881
LeacockChodorow = 1.1349799328389845
Lin = 0.16528546101187536
Resnik = 1.1692001183611416
Path = 0.1111111111111111
Lesk = 0.0
HirstStOnge = 0.0
在线演示的值:
wup( home#n#8 , house#n#10 ) = 1.0000
jcn( home#n#8 , house#n#10 ) = 12876699.5 lch
( home#n#8 , house#n#10 ) = 3.6889
lin( home#n#8 , house#n#10 ) = 1.0000
res( home#v#1 , house#v#2 ) = 9.0735
路径( home#n#8 , house#n#10 ) = 1.0000
列斯克(家#n#8,房子#n#10)= 1571
hso(家#n#8,房子#n#10)= 16
当他们都使用相同的ws4j时,为什么这两者之间的差异如此之大?演示代码有什么问题吗?