我需要找出两个输入词之间的语义相似性/相关性。以下单词在现实世界中相似或相关:-
- genuineness, genuine, genuinely, valid, reality, fact, really
- painter, painting, paint
以下是我从这里截取的代码
ILexicalDatabase db = new NictWordNet();
RelatednessCalculator lin = new Lin(db);
RelatednessCalculator wup = new WuPalmer(db);
RelatednessCalculator path = new Path(db);
String w1 = "truth";
String w2 = "genuine";
System.out.println(lin.calcRelatednessOfWords(w1, w2));
System.out.println(wup.calcRelatednessOfWords(w1, w2));
System.out.println(path.calcRelatednessOfWords(w1, w2));
我在 Eclipse 3.4 中使用 WS4J Api (ws4j1.0.1.jar) 和 java 1.7。我得到以下没有意义的结果,或者我的看法可能是错误的。
如果我的方法是错误的,请让我知道如果我想计算单词之间的相似性,那么我应该使用什么其他 api。