我已经提取了每个单词的同义词。现在我想获取每个同义词集的域或类别,例如,如果我有light
我想要的词,physics
即同义词集的域。
现在假设我有同义词集,sense
这应该通过以下方式完成:
Pointer[] domain = sense.getPointers(PointerType.CATEGORY);
通过这样做,我总是会domain" empty
出错。我哪里错了?
此外,有没有办法获得一个指示域的字符串?
好的,似乎没有人对此感兴趣,但我会发布我的工作解决方案。
//'WordnetPOS' is an instance of the class POS defined in JWNL. It indicates the part of
//speech tag. token
JWNL.initialize(new FileInputStream("path/file_properties.xml"));
Dictionary wordnet = Dictionary.getInstance();
IndexWord token = wordnet.lookupIndexWord(WordnetPos, word); //word is a string
Synset[] senses = token.getSenses();
String Dom = new String();
for (int i = 0; i < senses.length; i++) {
String domSet = new String();
try {
//CATEGORY is the pointer type of the synset containing the domains
Pointer[] pointerArr = senses[i].getPointers(PointerType.CATEGORY);
for (Pointer pointer : pointerArr) {
Synset syn = pointer.getTargetSynset();
Word[] words = syn.getWords();
for (Word word : words) {
domaSet = domaSet + word.getLemma().trim().toLowerCase() + " ";
}
}
catch (NullPointerException e) {
}
Dom = Dom + domSet;
}
非常感谢您发布您的解决方案。这是一个很好的例子,它对我非常有用。但是我想我也可以与社区的其他人分享这个。
WordNet 具有上位词/下位词层次结构。例如,当您查找守门员时:
Synset('physical_entity.n.01')
Synset('causal_agent.n.01')
Synset('person.n.01')
Synset('contestant.n.01')
Synset('athlete.n.01')
Synset('soccer_player.n.01')
Synset('goalkeeper.n.01')
但是,使用 WordNet Domains 项目可能是一种不同的方法。回到守门员的例子,它可以返回 [sport->football; sport->hockey] 或 [football;hockey] 或只是 'football'
欲了解更多信息,请随时查看Get WordNet's domain name for the specified word