0

我已经提取了每个单词的同义词。现在我想获取每个同义词集的域或类别,例如,如果我有light我想要的词,physics即同义词集的域。

现在假设我有同义词集,sense这应该通过以下方式完成:

Pointer[] domain = sense.getPointers(PointerType.CATEGORY);

通过这样做,我总是会domain" empty出错。我哪里错了?

此外,有没有办法获得一个指示域的字符串?

4

2 回答 2

1

好的,似乎没有人对此感兴趣,但我会发布我的工作解决方案。

 //'WordnetPOS' is an instance of the class POS defined in JWNL. It indicates the part of        
//speech tag. token
JWNL.initialize(new FileInputStream("path/file_properties.xml"));
Dictionary wordnet = Dictionary.getInstance();
IndexWord token = wordnet.lookupIndexWord(WordnetPos, word); //word is a string
Synset[] senses = token.getSenses();
String Dom = new String();

for (int i = 0; i < senses.length; i++) {
   String domSet = new String();
   try {

   //CATEGORY is the pointer type of the synset containing the domains

   Pointer[] pointerArr = senses[i].getPointers(PointerType.CATEGORY);
   for (Pointer pointer : pointerArr) {
       Synset syn = pointer.getTargetSynset();
       Word[] words = syn.getWords();
       for (Word word : words) {
           domaSet = domaSet + word.getLemma().trim().toLowerCase() + " ";
       }
   }
   catch (NullPointerException e) {
   }
   Dom = Dom + domSet;
}
于 2014-03-13T09:42:45.230 回答
0

非常感谢您发布您的解决方案。这是一个很好的例子,它对我非常有用。但是我想我也可以与社区的其他人分享这个。

WordNet 具有上位词/下位词层次结构。例如,当您查找守门员时:

Synset('physical_entity.n.01') 
Synset('causal_agent.n.01') 
Synset('person.n.01')
Synset('contestant.n.01')
Synset('athlete.n.01')
Synset('soccer_player.n.01')
Synset('goalkeeper.n.01')

但是,使用 WordNet Domains 项目可能是一种不同的方法。回到守门员的例子,它可以返回 [sport->football; sport->hockey] 或 [football;hockey] 或只是 'football'

欲了解更多信息,请随时查看Get WordNet's domain name for the specified word

于 2015-11-15T21:46:13.630 回答