7

我的问题与WordNet Interface有关。

   >>> wn.synsets('cat')
       [Synset('cat.n.01'), Synset('guy.n.01'), Synset('cat.n.03'),
        Synset('kat.n.01'), Synset('cat-o'-nine-tails.n.01'), 
        Synset('caterpillar.n.02'), Synset('big_cat.n.01'), 
        Synset('computerized_tomography.n.01'), Synset('cat.v.01'), 
        Synset('vomit.v.01')]
    >>> 

我在or中找不到关于目的n和以下内容的答案。numbercat.n.01caterpillar.n.02

4

1 回答 1

10

根据NLTK 文档,一个<lemma>.<pos>.<number>Synset 字符串由以下部分组成:

  • <lemma>是词的形态词干
  • <pos>是模块属性 ADJ、ADJ_SAT、ADV、NOUN 或 VERB 之一
  • <number>是感觉数,从 0 开始计数

因此,<pos>是词性。根据wordnet 手册页,词性字符具有以下含义:

n    NOUN
v    VERB
a    ADJECTIVE
s    ADJECTIVE SATELLITE
r    ADVERB 

<number>用于消除词义的歧义。

于 2016-01-16T19:51:49.563 回答