我需要识别与动词相关的所有依赖标签。到目前为止,我已经确定:
'根'
'xcomp'
spacy.explain('xcomp') Out[72]: 'open clausal complement'
- '辅助'
spacy.explain('aux') Out[73]: 'auxiliary'
还有其他人吗?
我需要识别与动词相关的所有依赖标签。到目前为止,我已经确定:
'根'
'xcomp'
spacy.explain('xcomp') Out[72]: 'open clausal complement'
spacy.explain('aux') Out[73]: 'auxiliary'
还有其他人吗?
我使用 NLTK 网络文本语料库来获取词性是动词的依赖标记的计数。
from collections import Counter
from nltk.corpus import webtext
import spacy
nlp = spacy.load('en_core_web_lg')
nlp.max_length = 10**50
doc = nlp(webtext.raw())
print(Counter([tok.dep_ for tok in doc if tok.pos_=='VERB']))
输出:
Counter({'ROOT': 18067, 'aux': 4649, 'advcl': 4159, 'xcomp': 3102, 'ccomp': 3094, 'conj': 2568, 'acl': 1395, 'relcl': 1311, 'amod': 1073, 'pcomp': 1059, 'parataxis': 594, 'compound': 519, 'csubj': 458, 'nsubj': 248, 'dobj': 237, 'dep': 187, 'pobj': 174, 'intj': 157, 'auxpass': 148, 'nmod': 131, 'appos': 119, 'acomp': 119, 'prep': 63, 'attr': 46, 'npadvmod': 40, 'nsubjpass': 24, 'advmod': 21, 'oprd': 17, 'punct': 14, 'poss': 8, 'csubjpass': 6, 'nummod': 4, 'cc': 3, 'preconj': 2, 'mark': 1, 'meta': 1})