我正在尝试识别在文本中找到的特定句法模式的所有实例:RB + NN|NNS|NP|PP。也就是说,我正在寻找紧跟在名词之后的副词。我已经使用 TreeTagger 标记了我的文本。标记的文本存储在一个名为“标签”的列表中,如下所示:
how WRB
hard JJ
it PP
was VBD
这是我的代码的相关部分:
adverb = re.compile(r'RB$')
noun = re.compile(r'NN')
for n in range(len(tags)):
w = tags[n]
if adverb.search(w) != None and noun.search(w[n+1]) != None:
print(' '.join(tags[n-2 : n+3]))
我的问题是第五行产生以下错误:
if adverb.search(w) != None and noun.search(w[n+1]) != None:
IndexError: string index out of range
如果第四行代码是这样的......
if adverb.search(w) != None:
...然后返回副词列表。
我真的迷失了1)为什么我会犯这个错误以及2)我该如何解决它。你们可以提供的任何指导将不胜感激。