-1

我正在尝试识别在文本中找到的特定句法模式的所有实例:RB + NN|NNS|NP|PP。也就是说,我正在寻找紧跟在名词之后的副词。我已经使用 TreeTagger 标记了我的文本。标记的文本存储在一个名为“标签”的列表中,如下所示:

    how  WRB
    hard JJ
    it   PP
    was  VBD

这是我的代码的相关部分:

adverb = re.compile(r'RB$')
noun = re.compile(r'NN')
for n in range(len(tags)):                                                                                                                          
    w = tags[n]
    if adverb.search(w) != None and noun.search(w[n+1]) != None:
        print(' '.join(tags[n-2 : n+3]))

我的问题是第五行产生以下错误:

     if adverb.search(w) != None and noun.search(w[n+1]) != None:
     IndexError: string index out of range

如果第四行代码是这样的......

     if adverb.search(w) != None:

...然后返回副词列表。

我真的迷失了1)为什么我会犯这个错误以及2)我该如何解决它。你们可以提供的任何指导将不胜感激。

4

1 回答 1

0

你的问题是这样的:

w[n+1]

您将列表tags与该列表中的字符串混淆,w. 如果要访问列表中的另一个项目,则需要使用tags[...],而不是w[...]。此外,您应该确保您使用的索引在列表范围内。

于 2016-05-24T13:45:59.043 回答