对于生成的 Brill 标记规则:
Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])
我知道:
'CS'
是从属连词
'QL'
是限定词
我猜:
[(Word([1, 2, 3]),'as')]
表示规则的条件。它代表单词'as'
出现在目标单词之前的第一个、第二个或第三个位置。目标词是要被 POS 标签标记的词。
我不知道:这是什么意思'016'
?如何从整体上解读规则?
对于生成的 Brill 标记规则:
Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])
我知道:
'CS'
是从属连词
'QL'
是限定词
我猜:
[(Word([1, 2, 3]),'as')]
表示规则的条件。它代表单词'as'
出现在目标单词之前的第一个、第二个或第三个位置。目标词是要被 POS 标签标记的词。
我不知道:这是什么意思'016'
?如何从整体上解读规则?
规则的文档在这里。
016
将是templateid
,即用于创建规则的模板。您还可以获得规则的描述:
q = Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])
q.format('verbose')
'CS -> QL if the Word of words i+1...i+3 is "as"'
在这种情况下,实际上是目标词之后的词。(由 表示i+1...
)