nltk 中的 brill 标记器在标记指令数据时出现错误。例如:“heat until brown”,将被标记为“[[('heat', 'NN'), ('until', 'IN'), ('brown', 'JJ')]]"。指令数据集中的大多数动词将被标记为“NN”。
所以我想修改brill tagger中的规则,并根据我的烹饪动词列表来改变标签。例如:如果'IN'之前没有'VB',并且'IN'之前有一个标记,并且在我的烹饪动词列表中标记为'NN',则将'NN'更改为'VB'。
但是,我不知道如何在 brill 标记器中插入我自己的规则(具体来说,我正在查看 nltk 源代码:https ://www.nltk.org/_modules/nltk/tbl/template.html )。有人可以帮忙吗?
谢谢!