我是 nltk 图书馆的新手,我尝试用我自己的语料库教我的分类器一些标签。
为此,我有一个带有 IOB 标签的文件,如下所示:
How O
do B-MYTag
you I-MYTag
know O
, O
where B-MYTag
to O
park O
? O
我这样做:
self.classifier = nltk.MaxentClassifier.train(train_set, algorithm='megam', trace=0)
它有效。
如何训练我classifier
的负面案例?
我会有类似的带有 IOB 标签的文件,并且我会指定这个文件设置错误。(负重)
我怎样才能做到这一点?
否定情况的示例是:
How B-MYTag
do O
you O
know O
, O
where B-MYTag
to O
park O
? O
在那之后,我希望记住 How 可能不是 MYTag... 这样做的原因是,分类器学习得更快。
如果我可以只输入语句,程序会处理它,最后问我是否对结果满意。如果是,则此文本将添加到 . train_set
,否则将添加到negative_train_set
.
这样,教分类器正确的东西会更容易和更快。