几周以来,我一直在寻找解决方案,我有一些文件(大约 95 个)正在尝试使用 GATE 进行分类。我已将它们放在一个名为 training_corpus 的语料库中,但是,在 ANNIE 对语料库进行注释之后,我必须返回每个文件,选择文档中的所有标记,并创建一个名为 Mention 的注释,其中包含特征类型和类值为文档。例如:
type Start End id Features
Mention 0 70000 2588 {type=neg}
无论如何,有没有用 JAPE 自动执行此操作?基本上,我想选择所有标记并使用功能(类型=类)创建一个新注释。此外,该类被附加到文档中。由于文档很多,JAPE 可以从文档名称中提取类并将其设置为 Mentions 特征的值。示例文档名称为 neg_data1.txt,因此注释将为 Mention.type = neg?
任何帮助将不胜感激。谢谢