好的,我有以下代码来训练来自 OpenNLP 的 NER 标识符
FileReader fileReader = new FileReader("train.txt");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);
我不知道我是否做错了什么,如果缺少某些东西,但分类不起作用。我假设 train.txt 是错误的。
发生的错误是所有令牌都被分类为仅一种类型。
我的 train.txt 数据类似于以下示例,但具有更多的变化和条目数量。另一件事是我每次从文本中逐字分类,而不是所有标记。
<START:distance> 8000m <END>
<START:temperature> 100ºC <END>
<START:weight> 50kg <END>
<START:name> Renato <END>
有人可以证明我做错了什么?