1

我想使用斯坦福 NER 在多个文件中标记名称实体。在文档中,据说我们可以使用-testFiles带有逗号分隔的测试文件列表的选项,但在我的情况下它不起作用,例如:

java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier
     -loadClassifier ner-model.ser.gz -testFiles Test_file1.tsv,Test_file2.tsv

但是当我们只输入一个文件时它可以工作。

系统是否也对所有多个文件进行内联评估(FOR P、R)?我只是想知道在多个文件的情况下它是如何工作的。

提前致谢。

哈达卡

4

1 回答 1

1

您必须使用 prop.txt 文件才能使用多个 tsv 文件。检查此链接

https://nlp.stanford.edu/software/crf-faq.html#mfiles

以下是NER FAQ页面的片段

如何从多个文件中训练一个模型?

不要设置 trainFile 属性或标志,而是设置 trainFileList 属性或标志。使用逗号分隔的文件列表。

于 2019-11-06T09:45:10.650 回答