我GATE NLP
用来处理我的文档,我想使用实体名称作为标签候选者在 Gate 有OpenNLP
,当我在这里LingPipe
阅读答案表格时, @Shashikant Kore 回答他说
如果你有句子“我的朋友 Joe Smith 去了沃尔玛商店”,OpenNLP 会识别出两个命名实体——“Joe Smith”和“Walmart”。我无法将“Joe Smith”标记为“个人”,将“Walmart”标记为“组织”。
并建议使用LingPipe
,所以我使用了 Gate NLP 中提供的 LingPipe,如下所示
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
Corpus corpus = Factory.newCorpus("SegmenterCorpus");
Document document = Factory.newDocument(handler.toString());
corpus.add(document);
pipeline.setCorpus(corpus);
pipeline.execute();
但是,当我运行我的程序时,我有这个异常
线程“main”gate.creole.ResourceInstantiationException 中的异常:未提供模型文件!在gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55) 在gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)
没有提供模型文件是什么意思?抱歉,因为我在问这个问题,但我对这个领域完全陌生,我刚刚了解了 ANNIE,当我使用它来提取 POS 标记时它不需要任何文件有任何帮助吗?