3

GATE NLP用来处理我的文档,我想使用实体名称作为标签候选者在 Gate 有OpenNLP,当我在这里LingPipe 阅读答案表格时, @Shashikant Kore 回答他说

如果你有句子“我的朋友 Joe Smith 去了沃尔玛商店”,OpenNLP 会识别出两个命名实体——“Joe Smith”和“Walmart”。我无法将“Joe Smith”标记为“个人”,将“Walmart”标记为“组织”。

并建议使用LingPipe,所以我使用了 Gate NLP 中提供的 LingPipe,如下所示

SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
        pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
        Corpus corpus = Factory.newCorpus("SegmenterCorpus");
        Document document = Factory.newDocument(handler.toString());
        corpus.add(document); 
        pipeline.setCorpus(corpus); 
        pipeline.execute();

但是,当我运行我的程序时,我有这个异常

线程“main”gate.creole.ResourceInstantiationException 中的异常:未提供模型文件!在gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55) 在gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)

没有提供模型文件是什么意思?抱歉,因为我在问这个问题,但我对这个领域完全陌生,我刚刚了解了 ANNIE,当我使用它来提取 POS 标记时它不需要任何文件有任何帮助吗?

4

1 回答 1

2

最后它对我有用。

我在 GATE GUI 中尝试过File-> Ready Made Applications-> LingPipe-> 。LingPipe IE System并且已经加载好了。

工作模型是: $gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker

完整的相关配置gate.lingpipe.NamedEntityRecognizerPR是:

...    
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
  <urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...

GATE 屏幕剪辑

于 2016-03-07T14:34:44.673 回答