如何使用嵌入式 GATE 的斯坦福解析器(通过 Java 代码使用 GATE)。我目前在我的机器上使用 GATE_Developer_7.0;我知道 GATE 中有 Stanford Parser 的插件,但不知道如何使用 java 代码来使用它。
谢谢
如何使用嵌入式 GATE 的斯坦福解析器(通过 Java 代码使用 GATE)。我目前在我的机器上使用 GATE_Developer_7.0;我知道 GATE 中有 Stanford Parser 的插件,但不知道如何使用 java 代码来使用它。
谢谢
我们一直为 GATE Embedded 推荐的常用方法是使用 GATE Developer 构建您的管道,对其进行测试并通过在 GUI 中处理示例文档对其进行调试。一旦您对应用程序感到满意,请使用“保存应用程序状态”或“为 GATECloud.net 导出”来生成保存状态,然后您可以使用PersistenceManager
. 这将自动确保加载所有必要的插件,并且通常比尝试在代码中手动构建管道更简单且不易出错。
GATE 网站上的BatchProcessApp 示例展示了如何使用 PersistenceManager 加载保存的应用程序,本质上是
Gate.init(); // always the first thing you do
CorpusController controller = (CorpusController)PersistenceManager
.loadObjectFromFile(new File("/path/to/application.xgapp"));
Corpus corpus = Factory.newCorpus("myCorpus");
controller.setCorpus(corpus);
然后对于您要处理的每个文档
Document doc = Factory.newDocument(....);
corpus.add(doc);
try {
controller.execute();
// code here to do stuff with the annotated document, e.g. extract
// annotations/features
} finally {
corpus.clear();
Factory.deleteResource(doc);
}