我需要使用 Stanford parsed 解析数百个大文件,当我解析 20 个文件时需要 2 个小时来解析,有什么办法可以在更短的时间内做到这一点。
下面是我解析单个文件的代码
TreebankLanguagePack tlp = new PennTreebankLanguagePack();
GrammaticalStructureFactory gsf = tlp.grammaticalStructureFactory();
for (List<HasWord> sentence : new DocumentPreprocessor("C://sample.txt")) {
Tree parse = lp.apply(sentence);
GrammaticalStructure gs = gsf.newGrammaticalStructure(parse);
Collection tdl = gs.typedDependenciesCCprocessed();
pw.print(parse.pennString());
pw.println(tdl.toString());
}
谢谢