0

我需要使用 Stanford parsed 解析数百个大文件,当我解析 20 个文件时需要 2 个小时来解析,有什么办法可以在更短的时间内做到这一点。

下面是我解析单个文件的代码

TreebankLanguagePack tlp = new PennTreebankLanguagePack();
GrammaticalStructureFactory gsf = tlp.grammaticalStructureFactory();

for (List<HasWord> sentence : new DocumentPreprocessor("C://sample.txt")) {
    Tree parse = lp.apply(sentence);
    GrammaticalStructure gs = gsf.newGrammaticalStructure(parse);
    Collection tdl = gs.typedDependenciesCCprocessed();

    pw.print(parse.pennString());
    pw.println(tdl.toString());

}

谢谢

4

0 回答 0