从版本 2.0 (02.03.2012)开始,Stanford Parser 现在是“线程安全的” 。我目前正在运行命令行工具,无法弄清楚如何通过线程化程序来利用我的多个内核。
过去,这个问题已经用“Stanford Parser 不是线程安全的”来回答,正如常见问题解答中所说的那样。我希望找到成功线程化最新版本的人。
我曾尝试使用 -t 标志(-t10 和 -tLLP),因为这是我在搜索中所能找到的所有内容,但两者都抛出错误。
我发出的命令示例是:
java -cp stanford-parser.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser \
-outputFormat "oneline" ./grammar/englishPCFG.ser.gz ./corpus > corpus.lex