斯坦福解析器在线给出的类型化依赖和给出的源代码生成的依赖并不相同。
斯坦福网站上提供的源代码版本不生成缩写、所有格和 poss 标签。
使用哪个版本的斯坦福解析器来生成这些标签?
他们是一样的。答案是您必须以一种会导致输入标记化的方式调用解析器。一些例子是:
LexicalizedParser lp = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");
String sent = "This is one last test!";
lp.apply(sent).pennPrint();
或者在更复杂的场景中:
TreebankLanguagePack tlp = lp.getOp().langpack();
Tokenizer<? extends HasWord> toke = tlp.getTokenizerFactory().getTokenizer(new StringReader(sent));
List<? extends HasWord> sentence = toke.tokenize();
lp.apply(sentence);