我有一组句子。对于它们中的每一个,我想获得一个“通用”类型的依赖关系图,其中每个单词都被相应的 POS 标签替换(除了动词和一些关键字,如LOCATION和TARGET)。
例如,从句子
take a left turn till you come to a LOCATION
我想获得
amod(take,JJ)dobj(take,NN)mark(come,IN)nsubj(come,PP)prep_to(come,LOCATION)
更简单的方法是什么?
我有一组句子。对于它们中的每一个,我想获得一个“通用”类型的依赖关系图,其中每个单词都被相应的 POS 标签替换(除了动词和一些关键字,如LOCATION和TARGET)。
例如,从句子
take a left turn till you come to a LOCATION
我想获得
amod(take,JJ)dobj(take,NN)mark(come,IN)nsubj(come,PP)prep_to(come,LOCATION)
更简单的方法是什么?
行。我通过一些树操作解决了这个问题。
public static void exploreTree(Tree t) {
List<Tree> child = t.getChildrenAsList();
Tree terminal;
for (Tree c : child) {
if (c.isPreTerminal()) {
terminal = c.getChild(0);
String t_value = terminal.value();
String c_value = c.value();
if (!c_value.startsWith("VB")) {
if (!t_value.equals("LOCATION") && !t_value.equals("TARGET")) {
terminal.setValue(c.value());
}
}
// test[1].setValue(test[0].value());
} else
exploreTree(c);
}
}
它根据我的要求更改斯坦福解析器树的内部数据。也许不是最优雅和最强大的解决方案,但有效。