这是一些基于库pymeta2的 Python 代码,用于解析这种类型的树。
import pymeta.grammar
def f(name,E):
print name+' -> '+' '.join(E)
return name
G=pymeta.grammar.OMeta.makeGrammar("""
name = spaces ('.'|letterOrDigit|'-')+:n -> ''.join(n)
expr = token("(") name:p expr+:e token(")") -> f(p,e)
| token("(") name:p name:e token(")") -> p
""",{'f':f})
s="(ROOT (S (NP (ADJP (JJ Bahasa)) (NN daerah) (NN merupakan) (NN bahasa) (NN yang) (NN digunakan) (NN dalam) (NN bahasa) (NN pergaulan) (NN sehari-hari) (NN di) (NN suatu) (NN daerah) (NNP tertentu)) (VP (VBZ .))))"
G(s).apply("expr")
运行此代码的输出是:
ADJP -> JJ
NP -> ADJP NN NN NN NN NN NN NN NN NN NN NN NN NNP
VP -> VBZ
S -> NP VP
ROOT -> S
(我必须在 (JJ Bahasa) 之后添加一个额外的括号才能完成这项工作。我怀疑这是问题中的错字?)