为每个句子生成以下指定规则。我们必须为每个句子对它们进行分组。输入在文件中。输出也应该在文件中
sentenceid=2
NP--->N_NNP
NP--->N_NN_S_NU
NP--->N_NNP
NP--->N_NNP
NP--->N_NN_O_NU
VGF--->V_VM_VF
sentenceid=3
NP--->N_NN
VGNF--->V_VM_VNF
JJP--->JJ
NP--->N_NN_S_NU
NP--->N_NN
VGF--->V_VM_VF
sentenceid=4
NP--->N_NNP
NP--->N_NN_S_NU
NP--->N_NNP_O_M
VGF--->V_VM_VF
上面包含输入的部分,实际上是每个句子的语法。我想对相邻的规则句子进行分组。输出应如下所示。
sentenceid=2
NP--->N_NNP N_NN_S_NU N_NNP N_NNP N_NN_O_NU
VGF--->V_VM_VF
sentenceid=3
NP--->N_NN
VGNF--->V_VM_VNF
JJP--->JJ
NP--->N_NN_S_NU N_NN
VGF--->V_VM_VF
senetnceid=4
NP--->N_NNP N_NN_S_NU N_NNP_O_M
VGF--->V_VM_VF
我该如何实施?我需要近 1000 句规则来进行概率计算。这是每个句子的 CFG 语法,我想按句子对相邻规则进行分组。