我对englishPCFG Model 和Penn treebank 注释的目的感到困惑,Standford Parser 的包只包含所有类型的模型,如果我们已经有来自Peen treebank 的注释,它总是问我这个模型是如何工作的。简单来说,Peen Treebank Annotation 对 Parser 有什么作用,Model 是怎么出来的?如果原始文本用于解析器,是否需要查询 Treebank 来预测树木?
我正在阅读一些材料,但仍然不知道在以下步骤中何时生成模型。1、选择一个可用的树库。2、选择适合treebank注解的解析器引擎。3、选择训练和测试数据。4、在训练集上训练解析器。5、评估解析器在测试集上的准确性。6、写项目报告,附实验结果。
有人可以帮忙吗?