java - 为新语言训练斯坦福 RSS 和 Shift Reduce 解析器

翻译自：https://stackoverflow.com/questions/44105237 2017-05-22T05:29:35.660

42 次

1

我想用现有的树库训练基于选区的斯坦福解析器（RSS 和 Shift Reduce），但无法在网上找到足够的信息来做到这一点。两个关键问题：

我应该以什么格式导出我的树库以便能够训练每个解析器？（我注意到“标准树库格式”应该用于 SR 解析器 - 但我找不到这种格式的规范。如果它与 PENN 树库使用的格式相同，树应该如何拆分？在一个单个文件根据换行符分隔？在单独的文件中？）
我正在通过在 IDE 中编写一些 Java 代码以编程方式尝试此操作。假设我现在有正确的文件，我将如何训练每个解析器？应该以什么顺序使用哪些方法调用？

我无法从每个解析器的源代码或 Javadocs 中弄清楚这一点。任何建议将不胜感激。

0 回答 0