1

我想用现有的树库训练基于选区的斯坦福解析器(RSS 和 Shift Reduce),但无法在网上找到足够的信息来做到这一点。两个关键问题:

  1. 我应该以什么格式导出我的树库以便能够训练每个解析器?(我注意到“标准树库格式”应该用于 SR 解析器 - 但我找不到这种格式的规范。如果它与 PENN 树库使用的格式相同,树应该如何拆分?在一个单个文件根据换行符分隔?在单独的文件中?)

  2. 我正在通过在 IDE 中编写一些 Java 代码以编程方式尝试此操作。假设我现在有正确的文件,我将如何训练每个解析器?应该以什么顺序使用哪些方法调用?

我无法从每个解析器的源代码或 Javadocs 中弄清楚这一点。任何建议将不胜感激。

4

0 回答 0