1

错误报告在 TextRuler 视图中,训练数据中的输入数量是否有任何限制。因为它花费了太多时间。有时它会生成规则,或者它会显示一些 GC 开销限制。

如果我尝试使用由算法生成的脚本,它会显示一些错误。

错误:

Error in KEP,  line 160, "SCRIPT": found no viable alternative

生成的脚本:

SCRIPTSTART{->MARKONCE(SCRIPT,1,3)} ANY*? SCRIPTEND;
SCRIPTSTART{IS(SCRIPTEND)->MARKONCE(SCRIPT)} ;
4

1 回答 1

0

关于错误:

该错误表明 SCRIPT 未知。是否声明了类型 SCRIPT?生成的规则可能只是规则,您需要添加导入才能构建正确的脚本。第160行的内容是什么?

关于 TextRuler 一般:

创建该框架是为了在规则工程期间支持用户。它不是针对常见的监督机器学习优化的框架。因此,它没有针对运行时和内存使用进行优化。

算法为每个示例创建规则并尝试获得良好的覆盖率。因此,示例越多,算法所需的时间就越长。

内存使用率不应该这么高。这可能是可以修复的,但现在没有人可以做任何事情。

免责声明:我是 UIMA Ruta 的开发人员

于 2016-09-21T06:58:15.543 回答