2

我有一个输入字符串(例如'abcdefgh'),我只需要使用该字符串的一部分(例如'cd')进行注释,换句话说,我需要对输入字符串进行子串化并用标记注释它。我怎样才能做到这一点?

4

1 回答 1

0

新注解始终仅使用具有正常规则的现有注解的偏移量创建。在您的情况下,您匹配类型的注释并对ANY每个注释所涵盖的文本应用条件。条件与完整文本上的正则表达式匹配,因此条件失败。

为了创建小于可用的最小注释的注释,例如,在标记内,您不能使用正常的 UIMA Ruta 规则。您需要应用不依赖于匹配过程注释的简单正则表达式规则。这是一个例子:

ANY->{"cd" -> MyType};

此规则匹配每个ANY注释并在每个覆盖的文本上应用内联规则。内联规则是带有 regex 的简单正则表达式规则cd。如果找到该模式,MyType则会在此处创建该类型的新注释。

如果你做这样的事情,你应该仔细选择匹配类型,例如,使用其他东西 but ANY

免责声明:我是 UIMA Ruta 的开发人员

于 2016-11-07T07:35:38.907 回答