0

示例输入文件:

<p class="Head1"><a name="para1">Sections 87-89</a></p>
some text
<p class="Head2"><a name="para2">Sections 90-92</a></p>
some text
<p class="ParaFL"><a name="para3">Some Text1</a></p>
<p class="ParaFirstLineInd"><a name="para4">Some Text2</a></p>

例如,从示例输入文件中,如果我将“Sections 87-89 and Sections 90-92”注释为 Head1”。现在我想将注释类型(Head1)与其类类型(class="Head1", class= “head”)。如果注解类型不等于类,那么我想为相应的注解类型设置一个特征“类改变”。同样对于“Some Text1”和“Some Text2”被注解为ParaFL(注解类型) .

4

1 回答 1

0

这取决于所需信息的表示方式。我假设类信息由 Ruta 中的 HtmlTypeSystem 表示。

为了解决这个问题,Ruta (2.4.0) 中缺少两个语言元素。主要问题是html标签的属性信息存储在两个单独的数组中,Ruta中没有选项可以联合迭代它们。第二个是将类型自动装箱为字符串。

我建议创建一个分析引擎(也可以在 Ruta 脚本中执行),它使用一个包含所需信息的字符串特征创建新注释。然后,您可以将注释与特征值进行比较。自动装箱不会转换短类型名称。我会为您的注释类型添加一个具有相应类型/类值的功能。然后,您可以比较特征值。

于 2016-08-19T08:21:07.200 回答