5

我正在学习 GATE 和 JAPE 语法。这是我第一次使用 GATE 和 JAPE 语法。我正在关注教程,其中给出了识别体育内容的语法。我使用了这个.jape文件和给出的示例文本,但 GATE 无法识别除人员、组织、日期等之外的任何内容。

我想知道如何.jape在 GATE 中使用自定义语法?如果有人可以提供步骤,那将是非常棒的。

目前我正在执行以下步骤:

  1. 启动 GATE GUI。

  2. 使用默认值加载 ANNIE 系统。

  3. 步骤(2)加载ANNIE POS Tagger、tokenizer、sentence splitter等Processing Resources

  4. 右键单击Processing Resources并选择New -> JAPE Transducer

  5. 给出.jape文件路径并给出一些名称。

  6. 右键单击Language Resources并选择New -> GATE Corpus。给语料库命名。

  7. 右键单击新创建的语料库并选择Populate.

  8. 选择存在文本文件的目录。我们想在这些文件上运行 GATE。

  9. 双击节点ANNIEApplications并单击Run This Application按钮。

单击Run This Application按钮后,所有处理完成后,我打开输入文本文件。

该文件没有任何标签写入.jape文件,它只显示普通标签,如人员、组织等。

在此处输入图像描述

我的.jape文件如下所示:

Phase:firstpass
Input:  Lookup  
Options: control = brill

Rule: SportsCategory
Priority: 20
(
{Lookup.majorType == "Sports"}
): label
-->
:label.Sport = {rule= "SportsCategory" } 

输入文本文件如下:

Soccer   -  Rooney  Gerrard   -  File .
Composite  file  picture  of  Liverpool 's  Steven  Gerrard   (left ,  dated  27  September  2006 )  and  Manchester  United 's  Wayne  Rooney   (dated  20  August  2006 ) .  On  the  occasion  of  his  21st  Birthday ,  Tuesday  24  October  2006 ,  Wayne  Rooney  has  hailed  England  team -mate  Steven  Gerrard  as  one  of  the  world 's  best  midfielders  and  wishes  the  Liverpool  star  could  play  at  Manchester  United .  

如果我错过了任何其他步骤,谁能告诉我。我无法找到有关此的分步说明 :( 我希望 GATE 的人会花一些时间来编写这样的教程。

4

1 回答 1

4

您的规则不会被触发,因为带注释的文档中没有主要类型 Sports 的查找。

除非您在默认的 ANNIE 应用程序中添加了某些内容,否则我刚刚打开它并看到默认地名词典中只有一个带有 majorType 运动的文件,它包含网球、游泳等内容,没有足球。如果您使用的是基于规则的系统,您最终可能还会添加很多字典 :)

一个好的做法是创建一个简单的测试文档并运行管道直到 jape 规则(之后停止或排除所有 PR),然后检查文档是否满足 LHS 先决条件。在您的情况下,应该有一个带有 majorType 运动的查找。

我认为最好的 jape 一步一步教程可以在这个培训材料中找到。但你想通了。

于 2013-10-10T10:33:24.577 回答