我正在学习 GATE 和 JAPE 语法。这是我第一次使用 GATE 和 JAPE 语法。我正在关注本教程,其中给出了识别体育内容的语法。我使用了这个.jape
文件和给出的示例文本,但 GATE 无法识别除人员、组织、日期等之外的任何内容。
我想知道如何.jape
在 GATE 中使用自定义语法?如果有人可以请提供步骤,那将是非常棒的。
目前我正在执行以下步骤:
启动 GATE GUI。
使用默认值加载 ANNIE 系统。
步骤(2)加载ANNIE POS Tagger、tokenizer、sentence splitter等
Processing Resources
。右键单击
Processing Resources
并选择New -> JAPE Transducer
。给出
.jape
文件路径并给出一些名称。右键单击
Language Resources
并选择New -> GATE Corpus
。给语料库命名。右键单击新创建的语料库并选择
Populate
.选择存在文本文件的目录。我们想在这些文件上运行 GATE。
双击节点
ANNIE
下Applications
并单击Run This Application
按钮。
单击Run This Application
按钮后,所有处理完成后,我打开输入文本文件。
该文件没有任何标签写入.jape
文件,它只显示普通标签,如人员、组织等。
我的.jape
文件如下所示:
Phase:firstpass
Input: Lookup
Options: control = brill
Rule: SportsCategory
Priority: 20
(
{Lookup.majorType == "Sports"}
): label
-->
:label.Sport = {rule= "SportsCategory" }
输入文本文件如下:
Soccer - Rooney Gerrard - File .
Composite file picture of Liverpool 's Steven Gerrard (left , dated 27 September 2006 ) and Manchester United 's Wayne Rooney (dated 20 August 2006 ) . On the occasion of his 21st Birthday , Tuesday 24 October 2006 , Wayne Rooney has hailed England team -mate Steven Gerrard as one of the world 's best midfielders and wishes the Liverpool star could play at Manchester United .
如果我错过了任何其他步骤,谁能告诉我。我无法找到有关此的分步说明 :( 我希望 GATE 的人会花一些时间来编写这样的教程。