0

我想使用BWP Gazetteer而不是 GATE 的默认地名词典。为此,我将它作为资源添加到工作区中,creole.xml并将其 JAR 包括在工作区中。

克里奥尔语.xml

  <RESOURCE>
<NAME>BWPGazetteer</NAME>
<JAR>BWPGazetteer.jar</JAR>
<CLASS>bwp.gate.gazetteer.BWPGazetteer</CLASS>
<COMMENT>A BWPGazetteer.</COMMENT>
  <PARAMETER NAME="document" RUNTIME="true"
    COMMENT="The document to be processed"> gate.Document</PARAMETER>
  <PARAMETER NAME="annotationSetName" RUNTIME="true"
    COMMENT="The annotation set to be used for the generated annotations"
    OPTIONAL="true">java.lang.String</PARAMETER>
  <PARAMETER NAME="listsURL"
    DEFAULT="resources/gazetteer/lists.def"
    COMMENT="The URL to the file with list of lists" SUFFIXES="def">
    java.net.URL</PARAMETER>
  <PARAMETER DEFAULT="UTF-8"
    COMMENT="The encoding used for reading the definitions" NAME="encoding">
    java.lang.String</PARAMETER>
  <PARAMETER DEFAULT="true"
    COMMENT="Should this gazetteer diferentiate on case"
    NAME="caseSensitive">java.lang.Boolean</PARAMETER>
  <PARAMETER DEFAULT="true"
    COMMENT="Should this gazetteer only match whole words"
    NAME="wholeWordsOnly">java.lang.Boolean</PARAMETER>
    <PARAMETER NAME="normalizedDistanceThreshold"
            COMMENT="Maximum normalized distance(0.0-1.0) for a match"
            DEFAULT="0.1">
            java.lang.Double
        </PARAMETER>
<PARAMETER DEFAULT="true"
    COMMENT="Should this gazetter avoid overlapping annotations"
    NAME= "avoidOverlapingAnnotations">
    java.lang.Boolean
</PARAMETER>

谁能告诉我需要在我的 JAVA 代码或配置文件中进行哪些进一步更改才能使用它?

4

1 回答 1

1

您不需要修改任何 creole.xml 文件,您只需下载并解压 BWPGazetteer 发行版,将BWPGazetteer目录加载为 CREOLE 插件,创建地名词典的实例并将其插入管道中适当的位置。到目前为止,最简单的方法是使用 GATE Developer 构建您的管道(包括在正确位置的相关地名词典实例),然后右键单击并“为 GATECloud.net 导出”。这将生成一个 zip 文件,其中包含已保存的应用程序状态 (application.xgapp) 以及应用程序使用的所有插件和资源文件。

在项目中的某个位置解压缩此 zip 文件,然后您可以简单地使用PersistenceManager.loadObjectFromFile(或loadObjectFromUrl)加载保存的应用程序及其所需的所有插件。

于 2013-03-08T10:24:37.890 回答