3

我已经研究了默认的 UIMA Ruta Workbench Eclipse 项目,足以显着理解它的移动部分——例如,为什么input/output/文件夹的行为如此,如何使用jcasgen和其他 Maven 插件完成项目等。

但是,即使经过数小时的研究并使用 Maven 尝试让它工作,我仍然在做一些非常简单的事情时遇到很多麻烦:使用脚本中的DKPro库(尤其是类型) 。Ruta

我的基本问题是:在 Ruta 脚本中使用 DKPro 和 TC 库中的类型和分析组件的阻力最小的路径是什么?

我的具体问题是:

  1. 我注意到在desc/type许多apijar 的文件夹中,有一些TypeSystemDescription似乎适合与 Ruta 一起使用的 XML 文件。有什么方法可以获取组件的“主” TypeSystemDescriptionXML 文件DKPro吗?

  2. 是否有一个非常复杂的项目同时使用Ruta并且DKPro我可以学习?

  3. AnalysisEngine你用Ruta脚本做的事情和Analysis Component你用Java写的东西有什么区别?

编辑以反映较少的挫败感

4

1 回答 1

3

实际上,Ruta 和 DKPro 的人一起做工作坊,然后愉快地围坐在篝火旁——或者至少在鸡尾酒吧里喝点酒。不幸的是,我们并没有经常这样做。

您提出的问题的种类和数量要求提供教程;)

您看过我们在 GSCL 2013 的联合研讨会上的幻灯片和示例吗?

它包括几个如何一起使用 DKPro Core 和 Ruta 的示例。在这些示例中,有一个 Maven 项目负责获取 DKPro Core 依赖项,而单独的 Ruta 项目则依赖于该 Maven 项目并使用分析引擎。

拥有一个同时具有 Ruta 和 Maven 特性的项目也应该有效。

  1. 获取类路径中所有 DKPro Core 类型(或者更确切地说是类路径中所有启用 uimaFIT 的类型)的单一类型描述符的方法是

    import org.apache.uima.fit.factory.TypeSystemDescriptionFactory;
    
    OutputStream os = ...
    TypeSystemDescriptionFactory.createTypeSystemDescription().toXML(os);
    
  2. 查看GSCL 2013 教程示例

  3. AnalysisComponent代表从内部的视图,即从组件开发者的角度(框架内的视图)。AnalysisEngine表示从外部的视图,即来自组件/工作流的用户的视图。但是,通常有人会说“我正在实现一个新的分析引擎”,并表示“我要子类JCasAnnotator_ImplBase化(一个实现AnalysisComponent)”。另请参阅UIMA 开发人员邮件列表上的这篇文章。

披露:我是 DKPro Core 开发人员和 Apache UIMA 开发人员。

于 2015-11-29T09:37:21.037 回答