问题标签 [dkpro-core]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - DKPro Core Groovy 使用与 UIMA 安装
嘿,我是 groovy 的极端贵族,我刚刚发现它存在。我将它安装在 centos 5 系统上,这些是版本
然后我尝试运行在这里找到的一个简单脚本,而无需下载或安装或包含任何其他内容。运行失败,结果如下。我究竟做错了什么?
groovy - DKPro Core Groovy,NP 识别不起作用
我对 groovy 很陌生,我正在尝试将 DKPro Core 用于一些 nlp 的东西。在这一点上,我正在尝试识别一段文本中的名称短语。我可以正确识别标记句子和命名实体,但由于某种原因,同样不适用于 NP 类。我的代码如下所示,请指出错误。
在我的输出中,句子被正确识别,但没有为命名短语打印任何内容。
eclipse - maven依赖未解决,未授权错误
我正在尝试在 Eclipse 中使用 Maven 项目。这是我第一次使用 maven 存储库。我正在使用 maven 3.2.3 当我这样做时
它显示了这些错误
我的 pom 文件是
我想将 treetagger 从 dkpro 添加到 pom ,但它给出了错误?
java - 注释器依赖项:UIMA 类型功能?
在我的 UIMA 应用程序中,我有一些注释器必须在某个注释器运行后运行。
起初,我考虑将这些注释器聚合在一起,但我还有其他注释器也依赖于这个(和其他)注释器,这使得聚合变得困难和/或不切实际。
我阅读了关于 Type Capabilities 的文章,如果我理解正确,它会告诉 UIMA 在用作Input Type
. 我希望 UIMA 在运行没有注释器的管道时会给我一些警告,这些注释器有一些输出类型被声明为使用的注释器的输入类型。相反,注释器会像往常一样继续运行/处理。
有没有办法实现我想要的,或者这只是不必要的?如果这很重要,我目前正在使用 SimplePipeline。
TL;DR:我的目标是,如果管道中缺少某些其他注释器/计划在这些注释器之后,注释器将拒绝运行
提前致谢。
nlp - UIMA/dkpro:获取连接类型
我将 UIMA 与 UIMAfit 和 dkpro 以及 StanfordParser 结合使用来解析英语句子。
我可以毫无问题地构建依赖树。对于“and”/“or”连词,我得到一个带有 class 的注释CONJ
,它是Dependency
. 到目前为止,我还没有发现如何检查找到的连词是“AND”还是“OR”连词。
有谁知道如何解决这个问题?我看到了显示依赖项“conj_and”和“conj_or”的示例,但我看不到它们来自哪里。 http://nlp.stanford.edu/software/dependencies_manual.pdf
提前致谢
一些可视化代码:
eclipse - 您应该如何/应该将 DKPro 库与 UIMA Ruta 一起使用?
我已经研究了默认的 UIMA Ruta Workbench Eclipse 项目,足以显着理解它的移动部分——例如,为什么input/
和output/
文件夹的行为如此,如何使用jcasgen
和其他 Maven 插件完成项目等。
但是,即使经过数小时的研究并使用 Maven 尝试让它工作,我仍然在做一些非常简单的事情时遇到很多麻烦:使用脚本中的DKPro
库(尤其是类型) 。Ruta
我的基本问题是:在 Ruta 脚本中使用 DKPro 和 TC 库中的类型和分析组件的阻力最小的路径是什么?
我的具体问题是:
我注意到在
desc/type
许多api
jar 的文件夹中,有一些TypeSystemDescription
似乎适合与 Ruta 一起使用的 XML 文件。有什么方法可以获取组件的“主”TypeSystemDescription
XML 文件DKPro
吗?是否有一个非常复杂的项目同时使用
Ruta
并且DKPro
我可以学习?AnalysisEngine
你用Ruta
脚本做的事情和Analysis Component
你用Java写的东西有什么区别?
编辑以反映较少的挫败感
java - 如何从 DKPro/UIMA 中的句子中获取引理?
我正在尝试建立一个管道,它会产生词形还原的句子。我知道如何获得所有句子或所有引理,但我不知道如何获得引理集合除以句子结尾。这是一个缺少参数的代码片段,标记为??????
:
我需要在此代码中更改什么,因此它从两行中的两个输入句子中打印引理。
nlp - DKPro Core 管道的可重用版本
我已将 DKPro Core 设置为 Web 服务,以获取输入并提供标记化的输出。服务本身设置为 Jersey 资源:
一切正常,但速度很慢,每次输入需要 7-10 秒。我认为这是因为正在为每个请求重新创建管道。
如何重新编写此代码以将管道创建移至构造函数并减少单个请求的负载?请注意,可能有多个同时请求,因此任何不是线程安全的都需要在请求中。
uima - 如何解决 GermanNovel 示例项目(带有 ruta 的 dkpro)中的 ruta 脚本错误?
我将GermanNovel示例项目(基本上从https://github.com/apache/uima-ruta/releases的 uima-ruta 版本之一下载)作为 maven 项目导入到 eclipse 中。我将它作为 maven 导入,因为我找到了一个 pom.xml 文件。
我在 Main.ruta 脚本中发现一个错误,指出 "GeneratedDKProCoreTypes" not found,但在描述符文件夹中存在 GeneratedDKProCoreTypes.xml。
如果我将de.tudarmstadt.ukp.dkpro.core.treetagger-asl依赖项的版本从1.5.0更改为1.7.0 ,则找不到类TreeTaggerPosLemmaTT4J 。它已被弃用还是什么?我应该改用其他一些类和类型吗?
主菜
java - 在 DKPro 中更改可重用管道中的文本
这个问题描述了如何在 dkpro 中重用管道,但是如果我只创建一个 JCas 然后尝试更改文本,那么我会得到异常
org.apache.uima.cas.CASRuntimeException: Data for Sofa feature setLocalSofaData() has already been set.
我该如何解决这个问题?