问题标签 [uima]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 从 CPE 描述符获取 UIMA 类型系统
我将如何从 CPE 描述符 XML 文件中获取(或计算)UIMA 类型系统?我已经查看了用于在 Java 中加载 CPE 描述符的类,但看不到任何可以让我获得类型系统的东西。
我知道 CAS 有一个 getTypeSystem() 函数,但我需要在运行 CPE 管道之前获取类型系统(即在我拥有 CAS 对象之前)。
xml - 无效描述符异常 - 带有 JSF 和 Tomcat 7 的 UIMA
我在 TOMCAT 7.0 上运行 UIMA 应用程序时遇到异常。
脚步
1)创建了一个动态的Web项目
2) 新增“添加 UIMA NATURE”
3)创建原始分析引擎(AE)。每个原始 AE 都有一个注释类型和一个注释器(以此处为例)
来自链接的片段
邮编.xml
邮编AE.xml
ZipCodeAnnotator.java
测试用例
如果我通过 JUnit 测试用例(如上面的代码中给出的)测试这个应用程序,它运行成功,没有任何异常,但是当我通过创建一个带有按钮的简单 xhtml 页面在 Tomcat 上运行这个应用程序时。并且单击按钮时,它会引发异常。
这是代码片段
XHTML
DemoClass.java
测试AE.xml
例外
我最初认为,由于 XML 中的任何无效字符,异常被抛出,然后按照此链接(XML - Data At Root Level is Invalid)并确保 xml 编码时没有 BOM(字节顺序标记)。不幸的是,这没有帮助。
任何想法如何摆脱这个异常。
nlp - 准确度:ANNIE vs Stanford NLP vs OpenNLP with UIMA
我的工作是计划使用 UIMA 集群来运行文档以提取命名实体等等。据我了解,UIMA 打包的 NLP 组件很少。我已经测试 GATE 有一段时间了,并且对它相当满意。它在普通文本上没问题,但是当我们通过一些有代表性的测试数据运行它时,准确性会下降很多。我们内部拥有的文本数据有时全大写,有时全小写,或在同一文档中混合使用两者。即使使用 ANNIE 的全部大写规则,准确性仍然有很多不足之处。我最近听说过斯坦福 NLP 和 OpenNLP,但还没有时间对它们进行广泛的训练和测试。这两者在准确性方面与 ANNIE 相比如何?他们是否像 GATE 一样与 UIMA 合作?
提前致谢。
dll - UIMA integrate DLL
How can UIMA integrate DLLs?I want to make a system ,it can integrate some components in the UIMA ! Then how can I do it?
java - UIMA for parsing emails
I am new to UIMA.
I want to develop an app using UIMA and uimaFIT that can parse any email related to air tickets, such as Confirmation Email, Cancellation Email etc. and extract the valuable information from it like Ticket Number, Flight Number, Departure Time, Arrival Time, Passenger Name etc. How can I achieve this using uimaFIT. Currently I tried to use uimaFIT to just read a String and with Regular Expression tried to extract the information, but it seems too complicated as Email is not structured. Any suggestions of how to connect with the emails and perform parsing without using RegEx.
Any suggestions.
java - 如何在项目中创建类似的代码
我有一个使用cleartk的 java 项目。现在我需要为它制作一个额外的代码并进行测试。在他们的项目/src/main/java/org.cleartk.syntax.opennlp/下已经有一些java文件。我需要复制其中一个,重命名并更改里面的代码,这意味着我需要创建一些具有相同格式但不同功能的东西(我要制作的东西,他们称之为注释器)。这个java文件中的每一个都将与某个类(在目标文件夹中)链接,所以无论如何要复制和创建所有相关的文件、类以便我可以对它们进行更改?我用的是Eclipse,不知道有没有这样的方法?
opennlp - 我们是否需要在新的注释器中创建 process() ?
我创建了一个名为“NewAnnotator”的注释器,并尝试使其与 ClearTK 中的其他注释器一起在管道中工作,例如:SentenceAnnotator、PosTaggerAnnotator 等。所以我希望能够运行管道:
我编写了没有错误的代码,但是在运行时它返回了很多错误,我认为这是我的 NewAnnotator 代码中的这一部分:
我几乎从 PosTaggerAnnotator 复制了这部分,但它在我的 NewAnnotator 中没有用,我只是添加以便我可以使用:
因为我不知道没有其他方法可以添加到聚合中,.getDescription();
而且我也不知道如何getDescription()
在我的注释器中声明正确,即使没有它也可以正常工作。所以如果你经历过,请在这里给我一些建议!谢谢!
java - 如果我想使用单个 UIMA 相关库,是否需要重写整个 Java 项目?
我想在 java 项目中使用https://code.google.com/p/heideltime/ 。该代码“适合 UIMA 管道”,这是我完全不理解的。UIMA 看起来它旨在解决我没有的大量问题,所以我只想获得运行该代码所需的最少量的 UIMA。
有没有一个简单的例子来说明我如何运行一个简单的 UIMA 程序?
我已经添加
到我的 pom.xml 但由于某种原因 maven 仍然不会编译这个:
UIMA 依赖项是否比典型的 java 库更重要?仅仅从 Maven Central 中提取 UIMA 并开始在我现有的代码中使用它们的类还不够吗?
好的,我以某种方式使这个示例正常工作(我不知道它是什么,并且仍然很困惑为什么它以前不工作)我仍然无法使用 heideltime:
编辑 现在尝试:
得到:
eclipse - 在 Ecplise 中运行 UIMA 示例时出错
我已按照这些关于如何在 Eclipse 中设置 UIMA 的说明进行操作。但是当导入 UIMA 示例时,我得到了这个错误。
谁能建议如何解决这个问题?
regex - Java UIMA:正则表达式变量中的正则表达式变量?
我正在 UIMA 中使用 RegEx Annotator。我知道我可以像这样在 XML 描述符文件中创建正则表达式变量:
并在规则中像这样访问它:
这将匹配Month: Jan
andMonth: Feb
和Month: Mar
。
现在我想在另一个变量中使用该变量,这可能吗?我正在寻找这样的东西:
例如,我想创建适当的规则来匹配Month: JanJan
。
我已经阅读了http://uima.apache.org/downloads/sandbox/RegexAnnotatorUserGuide/RegexAnnotatorUserGuide.html#sandbox.regexAnnotator.conceptsFile.regexVariables中的文档,它没有提到在变量中使用正则表达式变量的可能性,尽管它确实说The variables can be used in all concept definition within the same file.
我正在使用 UIMA RegularExpressionAnnotator 2.3.1。
任何帮助表示赞赏。=)