问题标签 [ruta]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
58 浏览

uima - 根据条件匹配 UIMA RUTA 中的中断

我有以下示例文本:

邮编 20193 美国
纽约

我想做的是只匹配“纽约”,即邮政编码后的行。

我尝试使用此代码,但它不起作用 -

声明标题;pin BREAK #{-> MARK(heading)} BREAK;

(在此之前我已经声明了 pin)。

请让我知道该怎么做。

谢谢!

0 投票
1 回答
164 浏览

regex - 使用 UIMA Ruta 在文本文件中搜索项目

我一直在尝试搜索文本文件中的项目。

文本文件就像例如:`

>标题

00345

XYZ

方法名:fdsafk

日期:23-4-2012

更多文本和一些包含 XYZ 实例的部分

所以我最初对 XYZ 进行了字典搜索并找到了位置,但我只想要第一个XYZ而不是其余的。XYZ 有一个属性,它总是在 5 位代码和文本MethondName 之间

我无法做到这一点。

另外,我们如何在 UIMA RUTA 中使用 REGEX?

0 投票
1 回答
101 浏览

uima - UIMA Ruta 输入类型 - html

我有需要用作 Ruta 输入的 pdf 和 word 文件。我可以将它们转换为文本文件,但如果这样做会丢失所有表格和格式。无论如何我可以在不丢失任何信息的情况下使用它们吗?

谢谢!

0 投票
1 回答
600 浏览

uima - 如何在 Ruta 脚本中访问不是原始类型的特征值?

我可以使用 Ruta 脚本访问定义为原始类型的功能。例如,postTag 是 TokenAnnotation 的字符串特征。以下脚本有效。

字符串str1,str2;TokenAnnotation{->GETFEATURE("posTag", str1), LOG("posTag=" + str1)};

但是,我无法读取定义为另一种注释类型的功能。

TokenAnnotation 继承了一个叫做 lemma 的特性,它是 Lemma 类型。引理有它自己的特点。“钥匙”就是其中之一。

如何通过 Ruta 脚本中的给定 TokenAnnotation 访问引理的“关键”特征值?

我试过类型变量。但是,我不知道在将引理特征分配给类型变量后我能用它做什么。如果有人可以向我展示一些类型变量用法的示例,那就太好了。

以下是我的类型描述,和 cas. 提前致谢。

0 投票
1 回答
99 浏览

uima - 在 UIMA RUTA 中的注释器上使用覆盖文本

我想在后续代码中使用注释的覆盖文本作为输入(例如,命名另一个注释)。是否可以召回覆盖的文本并在代码中再次提及?例如,如果我有以下文本 -

标题 1 ......(文本 1)

标题 2 ....................(文本 2)

代码:

声明标题“标题 1”{-> 标记(标题)}

DECLARE Text_Heading1(其中 Heading1 = 标题的覆盖文本)

在鲁塔可以做到这一点吗?

非常感谢!

0 投票
1 回答
78 浏览

uima - UIMA Ruta - 带有可选注释的收集

我需要收集一些注释来创建一个新的注释。例如,假设

a 被标记为注释 A

b被标记为注释B

c被标记为注释C

我想创建另一个具有 A、B 和 C 作为特征的注释 D,但 B 必须是可选的。

乙?C{-> GATHER D, 1, 2, "a" = 1, "b" = 2, c=3)};

如果 B 丢失,这将不起作用,我知道这是因为相关的数字。有解决方法吗?

谢谢!

0 投票
1 回答
96 浏览

uima - uima ruta 评分条件

我尝试了一个脚本来使用分数条件标记期刊。

示例文本

1.劳伦斯 RA。回顾美国母乳喂养的医疗 342-340 益处和禁忌症 [互联网]。阿灵顿(弗吉尼亚州):国家妇幼保健教育中心;1997 年 10 月 [引自 2000 年 4 月 24 日]。页。40. 可查阅:www.ncemch.org/pubs/PDFs/Welcometojungle.pdf。

2.Shishido A. 撤回通知:铂化合物对小鼠淋巴细胞有丝分裂的影响 [撤回 Alsabti EA, Ghalib ON, Salem MH。在:Jpn J Med Biol 1979 年 4 月;32(2):53-65]。Jpn J Med Sci Biol 1980 年 8 月;33(4):235-237。

3.Leist TP,Zinkernagel RM。用 IL-2 受体特异性单克隆抗体治疗小鼠的效果 [信] [Leist TP、Kohler M、Eppler M、Zinkernagel RM 的撤回。在:J Immunol 1989 年 7 月 15 日;143(2):628-32]。J Immunol 1990 年 4 月 1 日;144(7):2847。

4.Chen, L.、James, N.、Barker, C.、Busam, K. 和 Marghoob, A.(2013 年)。促纤维增生性黑色素瘤:综述。美国皮肤病学会杂志,68(5),825-833。doi: 10.1016/j.jaad.2012.10.041。

但是上面的脚本不起作用。任何人都可以找到解决方案。提前致谢。

0 投票
1 回答
103 浏览

uima - UIMA Ruta 支持多少种语言?

我是文本分析、UIMA 和 UIMA Ruta 相关技术的新手,并且正在开发一种用于智能文档处理的新软件(基于 Java)。目前,我正在阅读与 UIMA/Ruta 相关的所有阅读材料。我有一个问题但仍然不知道明确的答案是 UIMA Ruta 支持多少种不同的语言?对于我应该阅读哪些阅读材料(对于能够分析多种语言文档的智能文档处理软件),我会很乐意提供任何其他帮助/链接/文档。谢谢-拉胡尔

0 投票
1 回答
131 浏览

uima - 我们如何在 uima ruta 中注释 unicode 字符

我们如何在 uima ruta 中注释一个 unicode 字符: 例如:我想标记这个文本(巴黎:Éditions Robert Laffont)。所以我使用了以下规则。

但是文本覆盖到巴黎:Ã。有什么办法可以解决这个问题。等待答案。在此先感谢。

0 投票
1 回答
59 浏览

uima - REGEXP("CORA:.*")

我对这条规则有疑问 Line{-REGEXP("CORA:.*") -> MARK(Reference)}; CORA:.* 是什么意思