问题标签 [ruta]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
uima - 根据条件匹配 UIMA RUTA 中的中断
我有以下示例文本:
邮编 20193
美国
纽约
我想做的是只匹配“纽约”,即邮政编码后的行。
我尝试使用此代码,但它不起作用 -
声明标题;pin BREAK #{-> MARK(heading)} BREAK;
(在此之前我已经声明了 pin)。
请让我知道该怎么做。
谢谢!
regex - 使用 UIMA Ruta 在文本文件中搜索项目
我一直在尝试搜索文本文件中的项目。
文本文件就像例如:`
>标题
00345
XYZ
方法名:fdsafk
日期:23-4-2012
更多文本和一些包含 XYZ 实例的部分
所以我最初对 XYZ 进行了字典搜索并找到了位置,但我只想要第一个XYZ而不是其余的。XYZ 有一个属性,它总是在 5 位代码和文本MethondName 之间。
我无法做到这一点。
另外,我们如何在 UIMA RUTA 中使用 REGEX?
uima - UIMA Ruta 输入类型 - html
我有需要用作 Ruta 输入的 pdf 和 word 文件。我可以将它们转换为文本文件,但如果这样做会丢失所有表格和格式。无论如何我可以在不丢失任何信息的情况下使用它们吗?
谢谢!
uima - 如何在 Ruta 脚本中访问不是原始类型的特征值?
我可以使用 Ruta 脚本访问定义为原始类型的功能。例如,postTag 是 TokenAnnotation 的字符串特征。以下脚本有效。
字符串str1,str2;TokenAnnotation{->GETFEATURE("posTag", str1), LOG("posTag=" + str1)};
但是,我无法读取定义为另一种注释类型的功能。
TokenAnnotation 继承了一个叫做 lemma 的特性,它是 Lemma 类型。引理有它自己的特点。“钥匙”就是其中之一。
如何通过 Ruta 脚本中的给定 TokenAnnotation 访问引理的“关键”特征值?
我试过类型变量。但是,我不知道在将引理特征分配给类型变量后我能用它做什么。如果有人可以向我展示一些类型变量用法的示例,那就太好了。
以下是我的类型描述,和 cas. 提前致谢。
uima - 在 UIMA RUTA 中的注释器上使用覆盖文本
我想在后续代码中使用注释的覆盖文本作为输入(例如,命名另一个注释)。是否可以召回覆盖的文本并在代码中再次提及?例如,如果我有以下文本 -
标题 1 ......(文本 1)
标题 2 ....................(文本 2)
代码:
声明标题“标题 1”{-> 标记(标题)}
DECLARE Text_Heading1(其中 Heading1 = 标题的覆盖文本)
在鲁塔可以做到这一点吗?
非常感谢!
uima - UIMA Ruta - 带有可选注释的收集
我需要收集一些注释来创建一个新的注释。例如,假设
a 被标记为注释 A
b被标记为注释B
c被标记为注释C
我想创建另一个具有 A、B 和 C 作为特征的注释 D,但 B 必须是可选的。
乙?C{-> GATHER D, 1, 2, "a" = 1, "b" = 2, c=3)};
如果 B 丢失,这将不起作用,我知道这是因为相关的数字。有解决方法吗?
谢谢!
uima - uima ruta 评分条件
我尝试了一个脚本来使用分数条件标记期刊。
示例文本
1.劳伦斯 RA。回顾美国母乳喂养的医疗 342-340 益处和禁忌症 [互联网]。阿灵顿(弗吉尼亚州):国家妇幼保健教育中心;1997 年 10 月 [引自 2000 年 4 月 24 日]。页。40. 可查阅:www.ncemch.org/pubs/PDFs/Welcometojungle.pdf。
2.Shishido A. 撤回通知:铂化合物对小鼠淋巴细胞有丝分裂的影响 [撤回 Alsabti EA, Ghalib ON, Salem MH。在:Jpn J Med Biol 1979 年 4 月;32(2):53-65]。Jpn J Med Sci Biol 1980 年 8 月;33(4):235-237。
3.Leist TP,Zinkernagel RM。用 IL-2 受体特异性单克隆抗体治疗小鼠的效果 [信] [Leist TP、Kohler M、Eppler M、Zinkernagel RM 的撤回。在:J Immunol 1989 年 7 月 15 日;143(2):628-32]。J Immunol 1990 年 4 月 1 日;144(7):2847。
4.Chen, L.、James, N.、Barker, C.、Busam, K. 和 Marghoob, A.(2013 年)。促纤维增生性黑色素瘤:综述。美国皮肤病学会杂志,68(5),825-833。doi: 10.1016/j.jaad.2012.10.041。
但是上面的脚本不起作用。任何人都可以找到解决方案。提前致谢。
uima - UIMA Ruta 支持多少种语言?
我是文本分析、UIMA 和 UIMA Ruta 相关技术的新手,并且正在开发一种用于智能文档处理的新软件(基于 Java)。目前,我正在阅读与 UIMA/Ruta 相关的所有阅读材料。我有一个问题但仍然不知道明确的答案是 UIMA Ruta 支持多少种不同的语言?对于我应该阅读哪些阅读材料(对于能够分析多种语言文档的智能文档处理软件),我会很乐意提供任何其他帮助/链接/文档。谢谢-拉胡尔
uima - 我们如何在 uima ruta 中注释 unicode 字符
我们如何在 uima ruta 中注释一个 unicode 字符: 例如:我想标记这个文本(巴黎:Éditions Robert Laffont)。所以我使用了以下规则。
但是文本覆盖到巴黎:Ã。有什么办法可以解决这个问题。等待答案。在此先感谢。
uima - REGEXP("CORA:.*")
我对这条规则有疑问 Line{-REGEXP("CORA:.*") -> MARK(Reference)}; CORA:.* 是什么意思