问题标签 [gate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
gate - 如何将一个巨大的语料库随机分成 3 个?
我有一个包含数千个带有注释的文档的语料库(保存在 JSerial Datastore 中)。现在我需要将它分成 3 个较小的,随机挑选。GATE 中最简单的方法是什么?
欢迎提供一段运行代码或详细指南!
javascript - 年龄验证 - 关闭对话窗口
使用 Nation Builder 作为客户网站的平台,需要创建年龄门。我会在单独的页面上进行年龄验证,但显然它不适用于这个平台,所以我使用 Jquery 对话框显示在主页顶部。我验证年龄的代码有效,但需要对其进行调整以关闭小部件 UI 而不是 url 重定向。
我不是编程专家,因此将不胜感激。这是一个链接。http://patricialourenco.com/test.html 干杯!
java - 添加 WordNet 作为 GATE 处理资源
我正在尝试使用 GATE 使用 WordNet 注释来注释文本语料库。在 GATE-Developer 系统中添加 WordNet creole 插件后,我只能将 WordNet 添加为语言资源,而不能添加为处理资源或应用程序。所以我不能将它添加到语料库管道中。
我会很感激这里的任何帮助。
(是的,我确实阅读了GATE 用户手册。)
nlp - Gate/Jape 西班牙语
我在许多网站上阅读,他们说 Gate 支持西班牙语,但我没有找到如何使用 Gate 分析西班牙语文本。我尝试使用 treetagger,但出现错误:TreeTagger\tree-tagger-spanish-gate": CreateProcess error=193, %1 no es una aplicación Win32 válida
我也尝试过使用 OpenNLP,但我没有找到西班牙语的模型(标记器、块等),我只找到了荷兰语、德语和英语。
我还需要识别句子的主语和谓语。如果我错了,请纠正我,但我认为我可以使用 OpenNLP 来做到这一点,因为可以使用树库解析器或 MuNPEx 插件来识别 NP(名词短语)和 VP(动词短语)。
Summering,有什么方法可以将 Gate 语言设置为西班牙语?
谢谢。
annotations - 我如何使用 GATE annie 将整个段落(或正文)标记为注释。
我如何将整个正文标记为注释(Gate Annie)。例如,我正在尝试对推文进行分类。我想将推文分类为正面或负面推文。手动标记它非常耗时。是否可以使用 Jape 进行此活动?标记的推文将用于机器学习。
nlp - 命名实体识别问题将文本“下周一”识别为日期?
我是文本挖掘和 NLP 的新手。我正在尝试使用命名实体识别 (NER) (Stanford Named Entity Tagger) 从给定文本中提取日期。我正在使用斯坦福 NLP http://nlp.stanford.edu:8080/ner/process和 GATE ANNIE http://services.gate.ac.uk/annie/提供的在线演示
此演示无法将完整的“上周日”、“下周一”、“本月末”“直到本周日晚上”等文本识别为日期。仅星期日或星期一对确定日期没有用处。是否有任何选项可以提取给定示例文本提到的实际文本?
示例文本:
使用 Puma 犒劳自己,因为它提供 Flat 50% 折扣。快点优惠有效期至本周日。开心购物。
提取日期:25-08-2013(考虑到今天是 19-08-2013。日期格式可以是任何东西)
任何库都提供这种日期识别功能,或者是否可以构建自定义模型来识别示例文本中给出的日期?
annotations - 如何在 GATE 中存储和比较注释(使用黄金标准)
于是,我开始学习 GATE。我的问题是关于如何计算我的标记引擎(基于java)的性能。
使用 UIMA,我通常将所有系统注释转储到 xmi 文件中,然后使用 Java 代码将其与人工注释(黄金标准)注释进行比较,以计算 Precision/Recall 和 F-score。
但是,我仍然在努力寻找与 GATE 类似的东西。在浏览了该页面上的 Gate Annotation-Diff和其他信息之后,我觉得必须有一种简单的方法可以在 JAVA 中完成。但是,我无法弄清楚如何使用 JAVA 来做到这一点。想把这个问题放在这里,可能有人已经想通了。
- 如何以编程方式将系统注释存储到 xmi 或任何格式文件中。
- 如何创建一次性黄金标准数据(即人工注释数据)用于性能计算。
如果您需要更具体或更详细的信息,请告诉我。
java - 多租户与 GATE
我正在使用 Gate 在我的项目中实现自然语言处理模块。在下一步中,我希望系统支持多个用户。每个用户都有不同的领域词集(我将其放入地名词典)。据我所知,gate 使用了大量的静态资源,并且很难创建多个 gate 实例。有人知道用 Gate 实现多租户吗?
非常感谢你。
PS:我使用gate的原因是因为它有jape规则。如果您可以引入其他更易于定制并且具有这种基于规则的语法的工具,那就太好了。
lucene - 自然语言处理工具的比较(UIMA、LingPipe、Lucene、Gate、Stanford)
我想选择一种自然语言处理工具来完成常见的任务,例如标记化、句子检测、各种标记(名称实体识别、POS 标记……)。我的问题有两个部分:
- 选择自然语言处理工具的标准是什么?
- 在(UIMA、LingPipe、Lucene、Gate、Stanford)中,哪一个更符合这些标准?
你的建议是什么?
grammar - GATE 教程网站上的简单 JAPE 语法不起作用
我正在学习 GATE 和 JAPE 语法。这是我第一次使用 GATE 和 JAPE 语法。我正在关注本教程,其中给出了识别体育内容的语法。我使用了这个.jape
文件和给出的示例文本,但 GATE 无法识别除人员、组织、日期等之外的任何内容。
我想知道如何.jape
在 GATE 中使用自定义语法?如果有人可以请提供步骤,那将是非常棒的。
目前我正在执行以下步骤:
启动 GATE GUI。
使用默认值加载 ANNIE 系统。
步骤(2)加载ANNIE POS Tagger、tokenizer、sentence splitter等
Processing Resources
。右键单击
Processing Resources
并选择New -> JAPE Transducer
。给出
.jape
文件路径并给出一些名称。右键单击
Language Resources
并选择New -> GATE Corpus
。给语料库命名。右键单击新创建的语料库并选择
Populate
.选择存在文本文件的目录。我们想在这些文件上运行 GATE。
双击节点
ANNIE
下Applications
并单击Run This Application
按钮。
单击Run This Application
按钮后,所有处理完成后,我打开输入文本文件。
该文件没有任何标签写入.jape
文件,它只显示普通标签,如人员、组织等。
我的.jape
文件如下所示:
输入文本文件如下:
如果我错过了任何其他步骤,谁能告诉我。我无法找到有关此的分步说明 :( 我希望 GATE 的人会花一些时间来编写这样的教程。