问题标签 [gate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 如何开始情绪分析?
有人可以就如何开始情绪分析提供一些起点。
如果您可以提供一些可用于该任务的开源工具,那就太好了。
目前我正在研究 GATE ( http://gate.ac.uk ) 和 RapidMiner ( http://rapid-i.com/ ),但我认为我在茫茫人海中,缺乏入门的基础知识这些工具...
如果之前有 GATE/RapidMiner 经验的人解释了如何开始使用它们,那将会很有帮助。
java - 从没有 GUI 的 Java 程序内部运行 GATE 管道。用门构建一个tomcat应用程序
我已经为 GATE 构建了一些插件组件,并结合 ANNIE 工具,我在 GATE 平台上运行管道。
有谁知道我如何从控制台运行管道?我想在 Tomcat 中构建一个 Web 应用程序,它将从网页中获取纯文本,将其传递给我构建的 GATE 管道并做一些事情。所以我需要在一个简单的 Java 文件中运行 GATE,怎么做?
在此先感谢并为我糟糕的语法感到抱歉
java - java门API。成功创建管道,如何从处理的文档中获取注释集?
提前为我糟糕的语法道歉。
我已经使用 GATE API 创建了一个管道,我成功运行它。我创建了一个这样的串行分析器控制器: pipeline = (SerialAnalyserController)Factory.createResource("gate.creole.SerialAnalyserController"); ,然后我加载一个文件语料库(以前填充)
pipeline.setCorpus(foo) 和最后一个 pipeline.execute()。
这一切都很好,我看到了结果。我的问题是我找不到为语料库中处理的每个文档获取 AnnotationSet 的方法。例如,我想找到 AnnotationSet(“句子”)来查找句子在原始文本文件中开始和停止的偏移量。API 没有告诉我如何从 SerialAnalyserController 获取注释 - 在流程管道完成后如何获取每个 gate.Document。
提前致谢
java - 如何为非英语语言运行 GATE/JAPE?
我想将 JAPE/GATE 用于我自己的母语(不是英语),因为我的文件已经被标记和 POS 标签。那么如何让 GATE 将我的文档加载为资源进行处理呢?
nlp - 为命名实体使用 (NLP) 门工具
我可以在我的 java 程序中使用 GATE http://gate.ac.uk/来提取命名实体吗?如果是,您能否举出任何例子或指导我找到一些来源。谢谢
java - Gate ANNIE 语法
您好我一直在努力从事信息检索工作,并且遇到了一些困难。最近我从以下链接下载了 StandAloneAnnie.java
http://gate.ac.uk/wiki/code-repository/src/sheffield/examples/StandAloneAnnie.java 虽然我已经能够执行它并查看输出,但我有一两个查询。
该程序注释人员和位置,用于注释此类实体的语法存储在哪里。
如何编写自己的简单语法来提取一些数据并在我的 StandAloneAnnie.java 副本中使用它?
gate - 使用 JAPE 语法的困难
我有一个文档,其中包含诸如评估、HPI、ROS、Vitals 等部分。我想在每个部分中提取注释。我为此目的使用 GATE。我制作了一个 JAPE 文件,它将在评估部分提取注释。以下是语法,
现在,当评估部分位于文档末尾时,我可以正确检索笔记。但是,如果它介于两个部分之间,那么这将从评估部分返回整个文档,直到文件结束。
我尝试以不同的方式使用 {Token.string=~"$"} 但无法仅提取评估部分,而不管其在文档中的位置。
请解释如何使用 JAPE 语法来实现这一点。
nlp - 用于编写 JAPE 语法的 ANTLR
我正在使用 GATE 处理用自然语言编写的文本。我必须从文本中提取身高、体重、bp 等并以结构化形式存储。现在,这些东西(即身高、体重等)可以写成我不知道的多种形式。为我能想到的所有不同方式编写 JAPE 语法,只是对其进行硬编码。我还有其他选择可以更灵活地处理文档吗?
另外,我很困惑我是否可以使用 ANTLR 通过呈现不同的书写高度、体重等方式来生成日语语法?
文本将包含以下内容:
现在我使用 JAPE 语法和 ANNIE 对文本进行标记,以提取这些生命体征并以结构化形式存储。使用 ANTLR 是否可以灵活地标记此类文本?在某种意义上说我不应该为每种表示方式硬编码它是灵活的,正如您所见,身高、体重等可以以多种形式表示。
搜索或开发任何会生成 jape 语法的语法生成器会是一个好主意吗?
如果您需要任何详细信息以更好地理解问题,请告诉我。
非常感谢!!
java - 字典上的部分匹配
我正在使用 GATE(基于 Java 的 NLP 框架)并希望找到与字典部分匹配的单词。例如,我有一个包含以下术语的疾病词典
假设我有"Father had cardiac failure last year"
这个字符串中的字符串,我想将“心脏衰竭”识别为部分匹配,因为它作为字典中某个术语的一部分出现。
我在 Python、JS 和 C# 中看到过一些关于类似主题的讨论,但我不确定在这种情况下有什么帮助。我想知道我是否可以在这里使用 Aho-Corrasick。