问题标签 [cleartk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 实例提取中的 cleartk 错误
我正在尝试运行介绍性 cleartk 示例,以对具有一些修改和不同数据集的文档进行分类。我收到以下错误:
显然是由以下行引起的:
更具体地说:
注释 Question.xml 定义为:
有什么线索吗?我发现这个问题可能有点相关
machine-learning - Cleartk:初始化错误 [class org.cleartk.classifier.jar.DefaultSequenceDataWriterFactory] 字段“dataWriterClassName”是必需的
我的主程序看起来像:
谁能解释这个错误?
原因:java.lang.IllegalArgumentException:初始化错误 [class org.cleartk.classifier.jar.DefaultSequenceDataWriterFactory] 字段“dataWriterClassName”是必需的
我试图用其他数据写入器替换 InstanceDataWriter,但它们不起作用。
java - 如何在项目中创建类似的代码
我有一个使用cleartk的 java 项目。现在我需要为它制作一个额外的代码并进行测试。在他们的项目/src/main/java/org.cleartk.syntax.opennlp/下已经有一些java文件。我需要复制其中一个,重命名并更改里面的代码,这意味着我需要创建一些具有相同格式但不同功能的东西(我要制作的东西,他们称之为注释器)。这个java文件中的每一个都将与某个类(在目标文件夹中)链接,所以无论如何要复制和创建所有相关的文件、类以便我可以对它们进行更改?我用的是Eclipse,不知道有没有这样的方法?
opennlp - 我们是否需要在新的注释器中创建 process() ?
我创建了一个名为“NewAnnotator”的注释器,并尝试使其与 ClearTK 中的其他注释器一起在管道中工作,例如:SentenceAnnotator、PosTaggerAnnotator 等。所以我希望能够运行管道:
我编写了没有错误的代码,但是在运行时它返回了很多错误,我认为这是我的 NewAnnotator 代码中的这一部分:
我几乎从 PosTaggerAnnotator 复制了这部分,但它在我的 NewAnnotator 中没有用,我只是添加以便我可以使用:
因为我不知道没有其他方法可以添加到聚合中,.getDescription();
而且我也不知道如何getDescription()
在我的注释器中声明正确,即使没有它也可以正常工作。所以如果你经历过,请在这里给我一些建议!谢谢!
java - 在 Java 中使用 MaltParser 解析原始文本
我发现 Python 中的 NLKT 是通过 *raw_parse* 函数完成的,但我需要使用 Java。我发现 cleartk 有一个 MaltParser 包装器,但没有关于它的文档。我正在寻找一个函数或项目,它首先将原始英文文本转换为 MaltParser 可以使用的 conll 文件并使用 MaltParser 解析它。任何帮助表示赞赏。
stanford-nlp - 从 UIMA RUTA 调用 StanfordCoreNLPAnnotator 时未找到 cleartk 依赖项
我试图从 UIMA RUTA 中调用 ClearTK 的 StanfordCoreNLPAnnotator,但无法使其正常工作。我正在将 eclipse 与启用 maven 的 RUTA 项目一起使用,其中我还有用于辅助任务的 Java 代码。我已经使用 maven 导入了 cleartk-stanford-corenlp 0.8。
我尝试在我的脚本中使用这一行:
... 其中 utils/MyStanfordEngine.xml 是使用此 java 代码创建的 XML 描述符文件:
没有出现错误,但在执行时我得到:
我想我了解 RUTA 项目在 Maven 依赖项中找不到它,但出于协作目的,我需要坚持使用 Maven 作为我的依赖项工具。
有人可以帮忙吗?
更新:
当我遇到问题时,我使用的是 RUTA 2.1.0。从那以后我已经更新到 2.2.0rc1,但问题仍然存在。
根据 Peter 的建议(谢谢!),在 Java 构建路径中,我引用了一个空白的支持 Maven 的 Java 项目,该项目除了导入 cleartk-stanford-corenlp 0.8 之外什么都不做。我现在可以运行以下 RUTA 代码:
...成功地为输入文件夹中的所有文档执行了看起来像是所有预期注释的操作,但最终崩溃并出现此异常:
很抱歉整个堆栈跟踪,但我认为如果 RUTA 开发人员正在阅读此内容,他们可能想要整个内容。
有没有办法解决这个问题?我究竟做错了什么?
java - 为什么我的 Java 程序找不到 svm_learn 或 svm_classify?
我在 Java 中以编程方式使用 ClearTK 和 SVM-Light。我已经下载了用于 ClearTK 集成以及 SVM-Light 本身的包。无论我是通过 Eclipse 还是命令行运行,我都会不断收到
Cannot find file "svm_learn"
我尝试将它放在当前目录中。我尝试在命令行上使用“-cp”将其位置包含在内,或者将 Eclipse 中的文件夹添加到运行时类路径。我必须怎么做才能让我的 Java 代码识别这两个可执行文件所在的位置?
uima - Cleartk - Mallet Classifier 在 0 个实例上训练,尽管有数据
我正在使用 Cleartk (V. 2.0) 简单管道为 CAS 中的单个句子开发二进制分类器。然而,即使生成了训练数据,分类器也不会在训练期间拾取它,见下文。
我正在处理这个例子,特别是这个代码片段:
所以我的初始化代码如下所示:
当我运行我的管道时,数据被创建并存储到target/classifier-data/training-data.malletcrf
中,其中每一行都是一个特征向量,其中各个条目的格式<featurename>_<value>
和我的布尔目标属性。我可以在文本编辑器中打开它并查看它。
我正在使用字符串结果分类器,因为我的目标变量注释器继承自CleartkSequenceAnnotator
并且,正如我从对 Cleartk 列表的先前答案所了解的那样,似乎没有一个布尔分类器能够处理每个 CAS 的多个分类任务。
我粗略的分类器代码:
这是管道代码:
当我运行管道时,即使已经写入了训练数据,我也会得到以下控制台输出:
...这向我表明,分类器以某种方式没有从文件中提取训练数据。
我究竟做错了什么?提前致谢!
java - 如何将cleartk管道传输到ruta?
错误消息我正在为我的项目使用cleartk和Ruta。我想使用 SimplePipeline 将 ClearTk 与 Ruta 连接起来。如何将 ClearTk 输出值传递到 Ruta 脚本中?Cleartk Github 链接是 Github Example ClearTk
我正在尝试这种方法
但它会引发错误。
我的新错误消息是....
我的样本输入是...
我的脚本是.......