问题标签 [ctakes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3845 浏览

java - 使用 cTAKES 解析临床文档

我试图弄清楚如何从 Java 运行临床文档管道。我有一组纯文本的临床文件。我想解析这些文档并提取文档 doc_ID 中的列表,有频率为 freq 的 CUI。我花了几天时间安装 cTAKES 并寻找解决方案。我将其缩小到 ClinicalPipelineWithUmls.java,在其中进行测试并使用 AnaylisisEngineDescription 运行 SimplePipeline。这是代码的一部分:

问题是它找不到“InputStreamCollectionReader”。我搜索了它,但到目前为止没有成功!请您给我一个提示或指示一些方向吗?谢谢你的帮助!

0 投票
0 回答
1010 浏览

database - 如何将新的字典数据库添加到 cTAKES

如何将新数据库添加到 cTAKES 管道以执行查找?如何指定要查找的列以及如何使用返回的命中来注释文本?我浏览了 DictionaryLookupAnnotatorDB.xml 和 LookupDesc_Db.xml 文件。但是,我无法理解“lookupField”、“metaField”、“maxPermutationLevel”和“exclusionTags”等术语的含义。如果我添加一个新数据库,我需要正确配置这个 xml 文件。请指导我解决这些问题。

0 投票
2 回答
3090 浏览

nlp - 如何从命令行使用 cTAKES?

我想知道如何从命令行使用Apache cTAKES

例如:

  • 我有一个文件 note.txt,其中包含一些文本,例如“患者血糖升高,但测试证实没有糖尿病。患者的父亲患有成人糖尿病。”
  • 我想使用提供的分析引擎 \apache-ctakes-3.2.2-bin\apache-ctakes-3.2.2\desc\ctakes-clinical-pipeline\desc\analysis_engine\AggregatePlaintextUMLSProcessor.xml

如何使用命令行(即不使用 UIMA CAS Visual Debugger 或 Collection Processing Engine 等图形用户界面)获取分析引擎的输出(即注释)?我宁愿使用提供的 JAR 文件,而不必编译代码。

这个问题相当简单,但我在cTAKES 的 READMEConfluence上找不到信息 。

0 投票
0 回答
228 浏览

nlp - 如何强制 cTAKES 将 UMLS 存储在 RAM 中?

我正在通过 CPE 配置器使用Apache cTAKES处理一批文档。我的管道包括UmlsDictionaryLookUpAnnotator. 对于每个文档,UmlsDictionaryLookUpAnnotator从硬盘驱动器重新读取 UMLS。

这导致UmlsDictionaryLookUpAnnotator占用大部分运行时间:

在此处输入图像描述

并进行许多 I/O:

在此处输入图像描述

如何强制 cTAKES 将 UMLS 存储在 RAM 中?

我尝试将分配给 cTAKES 的内存从默认的 3 GB 增加到 ~8 GB,但没有帮助:

0 投票
1 回答
2175 浏览

java - 在django框架中使用java代码

好的,所以我有一个使用 Django 框架设计的简单界面,它从用户那里获取自然语言输入并将其存储在表中。

此外,我有一个使用 Java 构建的管道,使用 cTAKES 库进行命名实体识别,即它将获取用户提交的文本输入并使用相关的 UMLS 标记对其进行注释。

我想要做的是从用户那里获取输入,然后提交一次,将其引导到我的 java-cTAKES 管道中,然后将带注释的输出反馈回数据库。

我对这方面的 Web 开发方面还很陌生,并且在这个意义上找不到关于集成脚本的任何内容。因此,如果有人可以向我指出有用的资源或只是大体上正确的方向,那将非常有帮助。

========================== 更新:

好的,所以我发现子进程是我想在这种情况下使用的模块,我尝试根据文档实现一些简单的代码,但我得到了一个

我正在尝试做的简要概述:

这是我在视图中的代码。它的目的是从模型表单中获取文本输入,将其发布到数据库,然后将该输入传递到我的脚本中,该脚本会生成一个 XML 文件,该文件存储在数据库的另一列中。我对 django 很陌生,所以如果这是一个简单的修复,我很抱歉,但我找不到任何将 django 与子进程相关的文档,这是有帮助的。

型号代码片段:

更新 2:好的,通过更改子流程代码,代码不再中断,如下所示

但是,我现在得到一个我不明白的“无法找到或加载主类 pipeline.CtakesPipeline”,因为脚本在这个工作目录中的 shell 中运行良好。这是我试图用子进程调用的脚本。

我不确定如何解决此错误,因此不胜感激。

0 投票
0 回答
128 浏览

java - 将独立本体集成到基于 UIMA 的 cTAKES

好的,基本上,我有一个 cTAKES 管道,它使用 UMLSlookupannotator 来执行 NER(命名实体识别)。此外,我有一个使用 protege 制作的 .owl 本体。本质上,我想做的是扩展 UMLS 本体以包含我自己的本体。但是,我似乎无法在网上找到任何文档。

如果这里的任何人都有尝试使用 UIMA 或 cTAKES 进行此类操作的经验,并且可以为我指出任何真正值得赞赏的资源的方向。谢谢!

0 投票
0 回答
146 浏览

ctakes - 如何在 Eclipse IDE 中安装 cTAKES?

我想cTAKES在 Eclipse 中安装,但没有找到任何合适的文档。我正在关注 Apache 软件基金会的文档,但我无法安装cTAKES. 请建议任何适当的安装方法。

0 投票
1 回答
583 浏览

java - 使用 cTakes AggregatePlaintextUMLSProcessor 的示例代码

我是 Java 和 UIMA 的新手,我找不到一个全面的示例来使用代码中的 AggregatePlaintextUMLSProcessor 并以正确的格式打印结果。

我设法从命令行运行 cTakes,我看到它正在使用 FileWriterCasConsumer.xml 来编写输出,但我想知道我可以获得哪些其他格式。

我有 apache-ctakes-3.2.2 的代码,它是在 Windows 10 机器上构建的。

0 投票
1 回答
116 浏览

java - cTAKES 和线程安全

在使用 AnalysisEngine 和 JCAS 时,我在线程安全方面遇到了 cTAKES(一个 apache 项目)问题。

我尝试在 Apache 项目的 Question/Answer 上获得相同的解决方案,但没有获得足够的信息。如果有人可以指导解决相同的问题,我将不胜感激。

谢谢。

0 投票
1 回答
656 浏览

java - 在 UIMA 中以 JSON 格式获取输出

我正在使用Apache cTAKES,其中需要 JSON 格式的输出。我在这里尝试谷歌的gson

这将返回以下错误,

任何指导都会有很大帮助。谢谢