问题标签 [ctakes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 使用 cTAKES 解析临床文档
我试图弄清楚如何从 Java 运行临床文档管道。我有一组纯文本的临床文件。我想解析这些文档并提取文档 doc_ID 中的列表,有频率为 freq 的 CUI。我花了几天时间安装 cTAKES 并寻找解决方案。我将其缩小到 ClinicalPipelineWithUmls.java,在其中进行测试并使用 AnaylisisEngineDescription 运行 SimplePipeline。这是代码的一部分:
问题是它找不到“InputStreamCollectionReader”。我搜索了它,但到目前为止没有成功!请您给我一个提示或指示一些方向吗?谢谢你的帮助!
database - 如何将新的字典数据库添加到 cTAKES
如何将新数据库添加到 cTAKES 管道以执行查找?如何指定要查找的列以及如何使用返回的命中来注释文本?我浏览了 DictionaryLookupAnnotatorDB.xml 和 LookupDesc_Db.xml 文件。但是,我无法理解“lookupField”、“metaField”、“maxPermutationLevel”和“exclusionTags”等术语的含义。如果我添加一个新数据库,我需要正确配置这个 xml 文件。请指导我解决这些问题。
nlp - 如何从命令行使用 cTAKES?
我想知道如何从命令行使用Apache cTAKES。
例如:
- 我有一个文件 note.txt,其中包含一些文本,例如“患者血糖升高,但测试证实没有糖尿病。患者的父亲患有成人糖尿病。”
- 我想使用提供的分析引擎
\apache-ctakes-3.2.2-bin\apache-ctakes-3.2.2\desc\ctakes-clinical-pipeline\desc\analysis_engine\AggregatePlaintextUMLSProcessor.xml
如何使用命令行(即不使用 UIMA CAS Visual Debugger 或 Collection Processing Engine 等图形用户界面)获取分析引擎的输出(即注释)?我宁愿使用提供的 JAR 文件,而不必编译代码。
nlp - 如何强制 cTAKES 将 UMLS 存储在 RAM 中?
我正在通过 CPE 配置器使用Apache cTAKES处理一批文档。我的管道包括UmlsDictionaryLookUpAnnotator
. 对于每个文档,UmlsDictionaryLookUpAnnotator
从硬盘驱动器重新读取 UMLS。
这导致UmlsDictionaryLookUpAnnotator
占用大部分运行时间:
并进行许多 I/O:
如何强制 cTAKES 将 UMLS 存储在 RAM 中?
我尝试将分配给 cTAKES 的内存从默认的 3 GB 增加到 ~8 GB,但没有帮助:
java - 在django框架中使用java代码
好的,所以我有一个使用 Django 框架设计的简单界面,它从用户那里获取自然语言输入并将其存储在表中。
此外,我有一个使用 Java 构建的管道,使用 cTAKES 库进行命名实体识别,即它将获取用户提交的文本输入并使用相关的 UMLS 标记对其进行注释。
我想要做的是从用户那里获取输入,然后提交一次,将其引导到我的 java-cTAKES 管道中,然后将带注释的输出反馈回数据库。
我对这方面的 Web 开发方面还很陌生,并且在这个意义上找不到关于集成脚本的任何内容。因此,如果有人可以向我指出有用的资源或只是大体上正确的方向,那将非常有帮助。
========================== 更新:
好的,所以我发现子进程是我想在这种情况下使用的模块,我尝试根据文档实现一些简单的代码,但我得到了一个
我正在尝试做的简要概述:
这是我在视图中的代码。它的目的是从模型表单中获取文本输入,将其发布到数据库,然后将该输入传递到我的脚本中,该脚本会生成一个 XML 文件,该文件存储在数据库的另一列中。我对 django 很陌生,所以如果这是一个简单的修复,我很抱歉,但我找不到任何将 django 与子进程相关的文档,这是有帮助的。
型号代码片段:
更新 2:好的,通过更改子流程代码,代码不再中断,如下所示
但是,我现在得到一个我不明白的“无法找到或加载主类 pipeline.CtakesPipeline”,因为脚本在这个工作目录中的 shell 中运行良好。这是我试图用子进程调用的脚本。
我不确定如何解决此错误,因此不胜感激。
java - 将独立本体集成到基于 UIMA 的 cTAKES
好的,基本上,我有一个 cTAKES 管道,它使用 UMLSlookupannotator 来执行 NER(命名实体识别)。此外,我有一个使用 protege 制作的 .owl 本体。本质上,我想做的是扩展 UMLS 本体以包含我自己的本体。但是,我似乎无法在网上找到任何文档。
如果这里的任何人都有尝试使用 UIMA 或 cTAKES 进行此类操作的经验,并且可以为我指出任何真正值得赞赏的资源的方向。谢谢!
ctakes - 如何在 Eclipse IDE 中安装 cTAKES?
我想cTAKES
在 Eclipse 中安装,但没有找到任何合适的文档。我正在关注 Apache 软件基金会的文档,但我无法安装cTAKES
. 请建议任何适当的安装方法。
java - 使用 cTakes AggregatePlaintextUMLSProcessor 的示例代码
我是 Java 和 UIMA 的新手,我找不到一个全面的示例来使用代码中的 AggregatePlaintextUMLSProcessor 并以正确的格式打印结果。
我设法从命令行运行 cTakes,我看到它正在使用 FileWriterCasConsumer.xml 来编写输出,但我想知道我可以获得哪些其他格式。
我有 apache-ctakes-3.2.2 的代码,它是在 Windows 10 机器上构建的。
java - cTAKES 和线程安全
在使用 AnalysisEngine 和 JCAS 时,我在线程安全方面遇到了 cTAKES(一个 apache 项目)问题。
我尝试在 Apache 项目的 Question/Answer 上获得相同的解决方案,但没有获得足够的信息。如果有人可以指导解决相同的问题,我将不胜感激。
谢谢。