1

对 cTAKES 非常陌生,并且正在浏览文档,对UMLS 和 SNOMEDCT “词汇表”到底是什么感到好奇。用户安装文档似乎并没有真正说明并只是申请 UMLS 许可证,并且围绕UMLS Metathesaurus 的语言并没有真正透露更多关于被访问数据的结构。例如。是一些在线 API 服务吗?cTAKES 下载附带的某些文件是否只能使用根据在线数据库检查的有效 UMLS 密码才能解锁?

4

1 回答 1

1

可以在此处 ( https://www.nlm.nih.gov/research/umls/knowledge_sources/metathesaurus/index.html ) 和此处 ( https://www.ncbi.nlm ) 找到有关 UMLS Metathesaurus 和 SNOMEDCT 的信息.nih.gov/books/NBK9676/,特别是https://www.ncbi.nlm.nih.gov/books/NBK9684/):

Metathesaurus 是一个非常大的、多用途的、多语言的 [关系?] 词汇数据库,其中包含有关生物医学和健康相关概念、它们的各种名称以及它们之间的关系的信息。专为系统开发人员设计...

... Metathesaurus 包含来自 100 多个术语、分类和叙词表的概念、概念名称和其他属性,其中一些在多个版本中。

虽然我不确定 cTAKES 究竟是如何实现其对 UMLS Metathesaurus 的使用(任何知道的人都可以启发),但我假设它正在访问基于您需要添加到示例脚本中的 UMLS 凭据的关系数据库的一些 API cTAKES 下载附带的(请参阅https://cwiki.apache.org/confluence/display/CTAKES/cTAKES+4.0+User+Install+Guide#cTAKES4.0UserInstallGuide-(Recommended)AddUMLSaccessrights)。

...您可以从两种关系格式中进行选择:2004 年推出的丰富发布格式 (RRF) 和原始发布格式 (ORF)。

(我认为)这是用于为用于处理cTAKES 中文本的 UIMA 分析引擎提供动力的东西

UIMA是一种架构,其中包含称为分析引擎 (AE)的基本构建块以分析文档 [...] 注释器如何表示和共享其结果是 UIMA 架构的重要组成部分。为了实现组合和重用,UIMA精确地为这些目的定义了一个通用分析结构 (CAS) 。CAS 是一个基于对象的容器,用于管理和存储具有属性和值的类型化对象,https://www.ibm.com/developerworks/data/downloads/uima/#How-does-it-work

于 2019-04-20T00:26:57.097 回答