我正在通过 CPE 配置器使用Apache cTAKES处理一批文档。我的管道包括UmlsDictionaryLookUpAnnotator
. 对于每个文档,UmlsDictionaryLookUpAnnotator
从硬盘驱动器重新读取 UMLS。
这导致UmlsDictionaryLookUpAnnotator
占用大部分运行时间:
并进行许多 I/O:
如何强制 cTAKES 将 UMLS 存储在 RAM 中?
我尝试将分配给 cTAKES 的内存从默认的 3 GB 增加到 ~8 GB,但没有帮助:
java -Dctakes.umlsuser=MY_UMLS_USERNAME -Dctakes.umlspw=MY_UMLS_PASSWORD -cp "%CTAKES_HOME%/desc/;%CTAKES_HOME%/resources/;%CTAKES_HOME%/lib/*" -Dlog4j.configuration=file:/%CTAKES_HOME%/config/log4j.xml -Xms512M -Xmx8g org.apache.uima.tools.cpm.CpmFrame