当我尝试用 Stanford-NLP 和 CoreNLP 分析文本时,性能很差。处理来自 CNN.com 的文档大约需要 30 秒。
我的代码基本上创建了一个具有以下配置的 StanfordCoreNLP 实例:
注释器 = 标记化、ssplit、pos、引理、ner、解析、dcoref sutime.binders = 0
当我禁用“ner, parse, dcoref”时,性能非常快。由于我需要获取语义图,我想知道是否有一种优化性能的方法或另一种获取语义图的方法来检索诸如直接宾语、名词主语等内容。