我已经使用此链接中提供的 OpenNLP 解析器代码解析了文档,并得到以下输出:
(TOP (S (NP (NN Programcreek)) (VP (VBZ is) (NP (DT a) (ADJP (RB very) (JJ huge) (CC and) (JJ useful)) (NN website)))))
从中我想只提取有意义的词,这意味着我想删除所有停用词,因为我想根据这些有意义的词进一步分类。你能建议我如何从解析的输出中删除停用词吗?
最后我想得到下面的输出
(TOP (S (NP (NN Programcreek)) (JJ useful)) (NN website)))))
请帮我解决这个问题,如果 OpenNLP 无法实现,请向我推荐任何其他用于自然语言处理的 Java 库。因为我的主要目标是解析文档并仅获取有意义的单词。