我想使用 stanford nlp 解析文档并从中删除停用词,所以我的问题是如何使用 stanford nlp 删除停用词是否有任何 api 可以删除它,我找到 StopWords 类但我不知道如何使用它,请建议我如何得到这个?
谢谢
我想使用 stanford nlp 解析文档并从中删除停用词,所以我的问题是如何使用 stanford nlp 删除停用词是否有任何 api 可以删除它,我找到 StopWords 类但我不知道如何使用它,请建议我如何得到这个?
谢谢
我认为您可以使用此注释器删除停用词 https://github.com/jconwell/coreNlp
如果我是正确的,上面@Raju Penumatsa 提到的注释器可以在 Maven 上访问: https ://mvnrepository.com/artifact/com.zensols/stopword-annotator并在另一个 git repo 中维护:https://github。 com/plandes/停用词注释器
通过使用 Maven 存储库,您可以通过使用 Maven 或 Gradle 等构建工具将其导入项目中轻松地将注释器用作依赖项,并且您不必手动将 lib 复制到您的类路径中,因此它更容易和更易于维护。我链接的 Git 存储库将 jconwell/coreNlp 项目的停用词插件移动到一个单独的存储库中,并添加了一些额外的元数据,以便能够在 Maven Central 上发布它。