2

在过去的几天里,我一直在为在 elasticsearch 中索引的文档实施潜在语义分析。第一步是构建术语文档矩阵。所以我认为使用将索引作为输入的 stanford nlp 库含义小写,删除停用词,可能是词干并生成矩阵,或者只是可以使用 elasticsearch java api 来构建它?

4

1 回答 1

0

是的,您可以使用_analyzeelasticsearch 的端点并tokenizing/character mapping/stemming/...处理您的文本并返回结果。

于 2017-05-20T15:26:19.673 回答