在过去的几天里,我一直在为在 elasticsearch 中索引的文档实施潜在语义分析。第一步是构建术语文档矩阵。所以我认为使用将索引作为输入的 stanford nlp 库含义小写,删除停用词,可能是词干并生成矩阵,或者只是可以使用 elasticsearch java api 来构建它?
问问题
470 次
在过去的几天里,我一直在为在 elasticsearch 中索引的文档实施潜在语义分析。第一步是构建术语文档矩阵。所以我认为使用将索引作为输入的 stanford nlp 库含义小写,删除停用词,可能是词干并生成矩阵,或者只是可以使用 elasticsearch java api 来构建它?