5

我想在这里使用词干分析器来合并字数。
http://snowball.tartarus.org/download.html
该页面有一个下载链接,但我不知道如何将文件集成到我的eclipse项目中
它不仅仅是一个放入我的lib文件夹的jar,它是一个文件系统。有谁知道一些解释这一点的文件,因为我在网站上没有看到任何文件。
(如,我要导入什么,我该如何称呼它等等。)

4

1 回答 1

16

构建 jar 文件并将其添加到您的构建路径。

细节:

  • 从这里下载带有代码的 tgz http://snowball.tartarus.org/download.php
  • 解压缩。
  • 转到 libstemmer_java 目录并阅读 README。
  • 按照说明进行编译(使用 javac)。
  • 您可能必须更正或删除 java/org/tartarus/snowball/ext/frenchStemmer.java,因为它有错误并且无法编译。
  • 创建 jar 文件:转到 libstemmer_java/java 目录,然后 jar cvf libstemmer.jar *
  • 将 libstemmer.jar 添加到您的构建路径(在 Eclipse 中:项目-属性-Java 构建路径-库选项卡)。

然后您可以使用词干分析器执行以下操作:

import org.tartarus.snowball.ext.spanishStemmer;
...
spanishStemmer stemmer = new spanishStemmer();
stemmer.setCurrent("torero");
if (stemmer.stem()){
    System.out.println(stemmer.getCurrent());
}
于 2014-04-27T08:38:11.660 回答