我想在这里使用词干分析器来合并字数。
http://snowball.tartarus.org/download.html
该页面有一个下载链接,但我不知道如何将文件集成到我的eclipse项目中
它不仅仅是一个放入我的lib文件夹的jar,它是一个文件系统。有谁知道一些解释这一点的文件,因为我在网站上没有看到任何文件。
(如,我要导入什么,我该如何称呼它等等。)
问问题
10495 次
1 回答
16
构建 jar 文件并将其添加到您的构建路径。
细节:
- 从这里下载带有代码的 tgz http://snowball.tartarus.org/download.php
- 解压缩。
- 转到 libstemmer_java 目录并阅读 README。
- 按照说明进行编译(使用 javac)。
- 您可能必须更正或删除 java/org/tartarus/snowball/ext/frenchStemmer.java,因为它有错误并且无法编译。
- 创建 jar 文件:转到 libstemmer_java/java 目录,然后 jar cvf libstemmer.jar *
- 将 libstemmer.jar 添加到您的构建路径(在 Eclipse 中:项目-属性-Java 构建路径-库选项卡)。
然后您可以使用词干分析器执行以下操作:
import org.tartarus.snowball.ext.spanishStemmer;
...
spanishStemmer stemmer = new spanishStemmer();
stemmer.setCurrent("torero");
if (stemmer.stem()){
System.out.println(stemmer.getCurrent());
}
于 2014-04-27T08:38:11.660 回答