在此处下载适用于 Java 的Snowball。
它包括一个名为org.tartarus.snowball.ext.italianStemmer
extends的类SnowballStemmer
。
要使用 aSnowballStemmer
请查看以下动词attaccare
现在时的测试代码:
import org.junit.Test;
import org.tartarus.snowball.SnowballStemmer;
import org.tartarus.snowball.ext.italianStemmer;
public class SnowballItalianStemmerTest {
@Test
public void testSnowballItalianStemmerAttaccare() {
SnowballStemmer stemmer = (SnowballStemmer) new italianStemmer();
String[] tokens = "attacco attacchi attacca attacchiamo attaccate attaccano".split(" ");
for (String string : tokens) {
stemmer.setCurrent(string);
stemmer.stem();
String stemmed = stemmer.getCurrent();
Assert.assertEquals("attacc", stemmed);
System.out.println(stemmed);
}
}
}
输出:
attacc
attacc
attacc
attacc
attacc
attacc
另一个使用示例参见TestApp.java
包含在同一个 tgz 文件中。
用 Java 编写的 Lucene 使用 Snowball 进行词干提取,例如作为SnowballFilter中的过滤器。