Carrot2-我尝试通过 bisectingKmeans 算法对文档进行聚类。我设置了resouceLookup的属性并测试了英文/中文的语言。它都导致错误“资源查找位置中没有名为 stopwords.ar 的资源......”。我写的鳕鱼:
//set the resoucelookup
File resDir = new File("resouces");
ResouceLookup res = new ResouceLookup(new DirLocator(resDir));
LexicalDataLoaderDescriptor.attributeBuilder(preprocessAttr).resourceLookup(res);
//set the language
MultilingualClusteringDescriptor.attributeBuilder(processingAttr)
.defaultLanguage(LanguageCode.CHINESE_SIMPLIFIED);
有什么问题?谢谢。