我有一个大型 Apache Jena TDB,我想使用 Apache Jena 2.10.2 构建一个 Lucene 索引,以用于新的文本搜索功能。我发现文档很难遵循。
我首先尝试在代码中使用配置,但遇到了依赖问题。lecene-core 和 solr-solrj 的任何组合都会导致某些“classNotFound”错误或“StandardAnalyzer overrides final method tokenStream”错误。代码示例:
Dataset ds1 = DatasetFactory.createMem() ;
EntityDefinition entDef = new EntityDefinition("uri", "text", RDFS.label) ;
Directory dir = new RAMDirectory();
// Have also tried creating the index in a file
File indexDir = new File("luceneIndexes");
Directory dir = FSDirectory.open(indexDir);
// Fails on this line
Dataset ds = TextDatasetFactory.createLucene(ds1, dir, entDef) ;
我认为唯一的解决方案可能是创建一个文本数据集汇编器,但如果有人对在代码中创建它有建议,我更愿意这样做。