问题标签 [snowballanalyzer]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

14 问题

0 投票

1 回答

2614 浏览

maven-2 - 在 pom.xml 中使用 Snowball 分析器和 Lucene 2.4.0 的正确依赖项是什么？

我正在尝试在我的 Maven 2 项目中将SnowballAnalyzer换成StandardAnalyzer 。我目前正在使用

但我不断收到以下错误：

Hank Gay

2009-02-09T19:58:45.153

0 投票

1 回答

1107 浏览

java - 使用 Lucene 索引文本文档时出现异常，使用 SnowballAnalyzer 进行清理

我正在使用 Lucene 对文档进行索引，并尝试应用 SnowballAnalyzer 从文本中删除标点符号和停用词。我不断收到以下错误:(

IllegalAccessError：试图从类 org.apache.lucene.analysis.snowball.SnowballAnalyzer 访问方法 org.apache.lucene.analysis.Tokenizer.(Ljava/io/Reader;)V

这是代码，我将非常感谢帮助！！！！我是新来的..

公共类索引器{

}

private void indexDocument(File someDoc) 抛出 IOException {

} }

java full-text-indexing lucene snowballanalyzer

2010-04-28T07:27:53.137

0 投票

1 回答

1199 浏览

lucene - 在 Lucene 中获取词干

在 Lucene 中，我使用 SnowballAnalyzer 进行索引和搜索。

当我建立索引时，我对我的索引进行查询。例如，我对字段“body”进行了“specialized”查询。IndexSearcher 返回包含“specialize、specialized 等”的文档。因为 SnowballAnalyzer 进行了词干提取。

现在 - 拥有顶级文档 - 我想从正文字段中获取文本片段。此片段应包含查询词的词干版本。
例如，其中一份退回的文件有 body 字段：“不幸的是，在某些州，盲人只能使用一般康复机构，这些机构为各种残疾的人提供服务。在这些情况下，为视障人士提供的专门服务是不适用的。”始终可用。” 然后我希望得到部分'在这些情况下，视觉的专业服务'作为片段。此外，我想从这个片段中获得条款。可以执行此操作的代码，但带有一个标记为“？” 字符，我有一个问题是：

我想怎么做 IndexReader ir = IndexReader.open(fsDir); TermPositionVector tv = (TermPositionVector)ir.getTermFreqVector(hits.scoreDocs[i].doc, "body");

? - 这里：查询 - 查询必须是术语。因此，如果真正的查询是“专门的”，那么查询应该是专门的，通常雪球分析器会这样做。我怎样才能得到分析器为单个单词或短语分析的术语，因为查询可以包含一个短语：“专业机器”。

int idx = tv.indexOf(query); int [] idxs = tv.getTermPositions(idx); for(String t : tv.getTerms()){ int iidx = tv.indexOf(t); int [] iidxs = tv.getTermPositions(iidx); for(int ni : idxs){ tmpValue = 0.0f; for(int nni : iidxs){ if(Math.abs(nni-ni)<= Settings.termWindowSize){

编辑
我找到了获取词干的方法： Query object toString(String fieldName)
Query q = queryParser.parse("some text to be parsed"); String parsedQuery = q.toString();
有一个方法；

lucene snowballanalyzer

2010-11-20T21:29:53.460

0 投票

1 回答

540 浏览