1

我需要获取 lucene 中精确短语的索引。我用这个得到的一个词的索引:

TermFreqVector termFreqVector = reader.getTermFreqVector(docId, "content");
TermPositionVector termPositionVector = (TermPositionVector) termFreqVector;
int termIndex = termFreqVector.indexOf(searcWord);

termFreqVector.indexOf(searcWord)会返回一个搜索词的索引。

问题是我需要搜索一个短语,并且需要获取它的索引。如果我将一个短语传递给 termFreqVector 它总是返回 me -1,但我 100% 确定该短语存在。有什么解决办法吗?

4

1 回答 1

1

您需要手动完成。例如,如果你的词组是president obama,你需要找到在 offset 处的词的i所有位置。presidenti+1obama

于 2012-05-10T08:08:28.207 回答