我想弄清楚有效载荷评分如何在 lucene 中工作。由于我不明白 PayloadFunction 适合哪里,我想我并不真正了解它是如何工作的。尝试用谷歌搜索它,但除了建议通过源代码之外找不到太多。好吧,如果有人可以在这里解释它会很好,否则它是源代码:)
问问题
1409 次
1 回答
3
它分为三个部分。首先,您应该在分析期间生成有效载荷。这可以使用PayloadAttribute
. 您只需在分析期间将此属性添加到您想要的术语中。
class MyFilter extends TokenFilter {
private PayloadAttribute attr;
public MyFilter() {
attr = addAttribute(PayloadAttribute.class);
}
public final boolean incrementToken() throws IOException {
if (input.incrementToken()) {
Payload p = new Payload(PayloadHelper.encodeFloat(42));
attr.setPayload(p);
} else {
attr.setPayload(null);
}
}
然后在搜索过程中你应该使用特殊的查询类PayloadTermQuery
。此类的行为与SpanTermQuery
索引中的有效负载相同,但会跟踪。使用自定义Similarity
实现,您可以对文档中出现的每个有效负载进行评分。
public class MySimilarity extends DefaultSimilarity {
public float scorePayload(int docID, String fieldName,
int start, int end, byte[] payload,
int offset, int length) {
if (payload != null) {
return PayloadHelper.decodeFloat(payload, offset);
} else {
return 1.0f;
}
}
}
最后,使用PayloadFunction
您可以汇总文档上的有效负载分数以生成最终文档分数。
于 2011-06-27T22:11:04.837 回答