solr - 使用自定义文档转换器在 solr 中获取匹配项的有效负载

Question

在 Solr 中，我有一个名为“payloads”的自定义字段类型，它支持有效负载

<fieldtype name="payloads" stored="true" indexed="true" class="solr.TextField" >
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="com.abc.CustomPayloadTokenFilterFactory" encoder="custom"/>
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
</fieldtype>

我已经定义了这种类型的字段：

<field name = "somefield" type="payloads" indexed="true" stored="true"  multiValued = "true" omitNorms="true" />

"somefield" 的内容看起来像： ["abcd|payload1", "xyz|payload2", "mnop|payload3" ] （可以扩展到 1K 字）

假设我的查询词是“xyz”。我想只返回“xyz|payload2”，或者最好只返回“payload2”。

我在 Solr 中编写了一个自定义 DocumentTransformer，它在将文档与我的查询匹配后可以解析该字段并返回“payload2”。

但是如果感觉我应该能够提取“payload2”而不必解析整个字段，因为在内部 solr 可能已经索引了这些信息。

我正在尝试编写另一个文档转换器，它可以使用 PostingsEnum 返回有效负载：

IndexReader reader = this.context.getSearcher().getIndexReader();
final TermsEnum termsEnum = MultiFields.getTerms(
    reader, this.kField).iterator();
String term = "xyz";
PostingsEnum postingsEnum = MultiFields.getTermDocsEnum(
    reader,
    "somefield",
    new BytesRef(term));

if (termsEnum.seekExact(new BytesRef(term))) {
    PostingsEnum pe = termsEnum.postings(postingsEnum, PostingsEnum.ALL);

    int nextDoc = pe.advance(docid);
    postingsEnum.advance(docid);

    if (nextDoc == docid) { 
        if (sb.length() > 0)
            sb.append(",");
        sb.append(term );
        sb.append(pe.getPayload());
    }
}

但是当我执行“pe.getPayload()”时，我只是得到“null”。关于上述代码可能有什么问题以及为什么不存在有效负载的任何建议/指针？

（注意：呈现的场景非常简单，实际上文档和查询中还存在其他内容，因此请不要建议更改架构或不使用有效负载。）

solr - 使用自定义文档转换器在 solr 中获取匹配项的有效负载

0 回答 0

Related

Reference