0

我在 lucene 中编写了一个插件,它注释某些术语并以这种方式存储它们的跨度<term>,<span>;<term>,<span>;..

现在我需要只使用这些跨度而不是默认的 lucene 存储跨度来处理跨度附近的查询。这是因为并非所有相似的术语都被注释。所以基本上,如果我在 k 个标记中查询术语,那么我应该能够通过减去它们相应的跨度来获得它们的跨度距离。我将如何在 lucene 中做到这一点?我是新手,所以请尽可能描述。

谢谢,阿南特。

4

1 回答 1

0

我在 Lucene 中遵循的一个很好的一般规则是将经过特殊处理的数据放入其自己的字段中,这样就几乎没有混淆的机会。通过这种方式,您可以按照您想要的方式执行接近度查询。(这将使您的索引更大。)

于 2012-12-04T23:12:39.590 回答