6

我已经建立了一个 Lucene.net 书籍索引。一切正常,但我需要添加另一种查询索引的方法,但我不知道该怎么做。

基本上每本书都有适合的年龄范围。这由两列表示 - minAge 和 maxAge。两列都是整数。

我在以下循环中索引和存储这些字段

foreach (var catalogueBook in books)
{
    var book = new Book(catalogueBook.CatalogueBookNo,catalogueBook.IssueId);

    var strTitle = book.FullTitle ?? "";
    var strAuthor = book.Author ?? "";
    // create a Lucene document for this book
    var doc = new Document();

    // add the ID as stored but not indexed field, not used to query on
    doc.Add(
        new Field(
            "BookId",
            book.CatalogueBookNo.ToString(System.Globalization.CultureInfo.InvariantCulture),
            Field.Store.YES,
            Field.Index.NOT_ANALYZED_NO_NORMS,
            Field.TermVector.NO));

    // add the title and author as stored and tokenized fields, the analyzer processes the content
    doc.Add(
        new Field("FullTitle",
            strTitle.Trim().ToLower(), 
            Field.Store.YES, 
            Field.Index.ANALYZED, 
            Field.TermVector.NO));

    doc.Add(
        new Field("Author",
            strAuthor.Trim().ToLower(),
            Field.Store.YES,
            Field.Index.ANALYZED,
            Field.TermVector.NO));

    doc.Add(
        new Field("IssueId", 
            book.IssueId, 
            Field.Store.YES, 
            Field.Index.NOT_ANALYZED_NO_NORMS, 
            Field.TermVector.NO));

    doc.Add(
        new Field(
            "PublicationId",
            book.PublicationId.Trim().ToLower(),
            Field.Store.YES,
            Field.Index.NOT_ANALYZED_NO_NORMS,
            Field.TermVector.NO));

    doc.Add(
        new Field(
            "MinAge",
            book.MinAge.ToString("0000"),
            Field.Store.YES,
            Field.Index.NOT_ANALYZED_NO_NORMS,
            Field.TermVector.NO));

    doc.Add(
        new Field(
            "MaxAge",
            book.MaxAge.ToString("0000"),
            Field.Store.YES,
            Field.Index.NOT_ANALYZED_NO_NORMS,
            Field.TermVector.NO));

    doc.Add(new NumericField("Price",Field.Store.YES,true).SetDoubleValue(Convert.ToDouble(book.Price)));

    //Now we can loop through categories
    foreach(var bc in book.GetBookCategories())
    {
        doc.Add(
            new Field("CategoryId",
                bc.CategoryId.Trim().ToLower(),
                Field.Store.YES,
                Field.Index.NOT_ANALYZED_NO_NORMS,
                Field.TermVector.NO));
    }

    // add the document to the index
    indexWriter.AddDocument(doc);
}

// make lucene fast
indexWriter.Optimize();
}

如您所见,我正在填充 minAge 和 maxAge 字段,因为我认为对它运行 TermRangeQuery 是最简单的。

但是,我需要使用 Age 查询 minAge 和 maxAge 列,以查看该 Age 是否在 minAge 和 maxAge 定义的 Age 范围内。

Sql 将是

Select * 
From books 
where @age >= minAge and @age <= maxAge

不幸的是,我看不到这样做的方法。这在 Lucene.Net 中是否可行?

4

2 回答 2

10

如果内存可用,您应该能够使用范围查询来执行此操作。这实际上与标准范围查询相反,但您应该能够做到,例如:

+minAge:[* TO @age] +maxAge:[@age TO *]

或者,如果您构建查询对象,则具有上限或下限 null 的 RangeQuery(或者更好的是 NumericRangeQuery)可用作开放式范围。

我以前使用过上面的语法,但支持似乎有点……不稳定。如果这不起作用,您始终可以设置一个足够低的下限 (0) 和高上限(例如 1000),例如:

+minAge:[0000 TO @age] +maxAge:[@age TO 1000]

这应该足够安全,除非有任何玛土撒拉。

于 2012-09-28T23:05:19.160 回答
4

最终在上面 femtoRgon 的回答的帮助下做到了这一点。

var q = new TermRangeQuery("MinAge", "0000",searchTerms.Age.ToString("0000"), true, true);
mainQuery.Add(q, BooleanClause.Occur.MUST);
q = new TermRangeQuery("MaxAge", searchTerms.Age.ToString("0000"),"9999", true, true);
mainQuery.Add(q, BooleanClause.Occur.MUST);

翅膀

于 2012-09-29T09:44:27.033 回答