c# - 为什么 Lucene.NET IndexSearcher 返回零结果？

Question

我最近开始使用 Lucene.NET，但遇到了一些问题：我使用 anIndexWriter来索引我的文档C:\\TestIndex，我猜它在其中工作，因为它生成了几个.fnm, .frq, .cfx, .tii,.tis文件。

问题是当试图通过它们进行简单搜索时，我再也没有得到任何结果。下面是我使用的代码，

using Lucene.Net.Documents;
using Lucene.Net.Index;
using Lucene.Net.QueryParsers;
using Lucene.Net.Search;
using Lucene.Net.Store;
using Lucene.Net.Util;

//Provide the directory where index is stored
Directory directory = FSDirectory.Open(newSystem.IO.DirectoryInfo(@"C:\\TestIndex")); 

IndexReader indexReader = IndexReader.Open(directory, true);
Searcher indexSearch = new IndexSearcher(indexReader);

Analyzer std = new StandardAnalyzer(Version.LUCENE_29);
QueryParser parser = new QueryParser(Version.LUCENE_29, "text", std);
Query qry = parser.Parse("morning");

// true opens the index in read only mode
Searcher srchr = new IndexSearcher(IndexReader.Open(directory, true));

TopScoreDocCollector cllctr = TopScoreDocCollector.Create(100, true);

ScoreDoc[] hits = cllctr.TopDocs().ScoreDocs;
srchr.Search(qry, cllctr); 

for (int i = 0; i < hits.Length; i++)
{
    int docId = hits[i].Doc;
    float score = hits[i].Score;
    Document doc = srchr.Doc(docId);
    Console.WriteLine("Searched from Text: " + doc.Get("text"));
}

我尝试了几种方法，但从未得到任何结果。你有什么主意吗？

下面是索引代码，

IndexWriter indexWriter = 
    new IndexWriter(
        luceneDir, 
        new StandardAnalyzer(Version.LUCENE_29), 
        true, 
        IndexWriter.MaxFieldLength.UNLIMITED);

string[] listOfFiles = Directory.GetFiles(@"C:\Projects\lucene.net-trunk\build\vs2010\demo\MyTestProject\TestDocs");

foreach (string s in listOfFiles)
{
    String content = File.ReadAllText(s);
    Document doc = new Document();
    String title = s;

    // adding title field
    doc.Add(new Field("title", title, Field.Store.YES, Field.Index.NOT_ANALYZED));  
    doc.Add(new Field("content", content, Field.Store.YES, Field.Index.ANALYZED));

    indexWriter.AddDocument(doc);
}

indexWriter.Optimize();
indexWriter.Dispose();

score 2 · Accepted Answer

使用 luke 检查索引以确保它有数据，您也可以执行搜索以验证您的搜索条件

http://www.getopt.org/luke/

编辑- （Luke 将使用 lucene 和 lucene.net 索引，您需要安装 java 才能使用）

编辑

更新线路

Lucene.Net.QueryParsers.QueryParser parser = new Lucene.Net.QueryParsers.QueryParser(Lucene.Net.Util.Version.LUCENE_29, "text", std);

和

Lucene.Net.QueryParsers.QueryParser parser = new Lucene.Net.QueryParsers.QueryParser(Lucene.Net.Util.Version.LUCENE_29, "content", std);

您已将默认搜索字段设置为text不存在

您还试图在您的console.write行中获取错误的字段

score 0 · Accepted Answer

确保在索引和搜索时使用相同的分析器（在你的情况下，StandardAnalyzer我猜是这样）：

using Lucene.Net.Analysis;
using Lucene.Net.Documents;
using Lucene.Net.Index;
using Lucene.Net.Store;

...

Directory directory = FSDirectory.Open(new System.IO.DirectoryInfo(@"C:\\TestIndex"));

var writer = new IndexWriter(
    directory, 
    new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29), 
    true, 
    new MaxFieldLength(int.MaxValue));

更新

我使用稍微不同的搜索方法，但无论如何，也许你需要交换这两行：

ScoreDoc[] hits = cllctr.TopDocs().ScoreDocs;
srchr.Search(qry, cllctr);

所以它变成：

srchr.Search(qry, cllctr); 
ScoreDoc[] hits = cllctr.TopDocs().ScoreDocs;

这意味着收集器首先在执行搜索时收集结果，然后您通过收集器实例获取评分文档。

score 0 · Accepted Answer

您可以尝试明确指定您正在搜索的字段吗？例如：

    Lucene.Net.QueryParsers.QueryParser parser = new Lucene.Net.QueryParsers.QueryParser(Lucene.Net.Util.Version.LUCENE_29, "text", std);
    Lucene.Net.Search.Query qry = parser.Parse("content: morning");

我认为 Lucene 要求您告诉它您要运行查询的字段（标题、内容...）。

c# - 为什么 Lucene.NET IndexSearcher 返回零结果？

3 回答 3

Related

Reference