我有一些使用 Lucene 索引 IList 的无聊问题,我无法解决。
我的实体包含 IList,我应用 IndexedEmbedded 属性,如下所示:
[ScriptIgnore] //will not serialize
[IndexedEmbedded(Depth = 1, Prefix = "BookAdditionalInfos_"]
public virtual IList<BookAdditionalInfo> BookAdditionalInfos { get; set; }
此外,其他一些属性使用 Field 属性进行索引:
[Field(Index.Tokenized, Store = Store.Yes)]
在为索引标记实体后,我必须对 1200 万行进行初始索引(使用批处理)。在我开始索引名为 BookAdditionalInfos 的 IList 之前,一切都很完美。如果没有这个 IndexedEmbedded 属性(或没有索引这个 IList),一切正常,并且每个具有 Field 属性的属性标记都将被索引。
我正在使用流畅的 NHibernate。
有什么问题?
谢谢
编辑:我也看了http://ayende.com/blog/3992/nhibernate-search,但没有任何结果
问题是:当我尝试索引 IList 时,索引会永远占用并且不会索引任何内容。没有索引这个 IList(或没有指定 IndexedEmbedded 到 IList)索引是可以的,我得到了索引结果。
编辑(初始索引功能):
public void BuildInitialBookSearchIndex()
{
FSDirectory directory = null;
IndexWriter writer = null;
var type = typeof(Book);
var info = new DirectoryInfo(GetIndexDirectory());
//if (info.Exists)
//{
// info.Delete(true);
//}
try
{
directory = FSDirectory.GetDirectory(Path.Combine(info.FullName, type.Name), true);
writer = new IndexWriter(directory, new StandardAnalyzer(), true);
}
finally
{
if (directory != null)
{
directory.Close();
}
if (writer != null)
{
writer.Close();
}
}
var fullTextSession = Search.CreateFullTextSession(Session);
var currentIndex = 0;
const int batchSize = 5000;
while (true)
{
var entities = Session
.CreateCriteria<Book>()
.SetFirstResult(currentIndex)
.SetMaxResults(batchSize)
.List();
using (var tx = Session.BeginTransaction())
{
foreach (var entity in entities)
{
fullTextSession.Index(entity);
}
currentIndex += batchSize;
Session.Flush();
tx.Commit();
Session.Clear();
}
if (entities.Count < batchSize)
break;
}
}