我想问是否有一种快速的方法可以将文档内容放入单个文档字段中。我见过的所有例子都有相对较短的字符串。我无法将整篇期刊文章保存到字符串和索引中,有没有一种快速的方法可以告诉 lucene 索引文件中的所有单词?我为此应用程序使用 Lucene.net 3.03。
问问题
984 次
2 回答
0
仅传递文件不是一种简单的方法,您必须将整个内容提供给 lucene 以进行搜索索引。这是关于索引 PDF 的 Q/A 的答案,但对于每种类型的文档都是一样的,只需打开它并索引到 lucene。
于 2013-02-13T17:14:21.927 回答
0
您可以将 a 传递System.IO.TextReader
给 a Field
。如果文件是纯文本或类似的文件,您应该能够在其上打开阅读器,并将其直接传递到字段中,例如:
System.IO.TextReader reader = new StreamReader("path/to/my/file.txt");
Field field = new Field("fieldName", reader);
document.add(field);
于 2013-02-13T18:01:36.137 回答