我们希望在 Solr 中索引和存储一组 Word 文档,并将它们显示为多值文本字段的元素,每个文本字段的内容都显示为索引中该条目下的一个元素。换句话说,它看起来像这样
- ID
- abcdef [Word_1.docx 的文本]
- xyzabc [Word_2.docx 的文本]
- efghij [Word_3.docx 的文本]
我们不希望每个被索引的文档都有自己的唯一 ID;一组文档将是特定 ID 的子代。该 ID 可以有任意数量的文档。这个怎么做?
更新:这是我的 C# 代码;对于使用 设置的唯一 ID,我如何将多个文档读入其中(++count).ToString()
?
using (FileStream fileStream = File.OpenRead(path))
{
solr.Extract(
new ExtractParameters(fileStream, (++_count).ToString())
{
ExtractFormat = ExtractFormat.Text,
ExtractOnly = false,
Fields = new List<ExtractField>()
{
new ExtractField("action", actionTo),
new ExtractField("actiondate", actionDate),
new ExtractField("abstract", abstract),
new ExtractField("docval", docval),
new ExtractField("documentgeo",documentgeo),
new ExtractField("filename", filename),
new ExtractField("isprimary", IsPrimary.ToString())
},
AutoCommit = true
}
);
}