2

我有一个使用 XML 标记的信息数据库。XML 表示我想在搜索和查询中考虑的层次结构。例如,如果数据是书籍元数据:

<book>
    <author id="jd112">John Doe</author>
    <title>John's First Publication</title>
    <summary>This is a mundane memoir of John's life that no one else would care to read </summary>
</book>

我将拥有大量这样的 XML 文档。我希望搜索者将查询限制在特定字段。我还想允许搜索者对这些进行逻辑组合。

Lucene/Solr 是否提供了这样的能力,还是我应该考虑其他一些技术?如果是 Lucene,那么我可能会如何去做这件事的指针会很有帮助。

感谢您的见解。

-拉吉

4

3 回答 3

2

是的,这是最好的使用方式,但文件可能需要重新格式化

http://www.xml.com/pub/a/2006/08/09/solr-indexing-xml-with-lucene-andrest.html

和谷歌关于配置 schema.xml

于 2012-07-19T16:50:33.187 回答
1

您可以导入您的 xml 文件,而无需自己将它们转换为 Sorl xml 格式,只需使用DataImportHandler并应用xsl 转换

于 2012-07-19T19:04:03.803 回答
0

有几种方法可以索引 XML 文档。

  1. 您可以使用搜索引擎技术,包括例如 Apache Sor 和 ElasticSearch,它们都基于 Lucene 进行索引。
  2. 使用 NoSQL 数据库技术,例如基于 Lucene 的 LuX for XML

希望这可以帮助

于 2018-12-03T10:29:46.133 回答