xml - 使用 Lucene 索引和检索 XML 数据

翻译自：https://stackoverflow.com/questions/18571212 2013-09-02T10:39:45.750

199 次

我有 1000 万篇 XML 格式的文章。下面给出了一个示例结构 -

<address-book>
  <contact type="individual">
   <name c="10">Zane Pasolini</name>
   <address>999 W. Prince St.</address>
   <city>New York</city>
   <province>NY</province>
   <postalcode>10013</postalcode>
   <country>USA</country>
   <telephone>1-212-345-6789</telephone>
  </contact>
  <contact type="business">
   <name c="11">SAMOFIX d.o.o.</name>
   <address>Ilica 47-2</address>
   <city>Zagreb</city>
   <province/>
   <postalcode>10000</postalcode>
   <country>Croatia</country>
   <telephone>385-1-123-4567</telephone>
  </contact>
</address-book>

我正在使用 Lucene 4.x 来索引这些 XML 文件。我还有一个 XSLT 来转换这些 XML 文件，以便用户可以以经过精心修饰的格式查看它们。

我想知道在索引之后，XML 结构是完整的还是格式松散的？例如，如果用户搜索“个人”联系人类型，那么我是否可以检索所有数据，包括 XML 节点，以便我的 XSLT 将它们转换为修饰良好的 HTML？

xml - 使用 Lucene 索引和检索 XML 数据

0 回答 0

Related

Reference