0

我已经创建了 10 个不同类型的 xml 文档,例如一个有书籍详细信息,另一个有电影详细信息或新闻标题等。这样的 xml 文档之一是 books.xml,如下所示:

<bookstore>
    <book category="COOKING">
         <title lang="english">Everyday Italian</title>
         <author>Giada De Laurentiis</author>
         <year>2005</year>
         <price>200.00</price>
    </book>

    <book category="CHILDREN">
         <title lang="english">Harry Potter</title>
         <author>J K. Rowling </author>
         <year>2005</year>
         <price>625.00</price>
    </book> 
</bookstore>

我想通过在所有 10 个 xml 文档中搜索用户输入的单词来计算它们。这些词只不过是具有属性及其各自值的元素。

例如:用户输入类别

从上面的例子可以看出 category 是一个属性并且写了两次。因此,根据这个输出应该是“2”,如果这个词类别存在于其他 9 个文档中,那么计数会相应地升级。如何在不指定元素名称的情况下为单个文档执行此操作。它基本上是 xml 解析,那么我该怎么做呢?这对我来说是新的,我面临一些问题。

///////////////////////////////////////// ////////////////////////////

如果我想使用简单的doc而不是schema怎么办?它与xml解析有关,你能告诉我如何在dom模型对象中使用nodelist对象。

请帮忙。

4

1 回答 1

0

如果您要拥有大量此类 XML 文档,您可以执行以下步骤

  1. 摆脱属性中的数据。更改文档格式

    <book>
         <category>CHILDREN</category>
         <lang>english</lang>
         <title>Harry Potter</title>
         <author>J K. Rowling </author>
         <year>2005</year>
         <price>625.00</price>
    </book> 
    
  2. 使用Sphinx使用xmlpipe 数据源对文档进行索引

于 2012-07-01T10:49:20.593 回答