3

我正在使用 libxml++ 解析来自 wikimedia 的 xml 文件。我已经能够使用 textparser 将文本从所有节点推送到堆栈上,但我想专门抓取页面和 /page 之间的文本以及获取文本、作者姓名和标题。我不知道如何使用 libxml++ 做到这一点。这是来自 wikimedia 的页面示例

<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.7/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.7/ http://www.mediawiki.org/xml/export-0.7.xsd" version="0.7" xml:lang="en">
  <page>
    <title>Human Anatomy/Osteology/Axialskeleton</title>
    <ns>0</ns>
    <id>181313</id>
    <revision>
      <id>1481605</id>
  <parentid>1379871</parentid>
  <timestamp>2009-04-26T02:03:12Z</timestamp>
  <contributor>
    <username>Adrignola</username>
    <id>169232</id>
  </contributor>
  <minor/>
  <comment>+Category</comment>
  <sha1>hvxozde19haz4yhwj73ez82tf2bocbz</sha1>
  <text xml:space="preserve">[[Image:Axial_skeleton_diagram.svg|thumb|240px|right|Diagram of the axial skeleton]]

The Axial Skeleton is a division of the human skeleton and is named because it makes up the longitudinal ''axis'' of the body. It consists of the skull, hyoid bone, vertebral column, sternum and ribs. It is widely accepted to be made up of 80 bones, although this number varies from individual to individual.

[[Category:{{FULLBOOKNAME}}|{{FULLCHAPTERNAME}}]]</text>
</revision>

如何将文本、作者、日期等节点保存为字符串或 Glib::ustrings?我尝试使用 xpath 来使用。谢谢你的帮助,这不是家庭作业。

-gtk

4

0 回答 0