4

我正在尝试从中获取值xml,如下所示:

<data>
    <result name="r">
        <item>
            <str name="id">123</str>
            <str name="xxx">aaa</str>
        </item>
        <item>
            <str name="id">456</str>
            <str name="xxx">aaa</str>
        </item>
    </result>
</data>

到目前为止,我可以通过id以下方式获得价值:

xmlfile <- xmlParse(url)
data <- xmlRoot(xmlfile) 
result <- xmltop[["result"]]
for (i in xmlSize(result)) {
  print(xmlValue(result[[i]][[1]]))
}

这似乎非常低效,并且仅当“id”存储在第一个子元素中时才有效。123, 456那么,有没有办法通过搜索属性(name)和值( )来获取元素( )的值id

4

1 回答 1

8

xml2软件包非常适合解决此类问题。

library(xml2)
page<-read_xml('<data>
    <result name="r">
               <item>
               <str name="id">123</str>
               <str name="xxx">aaa</str>
               </item>
               <item>
               <str name="id">456</str>
               <str name="xxx">aaa</str>
               </item>
               </result>
               </data>')

#find all str nodes
 nodes<-xml_find_all(page, ".//str")
#filter out the nodes where the attribute name=id
 nodes<-nodes[xml_attr(nodes, "name")=="id"]
#get values (as character strings)
 xml_text(nodes)

这一切都可以在一行代码中完成,但为了清楚起见,这些步骤分为三个。

于 2017-07-22T18:39:11.490 回答