xml - R中的MLB XML解析

Question

我在有效解析从美国职业棒球大联盟 (MLB) 检索到的 XML 时遇到了困难。

首先，这是一个旨在让我熟悉 XML 的辅助项目。我最熟悉 R，所以我觉得一旦成功，我就有更好的机会调试代码。

我可以通过这些代码行获取 xml：

xmlurl<-"http://gd2.mlb.com/components/game/mlb/year_2012/month_06/day_11/miniscoreboard.xml"
xmltree<-xmlTreeParse(xmlurl,useInternalNodes=TRUE)

我希望能够在整个 XML 中提取信息。例如，对于这一天进行的所有比赛，我想提取每支球队的得分（“away_team_runs”和“home_team_runs”）。此外，我希望能够从文档中提取我希望的任何内容，但到目前为止我没有成功。

任何指针将不胜感激。

score 2 · Accepted Answer

例如，使用 xpathSApply

xpathSApply(xmltree,'//games/*',xmlGetAttr,'away_team_runs') 
[1] "6" "1" "3" "3"
xpathSApply(xmltree,'//games/*',xmlGetAttr,'home_team_runs') 
[1] "3" "4" "0" "2"

xml - R中的MLB XML解析

1 回答 1

Related

Reference