1

我在有效解析从美国职业棒球大联盟 (MLB) 检索到的 XML 时遇到了困难。

首先,这是一个旨在让我熟悉 XML 的辅助项目。我最熟悉 R,所以我觉得一旦成功,我就有更好的机会调试代码。

我可以通过这些代码行获取 xml:

xmlurl<-"http://gd2.mlb.com/components/game/mlb/year_2012/month_06/day_11/miniscoreboard.xml"
xmltree<-xmlTreeParse(xmlurl,useInternalNodes=TRUE)

我希望能够在整个 XML 中提取信息。例如,对于这一天进行的所有比赛,我想提取每支球队的得分(“away_team_runs”和“home_team_runs”)。此外,我希望能够从文档中提取我希望的任何内容,但到目前为止我没有成功。

任何指针将不胜感激。

4

1 回答 1

2

例如,使用 xpathSApply

xpathSApply(xmltree,'//games/*',xmlGetAttr,'away_team_runs') 
[1] "6" "1" "3" "3"
xpathSApply(xmltree,'//games/*',xmlGetAttr,'home_team_runs') 
[1] "3" "4" "0" "2"
于 2012-12-15T06:40:31.237 回答