我使用定期刷新的 XML 报告,我想使用 R & xml2 自动化处理过程。
这是整个示例文件的链接。 这是 XML 的示例:
<?xml version="1.0" ?>
<riDetailEnrolleeReport xmlns="http://vo.edge.fm.cms.hhs.gov">
- 将 XML 读入 R
- 找到特定的被保险人标识符
- 提取(2)中与成员ID关联的planIdentifier和所有claimIdentifier数据
- 将保险会员标识符、计划标识符、索赔标识符和索赔支付金额的所有文本和值存储在 data.frame 中,每个唯一索赔 ID 对应一行(会员 ID 到索赔 ID 是一对多)
到目前为止,我已经完成了 1 并且我在 2 的球场上:
## Step 1 ##
ride <- read_xml("/Users/temp/Desktop/RIDetailEnrolleeReport.xml")
## Step 2 -- assume the insuredMemberIdentifier of interest is 'ARS001' ##
memID <- xml_find_all(ride, "//d1:insuredMemberIdentifier[text()='ARS001']", xml_ns(ride))
在上面第 2 步中的代码之后,我尝试使用xml_parent()
来定位被保险人标识符的父节点,将其保存为变量,然后重复第 2 步以获取该已保存变量节点上的索赔信息。
node <- xml_parent(memID)
xml_find_all(node, "//d1:claimIdentifier", xml_ns(ride))
任何有关如何进入上述第 4 步的帮助/信息将不胜感激。先感谢您。