我有几个大的 XML 文件,如下所示:
<Listings>
<Listing>
<Location>
<StreetAddress>123 Main St</StreetAddress>
<UnitNumber>2F</UnitNumber>
<City>Anytown</City>
<State>NY</State>
<Zip>10000</Zip>
</Location>
</Listing>
<!-- a bajillion more Listing nodes -->
</Listings>
不同风味之间的主要区别在于一个有一个<Listing>
节点,另一个调用它<property/>
。子元素的嵌套也各不相同。
什么是解析一系列大 XML 文件的好方法,每个文件都包含相似的条目但具有不同的标签名称?我想维护标签名称的映射表是有道理的,但是如何使用 Ruby 有效地遍历这些名称呢?
我想抓取<Listing>
元素,解析出它们的子元素,例如StreetAddress
,等等,然后将它们写在其他地方。每个文件都包含数千个列表,有些是 100+MB。