我正在尝试将许多 google base xml 文件导入到单个数据库中,但是,虽然我认为 Google Base XML 将是一种标准化格式,但似乎不同的来源会创建具有不同结构的文件。
因此,可以处理来自源 A 的 XML 文件的导入在应用于源 B 时失败。
是否有将各种 Google Base XML 文档转换为单一格式的标准或通用方法?
例如,源 A 使用
<description>
标签,而源 B 使用
<summary>
标签。
来源 A 将产品链接指定为
<link href="http://..."></link>
而源 B 使用
<link>http://...</link>