该 XML 文件包含去年全年的存档新闻报道。我被要求按故事类别[y|ies] 将这些故事分类到新的 XML 文件中。
big_story_export.xml
变成
lifestyles.xml
food.xml
nascar.xml
...等等。
我使用一次性 python 脚本完成了这项工作,但是,我最初尝试使用 XSLT 进行此操作。这让我很沮丧,因为我的 XPATH 选择弄得一团糟。测试文件被完美地转换了,但是将大文件放在我的样式表上导致......什么都没有。
您推荐哪些策略来确保此类文件将通过 XSLT 运行?这是供应商交给我的,所以想象一下,在定义这个文件的结构时,我没有太多的影响力。
如果你们想要代码示例,我会把一些放在一起。
如果有的话,我会对一些使 XML+XSLT 顺利协同工作的技巧感到满意。
@Sklivvz
我正在使用 python 的 libxml2 & libxslt 来处理这个。我现在正在研究 xsltproc。
对于这些一次性情况,它似乎是一个很好的工具。谢谢!
@diomidis-spinellis
它的格式很好,尽管(如前所述)我没有能力发现它的有效性。
至于写一个模式,我喜欢这个主意。
如果这是一次性的事情,我在验证这个文件上投入的时间是不切实际的,尽管我预见到必须从我们的供应商处处理更多这样的文件。
编写一个模式(并将其提交给供应商)将是管理这样的 XML funk 的一个极好的长期策略。谢谢!