我的应用程序使用的文件格式是基于 Xml 的。我刚得到一个客户,他的 xml 文件很糟糕。该东西包含近 90,000 行,并且出于某种原因,随机散布了大约 20 个“=”符号。
我得到了大多数带有行号和字符位置的 XmlException ,这使我可以找到有问题的字符并手动删除它们。我刚刚开始编写一个小应用程序来自动化这个过程,但我想知道是否有更好的方法来修复损坏的 xml 文件。
拙劣的线路示例:
<item name="InstanceGuid" typ=e_name="gh_guid" type_code="9">ee330f9f-a1e2-451a-8c6d-723f066a6bd4</item>
↑ (this is supposed to be [type_name])