Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个巨大的文件,其中包含格式错误的 xml(主要是未转义的 XML 字符和 CDATA 部分)。我正在寻找一个可以修复格式错误的 xml 的体面的解析器。我使用 IntelliJIdea 来处理一些较小的 xml 文件,但是当我给它一个大文件时,IDE 冻结了。
有没有像样的工具可以修复格式错误的 XML?
我相信有人会告诉你回去修复文件的生成器。如果这是可能的,那肯定是最好的做法。
听起来您或多或少地计划手动执行此操作 - 寻找缺陷模式并修复它们。为此,我会使用 Notepad++——因为我知道,它可以处理非常大的文件,并且具有良好的搜索/替换功能,包括正则表达式。不过,还有很大的改进空间——特别是,如果你是一名正则表达式专家,正则表达式语言会有点弱。
在处理这样的文件时,任何试图理解 XML 来做比色度编码更多的事情都可能会很慢。
Intellij 中的 XML 支持非常糟糕,在性能方面,考虑到它的整体卓越性。