我正在努力寻找如何在非常大的 xml 数据文件中找到非 ascii 字符的答案。我不想转换非 ascii 字符,我只想确定字符在数据文件中的位置,以便通知源删除该值。非 ascii 数据(似乎是单个字符)导致我的处理程序失败。不幸的是,错误数据并不能帮助我确定违规字符在文件中的位置。此 XML 数据文件包含数据记录,并且很可能在描述字段或名称字段中。
我曾尝试使用文本工具,但它是一个如此大的文本文件 (>32MB),令人不知所措。有没有办法在 PSPad 或 TextPad 等工具中运行 REGEX 来查找 7 位 ASCII 字符集之外的任何字符?