我有谁的 xml 文件显然相同命名为 wrong.xml 和 good.xml。
代码如下:
<?xml version="1.0" encoding="utf-16"?>
<tag>
</tag>
问题是 XMLReader 类 (org.xml.sax.XMLReader) 在解析 wrong.xml 时检测到跟随错误。
Content is not allowed in prolog
原因是prolog之前存在一个隐藏字符。
我只能使用基本的 java 文件阅读器看到这些字符,我可以看到第一个和第二个字符是 -1 和 -2。
'-1''-2'<?xml version>......
Notepad、Ultraedit32、Wordpad、Notepad++等都看不到。
我真正的问题是我需要自动从 FTP 读取 xml,然后我需要任何方法在使用 xmlReader 解析之前删除这些字符而不解析所有文档,因为有些文档非常大。
如何删除文件的第一个字符?