我有一个 XML 文件 sample.xml,其中包含以下内容:
<Tokens>
<Token>Hello World</Token>
</Tokens>
我想解析它 - 但是当它到达 NBSP 时会出错
我无权访问我正在使用的 XML 的架构(定义一个或多个令牌的那个)。
DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
doc = docBuilder.parse("sample.xml");
由于我的 XML 文档没有 Schema,我想知道是否有办法让它在解析时完全忽略 HTML 特殊字符?