我通过网络套接字接收 XML。我需要将该 XML 加载到 DOM 中以执行进一步的操作。MSXML 需要 UCS-2 或 UTF-16 格式的输入字符串,并且在从字符串加载时完全忽略具有编码类型的 XML 标头。它允许加载 XML 片段,所以这是有道理的。
我看到了两种可能的方法来处理这个问题:
1) 将文件写入磁盘并通过文件路径将其加载到 MSXML。额外的磁盘 I/O 使这种方法远非首选。
2) 峰值到XML header 中手动检测编码,然后调用MultiByteToWideChar 转换为UTF-16 并根据检测到的编码指定代码页。这种方法工作正常,但我想将编码检测推送到 MSXML 上。
有人对如何实现这一点有任何其他想法吗?
我没有看过其他 XML 解析器,但会对非 MSXML DOM 解析器如何实现这一点感兴趣。
谢谢,保罗