我正在尝试使用 JAXB 从单个输入流中读取多个 xml 文档。由于 JAXB 本身不支持这一点,我创建了自己的 XmlReader。但是,这迫使我在这个单个输入流上使用多个 XMLEventReader(一个接一个,而不是并行)。
但这似乎不起作用。第一个 XML 文档被正确读取。但第二个不是。根据 XML,有时它只是在第一个 XML 文档之后停止,有时它只从 XML 中间返回任意标签(不知道这是怎么发生的)。
这是我用来读取 XML 的代码:
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.Stack;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.XMLEvent;
public class XmlReader {
private final XMLInputFactory infactory = XMLInputFactory.newInstance();
private final InputStream inStream;
private String lastInvalidInput= null;
public XmlReader(final InputStream inStream){
this.inStream= inStream;
}
public String readXml() throws XMLStreamException{
final XMLEventReader eventReader= infactory.createXMLEventReader(inStream);
final StringBuilder sb= new StringBuilder();
final Stack<String> openTags= new Stack<String>();
boolean endOfXml= false;
while (eventReader.hasNext() && !endOfXml){
try{
final XMLEvent nextEvent= eventReader.nextEvent();
sb.append(nextEvent.toString());
if (nextEvent.isStartElement()){
openTags.add(nextEvent.toString());
}else if (nextEvent.isEndElement()){
openTags.pop();
if (openTags.isEmpty()){
endOfXml= true;
}
}
}catch(XMLStreamException e){
//FIXME: There must be cleaner way to recognize the end of the stream.
if (e.getMessage().endsWith("ParseError at [row,col]:[1,1]\nMessage: Premature end of file.")){
if (openTags.isEmpty()){
return null;
}else{
lastInvalidInput= sb.toString();
throw new XMLStreamException("Unfinished XML stream", e);
}
}else{
lastInvalidInput= sb.toString();
throw e;
}
}
}
eventReader.close();
return sb.toString();
}
public String getLastInvalidInput() {
return lastInvalidInput;
}
public static void main(String[] args) throws Exception {
final File f= new File("/tmp/test.xml");
final XmlReader r= new XmlReader(new FileInputStream(f));
String xml;
while((xml= r.readXml()) != null){
System.out.println("------------");
System.out.println(xml);
}
}
}
这是一个要读取的示例 XML 文件:
<?xml version="1.0" encoding="latin3"?>
<myxml>
<eins>
<zwei>
<drei>
</drei>
</zwei>
</eins>
<vier>
<fuenf>
</fuenf>
</vier>
</myxml>
<?xml version="1.0" encoding="latin1"?>
<yourxml>
<one>
<two>
<three />
</two>
</one>
<four>
<five>
</five>
</four>
</yourxml>
为什么会出现这种奇怪的行为?我认为在关闭第一个 XMLEventReader (根据Javadoc不会关闭输入流)之后,下一个可用于从流中读取。不是这样吗?
有没有更好的方法来实现这一目标?