2

我正在尝试使用 JAXB 从单个输入流中读取多个 xml 文档。由于 JAXB 本身不支持这一点,我创建了自己的 XmlReader。但是,这迫使我在这个单个输入流上使用多个 XMLEventReader(一个接一个,而不是并行)。

但这似乎不起作用。第一个 XML 文档被正确读取。但第二个不是。根据 XML,有时它只是在第一个 XML 文档之后停止,有时它只从 XML 中间返回任意标签(不知道这是怎么发生的)。

这是我用来读取 XML 的代码:

import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.Stack;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.events.XMLEvent;

public class XmlReader {

  private final XMLInputFactory infactory = XMLInputFactory.newInstance();
  private final InputStream inStream;

  private String lastInvalidInput= null;

  public XmlReader(final InputStream inStream){
    this.inStream= inStream;
  }


  public String readXml() throws XMLStreamException{
    final XMLEventReader eventReader= infactory.createXMLEventReader(inStream);

    final StringBuilder sb= new StringBuilder();
    final Stack<String> openTags= new Stack<String>();
    boolean endOfXml= false;
    while (eventReader.hasNext() && !endOfXml){
      try{
        final XMLEvent nextEvent= eventReader.nextEvent();
        sb.append(nextEvent.toString());
        if (nextEvent.isStartElement()){
          openTags.add(nextEvent.toString());
        }else if (nextEvent.isEndElement()){
          openTags.pop();
          if (openTags.isEmpty()){
            endOfXml= true;
          }
        }
      }catch(XMLStreamException e){
        //FIXME: There must be cleaner way to recognize the end of the stream.
        if (e.getMessage().endsWith("ParseError at [row,col]:[1,1]\nMessage: Premature end of file.")){
          if (openTags.isEmpty()){
            return null;
          }else{
            lastInvalidInput= sb.toString();
            throw new XMLStreamException("Unfinished XML stream", e);
          }
        }else{
          lastInvalidInput= sb.toString();
          throw e;
        }                                                                                                                                       
      }
    }

    eventReader.close();
    return sb.toString();
  }


  public String getLastInvalidInput() {
    return lastInvalidInput;
  }


  public static void main(String[] args) throws Exception {
    final File f= new File("/tmp/test.xml");
    final XmlReader r= new XmlReader(new FileInputStream(f));

    String xml;
    while((xml= r.readXml()) != null){
      System.out.println("------------");
      System.out.println(xml);
    }
  }
}

这是一个要读取的示例 XML 文件:

<?xml version="1.0" encoding="latin3"?>
<myxml>
  <eins>
    <zwei>
      <drei>
      </drei>
    </zwei>
  </eins>
  <vier>
    <fuenf>
    </fuenf>
  </vier>
</myxml>
<?xml version="1.0" encoding="latin1"?>
<yourxml>
  <one>
    <two>
      <three />
    </two>
  </one>
  <four>
    <five>
    </five>
  </four>
</yourxml>

为什么会出现这种奇怪的行为?我认为在关闭第一个 XMLEventReader (根据Javadoc不会关闭输入流)之后,下一个可用于从流中读取。不是这样吗?

有没有更好的方法来实现这一目标?

4

1 回答 1

0

请参考这个旧线程,这可能会对您有所帮助

MultiXMLDocReader xmlReader = new MultiXMLDocReader(new InputStreamReader(anyInputStream));
ObjectA a = (ResponseHeader) u.unmarshal(xmlReader);
ObjectB b = (SubmissionProgress) u2.unmarshal(xmlReader);
于 2013-09-20T13:21:15.920 回答