我正在尝试将许多 xml 文件合并为一个。我已经在 DOM 中成功地做到了,但这个解决方案仅限于几个文件。当我在 >1000 的多个文件上运行它时,我得到一个 java.lang.OutOfMemoryError。
我想要实现的是我有以下文件
文件 1:
<root>
....
</root>
文件 2:
<root>
......
</root>
文件 n:
<root>
....
</root>
导致:输出:
<rootSet>
<root>
....
</root>
<root>
....
</root>
<root>
....
</root>
</rootSet>
这是我目前的实现:
DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docFactory.newDocumentBuilder();
Document doc = docBuilder.newDocument();
Element rootSetElement = doc.createElement("rootSet");
Node rootSetNode = doc.appendChild(rootSetElement);
Element creationElement = doc.createElement("creationDate");
rootSetNode.appendChild(creationElement);
creationElement.setTextContent(dateString);
File dir = new File("/tmp/rootFiles");
String[] files = dir.list();
if (files == null) {
System.out.println("No roots to merge!");
} else {
Document rootDocument;
for (int i=0; i<files.length; i++) {
File filename = new File(dir+"/"+files[i]);
rootDocument = docBuilder.parse(filename);
Node tempDoc = doc.importNode((Node) Document.getElementsByTagName("root").item(0), true);
rootSetNode.appendChild(tempDoc);
}
}
我已经对 xslt、sax 进行了很多实验,但我似乎总是遗漏一些东西。任何帮助将不胜感激