0

我正在使用woodstox 来解析一些svg 文件。这仅在我在线时有效。离线它似乎不会使用woodstox,但会退回到默认解析器。在这种情况下,它会慢很多(5 分钟对 15 秒)。对于当前的 SVG,它也会抛出异常。

难道我做错了什么?为什么不离线使用woodstox?

使用的 Maven 依赖项:

<dependency>
  <groupId>com.fasterxml.woodstox</groupId>
  <artifactId>woodstox-core</artifactId>
  <version>5.0.3</version>
</dependency>

解析代码:

XMLInputFactory inputFactory = XMLInputFactory.newInstance();
XMLEventReader reader = inputFactory.createXMLEventReader(new FileInputStream(svgFile));
while(reader.hasNext()) {
  XMLEvent event = reader.nextEvent();
...
}

这是抛出的异常reader.nextEvent()

com.ctc.wstx.exc.WstxIOException: www.w3.org
at com.ctc.wstx.sr.StreamScanner.throwFromIOE(StreamScanner.java:705)
at com.ctc.wstx.sr.ValidatingStreamReader.findDtdExtSubset(ValidatingStreamReader.java:466)
at com.ctc.wstx.sr.ValidatingStreamReader.finishDTD(ValidatingStreamReader.java:326)
at com.ctc.wstx.sr.BasicStreamReader.finishToken(BasicStreamReader.java:3836)
at com.ctc.wstx.sr.BasicStreamReader.nextFromProlog(BasicStreamReader.java:2168)
at com.ctc.wstx.sr.BasicStreamReader.next(BasicStreamReader.java:1181)
at org.codehaus.stax2.ri.Stax2EventReaderImpl.nextEvent(Stax2EventReaderImpl.java:255)

这是我的 SVG 之一。是畸形吗?

<?xml version="1.0" encoding="utf-8"?>
<!-- Generator: Adobe Illustrator 16.0.0, SVG Export Plug-In . SVG Version: 6.00 Build 0)  -->
<!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
<svg version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" x="0px" y="0px" width="64px"
 height="64px" viewBox="0 0 64 64" enable-background="new 0 0 64 64" xml:space="preserve">
  <g id="Ebene_1">
    <path fill="currentColor" d="M38.338,9.412H12.592v47.438h38.521V22.296L38.338,9.412z M46.728,51.866H17.191V14.129h14.771v12.577
    h14.766V51.866z"/>
  </g>
</svg>
4

1 回答 1

3

解析器只是尝试使用 DOCTYPE 声明中指定的 URL 加载 DTD 子集:“ http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd ”。这是 xml 规范要求它必须做的(或使用某种机制通过公共 id 获取副本)。无论是否启用 DTD 验证,这都必须发生:DTD 子集也可能包含 ENTITY 声明,如果不阅读它就无法知道是否如此。

但是:如果没有实体并且您不想要 DTD 验证,您可以简单地完全禁用 DTD 处理:

inputFactory.setProperty(XMLInputFactory.SUPPORT_DTD, false);

这将阻止阅读。您还可以快速查明是否缺少任何实体。:)

于 2017-08-24T22:31:28.323 回答