0

我正在使用 STAX 解析器来处理 xhtml 中的每个文本节点。该应用程序部署在 Unix 盒子中。解析操作在执行第一个实例时需要更多时间。当我第二次运行时,它花费的时间相对较少,在随后的调用中,它比第二次运行花费的时间要少得多,此后的结果几乎一致。下面是我正在使用的代码。不知道为什么解析相同输入所花费的时间不一致。请帮忙。

一次创建 XmlInputFactory,(类级别的静态方法)

    static {
    if (xmlInputFactory == null) {
    xmlInputFactory = XMLInputFactory.newInstance();
    xmlInputFactory.setProperty(javax.xml.stream.XMLInputFactory.IS_NAMESPACE_AWARE, false);
    }
    }

执行不一致的解析代码为同一输入文件提供不同的响应时间,

    private static void parse(String xhtmlInput) throws XMLStreamException {
    ByteArrayInputStream arrayInputStream = new ByteArrayInputStream      (xhtmlInput.getBytes(Charset.forName("UTF-8")));
    XMLStreamReader parser = xmlInputFactory.createXMLStreamReader(arrayInputStream);
    while (true) {
    int currentEvent = parser.next();
    if (currentEvent == XMLStreamConstants.CHARACTERS) {
        // Do operation
    } else if (currentEvent == XMLStreamConstants.END_DOCUMENT) {
    parser.close();
    break;
    }
    }
    }
4

1 回答 1

3

在不知道它是哪个实现的情况下,这是一种猜测,但有两个常见原因可以让任何 Java 库或应用程序在一段时间后运行得更快:

  • JVM 本身对字节码进行即时编译,并在运行中对其进行优化。这称为 JIT 预热,并且发生得非常快(在前 10 秒左右)
  • 读取文件时,底层操作系统通常会缓存正在读取的磁盘块——如果再次读取相同的内容,则不是从磁盘读取,而是从内存中的磁盘缓冲区读取。

这些也是幼稚的 java 测试基准给出无用结果的最常见原因:如果您不考虑两者(即预热测试一段时间,丢弃初始结果;并从内存而不是磁盘读取测试数据),结果将毫无意义。

于 2011-01-13T18:51:29.753 回答