18

最近我在写一些微基准代码,所以我必须打印出 JVM 行为以及我的基准信息。我用

-XX:+PrintCompilation
-XX:+PrintGCDetails

和其他选项来获取 JVM 状态。对于基准信息,我只是使用System.out.print()方法。因为我需要知道我打印的消息的顺序和 JVM 输出。

当我在控制台中打印出来时,我可以得到很好的结果,虽然 JVM 输出有时会破坏我的消息,但由于它们在不同的线程中,这是可以理解和接受的。

当我需要做一些批处理基准测试时,我想redirect the output into a file使用pipe (> in Linux system), 并使用 python 从文件中获取结果并进行分析。

这是问题所在:

The JVM output always overlapped with the messages I printed in the Java application.它破坏了消息的完成。

知道如何处理这种情况吗?我需要both the JVM output and application output in the same place in order to preserve the sequence because it is important. And they do not overlap on each other so I don't lose anything.

4

9 回答 9

9

I would suggest taking a slight detour and looking at using Java Instrumentation APIs - use (write) a simple Java Agent to do this. From your benchmarking perspective, this will give you far more power as well. You could use your Java Agent to log everything (and hence there would be no contention between different logger threads).

You can read more at http://www.javabeat.net/2012/06/introduction-to-java-agents/ or http://today.java.net/pub/a/today/2008/04/24/add-logging-at-class-load-time-with-instrumentation.html

于 2012-11-18T02:09:44.417 回答
5

尝试使用System.out.println()而不是System.out.print(). System.out.println()强制同步部分内的流刷新,至少您的输出不会混合。

于 2013-02-19T16:13:39.510 回答
5

使用 Log4J 或消息驱动的日志框架而不是System.out.println().

Log4J 使用消息事件模型来保证消息的顺序。此外,各种“附加程序”可用于记录到数据库或其他输出/文件,允许通过 Java 包和其他属性进行分离,因此数据不会混合。

此外,按照这些思路,考虑使用高性能计时器和/或不要尝试测量非常短(毫秒)的事件。原因是调用System.currentTimeMillis()将反过来调用操作系统时钟。在每个操作系统上,都会存在一些“时钟漂移”和缓存,这样底层系统函数可能会返回相同的值,从而导致实际时间出现 +/- 30 毫秒的偏移。为了解决这个问题或提高准确性,请将被测量的函数分组为足够大的样本大小,然后除以迭代次数。

例如,执行 10K 次平均 1-2 毫秒的操作作为一个测量操作。然后除以 10K 得到每次操作的时间。

否则,同样需要高性能计时器。

于 2013-02-21T23:07:20.123 回答
4

通过 System.out.print/println 直接记录被认为是不好的做法。

为什么?

  1. 它不是“线程安全的”。从多个线程记录导致乱码文本
  2. 它不灵活,因为它是硬编码的并且没有配置。
  3. 它不灵活,因为您无法指定希望在日志中看到的详细程度(例如详细跟踪/特定调试逻辑/应用程序警告/应用程序错误处理/应用程序致命错误)。你总是得到很多,需要注释很多行代码以避免日志过载。
  4. 它是不灵活的,因为您无法指定您对哪些包/类感兴趣或不感兴趣 - 同样,您总是会得到很多并且需要为更简单和更具体的内容注释很多行
  5. 它不灵活,因为您无法将日志重定向到数据库表和列、文件、电子邮件、消息系统、SMS 警报等
  6. 这是不灵活的,因为您不能将不同的日志级别/包或类流式传输到不同的日志记录目的地。此外,您不能将其配置为与应用服务器登录到相同的目的地或不同的目的地,并且它是 JVM
  7. 当您将数千/数百万行记录到物理磁盘时,它会很慢

2000 年,Log4J 被引入。
它解决了所有这些问题,从那时起就或多或少成为标准解决方案。虽然有一些最新最好的日志工具试图超越 Log4J,但您仍然可以使用 Log4J 获得强大、灵活的结果。如果您将所有 System.out.print 调用切换到 Log4J,那么您引用的问题和许多其他问题将会消失。

http://logging.apache.org/log4j/1.2/manual.html

于 2013-02-22T14:22:36.943 回答
2

对于-XX:+PrintCompilation,您可以改用-XX:+UnlockDiagnosticVMOptions -XX:+LogCompilation标志在单独的“hotspot.log”文件中获取“详细”输出。该文件为 XML 格式,包含-XX:+PrintCompilation此类编译的信息和原因。文件路径可以通过-XX:LogFile=<new_hotspot_log>. 参考:https ://wiki.openjdk.java.net/display/HotSpot/LogCompilation+overview

对于-XX:+PrintGCDetails,您可以使用-Xloggc:<gc_log>将 GC 输出重定向到指定文件。参考:java -X

于 2013-10-11T03:18:24.343 回答
0

Try splitting the output of JVM and your application.

  • Output JVM's information to stdout
  • Output your application's information to stderr, with "System.err.println()"
  • Analyze the the output with your favorite tools.

So, the command line is like this:

$java -XX:+PrintCompilation -XX:+PrintGCDetails MainClass 1>stdout.txt 2>stderr.txt
于 2013-02-21T06:03:49.913 回答
0

我建议尝试以下方法。这更像是一种黑客行为,需要一些修补。但从长远来看,掌握这种方法可能会有所回报。特别是,如果您进行大量基准测试。

话虽如此,我很肯定 HS(现在是 Oracle)应该可以选择将编译器输出重定向到文件。您只需要足够努力地寻找它:-) HS 应该有一个选项可以打印出所有 JVM 和编译器选项,其中可能是将输出重定向到文件的选项。

反正我跑题了...

1) 你的 $JAVA_HOME 或 %JAVA_HOME% 中应该有 src.zip。它包含 Java 类库的源代码。

2) 修改 System.out 以将所有输出重定向到特定的失败,或者只是让它插入一些特殊符号,您可以在其上使用 grep 来捕获 stdout 和 stderr。不幸的是,我不能更具体地说明这一特定步骤,因为我们公司的政策禁止我们检查 src.zip 的内容。我只能想象这一步会有多困难。也许它就像用你的输出流交换“out”一样微不足道,或者像修改你的应用程序直接使用的每一个打印方法一样困难。我什至不知道 System.out 使用了多少本地人

3) 将编译后的版本放入 jar 文件中。

4) 将此选项添加到您的命令行: -Xbootclasspath/p:full_path_to_your_jar 这将告诉 JVM 首先使用您的类版本。“P”代表前置。

希望这会有所帮助...

于 2012-11-18T06:11:38.703 回答
0

为了以非重叠方式输出,请使用 System.out.println。然后你可以像这样重定向到同一个文件:

java -XX:+PrintCompilation -XX:+PrintGCDetails MainClass 1>stdout.txt 2>&1

这在文件名 stdout.txt 中包含所有错误以及正常的控制台输出

此外,如果日志有任何形式的线程/时间信息,您可以简单地使用

sort -n -k 1

其中 -k 1 代表您拥有线程/数据(纪元)信息的列。

于 2013-02-23T05:56:44.200 回答
0

首先,我会尝试@barracel 关于使用 System.out.println() 的说明。

我对 Java 了解不多,但您也可以将所有调试消息写到 stderr 并将 stdout 留给 JVM。这可以防止多个线程写入同一文件描述符时明显发生的标准输出污染。

于 2013-02-19T20:24:53.497 回答