我们的 Tomcat Web 应用程序在被几百个用户使用时感觉很慢。服务器位于托管公司,他们的报告没有显示带宽或 CPU 工作负载有任何问题,所以我怀疑速度变慢的原因可能是因为我们在同步调用下封装的一些遗留代码的争用,因为它是更容易的路径。
我在开发环境中进行了一些人工测试,使用 ThreadLocal 解决方案更改同步调用,它变得更快,但我知道我的老板会要求我提供一些证据,证明它在生产中也会更快。
如何确定线程争用是否是我的应用程序中的问题?
我们的 Tomcat Web 应用程序在被几百个用户使用时感觉很慢。服务器位于托管公司,他们的报告没有显示带宽或 CPU 工作负载有任何问题,所以我怀疑速度变慢的原因可能是因为我们在同步调用下封装的一些遗留代码的争用,因为它是更容易的路径。
我在开发环境中进行了一些人工测试,使用 ThreadLocal 解决方案更改同步调用,它变得更快,但我知道我的老板会要求我提供一些证据,证明它在生产中也会更快。
如何确定线程争用是否是我的应用程序中的问题?
我认为最近 Java 6 JDK 附带的 visualVM 工具的线程详细信息视图将能够为您的理论提供确凿的证据(或反对)。它为每个线程显示一个饼图,显示它在运行、睡眠、等待和在监视器中花费了多少时间。最后一个(显示为红色)是您感兴趣的内容:
如果您有一个您认为更快的修改版本,请使用一些负载测试器(例如JMeter)来测试这两个版本。如果存在显着差异,您将有结果来证明这一点。
有一堆开源的 java profiler供你使用,还有其他可能要花钱的,比如YourKit。您应该使用现有代码和增强代码运行测试。使用 ThreadLocals 应该可以减少一般的争用,但请考虑在开始优化之前进行基准测试也是好的。
另一个无需设置任何分析器即可完成的非常简单的测试是在应用程序看起来很慢时进行一些线程转储(ctrl-break 或 kill -QUIT)。在很短的时间内发现一些线程在相似或相同的监视器上等待可能会非常清楚地指出慢点。您可以使用TDA 之类的工具,这是一个 Java 线程转储分析器来帮助您梳理线程转储。
同样,在开始优化之前完成这项工作是一个好主意。这是因为,尽管可能有一些明显的地方优化可能会产生影响,但实际的用户行为可能会触发开发人员没有考虑的路径,而这些可能会成为真正的问题区域。
jstack PID
将打印出带有进程 id PID 的 JVM 状态列表,以及线程状态信息。
样本输出(摘录):
"AWT-XAWT" daemon prio=10 tid=0x0000000000e5f800 nid=0x476d runnable [0x00007f1a75616000..0x00007f1a75616bf0]
java.lang.Thread.State: RUNNABLE
at sun.awt.X11.XToolkit.waitForEvents(Native Method)
at sun.awt.X11.XToolkit.run(XToolkit.java:543)
at sun.awt.X11.XToolkit.run(XToolkit.java:518)
at java.lang.Thread.run(Thread.java:636)
"Java2D Disposer" daemon prio=10 tid=0x0000000000d8b800 nid=0x476c in Object.wait() [0x00007f1a759df000..0x00007f1a759dfc70]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x00007f1a82e2c3f8> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:133)
- locked <0x00007f1a82e2c3f8> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:149)
at sun.java2d.Disposer.run(Disposer.java:143)
at java.lang.Thread.run(Thread.java:636)
我也会尝试隔离争用的资源。例如,如果遗留库被锁定以同步对数据库的写入,那么您可能会最小化写入。
我可以像这样在我们的同步调用中添加日志记录
//...
long t0 = System.currentTimeMillis();
synchronized(lockObj){
logger.info("T sync :" + (t0 - System.currentTimeMillis()));
//...
}
但这感觉又便宜又脏。
你的分析听起来很有道理。您能否将例如 visualvm(在 JDK 中)附加到进程中,以便查看时间花在了哪里?