我试图了解 Java Flight Recorder 如何对使用本机库的应用程序进行采样(在我的例子中是通过 JNA)。
让我们编写一个将大部分时间花在本土的测试用例:
public class Main {
interface MyLib extends Library {
long doStuff(long seed);
}
public static void main(String[] args) {
MyLib myLib = (MyLib) Native.loadLibrary("mylib", MyLib.class);
LongStream.range(0, 10)
.map(myLib::doStuff)
.forEach(System.out::println);
}
}
doStuff 是一个缓慢的、受 CPU 限制的函数
int64_t doStuff(int64_t acc) {
for (int i = 0; i < 1<<30; i++) { acc += i; }
return acc;
}
doStuff 在我的机器上执行大约需要 2 秒,而 main 在大约 30 秒内完成。我使用以下 JVM 选项使用 jdk1.8.0_60 运行此测试用例:-XX:+UnlockCommercialFeatures -XX:+FlightRecorder -XX:FlightRecorderOptions=defaultrecording=true,dumponexit=true,dumponexitpath=jna.jfr
.
当我打开时jna.jfr
,我看到转储包含一个堆栈跟踪事件。据我了解,与大多数分析器不同,JFR 在本机代码运行时不会生成堆栈跟踪事件。我完全理解 JFR 不会分析本机代码,但我希望生成堆栈跟踪事件,堆栈跟踪在 java/本机代码边界处被截断。
我的设置有问题还是预期的行为?我发现它真的很容易出错。如果您不仔细验证样本计数,很容易认为热点位于 Java 代码中,而大部分时间都花在本机代码中。
也不可能知道最昂贵的本地调用在哪里,这就是您首先使用分析器的原因:)