63

仅基于性能,大约有多少“简单”的 java 行相当于进行 JNI 调用的性能损失?

或者尝试用更具体的方式表达这个问题,如果一个简单的java操作比如

someIntVar1 = someIntVar2 + someIntVar3;

给定一个“CPU 工作”指数1,那么进行 JNI 调用的开销的典型(大致)“CPU 工作”指数是多少?


这个问题忽略了等待本机代码执行所花费的时间。在电话用语中,它是严格关于通话的“降旗”部分,而不是“通话率”。


问这个问题的原因是当您知道本机成本(来自直接测试)和给定操作的 java 成本时,有一个“经验法则”来知道何时尝试编写 JNI 调用。它可以帮助您快速避免编码 JNI 调用的麻烦,结果发现调用开销消耗了使用本机代码的任何好处。

编辑:

有些人对 CPU、RAM 等方面的变化感到困惑。这些几乎都与问题无关——我问的是 java 代码行的相对成本。如果 CPU 和 RAM 很差,那么它们对于 java 和 JNI 来说都很差,所以环境因素应该平衡。JVM 版本也属于“无关”类别。

这个问题不是要求以纳秒为单位的绝对时间,而是要求以“简单的 Java 代码行”为单位的球场“工作量”。

4

3 回答 3

49

快速探查器测试产生:

Java类:

public class Main {
    private static native int zero();

    private static int testNative() {
        return Main.zero();
    }

    private static int test() {
        return 0;
    }

    public static void main(String[] args) {
        testNative();
        test();
    }

    static {
         System.loadLibrary("foo");
    }
}

C 库:

#include <jni.h>
#include "Main.h"

JNIEXPORT int JNICALL 
Java_Main_zero(JNIEnv *env, jobject obj)
{
    return 0;
}

结果:

单次调用 循环调用 10 次 循环调用 100 次

系统详情:

java version "1.7.0_09"
OpenJDK Runtime Environment (IcedTea7 2.3.3) (7u9-2.3.3-1)
OpenJDK Server VM (build 23.2-b09, mixed mode)
Linux visor 3.2.0-4-686-pae #1 SMP Debian 3.2.32-1 i686 GNU/Linux

更新:x86(32/64 位)和ARMv6的Caliper 微基准测试如下:

Java类:

public class Main extends SimpleBenchmark {
    private static native int zero();
    private Random random;
    private int[] primes;

    public int timeJniCall(int reps) {
        int r = 0;
        for (int i = 0; i < reps; i++) r += Main.zero();
        return r;
    }

    public int timeAddIntOperation(int reps) {
        int p = primes[random.nextInt(1) + 54];   // >= 257
        for (int i = 0; i < reps; i++) p += i;
        return p;
    }

    public long timeAddLongOperation(int reps) {
        long p = primes[random.nextInt(3) + 54];  // >= 257
        long inc = primes[random.nextInt(3) + 4]; // >= 11
        for (int i = 0; i < reps; i++) p += inc;
        return p;
    }

    @Override
    protected void setUp() throws Exception {
        random = new Random();
        primes = getPrimes(1000);
    }

    public static void main(String[] args) {
        Runner.main(Main.class, args);        
    }

    public static int[] getPrimes(int limit) {
        // returns array of primes under $limit, off-topic here
    }

    static {
        System.loadLibrary("foo");
    }
}

结果(x86/i7500/热点/Linux):

Scenario{benchmark=JniCall} 11.34 ns; σ=0.02 ns @ 3 trials
Scenario{benchmark=AddIntOperation} 0.47 ns; σ=0.02 ns @ 10 trials
Scenario{benchmark=AddLongOperation} 0.92 ns; σ=0.02 ns @ 10 trials

       benchmark     ns linear runtime
         JniCall 11.335 ==============================
 AddIntOperation  0.466 =
AddLongOperation  0.921 ==

结果(amd64/phenom 960T/Hostspot/Linux):

Scenario{benchmark=JniCall} 6.66 ns; σ=0.22 ns @ 10 trials
Scenario{benchmark=AddIntOperation} 0.29 ns; σ=0.00 ns @ 3 trials
Scenario{benchmark=AddLongOperation} 0.26 ns; σ=0.00 ns @ 3 trials

   benchmark    ns linear runtime
         JniCall 6.657 ==============================
 AddIntOperation 0.291 =
AddLongOperation 0.259 =

结果(armv6/BCM2708/Zero/Linux):

Scenario{benchmark=JniCall} 678.59 ns; σ=1.44 ns @ 3 trials
Scenario{benchmark=AddIntOperation} 183.46 ns; σ=0.54 ns @ 3 trials
Scenario{benchmark=AddLongOperation} 199.36 ns; σ=0.65 ns @ 3 trials

   benchmark  ns linear runtime
         JniCall 679 ==============================
 AddIntOperation 183 ========
AddLongOperation 199 ========

总结一下,似乎JNI调用大致相当于典型(x86)硬件和Hotspot VM上的 10-25 个 java 操作。毫不奇怪,在优化程度较低的Zero VM下,结果大不相同(3-4 次操作)。


感谢@Giovanni Azua@Marko Topolnik的参与和提示。

于 2012-12-20T18:02:29.040 回答
6

因此,我刚刚使用带有 Profile Startup 附加组件的 Eclipse Mars IDE、JDK 1.8.0_74 和 VirtualVM profiler 1.3.8 在 Windows 8.1、64 位上测试了对 C 的 JNI 调用的“延迟”。

设置:(两种方法)
SOMETHING() 传递参数、执行操作并返回参数
NOTHING() 传入相同的参数,不对其执行任何操作,并返回相同的参数。

(每个被调用 270 次)
SOMETHING()的总运行时间: 6523
毫秒 NOTHING() 的总运行时间:0.102 毫秒

因此,在我的情况下,JNI 调用可以忽略不计。

于 2016-03-21T20:42:20.113 回答
2

您实际上应该自己测试一下“延迟”是什么。延迟在工程中被定义为发送零长度消息所需的时间。在这种情况下,它对应于编写最小的 Java 程序,该程序调用一个do_nothing空的 C++ 函数并计算超过 30 次测量的经过时间的平均值和标准差(做几个额外的预热调用)。对于不同的 JDK 版本和平台,您可能会惊讶于不同的平均结果。

只有这样做才能为您提供使用 JNI 是否对您的目标环境有意义的最终答案。

于 2012-12-20T13:25:07.790 回答