2

有各种说法认为,在某些情况下,Fortran 可以比 C 更快,例如在别名方面,我经常听说它比 C 更好地进行自动矢量化(请参阅此处进行一些很好的讨论)。

但是,对于像计算斐波那契数和 Mandelbrot 这样的简单函数,使用直接的解决方案,没有任何技巧和编译器的额外提示/关键字,我希望它们确实执行相同的操作。

C实现:

int fib(int n) {
    return n < 2 ? n : fib(n-1) + fib(n-2);
}

int mandel(double complex z) {
    int maxiter = 80;
    double complex c = z;
    for (int n=0; n<maxiter; ++n) {
        if (cabs(z) > 2.0) {
            return n;
        }
        z = z*z+c;
    }
    return maxiter;
}

Fortran 实现:

integer, parameter :: dp=kind(0.d0)          ! double precision

integer recursive function fib(n) result(r)
integer, intent(in) :: n
if (n < 2) then
    r = n
else
    r = fib(n-1) + fib(n-2)
end if
end function

integer function mandel(z0) result(r)
complex(dp), intent(in) :: z0
complex(dp) :: c, z
integer :: n, maxiter
maxiter = 80
z = z0
c = z0
do n = 1, maxiter
    if (abs(z) > 2) then
        r = n-1
        return
    end if
    z = z**2 + c
end do
r = maxiter
end function

朱莉娅实现:

fib(n) = n < 2 ? n : fib(n-1) + fib(n-2)

function mandel(z)
    c = z
    maxiter = 80
    for n = 1:maxiter
        if abs(z) > 2
            return n-1
        end
        z = z^2 + c
    end
    return maxiter
end

(可以在这里找到包括其他基准函数在内的完整代码。)

根据Julia 主页,Julia 和 Fortran (with ) 在这两个函数上的-O3性能优于 C (with )。-O3

这个怎么可能?

4

1 回答 1

8

老实说,我不会太认真地对待这些差异。不同的 C 编译器也会给出不同的结果。尝试使用 GCC 和 Clang 运行 C 微基准测试,您将获得几乎与 C 与 Fortran 相同的差异。为什么 GCC 有时比 Clang 快,有时又不是?他们只是以不同的方式进行不同的优化和代码生成。不同硬件的相对性能也不同,因为它可能取决于寄存器的确切数量、缓存大小、超标量吞吐量的程度、各种指令的相对速度等。

奇怪的是,Fortran对于 fib 基准测试的速度要快得多,所以如果有人想出来并在此处发布答案,我会很乐意支持它,但 mandel 和其他基准测试的 ≤ 15% 差异并不是全部太了不起了。这些基准对我来说最神秘的事情是为什么 Fortran 在整数解析方面如此缓慢。我怀疑这是因为该代码正在做一些愚蠢的事情,但我不是 Fortran 编码器,所以我不确定应该改进什么。如果有人阅读这篇文章是 Fortran 专业人士并想看看这段代码,我们将不胜感激。我怀疑 Fortran 比 C 慢 5 倍是错误的。

需要注意的一点是,在整理这些基准测试结果时,我们拒绝零时间以避免计算编译器只是对整个计算进行常量折叠的情况。在某些优化级别上,这正是 C 和 Fortran 编译器所做的,并且很难强迫他们不这样做,除非使用较低的优化级别。如果有人想弄清楚如何强制编译器不要不断折叠这些结果,同时仍然完全优化基准代码,那将是一个受欢迎的贡献。(一种可能的方法是使用完全优化将基准函数编译为共享库,然后在关闭链接时优化的情况下将其链接到主程序。这很棘手,但它可能会起作用。)

归根结底,过分担心确切的微基准数字会错过更大的图景。这些基准的重点是某些语言具有可靠快速的标准实现——如 C、Fortran、Julia 和 Go——而其他语言则没有。在慢速语言中,您有时不得不求助于使用不同的语言来获得所需的性能,而在可靠快速的语言中,您永远不必这样做。这就是所有这些。快速语言的确切相对性能是一场军备竞赛:一种语言有时可能会领先,但其他语言总是会紧随其后——关键是它们完全在竞争中。

于 2013-11-15T18:00:16.093 回答