我遇到了这个问题,它比较了各种编译器以天真的方式计算斐波那契数的性能。
我尝试用 Haskell 来做这件事,看看它与 C 相比如何。
C代码:
#include <stdio.h>
#include <stdlib.h>
int fib (int n) {
if (n < 2) return 1;
return fib (n-1) + fib (n-2);
}
int main (int argc, char* argv[]) {
printf ("%i\n", fib (atoi(argv[1])));
return 0;
}
结果:
> gcc -O3 main.c -o fib
> time ./fib 40
165580141
real 0m0.421s
user 0m0.420s
sys 0m0.000s
哈斯克尔:
module Main where
import System.Environment (getArgs)
fib :: Int -> Int
fib n | n < 2 = 1
| otherwise = fib (n-1) + fib (n-2)
main = getArgs >>= print . fib . read . head
结果:
> ghc -O3 -fllvm -optlo-O3 Main.hs -o fib
> time ./fib 40
165580141
real 0m1.476s
user 0m1.476s
sys 0m0.000s
分析与
> ghc -O3 -fllvm -optlo-O3 -prof -auto-all -caf-all -rtsopts Main.hs -fforce-recomp -o fib
> ./fib 40 +RTS -prof
表明这fib
需要 100% 的时间和分配,这不足为奇。我对堆进行了一些配置,但不知道它们意味着什么:
> ./fib 40 +RTS -hc
> ./fib 40 +RTS -hd
所以我的问题是:我能做些什么来让这个 Haskell 程序的性能更接近 C,或者这只是 GHC 在这个微基准测试中碰巧让它变慢的方式吗?(我不是在要求一种渐近更快的算法来计算 fibs。)
非常感谢。
[编辑]
事实证明,这ghc -O3
比ghc -O3 -fllvm -optlo-O3
这种情况下要快。但optlo-block-placement
对 LLVM 后端产生了明显的不同:
> ghc -O3 Main.hs -o fib -fforce-recomp
> time ./fib 40
165580141
real 0m1.283s
user 0m1.284s
sys 0m0.000s
> ghc -O3 -fllvm -optlo-O3 -o fib -fforce-recomp
> time ./fib 40
165580141
real 0m1.449s
user 0m1.448s
sys 0m0.000s
> ghc -O3 -fllvm -optlo-O3 -optlo-block-placement -o fib -fforce-recomp
> time ./fib 40
165580141
real 0m1.112s
user 0m1.096s
sys 0m0.016s
我想研究这个的原因是因为对于这个程序,C 和 OCaml 都比 Haskell 快得多。我有点不能接受,想了解更多,以确保我已经做了我能做的一切:D
> ocamlopt main.ml -o fib
> time ./fib 40
165580141
real 0m0.668s
user 0m0.660s
sys 0m0.008s