gcc - c - 将启用 PGI OpenACC 的库与 gcc 链接

Question

简而言之，我的问题依赖于使用两个不同的编译器编译/构建文件（使用库），同时利用源文件中的 OpenACC 结构。

我有一个具有 OpenACC 结构的 C 源文件。它只有一个简单的函数来计算数组的总和：

#include <stdio.h>
#include <stdlib.h>
#include <openacc.h>

double calculate_sum(int n, double *a) {
    double sum = 0;
    int i;

    printf("Num devices: %d\n", acc_get_num_devices(acc_device_nvidia));

    #pragma acc parallel copyin(a[0:n])
    #pragma acc loop
    for(i=0;i<n;i++) {
        sum += a[i];
    }

    return sum;
}

我可以使用以下行轻松编译它：

pgcc -acc -ta=nvidia -c libmyacc.c

然后，通过以下行创建一个静态库：

ar -cvq libmyacc.a libmyacc.o

为了使用我的库，我编写了一段代码，如下所示：

#include <stdio.h>
#include <stdlib.h>

#define N 1000

extern double calculate_sum(int n, double *a);

int main() {
    printf("Hello --- Start of the main.\n");
    double *a = (double*) malloc(sizeof(double) * N);
    int i;
    for(i=0;i<N;i++) {
        a[i] = (i+1) * 1.0;
    }

    double sum = 0.0;
    for(i=0;i<N;i++) {
        sum += a[i];
    }
    printf("Sum: %.3f\n", sum);


    double sum2 = -1;
    sum2 = calculate_sum(N, a);
    printf("Sum2: %.3f\n", sum2);

    return 0;
}

现在，我可以使用这个带有 PGI 编译器本身的静态库来编译上面的源代码（f1.c）：

pgcc -acc -ta=nvidia f1.c libmyacc.a

它将完美地执行。但是，对于 gcc，它有所不同。我的问题就在这里。如何使用 gcc 正确构建它？

感谢 Jeff 对这个问题的评论：使用 gcc 链接器链接 pgi 编译库，现在我可以f1.c无错误地构建我的源文件 ()，但可执行文件会发出一些致命错误。

这是我用 gcc ( f1.c) 编译我的源文件的方法：

gcc f1.c -L/opt/pgi/linux86-64/16.5/lib -L/usr/lib64 -L/usr/lib/gcc/x86_64-redhat-linux/4.8.5 -L. -laccapi -laccg -laccn -laccg2 -ldl -lcudadevice -lpgmp -lnuma -lpthread -lnspgc -lpgc -lm -lgcc -lc -lgcc -lmyacc

这是错误：

Num devices: 2
Accelerator Fatal Error: No CUDA device code available

感谢使用 PGI 编译器编译-v时的选项f1.c，我看到编译器调用了 PGI 和 NVidia 中的许多其他工具（如pgacclnk和nvlink）。

我的问题：

我走错路了吗？我可以从 GCC 调用 PGI 编译库中的函数并在这些函数中使用 OpenACC 吗？
如果上面的答案是肯定的，我可以使用没有PGI 采取的步骤（调用pgacclnk和）的仍然链接吗？nvlink
如果上面的答案也是肯定的，我该怎么办？

score 2 · Accepted Answer

将“-ta=tesla:nordc”添加到您的 pgcc 编译中。默认情况下，PGI 对 GPU 代码使用运行时动态编译 (RDC)。但是 RDC 需要 gcc 不支持的额外链接步骤（使用 nvlink）。“nordc”子选项禁用 RDC，因此您将能够在库中使用 OpenACC 代码。但是，通过禁用 RDC，您不能再从计算区域调用外部设备例程。

% pgcc -acc -ta=tesla:nordc -c libmyacc.c
% ar -cvq libmyacc.a libmyacc.o
a - libmyacc.o
% gcc f1.c -L/proj/pgi/linux86-64/16.5/lib -L/usr/lib64 -L/usr/lib/gcc/x86_64-redhat-linux/4.8.5 -L. -laccapi -laccg -laccn -laccg2 -ldl -lcudadevice -lpgmp -lnuma -lpthread -lnspgc -lpgc -lm -lgcc -lc -lgcc -lmyacc
% a.out
Hello --- Start of the main.
Sum: 500500.000
Num devices: 8
Sum2: 500500.000

希望这会有所帮助，垫

gcc - c - 将启用 PGI OpenACC 的库与 gcc 链接

1 回答 1

Related

Reference