2

我开发了一些需要集成到现有 C 代码中以更新其功能的功能。为了使调用新函数尽可能简单,我定义了一个容器结构,其中包含我需要的所有指针和数据,例如

typedef struct parameters
{
    double time;
    int num_sp;
    int num_nodes;
    int dielCount;
    double meshbounds[6];
} Params;

typedef struct FGM_Container
{
    dev_nodes *d_nodes;
    dev_nodes *h_nodes;
    dev_species *d_sp;
    dp_tree *octree;
    dp_params *dp_pars;
    dev_params *d_p;
    Params           p;     /* Parameters */
    Nodes           *n;     /* nodes array */
    int free_dev_flag;
    double guard_range;
    int max_octree_depth;
} fgm_container;

我将我的函数编译到一个名为 FGM 的共享库中(.so 因为我在 Linux 中工作),提供了一个带有原型的头文件,以便从原始代码中调用函数,并成功地重建了整个项目。但是,当执行进入我的函数时,传递给它们的变量似乎不会保留相同的值。这是一个非常简单的示例,之前和之后的代码更复杂,但这代表了我正在观察的行为:

int fgm_init(fgm_container *fgmc, int verbose);


int main()
{
    int fgm_ok = 0;
    int free_dev_flag;
    double guard_range = 0;
    int max_octree_depth = 5;

    Params p;
    fgm_container fgmc;

    //Set parameters
    p.time = 0;
    p.num_sp = 2;
    p.num_nodes = 500;
    p.dielCount = 1;
    p.meshbounds[0] = -0.019;
    p.meshbounds[1] =  0.0475;
    p.meshbounds[2] = -0.045;
    p.meshbounds[3] =  0.032;
    p.meshbounds[4] = -0.027;
    p.meshbounds[5] =  0.010;

    //Fill FGM container
    fgmc.p = p;
    fgmc.guard_range = guard_range;
    fgmc.max_octree_depth = max_octree_depth;

    //Print original data
    printf("Original data:\n");
    printf("dielCount: %d\n", fgmc.p.dielCount);
    printf("species: %d\n", fgmc.p.num_sp);
    printf("meshb: %lf %lf\n", fgmc.p.meshbounds[0], fgmc.p.meshbounds[1]);


    //Initialize FGM library
    fgm_ok = fgm_init(&fgmc, 2);

    if (fgm_ok != 0)
    {
        printf("FGM initialization failed. Exiting.\n");
        exit(-1);
    }

    return 0;
}


int fgm_init(fgm_container *fgmc, int verbose)
{
    int ok_flag=0;

    //Extract data from FGM container
    Params p = fgmc->p;
    double guard_range = fgmc->guard_range;
    int max_octree_depth = fgmc->max_octree_depth;


    if (verbose > 0) printf("FGM: Initializing...\n");
    printf("species: %d\n", p.num_sp);
    printf("meshb: %lf %lf\n", p.meshbounds[0], p.meshbounds[1]);
    printf("dielCount: %d\n", p.dielCount);
    getchar();  


    //Proceed with other initialization steps...

    return ok_flag;
}

此代码在我的屏幕上输出

Original data:
dielCount: 1
species: 2
meshb: -0.019000 0.047500

FGM: Initializing...
dielCount: 28203712
species: 2
meshb: 0.000000 0.000000
dielcount: 28203712

dielCount每次我启动代码时,该值都会发生变化,就好像它是一个未初始化的变量一样。由于在各种 malloc 函数中使用了各种参数,因此事情很快就会失控,并且我开始出现内存不足错误等等。此外,如果我尝试将参数结构本身按值传递给初始化函数,我会得到相同的结果,即:

int fgm_init(fgm_container *fgmc, Params p, int verbose);


int main()
{
    // Same steps as before...

    //Initialize FGM library
    fgm_ok = fgm_init(&fgmc, p, 2);

    if (fgm_ok != 0)
    {
        printf("FGM initialization failed. Exiting.\n");
        exit(-1);
    }

    return 0;
}


int fgm_init(fgm_container *fgmc, Params p, int verbose)
{
    int ok_flag=0;

    if (verbose > 0) printf("FGM: Initializing...\n");
    printf("species: %d\n", p.num_sp);
    printf("meshb: %lf %lf\n", p.meshbounds[0], p.meshbounds[1]);
    printf("dielCount: %d\n", p.dielCount);
    getchar();  


    //Proceed with other initialization steps...

    return ok_flag;
}

我想指出,在集成到目标项目(相当大)之前,共享库已经通过单独但小的测试验证可以正确执行。

当我试图弄清楚这个错误时,这个错误让我忙了几个小时,显然我错过了一些东西。关于使用共享库有什么我应该知道的,因为这是我第一次自己创建一个?这是否与编译有关,因为原始项目是使用 C 编译器编译的,而我的库是使用 NVIDIA NVCC 编译器编译的(因为我也使用了一些 CUDA 调用,但它们出现在麻烦的部分之后),这是一个 C++ 编译器主机代码部分?感谢您提供的任何见解。

4

1 回答 1

1

您是否检查过 .so 文件中的符号(使用 nm 或类似文件)?C++ 编译器可能会破坏名称,从而导致应用程序中发生奇怪的事情。

在你的结构周围添加extern "C"可能会解决你的问题。例如:

extern "C" {
    typedef struct parameters
    {
        double time;
        int num_sp;
        int num_nodes;
        int dielCount;
        double meshbounds[6];
    } Params;
}
于 2013-10-02T14:09:41.947 回答