我是 C 的初学者,我有这个问题,我malloc/calloc
使用二维数组并free
在使用后尝试它们时出错。该程序用随机值填充方阵,并让用户在不同的函数之间进行选择以将它们相乘,以评估性能。这是代码:
#include <stdio.h>
#include <stdlib.h>
#include <sys/time.h>
#include <cblas.h>
#include <assignment2.h> // declares my non-blas multiplication functions
int main(int argc, const char *argv[]) {
int n, i, j, blockSize, choice;
printf("Enter n: ");
scanf("%d", &n);
printf("Enter block size: ");
scanf("%d", &blockSize);
do {
printf("Enter method (1 -> naive, 2 -> ijk-blocked, "
"3 -> kij-blocked, 4 -> cblas_dgemm): ");
scanf("%d", &choice);
} while (choice < 1 || choice > 4);
double **a, **b, **result;
/* Init matrices*/
a = malloc(n * sizeof(double*));
b = malloc(n * sizeof(double*));
result = malloc(n * sizeof(double*));
if (a == NULL || b == NULL || result == NULL) {
printf("Error.\n");
return 1;
}
for (i = 0; i < n; i++) {
*(a + i) = malloc(n* sizeof(double));
*(b + i) = malloc(n* sizeof(double));
*(result + i) = calloc(n, sizeof(double));
}
fillMatrix(n, a);
fillMatrix(n, b);
// timing
struct timeval tv1, tv2;
struct timezone tz;
gettimeofday(&tv1, &tz);
switch(choice) {
case 1:
printf("matmul_ijk\n");
matmul_ijk(n, a, b, result);
break;
case 2:
printf("matmul_ijk_blocked\n");
matmul_ijk_blocked(n, blockSize, a, b, result);
break;
case 3:
printf("matmul_kij_blocked\n");
matmul_kij_blocked(n, blockSize, a, b, result);
break;
case 4:
printf("cblas_dgemm\n");
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, n, n, n, 1.0,
a[0], n, b[0], n, 0.0, result[0], n);
break;
default:
puts("Error. Mode not recognized.");
}
gettimeofday(&tv2, &tz);
// Print time
double elapsed = (double) (tv2.tv_sec-tv1.tv_sec)
+ (double) (tv2.tv_usec-tv1.tv_usec) * 1.e-6;
printf("Time elapsed: %lf\n", elapsed);
// for (i = 0; i < n; i++) {
// free(a[i]);
// free(b[i]);
// free(result[i]);
// }
// free(a);
// free(b);
// free(result);
return 0;
}
现在,在最后,我注释掉了我释放之前分配的内存的尝试。因为如果我启用对 的最后三个调用free
,我会遇到此类错误
2(724,0x7fff7cc76960) malloc: *** error for object 0x7fe62a016000: pointer being freed was not allocated
*** set a breakpoint in malloc_error_break to debug
我不知道为什么,因为我自己分配了内存。但是程序正常运行并提供结果,只有在释放错误时才会发生。有趣的是,这只发生在很大n
的时候。例如n=1000
,没有问题,但n=2000
有。出于速度原因,我总是选择BLAS
例程来测试它,我不知道其他人是否表现出相同的行为。
所以我猜我在这里遗漏了一些重要的东西,因为
- 我编辑的记忆
malloc
似乎不想被free
删除 - 问题似乎与矩阵的大小有关,我不明白。
谁能指出我的错误?