我正在尝试使用 STXXL 构建一个大型矩阵并能够对矩阵执行几种不同的操作。目前,我正在使用stxxl::vector
作为存储我的大矩阵的子矩阵的一种方式。我正在尝试做的是规范化矩阵的每一列。所以我唯一的数据依赖应该在列中。当我尝试使用 openmp 并行化对子矩阵的访问时,我收到错误消息
[STXXL-ERRMSG] 为 BID 提交的 WRITE 请求具有待处理的 READ 请求
一遍又一遍地。我是否误解了 STXXL 的线程安全性?因为我所做的不应该访问同一个子矩阵。这是我尝试调试和运行的示例代码:
#include <iostream>
#include <stxxl/vector>
#define FEATURE_LENGTH 128
#define PARTITION_SIZE 16
typedef stxxl::VECTOR_GENERATOR<int>::result vec;
using namespace std;
struct MyMatrix
{
float A[FEATURE_LENGTH*PARTITION_SIZE];
};
int main()
{
const int N = (1 << 20);
stxxl::vector<MyMatrix> C;
for (int n = 0; n < N; ++n) {
MyMatrix A;
for (size_t j = 0; j < PARTITION_SIZE; ++j) {
for (size_t i = 0; i < FEATURE_LENGTH; ++i) {
A.A[j*FEATURE_LENGTH + i] = n;
}
}
if (n == 0) {
std::cout << "sizeof(A) = " << sizeof(A) << std::endl;
}
C.push_back(A);
}
#pragma omp parallel for shared(C)
for (unsigned long long m = 0; m < C.size(); ++m) {
for (int j = 0; j < PARTITION_SIZE; ++j) {
MyMatrix& C_m = C[m];
float sum = 0;
for (int i = 0; i < FEATURE_LENGTH; ++i) {
sum += C_m.A[j*FEATURE_LENGTH + i];
}
if (sum != 0) {
for (int i = 0; i < FEATURE_LENGTH; ++i) {
C_m.A[j*FEATURE_LENGTH + i] /= sum;
}
}
}
}
return 0;
}
我正在运行的 CXX 标志是
-fopenmp -W -Wall -std=c++11 -O3