0

给定一个MN列的矩阵,并分配为M*N元素的字节数组(这些元素最初设置为零),我将根据以下规则修改此矩阵:在 a 附近找到的元素某些元素必须设置为给定值。换句话说,给定一个矩阵,我应该设置矩阵的一个区域:为此,我应该访问数组的不连续部分。

为了执行上述操作,我可以访问以下信息:

  • 指向位于邻域中心的元素的指针(在上述操作期间不得更改此指针);还提供了该元素的位置(行和列);
  • L*L邻域的大小( L始终是奇数)。

实现此操作的代码应该在 C++ 中尽可能快地执行:出于这个原因,我想到了使用上面的指针来访问数组的不同部分。相反,邻域中心元素的位置(行和列)可以让我检查指定区域是否超过矩阵的维度(例如,区域的中心可能位于矩阵的边缘) :在这种情况下,我应该只设置位于矩阵中的那部分区域。

int M = ... // number of matrix rows
int N = ... // number of matrix columns

char* centerPtr = ... // pointer to the center of the region
int i = ... // position of the central element
int j = ... // of the region to be modified

char* tempPtr = centerPtr - (N+1)*L/2;
for(int k=0; k < L; k++)
{
    memset(tempPtr,value,N);
    tempPtr += N;
}

如何改进代码?如何处理一个区域可能超过矩阵维度的事实?如何使代码在执行时间方面更有效率?

4

1 回答 1

1

对于区域不与矩阵外部重叠的一般情况,您的代码可能是最佳的。使用这种代码可能导致的主要效率问题是在列而不是行上进行外部循环。这会破坏缓存和分页性能。你没有这样做。

对于大多数现代编译器,使用指针几乎没有速度优势。优化器将从普通数组索引中得出非常好的指针代码。在某些情况下,我看到数组索引代码比手动调整的指针代码运行得更快。因此,如果索引算术更清晰,请不要使用指针算术。

有 8 种边界情况:北、西北、西、...、东北。这些中的每一个都需要一个自定义版本的循环来接触正确的元素。我会展示西北的情况,让你解决剩下的问题。

处理这种情况的最快方法是使用 3 级“if”树:

if (j < L/2) {  // northwest, west, or southwest
  if (i < L/2) {  
    // northwest
    char* tempPtr = centerPtr - (L/2 - i) * N - (L/2 - j);
    for(int k = 0; k < L; k++) {
      memset(tempPtr, value, L - j);
      tempPtr += N;
    }
  } else if (i >= M - L/2) { 
    // southwest
  } else { 
    // west
  }
} else if (j >= N - L/2) { // symmetrical cases for east.
  if (i < L/2) {  
    // northeast
  } else if (i >= M - L/2) { 
    // southeast
  } else { 
    // east
  }
} else { 
  if (i < L/2) {  
    // north
  } else if (i >= M - L/2) { 
    // south
  } else { 
    // no overlap
  }
}

这样做很乏味,但每个区域最多只能进行 3 次比较。

于 2013-01-20T07:10:28.160 回答