1

考虑以下代码片段,

#include <iostream>
#include <valarray>

using namespace std;

std::ostream & operator<<(std::ostream & out, const std::valarray<int> inputVector);
typedef std::valarray<std::valarray<int> > val2d;

int main()
{
    val2d g(std::valarray<int>(10),4);

    for (uint32_t n=0; n<4; ++n){
        for (uint32_t m=0; m<10; ++m){
            g[n][m] = n*10 + m;
        }
    }  
   std::valarray<int> g_slice_rs = g[1][std::slice(0,10,1)];  // row slice
   //std::valarray<int> g_slice_cs = g[std::slice(0,1,3)][0];   // column slice (comment out)

   cout<<"row slice :: "<<g_slice_rs<<endl; 
   //cout<<"column slice :: "<<g_slice_cs<<endl; // (comment out)
   return 0;
}

std::ostream & operator<<(std::ostream & out, const std::valarray<int> inputVector)
{
  uint32_t vecLength = inputVector.size();
  out<<"[";
  for (uint32_t i=0; i<vecLength; ++i)
  {
    out <<inputVector[i]<<", ";
  }
  out<<"]"<<endl;
  return out;
}

在这里,我可以访问行切片,但不能访问列切片(如注释中所示)。是否有任何解决方法来访问列切片?线程不提供答案。

4

1 回答 1

3

首先,您没有 2D valarray。你有一个valarrayof valarrays,一个你不应该忽视的差异。

x = g[m][n];

只是看起来像数组样式的访问。它真的更接近

temp = g[m];
x = temp[n];

Avalarray的数据存储区是一个很好的连续内存块,但是如果您有一个 M × N 结构,那么您有 M+1 valarrays 可能分散在整个内存中。这可能会变成破坏性能的缓存未命中的噩梦。

您将不得不决定哪一个更重要是快速,行切片或列切片,因为只有一个会随着内存流运行,而另一个需要一个缓存颠簸副本来对抗颗粒。

目前

g[1][std::slice(0,10,1)];

有效,因为它正在切片一个连续的内存块,并且

g[std::slice(0,1,3)][0]

失败,因为它必须跨越 M distinct valarrays 来收集切片并且std::slice不能这样做。您将不得不从valarray组成该列的每个 s 中手动复制所需的元素。糟透了,是吗?

所以你会怎么做?

你造假!哈哈哈哈哈哈哈哈哈!

不要做一个valarrayvalarray制作一个valarray大小为 MxN 的大号。所以说再见

std::valarray<std::valarray<int> > g(std::valarray<int>(10),4);

你好

std::valarray<int>(10*4);

现在你可以利用std::slice的 stride 参数来抓取每十个元素

std::slice(column_to_slice,4,10);

作为额外的好处,您现在拥有一个连续的内存块,因此至少应该减轻一些缓存研磨滥用。如果步幅过大,你仍然是蓝精灵。

我全心全意地建议将其包装在一个对象中,以使访问和管理更容易。像这样的东西,除了你使用valarray而不是原始指针。

于 2016-10-03T23:12:43.657 回答