6

我有一个浮点指针(数组),它代表一个图像。它的元素计数和索引具有宽度*高度。图像不像矩阵,它的原点位于左上角。相反,它的原点位于左下方,就像在笛卡尔坐标系中一样。达到最大宽度后,它从左侧的下一行开始。

所以我想有效地将​​这个数组转换为二维矩阵(可选:opencv)。

我如何以一种良好而有效的方式做到这一点?以及如何将其转换回来?

提前致谢。

4

3 回答 3

3

我会在湖里扔一块石头,看着涟漪。注意:我知道调用者希望对 xformed 数据做什么,这主要是由于我对 OpenCV 的初步了解。然而,转型的核心问题似乎很简单。如果我离基地很远,请发表评论,我会放弃答案。我提出了两种方法,一种用于就地数据反转,另一种用于使用 C++ 类进行简单的访问器包装。

就地反转:如果调用者需要反转行以适应传递给 API 的使用,则可以就地完成。使用完反转数据后,请务必再次执行此操作。一个纯粹面向字节的例子是:

// in-place inversion of the linear matrix to re-origin.
void mat_invert(float *data, size_t height, size_t width)
{
    // must be at least 2 rows high for this to mean anything.
    if (height < 2)
        return;

    // setup a pair of pointers to walk the rows in byte-form
    unsigned char* top = (unsigned char*)data;
    unsigned char *bottom = (unsigned char *)(data + (height-1)*width);
    size_t row_width = sizeof(data[0]) * width;
    while (top < bottom)
    {
        for (size_t i=0; i<row_width; i++)
        {
            *top ^= *bottom;
            *bottom ^= *top;
            *top++ ^= *bottom++;
        }
        bottom -= 2*row_width;
    }
}

示例用法:

int main(int argc, char *argv[])
{
    const size_t w = 10;
    const size_t h = 5;

    float ar[h*w];
    memset(ar, 0, sizeof(ar));

    ar[0]       = 0.1;
    ar[1*w + 1] = 1.1;
    ar[2*w + 2] = 2.1;
    ar[3*w + 3] = 3.1;
    ar[4*w + 4] = 4.1;

    // dump original
    for (size_t i=0; i<h; i++)
    {
        for (size_t j=0; j<w; j++)
            cout << ar[i*w+j] << ' ';
        cout << endl;
    }
    cout << endl;

    // invert original
    mat_invert(ar, h, w);
    for (size_t i=0; i<h; i++)
    {
        for (size_t j=0; j<w; j++)
            cout << ar[i*w+j] << ' ';
        cout << endl;
    }
    cout << endl;

    // invert again
    mat_invert(ar, h, w);
    for (size_t i=0; i<h; i++)
    {
        for (size_t j=0; j<w; j++)
            cout << ar[i*w+j] << ' ';
        cout << endl;
    }
    cout << endl;

    return EXIT_SUCCESS;
}

结果:

0.1 0 0 0 0 0 0 0 0 0 
0 1.1 0 0 0 0 0 0 0 0 
0 0 2.1 0 0 0 0 0 0 0 
0 0 0 3.1 0 0 0 0 0 0 
0 0 0 0 4.1 0 0 0 0 0 

0 0 0 0 4.1 0 0 0 0 0 
0 0 0 3.1 0 0 0 0 0 0 
0 0 2.1 0 0 0 0 0 0 0 
0 1.1 0 0 0 0 0 0 0 0 
0.1 0 0 0 0 0 0 0 0 0 

0.1 0 0 0 0 0 0 0 0 0 
0 1.1 0 0 0 0 0 0 0 0 
0 0 2.1 0 0 0 0 0 0 0 
0 0 0 3.1 0 0 0 0 0 0 
0 0 0 0 4.1 0 0 0 0 0 

隐式访问类:如果您只需要为您完成虚拟化行/高度数学,则以下内容就足够了:

#include <iostream>
#include <exception>
#include <stdexcept>
using namespace std;

class matrix_xform
{
private:
    size_t width, height;
    float *data;

public:
    matrix_xform(float *data, size_t height, size_t width)
        : data(data), width(width), height(height)
    {
    }

    float * operator[](size_t x)
    {
        if (x > (height-1))
            throw std::out_of_range("matrix_xform[x]");
        return data + (width * (height - 1 - x));
    }

    const float * operator[](size_t x) const
    {
        if (x > (height-1))
            throw std::out_of_range("matrix_xform[x]");
        return data + (width * (height - 1 - x));
    }
};

示例用法:

int main(int argc, char *argv[])
{
    const size_t w = 10;
    const size_t h = 5;

    float ar[h*w];
    memset(ar, 0, sizeof(ar));

    matrix_xform mat(ar, h, w);
    mat[0][0] = 1.0;
    mat[1][1] = 1.0;
    mat[2][2] = 1.0;
    mat[3][3] = 1.0;
    mat[4][4] = 1.0;

    // dump original
    for (size_t i=0; i<h; i++)
    {
        for (size_t j=0; j<w; j++)
            cout << ar[i*w+j] << ' ';
        cout << endl;
    }
    cout << endl;

    // dump using accessor
    for (size_t i=0; i<h; i++)
    {
        for (size_t j=0; j<w; j++)
            cout << mat[i][j] << ' ';
        cout << endl;
    }

    return EXIT_SUCCESS;
}

结果:

0 0 0 0 1 0 0 0 0 0 
0 0 0 1 0 0 0 0 0 0 
0 0 1 0 0 0 0 0 0 0 
0 1 0 0 0 0 0 0 0 0 
1 0 0 0 0 0 0 0 0 0 

1 0 0 0 0 0 0 0 0 0 
0 1 0 0 0 0 0 0 0 0 
0 0 1 0 0 0 0 0 0 0 
0 0 0 1 0 0 0 0 0 0 
0 0 0 0 1 0 0 0 0 0 

我希望涵盖 OP 正在寻找的每个基础。

于 2012-11-12T10:44:13.217 回答
1

将您的图像处理 API 规划为

 void my_func (int *src, int *dst, int x_stride, int y_stride, int N);

可以轻松地在连续内存中进行迭代,同时在左 <-> 右之间以及上 <-> 下之间翻转扫描方向。

如果 API 设计用于不同的输入和输出步幅,还可以更改每个图像元素的字节数(例如将颜色模式从 RGBA 更改为 RGB 或从 24 位 RGB 更改为 16 位 R5G6B5,从 int 更改为 float 等.)还有图像宽度(和高度也......)。

关键是无论图像的每一行的位置如何,数学都应该是相同的。

这些功能之一可以是:

 copy_row(int *src, int* dst, int N, int x_stride);
 copy_2D_mem(int *src_base, int* dst_base, int N, int M, int y_stride, int x_stride);

话又说回来,很可能许多现有的 opencv 算法并不关心图像的方向。并且自己编写,可以使用相同的方法。

于 2012-11-12T10:01:16.913 回答
1

据我了解您的问题,您希望将数组传递给 OpenCV API,以便将其解释为(top,left)索引二维矩阵。以下示例说明了一种无需重新排列任何数组的简单方法:

float a[8] = {1,2,3,4,5,6,7,8};  //your array containing the image
int img_width = 2;
int img_height = 4;
float** b = new float*[img_height];
for(int i=img_height ; i>0; i--)
    b[img_height-i] = a+ (i-1)*img_width;

//call your API
do_something(b,img_height,img_width); 


//your OpenCV API that expects a 2-d matrix 
void do_something(float** x , int r, int c){};

如果你愿意,你可以把它变成一个方便的函数/宏,你可以在调用 OpenCV API 之前调用它来获取所需格式的二维矩阵。此外,一旦完成,不要忘记为为此目的创建的临时数组取消分配内存。

于 2012-11-12T10:41:35.543 回答