0

这是我在这里的第一篇文章,如果我做错了什么,很抱歉:)。我会尽力做到最好。

我目前正在开发我的 HDR 图像处理程序,我将使用 Halide 实现一些基于 TMO。问题是我所有的图像都表示为浮点数组(顺序如下: b1,g1,r1,a1, b2,g2,r2,a2, ... )。使用 Halide 处理图像需要 Halide::Image 类。问题是我不知道如何在那里传递这些数据。

任何人都可以提供帮助,或者有同样的问题并知道答案吗?

编辑:

终于明白了!我需要在生成器中设置输入和输出缓冲区的步幅。谢谢大家的帮助:-)

编辑:

我尝试了两种不同的方法:

int halideOperations( float data[] , int size, int width,int heighy ) 
{ 
buffer_t input_buf = { 0 }; 
input_buf.host = &data[0]; 
} 

或者:

int halideOperations( float data[] , int size, int width,int heighy ) 
{ 
Halide::Image(Halide::Type::Float, x, y, 0, 0, data);
}

我正在考虑编辑 Halide.h 文件并将 uint8_t * 主机更改为 float_t * 主机,但我认为这不是个好主意。

编辑:

我尝试将下面的代码与我的浮动图像(RGBA)一起使用:

AOT函数生成:

int main(int arg, char ** argv)
{
    Halide::ImageParam img(Halide::type_of<float>(), 3);
    Halide::Func f;
    Halide::Var x, y, c;
    f(x, y, c) = Halide::pow(img(x,y,c), 2.f);

    std::vector<Halide::Argument> arguments = { img };
    f.compile_to_file("function", arguments);
    return 0;
}

正确的代码调用:

int halideOperations(float data[], int size, int width, int height)
{
    buffer_t  output_buf = { 0 };
    buffer_t buf = { 0 };
    buf.host = (uint8_t *)data; 
    float * output = new float[width * height * 4];
    output_buf.host = (uint8_t*)(output);
    output_buf.extent[0] = buf.extent[0] = width; 
    output_buf.extent[1] = buf.extent[1] = height; 
    output_buf.extent[2] = buf.extent[2] = 4;
    output_buf.stride[0] = buf.stride[0] = 4;
    output_buf.stride[1] = buf.stride[1] = width * 4;
    output_buf.elem_size = buf.elem_size = sizeof(float);

    function(&buf, &output_buf);

    delete output;
    return 1;
}

不幸的是,我遇到了味精崩溃:

 Error: Constraint violated: f0.stride.0 (4) == 1 (1)

我认为这行有问题:output_buf.stride[0] = buf.stride[0] = 4,但我不确定我应该改变什么。有小费吗?

4

2 回答 2

1

如果您直接使用 buffer_t,则必须将分配给主机的指针转换为 uint8_t * :

buf.host = (uint8_t *)&data[0]; // Often, can be just "(uint8_t *)data"

如果您使用 Ahead-Of-Time (AOT) 编译并且数据没有作为直接调用 Halide 的代码的一部分分配,这就是您想要做的。(下面讨论的其他方法控制存储分配,因此它们无法获取传递给它们的指针。)

如果您使用的是 Halide::Image 或 Halide::Tools::Image,则类型转换在内部处理。上面用于 Halide::Image 的构造函数不存在,因为 Halide::Image 是一个模板类,其中基础数据类型是一个模板参数:

Halide::Image<float> image_storage(width, height, channels);

请注意,这会将数据存储在平面布局中。Halide::Tools::Image 类似,但可以选择进行交错布局。(就个人而言,我尽量不要在小型测试程序之外使用这些中的任何一个。有一个长期计划来合理化所有这些,这将在任意维度 buffer_t 分支合并后继续进行。另请注意 Halide::Image 需要 libHalide.a链接到 Halide::Tools::Image 没有的地方,并且仅通过包含 common/halide_image.h 是头文件。)

还有一个 Halide::Buffer 类,它是 buffer_t 的一个包装器,在即时 (JIT) 编译中很有用。它可以引用在存储中传递的并且不是模板化的。但是我的猜测是你想直接使用 buffer_t 并且只需要类型转换来分配主机。还要确保将 buffer_t 的 elem_size 字段设置为“sizeof(float)”。

对于交错的浮动缓冲区,你最终会得到类似的东西:

buffer_t buf = {0};
buf.host = (uint8_t *)float_data; // Might also need const_cast
// If the buffer doesn't start at (0, 0), then assign mins
buf.extent[0] = width; // In elements, not bytes
buf.extent[1] = height; // In elements, not bytes
buf.extent[2] = 3; // Assuming RGB
// No need to assign additional extents as they were init'ed to zero above
buf.stride[0] = 3; // RGB interleaved
buf.stride[1] = width * 3; // Assuming no line padding
buf.stride[2] = 1; // Channel interleaved
buf.elem_size = sizeof(float);

您还需要注意卤化物代码本身的边界。可能最好查看 tutorial/lesson_16_rgb_generate.cpp 中的 set_stride 和绑定调用以获取相关信息。

于 2016-04-24T18:47:24.620 回答
0

除了上面 Zalman 的回答之外,您还必须在定义 Halide 函数时指定输入和输出的步幅,如下所示:

int main(int arg, char ** argv)
{
    Halide::ImageParam img(Halide::type_of<float>(), 3);
    Halide::Func f;
    Halide::Var x, y, c;
    f(x, y, c) = Halide::pow(img(x,y,c), 2.f);

    // You need the following
    f.set_stride(0, f.output_buffer().extent(2));
    f.set_stride(1, f.output_buffer().extent(0) * f.output_buffer().extent(2));
    img.set_stride(0, img.extent(2));
    img.set_stride(1, img.extent(2) *img.extent(0));
    // <- up to here

    std::vector<Halide::Argument> arguments = { img };
    f.compile_to_file("function", arguments);
    return 0;
}

那么你的代码应该运行。

于 2016-11-17T23:37:13.437 回答