0

我正在尝试为拜耳滤波器实现去马赛克算法,如本 pdf 的第 2.8 节(第 8 页)所示:http ://www.arl.army.mil/arlreports/2010/ARL-TR-5061.pdf 。我一直试图通过 RDom 实现一个功能。当我使用 16x16 图像时,痕迹实际上完成了,但是当我使用更大的图像(如 768x1280)时,痕迹会卡在:

Store green.0(767, 1279);

以下是我的代码的简化版本:

#include "Halide.h"
#include<stdio.h>
#include<stdlib.h>
#include "halide_image_io.h"

using namespace Halide;


int main(int argc, char **argv) {

    Buffer<uint8_t> input = Tools::load_image(argv[1]);

    RDom r(2, input.width() - 4, 2, input.height() - 4);
    r.where((r.x % 2 == 0 && r.y % 2 == 0) || (r.x % 2 == 1 && r.y % 2 == 1));

    Var x("x"), y("y");

    Func g_n, w_n, g_n_est, green("green");

    g_n(x, y) = cast<float> (0);
    w_n(x, y) = cast<float> (0);
    g_n_est(x, y) = cast<float> (0);
    green(x, y) = cast<uint8_t> (0);


    printf("width: %d\n", input.width());
    printf("height: %d\n", input.height());
    printf("channels: %d\n", input.channels());

    g_n(r.x, r.y) = abs(cast<float>(input(r.x, r.y + 1) - input(r.x, r.y - 1))) + abs(cast<float>(input(r.x, r.y) - input(r.x, r.y - 2)));
    w_n(r.x, r.y) = cast<float>(1 / (1 + g_n(r.x, r.y)));
    g_n_est(r.x, r.y) = cast<float>(input(r.x, r.y - 1) + (input(r.x, r.y) - input(r.x, r.y - 2))) / 2;

    green(r.x, r.y) = cast<uint8_t>(w_n(r.x, r.y) * g_n_est(r.x, r.y));
    green.trace_stores();



    Buffer<uint8_t> temp = green.realize(input.width(), input.height());

    Tools::save_image(temp, "result.png");

}

这是卤化物中的错误吗?在这种情况下,代码完成执行并保存 16x16 输入的输出图像,但会卡在跟踪中以获取更大的图像。

4

1 回答 1

1

这只是一个非常非常低效的时间表。每个阶段都在其更新定义中计算O(n)像素,只要它们被实现(现在已经很大了RDom r),但每个阶段也都内联到下一个阶段。结果, 中的每个点都在green递归地计算 和 的整个图像g_n_estw_n然后对于它们的每个像素,它递归地计算 的整个图像g_n

您所看到的停顿green.0(767, 1023)实际上是它完成计算green(x,y) = 0最后一个像素的纯定义之后,此时它开始花费很长时间来实际计算所有更新阶段,因为它的O(n^3)工作正在做。

在这种情况下,积极地打开更多跟踪会使问题更加清晰。配置编译时,您可以全局打开实现或单个商店的跟踪:https ://github.com/halide/Halide/wiki/Debugging-Tips#tracing 。

对于此代码,可以根据您的需要安排早期阶段compute_root,尽管您实际上可能希望g_n_estandw_n定义是简单的纯函数(根本没有RDoms),可以融合到green中,在块中安排等。

于 2018-07-11T00:32:01.750 回答