11

我发现 RenderScript 中缺少好的文档,据我所知,forEach在 RS 中是为分配中的每个单独项目执行 root()。

我正在尝试为进行图像处理的 Renderscript 创建一个库,作为起点,我得到了这个很好的答案。但问题是,模糊操作是在每个像素上进行的,每个像素都需要另一个计算循环(n 和模糊宽度)。虽然运行在多核上,但还是有点太慢了。

我正在尝试对其进行修改以允许(两次通过)框过滤器,但这需要在单行或单列而不是单元格上工作。那么,有没有办法让 foreach 向 root() 发送一个数组呢?

4

1 回答 1

16

rsForEach 只能对分配进行操作。

如果您想让 rsForEach 函数为每个图像行调用 root(),您必须传入一个大小与行数相同的分配,然后计算出您应该在里面操作的行root() (类似地对每一列进行操作)。RenderScript 然后应该划分工作以在可用资源上运行(在多核设备上同时处理多行)。

您可以做到这一点的一种方法是传入一个分配,该分配给出图像行的偏移量(在图像数据数组内)。root() 中的 v_in 参数将是行偏移量。由于 rsForEach 调用所基于的分配不是图像数据,因此您无法使用 v_out 参数将图像写出,您必须单独绑定输出图像。

这是一些显示这一点的 RenderScript:

#pragma version(1)
#pragma rs java_package_name(com.android.example.hellocompute)

rs_allocation gIn;
rs_allocation gOut;
rs_script gScript;

int mImageWidth;
const uchar4 *gInPixels;
uchar4 *gOutPixels;

void init() {
}

static const int kBlurWidth = 20;

//
// This is called per row.
// The row indices are passed in as v_in or you could also use the x argument and multiply it by image width.
//
void root(const int32_t *v_in, int32_t *v_out, const void *usrData, uint32_t x, uint32_t y) {
    float3 blur[kBlurWidth];
    float3 cur_colour = {0.0f, 0.0f, 0.0f};

    for ( int i = 0; i < kBlurWidth; i++) {
        float3 init_colour = {0.0f, 0.0f, 0.0f};
        blur[i] = init_colour;
    }

    int32_t row_index = *v_in;
    int blur_index = 0;

    for ( int i = 0; i < mImageWidth; i++) {
        float4 pixel_colour = rsUnpackColor8888(gInPixels[i + row_index]);

        cur_colour -= blur[blur_index];
        blur[blur_index] = pixel_colour.rgb;
        cur_colour += blur[blur_index];

        blur_index += 1;
        if ( blur_index >= kBlurWidth) {
            blur_index = 0;
        }

        gOutPixels[i + row_index] = rsPackColorTo8888(cur_colour/(float)kBlurWidth);
        //gOutPixels[i + row_index] = rsPackColorTo8888(pixel_colour);
    }
}


void filter() {
    rsDebug("Number of rows:", rsAllocationGetDimX(gIn));
    rsForEach(gScript, gIn, gOut, NULL);
}

这将使用以下 Java 进行设置:

    mBlurRowScript = new ScriptC_blur_row(mRS, getResources(), R.raw.blur_row);

    int row_width = mBitmapIn.getWidth();

    //
    // Create an allocation that indexes each row.
    //
    int num_rows = mBitmapIn.getHeight();
    int[] row_indices = new int[num_rows];
    for ( int i = 0; i < num_rows; i++) {
        row_indices[i] = i * row_width;
    }
    Allocation row_indices_alloc = Allocation.createSized( mRS, Element.I32(mRS), num_rows, Allocation.USAGE_SCRIPT);
    row_indices_alloc.copyFrom(row_indices);

    //
    // The image data has to be bound to the pointers within the RenderScript so it can be accessed
    // from the root() function.
    //
    mBlurRowScript.bind_gInPixels(mInAllocation);
    mBlurRowScript.bind_gOutPixels(mOutAllocation);

    // Pass in the image width
    mBlurRowScript.set_mImageWidth(row_width);

    //
    // Pass in the row indices Allocation as the input. It is also passed in as the output though the output is not used.
    //
    mBlurRowScript.set_gIn(row_indices_alloc);
    mBlurRowScript.set_gOut(row_indices_alloc);
    mBlurRowScript.set_gScript(mBlurRowScript);
    mBlurRowScript.invoke_filter();
于 2012-05-16T11:00:32.710 回答