2

我正在尝试在android中实现一个简单的高斯模糊,它的工作速度很慢:(这是相关代码:

double rSum = 0;
double gSum = 0;
double bSum = 0;
double weightSum = 0;

for(int y = 0; y < originalImage.height ; y++){
    for(int x = 0; x < originalImage.width ; x++){
        int newPixel;

        rSum = 0;
        gSum = 0;
        bSum = 0;
        weightSum = 1;

        for(int row = y-FRAME_OFFSET ; row <= y+FRAME_OFFSET ; row++){
            for(int col = x-FRAME_OFFSET ; col <= x+FRAME_OFFSET ; col++){
                if(originalImage.inBounds(col, row)){
                    double weight = weights[(x-col)*(x-col) + (y-row)*(y-row)];
                    weightSum += weight;

                    int pixel = originalImage.at(col, row);

                    int red =  (pixel >> 16) & 0xFF ;
                    int green = (pixel >> 8) & 0xFF ;
                    int blue = pixel & 0xFF ;

                    rSum += red * weight;
                    gSum += green * weight;
                    bSum += blue * weight;  

                }
            }
        }

        rSum /= weightSum;
        gSum /= weightSum;
        bSum /= weightSum;

        newPixel = Color.rgb((int)rSum, (int)gSum, (int)bSum);                  

        maskedImage.set(x, y, newPixel);
    }
}

如果我在帧 FRAME_OFFSET(半径)为 15 的情况下使用此算法,则在 512x512 图像上大约需要 3 分钟(!),并且随着我增加偏移量,它会变得最差。我的猜测是这是一个缓存问题,因为当我计算新像素时,我正在访问可能不在缓存中的不同行中的像素。

任何帮助/改进将不胜感激。

请注意,我需要自己实现这个算法,而不是使用现有的实现。

谢谢。

4

2 回答 2

1

2D 高斯模糊核是线性可分的,这意味着它可以表示为两个 1D 核的外部(列乘以行)乘积,一个用于图像行,一个用于列。因此,任何使用此属性的直接实现对于 M N 图像和 ak k 内核都应该是 O(k M N) ,并且被实现为两遍算法,每遍执行一维卷积,首先沿着图像行,然后沿着图像列。

在某些情况下,可以通过利用高斯核本身的某些特性来加速 1D 步骤,这允许仅使用整数运算增量地完成权重系数的计算。这是我所知道的最快的实现——它可以很容易地移植到 Android 上的 Java:Incremental Computation of the Gaussian

于 2013-07-03T16:22:49.460 回答
0

使用这个库:https ://github.com/jrvansuita/GaussianBlur

像这样实现:

//Asynchronous with scaleDown and changing radius
GaussianBlur.with(context).size(300).radius(10).put(R.mipmap.your_image, imageView);
于 2017-03-03T12:40:25.237 回答