1

我相信我在尝试将傅里叶幅度谱转换为图像时遇到了缩放问题。

我正在研究自己的视觉里程计项目,以确定来自相机输入的连续帧之间的平移和旋转。我已经成功地使用傅立叶变换的相位相关确定了平移,但是确定旋转的一部分需要对幅度谱进行卷积。从本质上讲,我产生的幅度似乎并不正确,如下所示。

原图:
在此处输入图像描述

幅度,使用 'mag = 255*(mag/max)' 缩放
在此处输入图像描述

幅度,没有缩放
在此处输入图像描述

不幸的是,我需要关于我用来确定幅度的函数的帮助,我相信我的错误在于幅度的缩放,但我不确定。这个问题困扰了我一段时间,您的意见将不胜感激,谢谢。

void iplimage_dft(IplImage* img)
{
  IplImage*     img1, * img2;
  fftw_complex* in, * dft, * idft;
  fftw_plan     plan_f, plan_b;
  int           i, j, k, w, h, N;

  /* Copy input image */
  img1 = cvCloneImage(img);

  w = img1->width;
  h = img1->height;
  N = w * h;

  /* Allocate input data for FFTW */
  in   = (fftw_complex*) fftw_malloc(sizeof(fftw_complex) * N);
  dft  = (fftw_complex*) fftw_malloc(sizeof(fftw_complex) * N);

  /* Create plans */
  plan_f = fftw_plan_dft_2d(w, h, in, dft, FFTW_FORWARD, FFTW_ESTIMATE);

  /* Populate input data in row-major order */
    for (i = 0, k = 0; i < h; i++) 
    {
        for (j = 0; j < w; j++, k++)
        {
            in[k][0] = ((uchar*)(img1->imageData + i * img1->widthStep))[j];
           in[k][1] = 0.0;
        }
    }

  /* Forward & inverse DFT */
  fftw_execute(plan_f);

  /* Create output image */
  img2 = cvCreateImage(cvSize(w, h), 8, 1);

    //Find the maximum value among the magnitudes
    double max=0;
    double mag=0;
    for (i = 0, k = 1; i < h; i++){
        for (j = 0; j < w; j++, k++){
            mag = sqrt(pow(dft[k][0],2) + pow(dft[k][1],2));
            if (max < mag)
                max = mag;
        }
    }

  // Convert DFT result to output image
    for (i = 0, k = 0; i < h; i++)
    {
        for (j = 0; j < w; j++, k++)
        {
            double mag = sqrt(pow(dft[k][0],2) + pow(dft[k][1],2));
            mag = 255*(mag/max);
            ((uchar*)(img2->imageData + i * img2->widthStep))[j] = mag;
        }
    }   

  cvShowImage("iplimage_dft(): original", img1);
  cvShowImage("iplimage_dft(): result", img2);
  //cvSaveImage("iplimage_dft.png", img2,0 );
  cvWaitKey(0);

  /* Free memory */
  fftw_destroy_plan(plan_f);
  fftw_free(in);
  fftw_free(dft);
  cvReleaseImage(&img1);
  cvReleaseImage(&img2);
}

int main( int argc, char** argv )
{
    argv[1] = "image1.jpg";

    IplImage *img3 = cvLoadImage( argv[1], CV_LOAD_IMAGE_GRAYSCALE );
    iplimage_dft(img3);
    return 0;
}
4

1 回答 1

0

许多图像的光谱具有这样的特征 - 几个相对较高的峰值,而其余的场在幅度上非常小。看起来您正在正常化,只是细节丢失了,因为大部分频谱的幅度非常小。如果您想检查细节,我经常发现使用 log(mag(spectrum)) (甚至在某些情况下甚至 log(log(mag(spectrum))) 来生成图像更有用。

于 2012-08-15T14:28:33.470 回答