c++ - 高维空间中的 OpenCV 1.1 K-Means 聚类

Question

我正在尝试编写一袋特征系统图像识别系统。该算法的一个步骤是获取大量的小图像块（例如 7x7 或 11x11 像素），并尝试将它们聚集成看起来相似的组。我从图像中获取我的补丁，将它们转换为灰度浮点图像补丁，然后尝试让 cvKMeans2 为我聚类它们。我认为我在格式化输入数据时遇到问题，以便 KMeans2 返回一致的结果。我之前使用 KMeans 进行 2D 和 3D 聚类，但 49D 聚类似乎是另一种野兽。

我不断获取返回的集群向量的垃圾值，所以显然这是一个垃圾输入/垃圾输出类型的问题。此外，对于如此庞大的数据集，该算法的运行速度比我认为的要快得多。

在下面的代码中，直接 memcpy 只是我最近一次尝试以正确格式获取输入数据，我花了一段时间使用内置的 OpenCV 函数，但是当您的基本类型是 CV_32FC(49) 时，这很困难。

OpenCV 1.1 的 KMeans 算法能否支持这种高维分析？

有人知道从图像复制到 K-Means 输入矩阵的正确方法吗？

有人可以指出我可以使用的免费非 GPL KMeans 算法吗？

这不是最好的代码，因为我现在只是想让事情正常工作：

    std::vector<int> DoKMeans(std::vector<IplImage *>& chunks){
 // the size of one image patch, CELL_SIZE = 7
 int chunk_size = CELL_SIZE*CELL_SIZE*sizeof(float);
 // create the input data, CV_32FC(49) is 7x7 float object (I think)
 CvMat* data = cvCreateMat(chunks.size(),1,CV_32FC(49) );


 // Create a temporary vector to hold our data
 // we'll copy into the matrix for KMeans
 int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;
 float * rawdata = new float[rdsize];

 // Go through each image chunk and copy the 
 // pixel values into the raw data array.
 vector<IplImage*>::iterator iter;
 int k = 0;
 for( iter = chunks.begin(); iter != chunks.end(); ++iter )
 {

  for( int i =0; i < CELL_SIZE; i++)
  {
   for( int j=0; j < CELL_SIZE; j++)
   {
    CvScalar val;
    val = cvGet2D(*iter,i,j);
    rawdata[k] = (float)val.val[0];
    k++;
   }

  }
 }

 // Copy the data into the CvMat for KMeans
 // I have tried various methods, but this is just the latest.
 memcpy( data->data.ptr,rawdata,rdsize*sizeof(float));

 // Create the output array
 CvMat* results = cvCreateMat(chunks.size(),1,CV_32SC1);

 // Do KMeans
 int r = cvKMeans2(data, 128,results, cvTermCriteria(CV_TERMCRIT_EPS+CV_TERMCRIT_ITER, 1000, 0.1));

 // Copy the grouping information to our output vector
 vector<int> retVal;
 for( int y = 0; y < chunks.size(); y++ )
 {
  CvScalar cvs = cvGet1D(results, y);
  int g =  (int)cvs.val[0];
  retVal.push_back(g);
 }

 return retVal;}

提前致谢！

score 0 · Accepted Answer

0

虽然我不熟悉“特征包”，但您是否考虑过使用角检测器和 SIFT 等特征点？

于 2010-06-30T09:32:38.167 回答

score -1 · Accepted Answer

您可能想查看http://bonsai.ims.u-tokyo.ac.jp/~mdehoon/software/cluster/以获取另一个开源集群包。

像这样使用 memcpy 似乎很可疑，因为当你这样做时：

 int rdsize = chunks.size()*CELL_SIZE*CELL_SIZE;

如果 CELL_SIZE 和 chunks.size() 非常大，则您正在创建 rdsize 中的大型内容。如果这大于最大的可存储整数，您可能会遇到问题。

你想改变这个函数中的“块”吗？我猜你不知道，因为这是一个 K-means 问题。

因此，请尝试在此处通过引用传递 const。（一般来说，这就是你想要做的）

所以而不是：

std::vector<int> DoKMeans(std::vector<IplImage *>& chunks)

这将是：

std::vector<int> DoKMeans(const std::vector<IplImage *>& chunks)

同样在这种情况下，使用 static_cast 比使用旧的 c 样式转换更好。（例如 static_cast(variable) 而不是 (float)variable ）。

此外，您可能想删除“原始数据”：

 float * rawdata = new float[rdsize];

可以通过以下方式删除：

delete[] rawdata;

否则你可能会在这里泄漏内存。

c++ - 高维空间中的 OpenCV 1.1 K-Means 聚类

2 回答 2

Related

Reference