6

问题是,如何通过角度对某些单元进行聚类?问题是,kmeans 在欧几里得空间距离的概念上运行,不知道角度的周期性。因此,要使其工作,需要将角度转换为欧几里得空间,但要满足以下条件:

  1. 近角是欧几里得空间中的近值;
  2. 远角在欧几里得空间中很远。

这意味着,90 和 -90 是遥远的值,180 和 -180 是相同的,170 和 -170 是接近的(角度从左上到右:0 - +180,从左下到右:0 - -180)

我尝试使用各种sin()函数,但它们都存在第 1 点和第 2 点中提到的问题。大多数观点之一是sin(x * 0.5f)但也有问题,即 180 和 -180 在欧几里得空间中是遥远的值。

4

1 回答 1

0

我找到的解决方案是将角度转换为圆上的点并将它们输入 kmeans。通过这种方式,我们可以比较点之间的距离,并且效果很好。

值得一提的重要事情。终止标准中的Kmeans@eps以您提供给 kmeans 的样本单位表示。在我们的示例中,最大距离点的距离为 200 个单位(2 * 半径)。这意味着拥有 1.0f 完全没问题。如果您cv::normalize(samples, samples, 0.0f, 1.0f)在调用之前用于您的样品kmeans(),请适当调整您的@eps。类似的东西eps=0.01f在这里玩得更好。

享受!希望这可以帮助某人。

static cv::Point2f angleToPointOnCircle(float angle, float radius, cv::Point2f origin /* center */)
{
        float x = radius * cosf(angle * M_PI / 180.0f) + origin.x;
        float y = radius * sinf(angle * M_PI / 180.0f) + origin.y;
        return cv::Point2f(x, y);
}

static std::vector<std::pair<size_t, int> > biggestKmeansGroup(const std::vector<int> &labels, int count)
{
        std::vector<std::pair<size_t, int> > indices;
        std::map<int, size_t> l2cm;

        for (int i = 0; i < labels.size(); ++i)
                l2cm[labels[i]]++;

        std::vector<std::pair<size_t, int> > c2lm;
        for (std::map<int, size_t>::iterator it = l2cm.begin(); it != l2cm.end(); it++)
                c2lm.push_back(std::make_pair(it->second, it->first)); // count, group

        std::sort(c2lm.begin(), c2lm.end(), cmp_pair_first_reverse);
        for (int i = 0; i < c2lm.size() && count-- > 0; i++)
                indices.push_back(c2lm[i]);
        return indices;
}

static void sortByAngle(std::vector<boost::shared_ptr<Pair> > &group,
                        std::vector<boost::shared_ptr<Pair> > &result)
{
        std::vector<int> labels;
        cv::Mat samples;

        /* Radius is not so important here. */
        for (int i = 0; i < group.size(); i++)
                samples.push_back(angleToPointOnCircle(group[i]->angle, 100, cv::Point2f(0, 0)));

        /* 90 degrees per group. May be less if you need it. */
        static int PAIR_MAX_FINE_GROUPS = 4;

        int groupNr = std::max(std::min((int)group.size(), PAIR_MAX_FINE_GROUPS), 1);
        assert(group.size() >= groupNr);
        cv::kmeans(samples.reshape(1, (int)group.size()), groupNr, labels,
                   cvTermCriteria(CV_TERMCRIT_EPS/* | CV_TERMCRIT_ITER*/, 30, 1.0f),
                   100, cv::KMEANS_RANDOM_CENTERS);

        std::vector<std::pair<size_t, int> > biggest = biggestKmeansGroup(labels, groupNr);
        for (int g = 0; g < biggest.size(); g++) {
                for (int i = 0; i < group.size(); i++) {
                        if (labels[i] == biggest[g].second)
                                result.push_back(group[i]);
                }
        }
}
于 2020-01-15T09:36:44.683 回答