7

当我的图像具有 N 个样本大小的选择时,我应该使用什么均值统计方程?

我有一个独特的问题,我希望得到一些建议,这样我就不会错过任何事情。问题:根据用户对不同选择比率的区域的选择,在图像上找到最喜欢/最喜欢/最重要的区域。

场景:考虑一张狗的图像,数百名用户在不同分辨率的图像上选择区域,大多数选择中明显的焦点区域将是包含狗的区域。我可以记录 x1,x2,y1,y2 坐标并将它们放入数据库中,现在如果我想以一组分辨率自动生成该图像的版本,我应该能够识别具有最大吸引力的区域用户。我认为可行的方法是:

  1. 找到所有选择的平均中心点,并以此为基础选择。- 非常简单,但不会那么准确。
  2. 使用一些算法,如 K 均值或 EM 聚类,但我不知道哪一个最适合。

期待一些出色的解决方案来解决我的问题

有关该问题的更多信息:实际图像很可能是 1024x768 图像,并且在其上所做的选择将是最常见的手机分辨率。目标是根据用户选择通过智能学习自动生成手机壁纸。

4

2 回答 2

2

我相信您在上面发现了两个明显的问题:

一:点的识别

为此,您需要开发某种启发式方法来确定是否应考虑某个点。

我相信你提到过数百名用户将在这张图片上选择位置?数百个可能是很多点进行聚类。考虑排除异常值(通过删除在特定距离内没有一定数量邻居的点)

您可以做任何减少数据集的事情都会有所帮助。


二:点聚类

我相信 K 均值聚类最适合这个特定问题。 关联

您的特定问题似乎与解释此算法时使用的标准笛卡尔坐标聚类示例非常相似。

您尝试做的似乎是 NP-Hard,但应该通过经典近似来满足。

聚类后​​,您可以对该聚类中的点取平均值以获得相当准确的近似值。

此外:

您的数据集听起来像是已经紧密聚集在一起了。(即大多数人会选择狗的脸,而不是躯干的一侧。)您需要注意局部最小值。链接这些真的会给你的算法带来麻烦。尤其是在少量集群的情况下。请注意,您可能需要一些动态编程来解决这个问题。你通常可以在你的算法中引入一些方差,让平均点从这些局部最小值中“弹出”。局部最小值/最大值

希望这可以帮助!

于 2012-06-04T14:44:08.990 回答
2

我认为您可能能够以不同的方式解决您的问题。如果您还没有听说过Seam Carving,那么我建议您检查一下,因为您可以使用的数据非常适合它。这个想法是,您可以删除不一定在直线上的像素路径,而不是裁剪图像来调整它的大小。这使您可以在保留更多“有趣”信息的同时调整图像大小。

通常你会选择能量最小的路径,这里的能量是对沿着路径的色调/强度变化量的某种度量。当您拥有非常重要的图像区域(例如狗的脸)但这些区域的能量不一定非常高时,这将失败。由于您有指示图像的哪些部分非常重要的用户数据,因此您可以确保在每次有人选择具有该像素的区域时明确地向像素添加一点能量来围绕图像的这些区域进行雕刻。

这段视频展示了缝雕的实际效果,即使您认为自己不会使用它,观看起来也很酷。不过,我认为值得一试,我之前曾在一些有趣的调整大小应用程序中使用过它,而且它实际上很容易实现。

于 2012-06-04T17:03:34.420 回答