我正在测试图像检索中的一些东西,我正在考虑如何整理数据集的不良图片。例如,只有房屋的照片,而在两者之间有一张人和一些汽车的照片。所以最后我只想得到房子。目前,我的方法如下:
- 计算所有图片的描述符(Sift)
- 用 k-means 聚类所有描述符
- 通过计算聚类中心和图片描述符之间的欧几里德距离来创建图片的直方图
- 再次聚类直方图。
此刻我得到了第一类(这不是很好)。现在我的想法是拍摄所有聚集到一个中心的照片,len(center) > 1
并一次又一次地将它们聚集在一起。这样的结果是,在一个中心的特定图片将被整理出来。也许它足以再次将结果拟合到相同的 k-means 而无需再次聚类?!
结果并不令人满意,所以也许有人有一个好主意。
对于聚类等。我正在使用 scikit learn 的 k-means。