0

我发布了我的数据集的 3 张图像,以显示我的图像在视觉上的外观:

http://s1306.photobucket.com/user/Bidisha_Chakraborty/library/?page=1

我正在使用 VLFFeat DSIFT 实现。我使用每个描述符 4 个方向而不是 8 个。所以在我的情况下,它是 64 维向量而不是 128。我使用图像的原始比例,因为我的图像数据最初是从固定距离获取的。我以 4/8 像素的间隔密集计算描述符。我通过将窗口大小从 80*80 像素更改为 20*20 像素进行了几次实验。我对不同数量的聚类中心进行了聚类方法。最后,我使用了推土机的距离来计算相似度指标。在对窗口大小、字数进行各种参数调整后,我发现即使我有像 1 和 3 这样几乎相似的图像,距离度量也表明图像 1 与图像 2 比图像 1 与图像 3 更相似。

我做了主成分分析来查看数据的方差。我希望图像 1 和图像 2 具有分离的簇,而图像 1 和 3 具有重叠的簇。由于我绘制了前 3 个维度,而这 3 个维度占数据的比例不到 30%,我确信包括所有维度(我当然无法可视化)会产生更差的结果。

  1. 我是否应该得出结论认为 SIFT 不是我的应用程序的最佳选择,或者我错过了一些东西。我已经为这些使用了 GLCM,但没有得到好的结果。非常欢迎对任何其他功能空间提出任何建议。感谢您的任何见解。
4

0 回答 0