我希望计算网站的两个屏幕截图之间的某种“相似度百分比”。我特别想计算一个特定网站如何随时间变化(即确定哪些网站倾向于保持一致的外观),并将一个网站的外观与一堆类似类别的其他网站(例如所有新闻网站)进行比较看看它与其他人有多么不同。[我想到的应用程序之一是分析“新闻”网站的演变——许多网络博客看起来非常相似,而一些新闻网站非常独特,并且随着时间的推移发生了很大变化]
还有很多其他关于比较图像相似性的堆栈溢出 - 但是它们往往专注于检测相同/非常相似的图像(例如图像比较 - 快速算法或 图像相似性比较)。相比之下,我希望确定差异很大的图像之间的某种分数。因此,可能会排除诸如散列/关键点匹配之类的某些方法(即,因为可能不完全共享任何关键点的两个图像可能仍然看起来非常相似,至少在眼睛看来)
注意:我目前的头脑风暴是使用颜色直方图方法,可能使用相对粗糙的颜色桶,因为许多颜色相对难以区分(例如将站点转换为 256 色)。可能还比较一个网站是否倾向于仅以一种颜色为主,或者具有多种颜色。