我们想判断一个图像是好是坏。
我们会进行一组固定的检查来将图像分类为好或坏类别。
例子:
1. Background color.
2. Height X Width ratio.
3. No water marks.
一般来说,我们只想要好的图像。我们从网站获取这些图像并执行操作以验证该网站的图像。
截至目前,我们访问网站,尝试获取正常图像(例如电子商务网站的产品图像,通过排除所有页面中的常见图像)。在使用搜索参数访问谷歌方面有另一种选择"site:website name"
,它减少了我们识别图像的工作量。
我没有尝试/使用过color histogram
的方法。
解决这个问题的更好方法是什么?任何易于实施的研究论文(或 Mahout 等开源库)也将很有用。