4

我的图像数据集来自http://www.image-net.org。对于不同的事物,如植物群、动物群、人等,有各种同义词集,
我必须训练一个分类器,如果图像属于花卉同义词集,则预测为 1,否则为 0。
属于花卉同义词集的图像可以在http://www.image-net.org/explore上查看,通过单击左侧窗格中的植物、植物、植物生命选项。

这些图像包括各种各样的植物群——如树木、草本植物、灌木、花卉等。我无法弄清楚要使用哪些特征来训练分类器。这些图像中有很多绿色植物,但有很多花卉图像,没有太多绿色成分。另一个特点是叶子和花瓣的形状。

如果有人能建议如何提取这个形状特征并用它来训练分类器,那将会很有帮助。还建议可以使用哪些其他特征来训练分类器。
提取特征后,要使用哪种算法来训练分类器?

4

2 回答 2

4

不确定形状信息是您链接到的数据集的方法。

只是快速浏览了一些图像,我有一些分类建议:

  1. 自然场景很少有直线——直线检测
  2. 您可以忽略其中包含“不自然”颜色的场景。
  3. 如果你想尝试更高级的东西,我建议熵/模式识别之间的混合会形成一个很好的分类器,因为自然场景两者都有。
  4. 尝试对叶子/花瓣进行模板匹配/形状匹配会让你心碎——你需要使用更通用的东西。

至于使用哪个分类器......我通常会在最初建议 K-means,一旦你有一些结果,确定是否值得付出额外的努力来实现贝叶斯或神经网络。

希望这可以帮助。

T。

扩展:

“不自然的颜色”可能是绿色和棕色范围之外的高度饱和的颜色。它们非常适合检测自然场景,因为即使一朵花在它的中心,也应该有大约 50% 的场景处于绿色/棕色光谱中。

此外,直线检测应该在自然场景中产生很少的结果,因为直线边缘在自然界中很少见。在基本级别上生成边缘图像,对其设置阈值,然后搜索线段(近似直线的像素)。

熵需要一些机器视觉知识。您将通过确定局部熵来接近场景,然后在此处对结果进行直方图处理,这是您必须使用的类似方法。

如果您要尝试模式识别,您会希望在机器视觉方面取得进步,因为这是一个困难的主题,而不是您可以在代码示例中抛出的东西。一旦颜色和边缘信息(线)用尽,我只会尝试将它们实现为分类器。

如果这是商业应用,则应咨询 MV 专家。如果这是大学作业(除非是论文),颜色和边缘/线条信息应该绰绰有余。

于 2012-10-18T12:52:53.833 回答
0

我认为, HOOG功能几乎是这类问题的事实上的标准。他们有点参与计算(我不知道你在什么环境中工作)但功能强大。

一个更简单的解决方案可能会让您启动并运行,具体取决于数据集的难易程度,是从图像中提取所有重叠的补丁,使用 k-means(或任何您喜欢的方法)对它们进行聚类,然后将图像表示为分布在这组量化图像块上,用于像 SVM 这样的监督分类器。你会惊讶于这样的事情有多频繁,它至少应该提供一个有竞争力的基线。

于 2012-10-18T13:45:50.317 回答