0

我正在用词袋直方图实现对象识别。直方图由每张图像 200 个“单词”组成,kmeans 来自描述符。问题是对于一个大型数据集,比如 5000 张图像,我们突然在直方图中有 200x5000=1,000,000 个单词。这意味着每个对象都将由一个 1,000,000 长度的直方图表示。

这在某些时候变得太大而且太麻烦了。有什么办法吗?

4

1 回答 1

0

通常,您选择的码本大小与训练图像的数量无关。您将通过在从所有训练数据中提取的一组描述符上运行 k-means(或其他一些字典学习方法)来构建码本。

因此,在您的示例中,如果您有 5000 个训练图像,并且从每个图像中提取了大约 1000 个描述符,那么您可以使用 k-means 对您进行聚类的 5,000,000 个描述符。

这可能非常耗时,因此您可以选择使用描述符的随机子集进行聚类。

于 2012-07-28T04:01:05.837 回答