我设法将图像转换为视觉词的直方图表示。它可能很简单,如下所示(标准化):
[0.1, 0.2, 0, 0.1, 0, 0.05, 0.3, 0, 0, 0, 0.2, 0.05, 0]
加起来 1
现在,如果我对上面的直方图有很多不同的迭代,我想用 libsvm 对其进行分类。但我被困在这里,我知道 svmtrain 的语法:
model=svmtrain(label,training_matrix)
训练矩阵应该只是我所有直方图的 amxn 矩阵,但是标签呢?我知道它应该是 +1 或 -1,但负面图像来自哪里?training_matrix 中的所有内容都应该是代表班级的正面图像。
将每个直方图视为一个单独的实例我错了吗?相反,如果我将每个视觉单词都视为一个实例,那么我会从代表类的单词中得到否定。