我正在使用词袋模型对医学图像进行分类。我做了以下提取特征向量:
- 从小图像块中提取特征,然后在这些特征上应用 BOW
- 从小图像块中提取像素值,然后对这些像素值应用 BOW
在特征提取之后,我尝试了 PCA、特征选择、更改 KMeans 的集群数量等以提高准确性。但在我的例子中,BOW 在像素值 (1) 上学习的表现优于 BOW (90%) 在特征 (2) 上学习的效果 (70%)。我的功能很好,当我使用这些功能使用其他框架对图像进行分类时,我能够获得超过 95% 的准确率。
我的问题是为什么在像素上学习的 BOW 比在特征上学习的 BOW 表现更好?
正常-异常结肠镜图像分类
Figure 1: a normal colon image
Figure 2: an image with polyp